# Selber Ausführen

Das Buch ist so geschrieben, das nicht nur alle Quelltextbeispiele vorhanden sind. Es ist sogar möglich sich das komplette Buch runterzuladen und alles selbst auszuführen, anzupassen, und mit den Beispielen zu experimentieren. Hier ist eine kurze Erklärung, wie das unter Linux (getestet mit Ubuntu 20.04) geht. Windowsnutzer müssen entweder Python unter Windows installieren oder - wie ich selbst - mit dem Windows Subsystem for Linux (WSL) arbeiten [^wsl]. 

1. Wir beginnen mit dem Installieren der benötigten Linuxpakete. Python sollte bereits installiert sein (mindestens Version 3.6). Wir brauchen noch eine virtuelle Umgebung für Python (`venv` genannt). Außerdem wird noch Graphviz benötigt, jedoch nur für das Zeichnen der Struktur des Neuronalen Netzes in [Kapitel 7](kapitel_07).
   ```
   sudo apt-get update
   sudo apt-get install python3-venv graphviz
   ```
2. Jetzt können wir Inhalte runterladen, entpacken und in den Ordner wechseln. 
   ```
   cd ~
   wget https://github.com/sherbold/einfuehrung-in-data-science/archive/refs/heads/main.zip
   unzip main.zip
   cd einfuehrung-in-data-science-main
   ```
3. Jetzt können wir uns in diesem Ordner eine virtuelle Pythonumgebung erstellen, aktivieren und die benötigten Pythonpakete installieren. 
   ```
   python3 -m venv venv
   source venv/bin/activate
   pip install -r requirements.txt
   ```
4. Jetzt muss noch noch das Jupyter Lab gestartet werden.
   ```
   cd content
   juypter-lab
   ```
5. Fertig! Jetzt können wir das Juypter Lab im Browser öffnen (der Link wird ja angezeigt) und sehen die Jupyter Notebooks für alle Kapitel, mit denen wir alles selbst ausprobieren können.

Wenn wir fertig sind, können wir die Notebooks einfach schließen und mit `Strg+C` das Jupyter Lab im Terminal beenden. Beim nächsten Starten müssen wir nur in den Ordner wechseln, die `venv` aktivieren, und können dann direkt das Jupyter Lab starten.
```
cd ~
cd einfuehrung-in-data-science-main/content
source venv/bin/activate
jupyter-lab
```

[^wsl]: https://ubuntu.com/wsl

# Notationen

In diesem Buch verwenden wir viele Mathematische Notation. Hier sind noch einmal die wichtigsten zum Nachschlagen also Tabelle. 

| Notation | Definition |
|----------|------------|
| $\mathbb{R}$ | Die reellen Zahlen, also mehr oder weniger beliebige numerische Werte. |
| $\mathbb{N}$ | Die natürlichen Zahlen, also alle ganzen Zahlen die größer null sind.  |
| $O$ | Objektraum, also die Menge der Objekte aus der realen Welt. |
| $\phi$ | Feature map, also eine Abbildung die definiert wie Merkmale für Objekte berechnet werden. |
| $\mathcal{F}$ | Merkmalsraum (engl. feature space), also die Dimension und die möglichen Werte der Merkmale. Häufig ist dies der $\mathbb{R}^d$, also die $d$-dimensionalen reellen Zahlen. In diesem Fall gibt es $d \in \mathbb{N}$ Merkmale. |
| $X$ (Clustering, Klassifikation, Regression) |  Instanzen von Objekten im Merkmalsraum. Je nach Kontext ist $X$ entweder eine Menge von Instanzen $X = \{x_1, ..., x_n\} \subseteq \mathcal{F}$ oder eine Zufallsvariable, so dass die Instanzen Realisierungen dieser Zufallsvariablen sind. |
| $Y$ (Klassifikation, Regression) | Wert von Interesse, also die Klasse oder die abhängige Variable. Wie $X$ wird $Y$ auch entweder als Menge $Y= \{y_1, ..., y_n\}$ oder als Zufallsvariable definiert. |
| $I$ | Endliche Menge von Gegenständen  \{i_1, ..., i_m\}.
| $T$ | Endliche Menge von Transaktionen $T=\{t_1, ..., t_n\}$, wobei $t_i \subseteq I$ für $i=1, ..., n$. |
| $X$ (Assoziationsregeln) | Bedingung (engl. antecedent) einer Assoziationsregel. |
| $Y$ (Assoziationsregeln) | Folgerung (engl. consequent) einer Assoziationsregel. |
| $X \Rightarrow Y$ | Assoziationsregel, wobei $X$ die Bedingung und $Y$ die Folgerung ist. |
| ${n \choose k}$ | Binomialkoeffizient ${n \choose k} = \frac{n!}{(n-k)!k!}$. |
| $\mathcal{P}(I)$ | Die Potenzmenge einer endlichen Menge $I$. |
| $\vert \cdot \vert$ | Die Kardinalität einer Menge, zum Beispiel $\vert X \vert$ für die Anzahl der Elemente der Menge $X$ |
| $d(x,y)$ | Distanz zwischen zwei Vektoren $x$ und $y$, zum Beispiel die Euklidische Distanz, die Manhattan Distanz oder die Chebyshev Distanz. |
| $argmin_{i=1,...,k} f(i)$ | Der Wert $i$ für den die Funktion $f$ minimiert wird. |
| $argmin_{i \in \{1, ..., k\}} f(i)$ | Andere Schreibweise für $argmin_{i=1,...,k} f(i)$. |
| $\min_{i=1,...,k} f(i)$ | Das Minimum der Funktion $f$ über die verschiedenen Werte von $i$. |
| $\min_{i \in \{1, ..., k\}} f(i)$ | Andere Schreibweise für $\min_{i=1, ..., k}$. |
| $argmax$ | Siehe $argmin$. |
| $\max$ | Siehe $\min$. |
| $\sim$ | Definiert die Verteilung einer Zufallsvariable. Wir schreiben $X \sim (\mu, \sigma)$ um zu definieren das $X$ normalverteilt mit dem Mittelwert $ \mu$ und der Standardabweichung $\sigma$ ist.|
| $C$ (Klassifikation) | Menge der Klassen. |
| $C$ (Clustering) | Beschreibung der Cluster. |
| $h$ | Hypothese, Konzept, Klassifikator, Klassifikationsmodell. |
| $h^*$ | Zielkonzept. |
| $h'_c$ | Score einer Hypothese für die Klasse $c$. |
| $P(X=x)$ | Wahrscheinlichkeit, dass die Zufallsvariable $X$ den Wert $x$ annimmt. |
| $p(x)$ | Kurzform für $p(x) = P(X=x)$ bei eine Zufallsvariable $x$. |
| $P(X \vert Y)$ | Bedingte Wahrscheinlichkeit einer Zufallsvariablen $X$ gegeben eine andere Zufallsvariable $Y$. | 
| $H(X)$ | Entropie einer Zufallsvariablen $X$. |
| $H(X \vert Y)$ | Bedingte Entropie der Zufallsvariablen $X$ gegeben der Zufallsvariable $Y$. |
| $I(X; Y)$ | Informationsgewinn (engl. information gain) für $X$, bzw. $Y$, wenn die andere Variable bekannt ist. Auch bekannt als gemeinsame Information (engl. mutual information). |
| $e_x$ | Residuen einer Regression. |
| $x_t$ | Werte einer Zeitreihe $\{x_1, ..., x_T\} = \{x_t\}_{t=1}^T$. |
| $T_t$ | Trend einer Zeitreihe. |
| $S_t$ | Saisonalität einer Zeitreihe. |
| $R_t$ | Autoregressiver Teil einer Zeitreihe. |

