# Z-Score

Der **Z-Score** (auch **Standardisierung** oder **z-Transformation** genannt) ist eine Methode, um Daten zu normalisieren. Ziel ist es, die Daten so zu transformieren, dass sie einen Mittelwert von 0 und eine Standardabweichung von 1 haben. Der Z-Score gibt also an, wie viele Standardabweichungen ein Datenpunkt vom Mittelwert entfernt liegt.

### Warum Z-Score?
Der Z-Score wird verwendet, um Daten auf eine einheitliche Skala zu bringen, ohne den Einfluss von Ausreißern zu eliminieren. Das ist besonders hilfreich bei Algorithmen, die empfindlich auf die Skalierung der Daten reagieren, wie z.B. bei linearen Modellen oder k-Nächste-Nachbarn.

### Berechnung des Z-Scores
Der Z-Score für einen Datenpunkt $x$ wird berechnet mit der Formel:

$$
z = \frac{x - \mu}{\sigma}
$$

- $x$: der Originalwert
- $\mu$: der Mittelwert der Daten
- $\sigma$: die Standardabweichung der Daten

### Interpretation
- Ein Z-Score von **0** bedeutet, dass der Wert genau dem Mittelwert entspricht.
- Ein positiver Z-Score zeigt, dass der Wert **über dem Mittelwert** liegt.
- Ein negativer Z-Score zeigt, dass der Wert **unter dem Mittelwert** liegt.
- Der Betrag des Z-Scores (also die Zahl ohne Vorzeichen) gibt an, wie viele Standardabweichungen der Wert vom Mittelwert entfernt ist.

### Beispiel in Python
Hier ein einfaches Beispiel, wie der Z-Score berechnet wird:

```python
import numpy as np

# Beispiel-Daten
daten = [10, 12, 14, 16, 18]

# Mittelwert und Standardabweichung berechnen
mean = np.mean(daten)
std_dev = np.std(daten)

# Z-Scores berechnen
z_scores = [(x - mean) / std_dev for x in daten]

z_scores
```

Hier wird für jeden Wert in `daten` der Z-Score berechnet und in der Liste `z_scores` gespeichert. Diese Liste enthält dann die standardisierten Werte, die für statistische Analysen oder als Input für ML-Modelle nützlich sein können.

In [1]:
import numpy as np

# Beispiel-Daten
daten = [10, 12, 14, 16, 18]

# Mittelwert und Standardabweichung berechnen
mean = np.mean(daten)
std_dev = np.std(daten)

# Z-Scores berechnen
z_scores = [(x - mean) / std_dev for x in daten]

z_scores

[-1.414213562373095,
 -0.7071067811865475,
 0.0,
 0.7071067811865475,
 1.414213562373095]