# Mean Squared Error (MSE)

Der **Mean Squared Error (MSE)** ist ein Maß dafür, wie gut ein Regressionsmodell Vorhersagen macht. Er berechnet den Durchschnitt der **quadratischen Fehler** zwischen den tatsächlichen Werten und den vorhergesagten Werten. Ein kleinerer MSE bedeutet, dass das Modell bessere Vorhersagen liefert.

### Formel für den MSE:

$$
\text{MSE} = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2
$$

### Erklärung der Formel:

- $n$ ist die Anzahl der Datenpunkte (Anzahl der Beobachtungen).
- $y_i$ ist der **tatsächliche** Wert der Zielvariablen beim $i$-ten Datenpunkt.
- $\hat{y}_i$ ist der **vorhergesagte** Wert des Modells für den $i$-ten Datenpunkt.
- $(y_i - \hat{y}_i)^2$ ist der quadratische Fehler für den $i$-ten Datenpunkt.

### Bedeutung:

- Die Differenz $y_i - \hat{y}_i$ zeigt den Fehler zwischen tatsächlichem und vorhergesagtem Wert.
- Durch das Quadrieren der Fehler werden sowohl positive als auch negative Abweichungen positiv und größere Fehler stärker gewichtet.
- Der MSE gibt uns den **durchschnittlichen quadratischen Fehler** und zeigt, wie stark die Vorhersagen vom tatsächlichen Ergebnis abweichen.

### MSE-Berechnung: Schritt-für-Schritt

Gegeben:
- Tatsächliche Werte $y = [3, -0.5, 2, 7]$
- Vorhergesagte Werte $\hat{y} = [2.5, 0.0, 2, 8]$

#### Schritte zur Berechnung des MSE

1. **Quadratische Abweichung**: Für jeden Datenpunkt berechnen wir die Differenz zwischen dem tatsächlichen und dem vorhergesagten Wert, quadrieren die Differenz und summieren die Ergebnisse:
   $
   (3 - 2.5)^2 = 0.25
   $
   $
   (-0.5 - 0.0)^2 = 0.25
   $
   $
   (2 - 2)^2 = 0
   $
   $
   (7 - 8)^2 = 1
   $

2. **Durchschnitt der quadratischen Fehler**: Addiere alle quadratischen Fehler und teile durch die Anzahl der Datenpunkte:
   $$
   MSE = \frac{0.25 + 0.25 + 0 + 1}{4} = \frac{1.5}{4} = 0.375
   $$

Der MSE für diese Daten ist also $0.375$.

In [1]:
import numpy as np
from sklearn.metrics import mean_squared_error

# Tatsächliche und vorhergesagte Werte
y_true = np.array([3, -0.5, 2, 7])
y_pred = np.array([2.5, 0.0, 2, 8])

# Berechnung des MSE
mse = mean_squared_error(y_true, y_pred)

print("Mittlere quadratische Abweichung (MSE):", mse)

Mittlere quadratische Abweichung (MSE): 0.375
