# Lineare Modelle

## Lineare Regression mit einem Feature

### Datensatz erzeugen

In [None]:
from sklearn.datasets import make_regression

In [None]:
x, y = make_regression(n_samples=200, n_features=1, noise=15)

### Datensatz explorieren

### Trainings- und Testdaten splitten

### Lineares Modell fitten

### Fit qualitativ untersuchen

### Fit quantitativ untersuchen

Mean Squared Error: $\text{MSE}(y, \hat{y}) = \frac{1}{n} \sum_{i=1}^n (y_i - \hat{y}_i)^2.$

Determinationskoffizient: $R^2(y, \hat{y}) = 1 - \frac{\sum_{i=1}^{n} (y_i - \hat{y}_i)^2}{\sum_{i=1}^{n} (y_i - \bar{y})^2}$

## Lineare Regression mit mehreren Features

In [None]:
x, y = make_regression(n_samples=200, n_features=5, noise=15)

**Aufgabe:**

1) Lineare Regression an die Daten fitten
2) Koeffizienten ansehen
3) Quantitativ die Güte des Fits für die Trainings- und die Testdaten prüfen

## Lineare Regression mit polynomialen Features

In [None]:
import numpy as np

In [None]:
rng = np.random.default_rng()

In [None]:
x1 = np.arange(-1, 2, 0.05)
x2 = np.arange(-1, 2, 0.05)
plot_x, plot_y = np.meshgrid(x1, x2)

In [None]:
noise = 0.2
plot_z = (plot_x + plot_y + noise * (rng.random(plot_x.shape[0]) - 0.5))**2 

In [None]:
plot_z.shape

In [None]:
import matplotlib.pyplot as plt
from matplotlib import cm
fig, ax = plt.subplots(subplot_kw={"projection": "3d"})
ax.plot_surface(plot_x, plot_y, plot_z, vmin=plot_z.min() * 2, cmap=cm.Blues)
plt.show()

### Datensatz erstellen

In [None]:
x = 5 * (rng.random((1000, 2)) - 0.5)
y = (x[:,0] + x[:,1] + noise * (rng.random(x.shape[0]) - 0.5))**2

In [None]:
plt.scatter(x[:,0], y)
plt.xlabel("$x_1$")
plt.ylabel("target")
plt.legend()

In [None]:
plt.scatter(x[:,1], y)
plt.xlabel("$x_2$")
plt.ylabel("target")
plt.legend()

### Lineares Modell fitten

**Aufgabe:**

1) Datensatz in Trainings- und Testdaten unterteilen (80:20-Split)

2) Lineare Regression an die Daten fitten

3) Vorhersage für die Testdaten mit den realen Testdaten vergleichen (je ein Plot pro Dimension)

4) Was lässt sich anhand der Plots erkennen?

### Polynomiale Features erzeugen

Transformation: $(x_1, x_2) \rightarrow (1, x_1, x_2, x_1^2, x_1 x_2, x_2^2)$

### Lineares Modell fitten

Erinnerung: $(x_1 + x_2)^2 = x_1^2 + 2 x_1 x_2 + x_2^2$

### Fit qualitativ untersuchen

### Fits quantitativ untersuchen

**Aufgabe:**

Für das Modell ohne und das Modell mit polynomialen Features jeweils den MSE und $R^2$ berechnen.


### Vorhersage-Funktion erstellen

**Aufgabe:** Erstelle eine Funktion, die einen zwei-dimensionalen Eingabewert ($x_1$ und $x_2$) nimmt und mit Hilfe des Modells mit polynomialen Features eine Vorhersage für $y$ zurückgibt.

*Beispiel:* `predict(np.array([[2,2]]))` $\approx$ 16

In [None]:
def predict(x):
    ...

In [None]:
predict(np.array([[2, 2]]))