# Programmieraufgaben zu 2.1 (Lineare Regression)


## Aufgabe 1

Sei ein Datensatz $D$ gegeben durch

$$
D=\{((23,36),0.1),((23,34),0),((26,29),1.2),((21,40),-0.5),((20,33),-1.5),((25,35),0.7)\}
$$

Bestimmen Sie, unter Nutzung von Python und scikit-learn, $\theta=(\theta_0,\theta_1,\theta_2)$ für das optimale lineare Modell $h_\theta$ bzgl. $D$.

In [30]:
from sklearn.linear_model import LinearRegression

D=[((23,36),0.1),((23,34),0),((26,29),1.2),((21,40),-0.5),((20,33),-1.5),((25,35),0.7)]
x_vals = [d[0] for d in D]
y_hats = [d[1] for d in D]


regressor = LinearRegression().fit(x_vals, y_hats)

thetas = regressor.intercept_, *regressor.coef_
for i, theta in enumerate(thetas, start=1):
    print(f"theta_{i}: {theta:0.3f}")


theta_1: -11.918
theta_2: 0.445
theta_3: 0.049


---

## Aufgabe 2

Sei ein Datensatz $D$ gegeben durch

$$
D=\{((0.5,4.4),6.8),((1,4.0),8.1),((1.5,3.8),9.3),((1.6,3.7),11.1),((1.2,5.2),11.6),((0.7,4.3),13.6)\}
$$

**Aufgabe**: Bestimmen Sie, unter Nutzung von Python und scikit-learn, $\theta=(\theta_0,\theta_1,\theta_2,\theta_3,\theta_4,\theta_5)$ für das optimale lineare Modell $h_\theta$ bzgl. $D′$, wobei $D′$ die polynomielle Merkmalserweiterung von $D$ mit Maximalgrad $2$ sei.

In [32]:
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures

D=[((0.5,4.4),6.8),((1,4.0),8.1),((1.5,3.8),9.3),((1.6,3.7),11.1),((1.2,5.2),11.6),((0.7,4.3),13.6)]
x_vals = [d[0] for d in D]
y_hats = [d[1] for d in D]


x_prime_vals = PolynomialFeatures(degree=2, include_bias=False).fit_transform(x_vals)
regressor = LinearRegression().fit(x_prime_vals, y_hats)

thetas = regressor.intercept_, *regressor.coef_
for i, theta in enumerate(thetas, start=1):
    print(f"theta_{i}: {theta:0.3f}")



theta_1: -1588.241
theta_2: 1488.408
theta_3: 353.983
theta_4: -180.842
theta_5: -266.054
theta_6: -3.934


---

## Aufgabe 3

Sei ein Datensatz $D$ gegeben durch

$$
D=\{((12,7),5.5),((10,8),6),((10,7.5),7),((15,5),6.5),((16,9),7.5),((18,8),10)\}
$$

**Aufgabe**: Bestimmen Sie, unter Nutzung von Python und scikit-learn, $\theta=(\theta_0,\theta_1,\theta_2)$ für das Ridge-Regressions Modell $h_\theta$ bzgl. $D$ mit $\lambda=0.1$.

In [33]:
from sklearn.linear_model import Ridge

D=[((12,7),5.5),((10,8),6),((10,7.5),7),((15,5),6.5),((16,9),7.5),((18,8),10)]
x_vals = [d[0] for d in D]
y_hats = [d[1] for d in D]


regressor = Ridge(alpha=0.1).fit(x_vals, y_hats)

thetas = regressor.intercept_, *regressor.coef_
for i, theta in enumerate(thetas, start=1):
    print(f"theta_{i}: {theta:0.3f}")


theta_1: -0.278
theta_2: 0.347
theta_3: 0.361


---

## Aufgabe 4

Sei ein Datensatz $D$ gegeben durch

$$
D=\{((17.5,20),0.85),((21.5,23),0.9),((19,19),1.1),((20,18),1),((22.5,16),1.1),((20.5,15),0.8)\}
$$

**Aufgabe**: Bestimmen Sie, unter Nutzung von Python und scikit-learn, $\theta=(\theta_0,\theta_1,\theta_2,\theta_3,\theta_4,\theta_5)$ für das Ridge-Regressions Modell $h\theta$ bzgl. $D'$, wobei $D'$ die polynomielle Merkmalserweiterung von $D$ mit Maximalgrad $2$ ist, mit $\lambda=0.2$.

In [34]:
from sklearn.linear_model import Ridge
from sklearn.preprocessing import PolynomialFeatures

D=[((17.5,20),0.85),((21.5,23),0.9),((19,19),1.1),((20,18),1),((22.5,16),1.1),((20.5,15),0.8)]
x_vals = [d[0] for d in D]
y_hats = [d[1] for d in D]

x_prime_vals = PolynomialFeatures(degree=2, include_bias=False).fit_transform(x_vals)

regressor = Ridge(alpha=0.2).fit(x_prime_vals, y_hats)


thetas = regressor.intercept_, *regressor.coef_
for i, theta in enumerate(thetas, start=1):
    print(f"theta_{i}: {theta:0.3f}")


theta_1: -0.900
theta_2: -0.062
theta_3: 0.227
theta_4: -0.002
theta_5: 0.010
theta_6: -0.011
