# Programmieraufgaben zu 2.2 (Logistische Regression)


## Aufgabe 1

Sei ein Datensatz $D$ gegeben durch

$$
D=\{((16,22),1),((43,70),1),((135,50),0),((42,46),0),((60,59),0),((105,140),1)\}
$$

**Aufgabe**: Bestimmen Sie, unter Nutzung von Python und scikit-learn, $\theta=(\theta_0,\theta_1,\theta_2)$ für das optimale logistische Modell $h^\text{logit}_\theta$ bzgl. $D$.

In [1]:
from sklearn.linear_model import LogisticRegression

D = [
    ((16, 22), 1),
    ((43, 70), 1),
    ((135, 50), 0),
    ((42, 46), 0),
    ((60, 59), 0),
    ((105, 140), 1),
]
x_vals = [d[0] for d in D]
y_hats = [d[1] for d in D]

regressor = LogisticRegression().fit(x_vals, y_hats)

thetas = *regressor.intercept_, *regressor.coef_[0]
for i, theta in enumerate(thetas, start=1):
    print(f"theta_{i}: {theta:0.3f}")

theta_1: 1.762
theta_2: -0.586
theta_3: 0.453


---

## Aufgabe 2

Sei ein Datensatz $D$ gegeben durch

$$
D = \{((12,11),0), ((13,14),1), ((11,8),1), ((6,2),0), ((12,10),0), ((7,11),0)\}
$$

**Aufgabe**: Bestimmen Sie, unter Nutzung von Python und scikit-learn, $\theta=(\theta_0,\theta_1,\theta_2,\theta_3,\theta_4,\theta_5)$ für das optimale logistische Modell $h_\theta^{\text{logit}}$ bzgl. $D'$, wobei $D'$ die polynomielle Merkmalserweiterung von $D$ mit Maximalgrad $2$ ist.



In [7]:
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LogisticRegression

D = [
    ((12, 11), 0),
    ((13, 14), 1),
    ((11, 8), 1),
    ((6, 2), 0),
    ((12, 10), 0),
    ((7, 11), 0),
]

x_vals = [d[0] for d in D]
y_hats = [d[1] for d in D]

x_prime = PolynomialFeatures(degree=2, include_bias=False).fit_transform(x_vals)

regressor = LogisticRegression().fit(x_prime, y_hats)

thetas = regressor.intercept_[0], *regressor.coef_[0]

for i, theta in enumerate(thetas, start=1):
    print(f"theta_{i}: {theta:0.3f}")

theta_1: -11.265
theta_2: 0.064
theta_3: -0.202
theta_4: 0.386
theta_5: -0.635
theta_6: 0.330


---

## Aufgabe 3

Sei ein Datensatz D gegeben durch

$$
D = \{((1,80),2),((20,3),2),((5,0),1),((13,12),1),((60,30),3),((10,40),3)\}
$$

Führen Sie, unter Nutzung von Python und scikit-learn, eine Mehrklassen-Klassifikation mithilfe logistischer Regression durch.

Erstellen Sie dazu klassenspezifische Versionen $D_c$, wobei $(c\in \{1, \ldots, k\}$ von Datensatz $D$ und bestimmen Sie jeweils $\theta_c=(\theta_{c,0},\theta_{c,1},\theta_{c,2})$ für das optimale logistische Modell $h_\theta^{\mathrm{logit}}$ bzgl. $D_c$.

In [None]:
from sklearn.linear_model import LogisticRegression

D = [
    ((1, 80), 2),
    ((20, 3), 2),
    ((5, 0), 1),
    ((13, 12), 1),
    ((60, 30), 3),
    ((10, 40), 3),
]

x_vals = [d[0] for d in D]
y_hats = [d[1] for d in D]

y_hats_cls_1 = [1 if y == 1 else 0 for y in y_hats]
y_hats_cls_2 = [1 if y == 2 else 0 for y in y_hats]
y_hats_cls_3 = [1 if y == 3 else 0 for y in y_hats]

print("class-1:", list((x, y) for x, y in zip(x_vals, y_hats_cls_1)))
print("class-2:", list((x, y) for x, y in zip(x_vals, y_hats_cls_2)))
print("class-3:", list((x, y) for x, y in zip(x_vals, y_hats_cls_3)))

regressor = LogisticRegression(multi_class="ovr").fit(x_vals, y_hats)

thetas_1 = regressor.intercept_[0], *regressor.coef_[0]
thetas_2 = regressor.intercept_[1], *regressor.coef_[1]
thetas_3 = regressor.intercept_[2], *regressor.coef_[2]

for i_cls, thetas in enumerate([thetas_1, thetas_2, thetas_3], start=1):
    print("-------------")
    print(f"cls: {i_cls}")
    print()
    for i, theta in enumerate(thetas, start=1):
        ("thetas:  ", [round(intercept, 3), *round(coef, 3)])
        print(f"theta_{i}: {theta:0.3f}")

class-1: [((1, 80), 0), ((20, 3), 0), ((5, 0), 1), ((13, 12), 1), ((60, 30), 0), ((10, 40), 0)]
class-2: [((1, 80), 1), ((20, 3), 1), ((5, 0), 0), ((13, 12), 0), ((60, 30), 0), ((10, 40), 0)]
class-3: [((1, 80), 0), ((20, 3), 0), ((5, 0), 0), ((13, 12), 0), ((60, 30), 1), ((10, 40), 1)]
-------------
cls: 1

theta_1: 14.690
theta_2: -0.789
theta_3: -0.246
-------------
cls: 2

theta_1: -0.917
theta_2: -0.030
theta_3: 0.024
-------------
cls: 3

theta_1: -5.138
theta_2: 0.196
theta_3: 0.053


---

## Aufgabe 4

Sei ein Datensatz D gegeben durch

$$
D = \{((0.3,0.3),1),((0.24,0.26),4),((0.33,0.2),2),((0.35,0.4),3),((0.39,0.38),3),((0.42,0.26),1)\}
$$

Führen Sie, unter Nutzung von Python und scikit-learn, eine Mehrklassen-Klassifikation mithilfe logistischer Regression durch.

Erstellen Sie dazu klassenspezifische Versionen $D'_c$, wobei $c\in \{1, \ldots, k\}$ von Datensatz $D'$ und bestimmen Sie jeweils $\theta_c=(\theta_{c,0},\theta_{c,1},\theta_{c,2},\theta_{c,3},\theta_{c,4},\theta_{c,5})$ für das optimale logistische Modell $h_\theta^{\text{logit}}$ bzgl. $D'_c$.

Dabei ist $D'$ die polynomielle Merkmalserweiterung von $D$ mit Maximalgrad $2$.

In [103]:
from numpy import round
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LogisticRegression

D = [
    ((0.3, 0.3), 1),
    ((0.24, 0.26), 4),
    ((0.33, 0.2), 2),
    ((0.35, 0.4), 3),
    ((0.39, 0.38), 3),
    ((0.42, 0.26), 1),
]
x_vals = [d[0] for d in D]
y_hats = [d[1] for d in D]

x_prime = PolynomialFeatures(degree=2, include_bias=False).fit_transform(x_vals)
x_prime = [tuple(round(x, 3)) for x in x_prime]  # ensure pretty print by rounding

y_hats_cls_1 = [1 if y == 1 else 0 for y in y_hats]
y_hats_cls_2 = [1 if y == 2 else 0 for y in y_hats]
y_hats_cls_3 = [1 if y == 3 else 0 for y in y_hats]
y_hats_cls_4 = [1 if y == 4 else 0 for y in y_hats]

print("D':   ", list(zip(x_prime, y_hats)))
print("D'_1: ", [(x, y) for x, y in zip(x_prime, y_hats_cls_1)])
print("D'_2: ", [(x, y) for x, y in zip(x_prime, y_hats_cls_2)])
print("D'_3: ", [(x, y) for x, y in zip(x_prime, y_hats_cls_3)])
print("D'_4: ", [(x, y) for x, y in zip(x_prime, y_hats_cls_4)])

regressor = LogisticRegression(multi_class="ovr").fit(x_prime, y_hats)

for cls, thetas in enumerate(zip(regressor.intercept_, regressor.coef_), start=1):
    print("----------")
    print(f"class-{cls}")
    print()
    intercept, coef = thetas
    print("thetas:  ", [round(intercept, 3), *round(coef, 3)])
    for i, theta in enumerate((intercept, *coef), start=1):
        print(f"theta_{i}:  {theta:0.3f}")

D':    [((0.3, 0.3, 0.09, 0.09, 0.09), 1), ((0.24, 0.26, 0.058, 0.062, 0.068), 4), ((0.33, 0.2, 0.109, 0.066, 0.04), 2), ((0.35, 0.4, 0.122, 0.14, 0.16), 3), ((0.39, 0.38, 0.152, 0.148, 0.144), 3), ((0.42, 0.26, 0.176, 0.109, 0.068), 1)]
D'_1:  [((0.3, 0.3, 0.09, 0.09, 0.09), 1), ((0.24, 0.26, 0.058, 0.062, 0.068), 0), ((0.33, 0.2, 0.109, 0.066, 0.04), 0), ((0.35, 0.4, 0.122, 0.14, 0.16), 0), ((0.39, 0.38, 0.152, 0.148, 0.144), 0), ((0.42, 0.26, 0.176, 0.109, 0.068), 1)]
D'_2:  [((0.3, 0.3, 0.09, 0.09, 0.09), 0), ((0.24, 0.26, 0.058, 0.062, 0.068), 0), ((0.33, 0.2, 0.109, 0.066, 0.04), 1), ((0.35, 0.4, 0.122, 0.14, 0.16), 0), ((0.39, 0.38, 0.152, 0.148, 0.144), 0), ((0.42, 0.26, 0.176, 0.109, 0.068), 0)]
D'_3:  [((0.3, 0.3, 0.09, 0.09, 0.09), 0), ((0.24, 0.26, 0.058, 0.062, 0.068), 0), ((0.33, 0.2, 0.109, 0.066, 0.04), 0), ((0.35, 0.4, 0.122, 0.14, 0.16), 1), ((0.39, 0.38, 0.152, 0.148, 0.144), 1), ((0.42, 0.26, 0.176, 0.109, 0.068), 0)]
D'_4:  [((0.3, 0.3, 0.09, 0.09, 0.09), 0), ((0.2