# HS22_Kreditkarte — Lösung (Python)

*Schema: Aufgabenbeschrieb → Lösungsansatz & Erklärung → Code → Erklärung Output → Nächste Aufgabe*

## Aufgabe 1

**Aufgabenbeschrieb**

Daten einlesen, **Besitz Kreditkarte (owns_card)** abhängig von **Alter (age)** grafisch darstellen.

**Lösungsansatz & Erklärung**

Scatter von age vs. owns_card (0/1) + ggf. Jitter; zusätzlich Balken der Mittelwerte nach Alters-Bins.

In [None]:
import pandas as pd, numpy as np, matplotlib.pyplot as plt
df = pd.read_csv("/mnt/data/creditcard-1760476079.csv")
y = 'owns_card'; X = 'age'
plt.figure(); plt.scatter(df[X], df[y], alpha=0.3); plt.xlabel(X); plt.ylabel(y)

**Erklärung Output**

Punkte bei 0/1; visuell erkennbar, wie Wahrscheinlichkeit mit Alter variiert.

---
*Nächste Aufgabe →*

## Aufgabe 2

**Aufgabenbeschrieb**

Logistische Regression ohne Regularisierung; Gleichung angeben.

**Lösungsansatz & Erklärung**

statsmodels.Logit mit Intercept. Gleichung: log(p/(1-p)) = b0 + b1*age.

In [None]:
import statsmodels.api as sm
Xmat = sm.add_constant(df[['age']])
yvec = df['owns_card'].astype(int)
logit = sm.Logit(yvec, Xmat).fit(disp=False)
b0, b1 = float(logit.params['const']), float(logit.params['age'])
b0, b1, logit.summary()

**Erklärung Output**

Mit b0, b1 kann p(x) = 1/(1+exp(-(b0+b1*x))) berechnet werden.

---
*Nächste Aufgabe →*

## Aufgabe 3

**Aufgabenbeschrieb**

Logistische Kurve zusammen mit den Daten plotten.

**Lösungsansatz & Erklärung**

Gitter über age aufspannen und p(x) plotten.

In [None]:
xg = np.linspace(df['age'].min(), df['age'].max(), 200)
Xg = sm.add_constant(pd.DataFrame({'age':xg}))
pg = logit.predict(Xg)
plt.figure(); plt.scatter(df['age'], yvec, alpha=0.2)
plt.plot(xg, pg, ls='--'); plt.xlabel('age'); plt.ylabel('P(owns_card)')

**Erklärung Output**

Die Kurve zeigt geschätzte Wahrscheinlichkeit des KK‑Besitzes über das Alter.

---
*Nächste Aufgabe →*

## Aufgabe 4

**Aufgabenbeschrieb**

Wahrscheinlichkeit für 80-jährige Person.

**Lösungsansatz & Erklärung**

In Gleichung einsetzen bzw. predict mit age=80.

In [None]:
x80 = sm.add_constant(pd.DataFrame({'age':[80]}))
p80 = float(logit.predict(x80)); p80, round(100*p80,2)

**Erklärung Output**

Prozentwert im Prüfungsbogen eintragen (z. B. 1.8 %).

---
*Nächste Aufgabe →*

## Aufgabe 5

**Aufgabenbeschrieb**

Konfusionsmatrix & Accuracy (Schwelle 0.5).

**Lösungsansatz & Erklärung**

Mit sklearn confusion_matrix und accuracy_score.

In [None]:
from sklearn.metrics import confusion_matrix, accuracy_score
p = logit.predict(Xmat)
yhat = (p>=0.5).astype(int)
cm = confusion_matrix(yvec, yhat); acc = accuracy_score(yvec, yhat)
cm, acc

**Erklärung Output**

Aus cm die Felder **TP/FP/FN/TN** herauslesen und beschriften.

---
*Nächste Aufgabe →*