In [None]:
!pip install pandas numpy scikit-learn

In [2]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, confusion_matrix


# Zufällige, aber reproduzierbare Werte
np.random.seed(42)

# Daten generieren
n = 500  # Anzahl der Kunden

alter = np.random.randint(18, 70, n)
einkommen = np.random.randint(20000, 100000, n)
bisherige_käufe = np.random.randint(0, 10, n)

# Realistisches Kaufverhalten simulieren
# Wahrscheinlichkeit für Kauf hängt von Alter, Einkommen und Käufen ab
kauf_wahrscheinlichkeit = (
    0.3 * (alter / 70) +          # ältere Kunden kaufen eher
    0.4 * (einkommen / 100000) +  # höheres Einkommen -> höhere Kaufchance
    0.3 * (bisherige_käufe / 10)  # treue Kunden kaufen eher
)

# Rauschen hinzufügen, damit es realistischer ist
kauf_wahrscheinlichkeit += np.random.normal(0, 0.15, n)

# In Kauf (0/1) umwandeln
kauf = (kauf_wahrscheinlichkeit > 0.5).astype(int)

# DataFrame erstellen
df = pd.DataFrame({
    'Alter': alter,
    'Einkommen': einkommen,
    'Bisherige_Käufe': bisherige_käufe,
    'Kauf': kauf
})

# Eingaben (X) und Zielvariable (y)
X = df[['Alter', 'Einkommen', 'Bisherige_Käufe']]
y = df['Kauf']

# Train/Test Split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

In [3]:
# Modell
model = LogisticRegression(max_iter=1000)
model.fit(X_train, y_train)

# Vorhersage
y_pred = model.predict(X_test)

print("Genauigkeit:", accuracy_score(y_test, y_pred))
print("Konfusionsmatrix:\n", confusion_matrix(y_test, y_pred))

Genauigkeit: 0.8066666666666666
Konfusionsmatrix:
 [[34 19]
 [10 87]]


In [4]:
# Beispielkunden
kunde1 = pd.DataFrame([[24, 23500, 2]], columns=['Alter', 'Einkommen', 'Bisherige_Käufe'])
kunde2 = pd.DataFrame([[69, 98000, 7]], columns=['Alter', 'Einkommen', 'Bisherige_Käufe'])
kunde3 = pd.DataFrame([[45, 58000, 3]], columns=['Alter', 'Einkommen', 'Bisherige_Käufe'])
kunden_vorschau = [kunde1, kunde2, kunde3]
for i in range(len(kunden_vorschau)):
    vorhersage = model.predict(kunden_vorschau[i])
    wahrscheinlichkeit = model.predict_proba(kunden_vorschau[i])[0][1]
    print("Kunde " + str(i+1) + ":")
    print("Wahrscheinlichkeit Kauf:", round(wahrscheinlichkeit * 100, 2), "%")
    print("Kauft der Kunde?:", "Ja" if vorhersage[0] == 1 else "Nein")

Kunde 1:
Wahrscheinlichkeit Kauf: 7.87 %
Kauft der Kunde?: Nein
Kunde 2:
Wahrscheinlichkeit Kauf: 98.43 %
Kauft der Kunde?: Ja
Kunde 3:
Wahrscheinlichkeit Kauf: 55.14 %
Kauft der Kunde?: Ja
