In [2]:
from sklearn.ensemble import AdaBoostClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.metrics import accuracy_score

# Daten laden
data = load_iris()
X = data.data
y = data.target

# Daten in Trainings- und Testsets aufteilen
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Basis-Decision-Tree-Klassifikator erstellen
base_estimator = DecisionTreeClassifier(max_depth=1)

# AdaBoost-Klassifikator erstellen
ada_boost = AdaBoostClassifier(n_estimators=50, learning_rate=1.0, random_state=42)
ada_boost.estimator = base_estimator

# Modell trainieren
ada_boost.fit(X_train, y_train)

# Vorhersagen treffen
y_pred = ada_boost.predict(X_test)

# Genauigkeit berechnen
accuracy = accuracy_score(y_test, y_pred)
print(f"Genauigkeit: {accuracy:.2f}")


# Kreuzvalidierung mit 5 Faltungen (optional)
scores = cross_val_score(ada_boost, X, y, cv=5)
print(f"Durchschnittliche Genauigkeit (Kreuzvalidierung): {scores.mean():.2f}")
print(f"Standardabweichung (Kreuzvalidierung): {scores.std():.2f}")

Genauigkeit: 1.00
Durchschnittliche Genauigkeit (Kreuzvalidierung): 0.95
Standardabweichung (Kreuzvalidierung): 0.03


In [9]:
# Ein paar Baumstümpfe ansehen....
from sklearn.tree import export_text

estimators = ada_boost.estimators_

# Regeln des ersten Baumstumpfes ausgeben
tree_rules = export_text(estimators[0])
print(tree_rules)

# Gewichte der Schätzer ausgeben
estimator_weights = ada_boost.estimator_weights_
print(estimator_weights)

|--- feature_3 <= 0.80
|   |--- class: 0
|--- feature_3 >  0.80
|   |--- class: 1

[1.30173697 2.11425095 2.43619031 2.60012919 2.1051634  1.648007
 2.01418878 1.73984193 2.40930651 1.95646664 1.10766574 1.81420584
 2.00237531 1.62658126 1.65249996 1.81958301 1.56791252 1.68287394
 1.80185717 1.40866336 1.93711667 1.71029623 1.13112705 1.65064836
 1.60056285 1.73660148 1.84535426 1.54516507 1.99921959 1.55333137
 1.83027889 1.57160595 1.7916875  1.57190224 1.47226046 1.57679889
 1.63045747 1.3247744  1.49315391 1.69955819 1.68096475 1.42662638
 1.72578347 1.49842848 1.58029523 1.70140799 1.6093806  1.60114344
 1.63760348 1.61642168]


In [4]:
# Aufgabe aus dem Wohnzimmer.
# Liste der zu testenden Baumstumpfzahlen
n_estimators_list = [12, 25, 50, 75, 100]

for n_estimators in n_estimators_list:
    # AdaBoost-Klassifikator erstellen
    ada_boost = AdaBoostClassifier(n_estimators=n_estimators, learning_rate=1.0, random_state=42)
    ada_boost.estimator = base_estimator

    # Modell trainieren
    ada_boost.fit(X_train, y_train)

    # Vorhersagen treffen
    y_pred = ada_boost.predict(X_test)

    # Genauigkeit berechnen
    accuracy = accuracy_score(y_test, y_pred)
    print(f"Genauigkeit mit {n_estimators} Baumstümpfen: {accuracy:.2f}")

    # Kreuzvalidierung mit 5 Faltungen (optional)
    scores = cross_val_score(ada_boost, X, y, cv=5)
    print(f"Durchschnittliche Genauigkeit (Kreuzvalidierung) mit {n_estimators} Baumstümpfen: {scores.mean():.2f}")



Genauigkeit mit 12 Baumstümpfen: 1.00
Durchschnittliche Genauigkeit (Kreuzvalidierung) mit 12 Baumstümpfen: 0.96
Genauigkeit mit 25 Baumstümpfen: 1.00
Durchschnittliche Genauigkeit (Kreuzvalidierung) mit 25 Baumstümpfen: 0.95
Genauigkeit mit 50 Baumstümpfen: 1.00
Durchschnittliche Genauigkeit (Kreuzvalidierung) mit 50 Baumstümpfen: 0.95
Genauigkeit mit 75 Baumstümpfen: 1.00
Durchschnittliche Genauigkeit (Kreuzvalidierung) mit 75 Baumstümpfen: 0.95
Genauigkeit mit 100 Baumstümpfen: 1.00
Durchschnittliche Genauigkeit (Kreuzvalidierung) mit 100 Baumstümpfen: 0.95
