### Import

In [27]:
import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
import pandas as pd
from decision_tree import DecisionTree 

In [28]:
iris = load_iris()
X = iris.data
y = iris.target
feature_names = iris.feature_names
target_names = iris.target_names

data_df = pd.DataFrame(X, columns=feature_names)
data_df['label'] = y

train_df, test_df = train_test_split(data_df, test_size=0.2, random_state=42)

print(f"Dimensions des données d'entraînement: {train_df.shape}")
print(f"Dimensions des données de test: {test_df.shape}")
print("\nQuelques premières lignes des données d'entraînement:")
print(train_df.head())

Dimensions des données d'entraînement: (120, 5)
Dimensions des données de test: (30, 5)

Quelques premières lignes des données d'entraînement:
    sepal length (cm)  sepal width (cm)  ...  petal width (cm)  label
22                4.6               3.6  ...               0.2      0
15                5.7               4.4  ...               0.4      0
65                6.7               3.1  ...               1.4      1
11                4.8               3.4  ...               0.2      0
42                4.4               3.2  ...               0.2      0

[5 rows x 5 columns]


In [None]:
my_decision_tree = DecisionTree(feature_names=feature_names, target_names=target_names)

print("Entraînement de l'arbre de décision avec profondeur maximale...")
my_decision_tree.fit(train_df)
print("Entraînement terminé.")

Entraînement de l'arbre de décision...
Entraînement terminé.


In [30]:
print("\n--- Visualisation de l'arbre de décision entraîné ---")
my_decision_tree.print_tree()
print("------------------------------------------")


--- Visualisation de l'arbre de décision entraîné ---
Est-ce que petal width (cm) >= 1.000?
--> Vrai:
  Est-ce que petal length (cm) >= 4.800?
  --> Vrai:
    Est-ce que petal width (cm) >= 1.800?
    --> Vrai:
      Est-ce que petal length (cm) >= 4.900?
      --> Vrai:
        Prédit: {'virginica': 1.0}
      --> Faux:
        Est-ce que sepal width (cm) >= 3.200?
        --> Vrai:
          Prédit: {'versicolor': 1.0}
        --> Faux:
          Prédit: {'virginica': 1.0}
    --> Faux:
      Est-ce que petal length (cm) >= 5.600?
      --> Vrai:
        Prédit: {'virginica': 1.0}
      --> Faux:
        Est-ce que sepal width (cm) >= 2.500?
        --> Vrai:
          Est-ce que petal length (cm) >= 5.100?
          --> Vrai:
            Est-ce que petal width (cm) >= 1.600?
            --> Vrai:
              Prédit: {'versicolor': 1.0}
            --> Faux:
              Prédit: {'virginica': 1.0}
          --> Faux:
            Prédit: {'versicolor': 1.0}
        --> Faux:
     

In [31]:
from sklearn.metrics import accuracy_score, classification_report, f1_score, precision_score, recall_score

X_train = train_df.drop('label', axis=1)
y_train_true = train_df['label'].values

X_test = test_df.drop('label', axis=1)
y_test_true = test_df['label'].values

y_train_pred = my_decision_tree.predict(X_train)

y_test_pred = my_decision_tree.predict(X_test)

print("\n--- Évaluation des Performances ---")

print("\nSur l'ensemble d'entraînement:")
print(f"Exactitude (Accuracy): {accuracy_score(y_train_true, y_train_pred):.4f}")
print(f"Précision (Precision) (weighted): {precision_score(y_train_true, y_train_pred, average='weighted', zero_division=0):.4f}")
print(f"Rappel (Recall) (weighted): {recall_score(y_train_true, y_train_pred, average='weighted', zero_division=0):.4f}")
print(f"F1-Score (weighted): {f1_score(y_train_true, y_train_pred, average='weighted', zero_division=0):.4f}")

print("\nSur l'ensemble de test:")
print(f"Exactitude (Accuracy): {accuracy_score(y_test_true, y_test_pred):.4f}")
print(f"Précision (Precision) (weighted): {precision_score(y_test_true, y_test_pred, average='weighted', zero_division=0):.4f}")
print(f"Rappel (Recall) (weighted): {recall_score(y_test_true, y_test_pred, average='weighted', zero_division=0):.4f}")
print(f"F1-Score (weighted): {f1_score(y_test_true, y_test_pred, average='weighted', zero_division=0):.4f}")

print("\nRapport de classification sur l'ensemble de test:")
target_names_str = [str(name) for name in target_names]
print(classification_report(y_test_true, y_test_pred, target_names=target_names_str, zero_division=0))


--- Évaluation des Performances ---

Sur l'ensemble d'entraînement:
Exactitude (Accuracy): 1.0000
Précision (Precision) (weighted): 1.0000
Rappel (Recall) (weighted): 1.0000
F1-Score (weighted): 1.0000

Sur l'ensemble de test:
Exactitude (Accuracy): 1.0000
Précision (Precision) (weighted): 1.0000
Rappel (Recall) (weighted): 1.0000
F1-Score (weighted): 1.0000

Rapport de classification sur l'ensemble de test:
              precision    recall  f1-score   support

      setosa       1.00      1.00      1.00        10
  versicolor       1.00      1.00      1.00         9
   virginica       1.00      1.00      1.00        11

    accuracy                           1.00        30
   macro avg       1.00      1.00      1.00        30
weighted avg       1.00      1.00      1.00        30

