In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, classification_report

# 1. Charger les données
file_path = 'BD_ML_1target.xlsx'  # ← à adapter
df = pd.read_excel(file_path)

# 2. Séparer X et y (la dernière colonne est la cible)
X = df.iloc[:, :-1]  # toutes les colonnes sauf la dernière
y = df.iloc[:, -1]   # dernière colonne

# 3. Diviser en train/test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 4. Créer et entraîner le modèle
clf = DecisionTreeClassifier(
    max_depth=None,               # profondeur maximale de l’arbre
    min_samples_split=2,         # nombre minimum d’échantillons pour un split
    criterion='gini',            # fonction d’impureté
    random_state=42
)
clf.fit(X_train, y_train)

# 5. Prédictions
y_pred = clf.predict(X_test)

# 6. Évaluation
accuracy = accuracy_score(y_test, y_pred)
precision = precision_score(y_test, y_pred, average='weighted')  # 'weighted' gère les classes déséquilibrées
recall = recall_score(y_test, y_pred, average='weighted')
f1 = f1_score(y_test, y_pred, average='weighted')

# Affichage des résultats
print("Accuracy:", accuracy)
print("Precision:", precision)
print("Recall:", recall)
print("F1-score:", f1)

# Rapport détaillé par classe
print("\nClassification Report:\n", classification_report(y_test, y_pred))


Accuracy: 0.9705882352941176
Precision: 0.972549019607843
Recall: 0.9705882352941176
F1-score: 0.9707182607791127

Classification Report:
               precision    recall  f1-score   support

           0       1.00      0.95      0.97        20
           1       0.93      1.00      0.97        14

    accuracy                           0.97        34
   macro avg       0.97      0.97      0.97        34
weighted avg       0.97      0.97      0.97        34

