# **3.5.Arbres de décision**

In [None]:
# Importation des bibliothèques
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.tree import DecisionTreeClassifier, plot_tree
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, fbeta_score
# Chargement des données d'apprentissage à partir de la feuille Excel
df_train = pd.read_excel('/content/Exemple_3.2.xlsx', sheet_name='Train')
X_train = df_train[['X1', 'X2', 'X3']]
y_train = df_train['Y']
# Création du modèle d'arbre de décision avec le critère GINI
dt_model = DecisionTreeClassifier(criterion='gini')
dt_model.fit(X_train, y_train)
# Visualisation de l'arbre de décision
plt.figure(figsize=(6,12))
plot_tree(dt_model, feature_names=X_train.columns, filled=True, class_names=True)
plt.title("Arbre de Décision (Sans Normalisation)")
plt.show()
# Chargement des données de test à partir de la feuille Excel
df_test = pd.read_excel('/content/Exemple_3.2.xlsx', sheet_name='Test')
X_test = df_test[['X1', 'X2', 'X3']]
y_test = df_test['Y']
# Prédiction sur les données de test
y_pred = dt_model.predict(X_test)
# Calcul des métriques d'évaluation
accuracy = accuracy_score(y_test, y_pred)
precision = precision_score(y_test, y_pred, average='weighted')
recall = recall_score(y_test, y_pred, average='weighted')
f1 = f1_score(y_test, y_pred, average='weighted')
f2 = fbeta_score(y_test, y_pred, beta=2, average='weighted')
# Affichage des métriques d'évaluation
print("Accuracy:", accuracy)
print("Precision:", precision)
print("Recall:", recall)
print("F1-score:", f1)
print("F2-score:", f2)

# **3.6.Forêt aléatoire**

In [None]:
# Importation des bibliothèques
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, fbeta_score
# Chargement des données d'apprentissage à partir de la feuille Excel
df_train = pd.read_excel('/content/Exemple_3.2.xlsx', sheet_name='Train')
X_train = df_train[['X1', 'X2', 'X3', 'X4']]
y_train = df_train['Y']
# Création du modèle de forêt aléatoire
rf_model = RandomForestClassifier(n_estimators=200, criterion='gini', random_state=60)
rf_model.fit(X_train, y_train)
# Importance des variables
feature_importances = rf_model.feature_importances_
print("Importances des caractéristiques :", dict(zip(X_train.columns, feature_importances)))
# Chargement des données de test à partir de la feuille Excel
df_test = pd.read_excel('/content/Exemple_3.2.xlsx', sheet_name='Test')
X_test = df_test[['X1', 'X2', 'X3', 'X4']]
y_test = df_test['Y']
# Prédiction sur les données de test
y_pred = rf_model.predict(X_test)
# Calcul des métriques d'évaluation
accuracy = accuracy_score(y_test, y_pred)
precision = precision_score(y_test, y_pred, average='weighted')
recall = recall_score(y_test, y_pred, average='weighted')
f1 = f1_score(y_test, y_pred, average='weighted')
f2 = fbeta_score(y_test, y_pred, beta=2, average='weighted')
# Affichage des métriques d'évaluation
print("\nÉvaluation sur les données de test :")
print(f"Accuracy: {accuracy:.2f}")
print(f"Precision: {precision:.2f}")
print(f"Recall: {recall:.2f}")
print(f"F1-score: {f1:.2f}")
print(f"F2-score: {f2:.2f}")
# Importance des Caractéristiques dans la Forêt Aléatoire
plt.bar(X_train.columns, feature_importances)
plt.xlabel('Caractéristiques')
plt.ylabel('Importance')
plt.title('Importance des Caractéristiques dans la Forêt Aléatoire')
plt.show()
