In [1]:
import numpy as np
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
import matplotlib.pyplot as plt

In [2]:
# Chargement du jeu de données Iris
iris_data = load_iris()
X_data = iris_data.data  # Les caractéristiques (longueur/largeur des sépales et pétales)
y_data = iris_data.target  # Les labels (espèce des fleurs)

In [3]:
# Affichage des caractéristiques et des classes
print("Caractéristiques :", iris_data.feature_names)
print("Classes :", iris_data.target_names)

Caractéristiques : ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
Classes : ['setosa' 'versicolor' 'virginica']


In [4]:
# Séparation des données en jeu d'entraînement et jeu de test
X_train_data, X_test_data, y_train_data, y_test_data = train_test_split(
    X_data, y_data, test_size=0.2, random_state=42
)

In [5]:
# Création du modèle Random Forest
random_forest_model = RandomForestClassifier(
    n_estimators=100,  # Nombre d'arbres dans la forêt
    criterion='gini',  # Critère d'impureté
    max_depth=4,  # Profondeur maximale des arbres
    random_state=42
)


In [6]:
# Entraînement du modèle
random_forest_model.fit(X_train_data, y_train_data)

# Évaluation du modèle sur les données de test
y_pred_data = random_forest_model.predict(X_test_data)
test_accuracy = accuracy_score(y_test_data, y_pred_data)
print("Précision sur le test :", test_accuracy)

Précision sur le test : 1.0


In [7]:
# Affichage de l'importance des caractéristiques
feature_importances = random_forest_model.feature_importances_
for feature_name, importance_score in zip(iris_data.feature_names, feature_importances):
    print(f"{feature_name} : {importance_score:.4f}")

sepal length (cm) : 0.1051
sepal width (cm) : 0.0212
petal length (cm) : 0.4501
petal width (cm) : 0.4236


In [8]:
# Prédiction sur une nouvelle observation
new_flower = [[5.9, 3.0, 5.1, 1.8]]  # Les caractéristiques d'une nouvelle fleur
predicted_class = random_forest_model.predict(new_flower)
print("Classe prédite pour la nouvelle fleur :", iris_data.target_names[predicted_class[0]])

Classe prédite pour la nouvelle fleur : virginica
