# Modele de Foret et importance de Features

## Importation des librairies

In [None]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.ensemble import RandomForestClassifier
import os
import numpy as np
from IPython.display import Image
from sklearn.tree import export_graphviz

## Création et Utilisation d'un arbre

### Chargement et partition des données en un dataset d'apprentissage et un dataset de test

In [None]:
iris = load_iris()
iris.feature_names=['Longueur Sépale (cm)', 'Largeur Sépale (cm)', 'Longueur Pétale (cm)', 'Largeur Pétale (cm)']
X_train, X_test, y_train, y_test = train_test_split(iris["data"], iris["target"], random_state=42)

### Apprentissage

In [None]:
rnd_clf = RandomForestClassifier(n_estimators=5, max_depth=4, n_jobs=-1, random_state=42)
rnd_clf.fit(X_train,y_train)

### Prévision pour une fleur

In [None]:
ma_nouvelle_fleur=[2,2,5, 1.5]
print('Probabilités :',np.round(rnd_clf.predict_proba([ma_nouvelle_fleur]),2))
print('N° classe :',rnd_clf.predict([ma_nouvelle_fleur]))
print('Classe :',iris.target_names[rnd_clf.predict([ma_nouvelle_fleur])])

### Calcul du score

In [None]:
y_pred = rnd_clf.predict(X_test)
print(round(accuracy_score(y_test, y_pred)*100,3), "%")

### Importance des features

In [None]:
for name, score in zip(iris["feature_names"], rnd_clf.feature_importances_):
    print('%s: %i%%' %(name, int(score*100)))

## Affichage d'un arbre du modèle de forêt  

In [None]:

export_graphviz(
        rnd_clf.estimators_[np.random.randint(rnd_clf.n_estimators)],
        out_file="iris_tree.dot",
        feature_names=iris.feature_names,
        class_names=iris.target_names,
        rounded=True,
        filled=True
    )
#appel à la fonction dot de graphwiz
os.system("dot -Tpng iris_tree.dot -o iris_tree.png")
#Affichage de l'image créée
Image("iris_tree.png")