# Chapitre 5 : Evaluation d'un modèle (Exemples)
Email : <a href='mailto:madani.a@ucd.ac.ma'>madani.a@ucd.ac.ma</a>
<img src='images/robot.png'>

Nous allons commencer par importer le dataset Iris que nous allons utiliser dans les exemples de ce chapitre

In [5]:
# Importer load_iris() permettant de charger le dataset Iris
from sklearn.datasets import load_iris
# Charger le dataset Iris
iris = load_iris()
# X : données
X = iris.data
# y : classes
y = iris.target
#Vérifier la structure de X et y
print(X.shape, y.shape)

(150, 4) (150,)


## Procédure d'évaluation  #1: Entraîner et tester sur le dataset entier

Cette procédure consiste à :
<ul>
<li>Entraîner le modèle sur <b>le dataset en entier</b></li>
<li>Tester le modèle sur <b>le même dataset</b>, et évaluer à quel point nous avons <b>bien comparé</b> les valeurs de <b>classess prédites</b> avec les vraies valeurs de réponse.</li>
</ul>

### Exemple : Cas de la regression logistique

In [6]:
# importer la classe LogisticRegression
from sklearn.linear_model import LogisticRegression

# instantier le modèle (en utilisant les valeurs par défaut des paramètres)
logreg = LogisticRegression()

# entraîner le modèle en utilisant les données du dataset
logreg.fit(X, y)

# predire les valeurs des classes pour les observations contenu dans X
logreg.predict(X)

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 1, 1,
       1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 1, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2])

In [7]:
# stocker les valeurs des classes prédites
y_pred = logreg.predict(X)

# combien de prédictions ont été générées
len(y_pred)

150

### Précision de classification :
<ul>
<li>Donne la <b>proportion de prédictions correctes</b></li>
<li>C'est une <b>mesure d'évaluation</b> commune pour les problèmes de classification</li>
</ul>

In [8]:
# calculer la précision de la classification pour le modèle de la regression logistique
from sklearn import metrics
print(metrics.accuracy_score(y, y_pred))

0.96


## Exemple : Cas de KNN avec différentes valeurs de K

### K=5

In [9]:
from sklearn.neighbors import KNeighborsClassifier
knn = KNeighborsClassifier(n_neighbors=5)
knn.fit(X, y)
y_pred = knn.predict(X)
print(metrics.accuracy_score(y, y_pred))

0.966666666667


### K=1

In [10]:
knn = KNeighborsClassifier(n_neighbors=1)
knn.fit(X, y)
y_pred = knn.predict(X)
print(metrics.accuracy_score(y, y_pred))

1.0


## Procédure d'évaluation #2 : Train/Test Split
<ul>
<li>Diviser l'ensemble de données en deux parties: un ensemble d'entraînement et un ensemble de tests.</li>
<li>Entraînez le modèle sur l'ensemble d'entraînement.</li>
<li>Testez le modèle sur l'ensemble de tests et évaluez notre performance.</li>
</ul>

In [11]:
# afficher les structures de X et y
print(X.shape)
print(y.shape)

(150, 4)
(150,)


In [20]:
# étape 1: diviser X et y en deux sous-ensembles : sous-ensemble d'entrainement et sous-ensemble de test
from sklearn.cross_validation import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.4, random_state=4)

<img src="images/train_test_split.png">

Qu'est-ce que nous avons accompli ?
<ul>
<li>Le modèle peut être entraîné et testé sur différentes données
<li>Les valeurs de réponse sont connues pour l'ensemble de test, et donc les prédictions peuvent être évaluées
</ul>

In [13]:
# afficher les structures des nouveaux objets X 
print(X_train.shape)
print(X_test.shape)

(90, 4)
(60, 4)


In [14]:
# afficher les structures des nouveaux objets y
print(y_train.shape)
print(y_test.shape)

(90,)
(60,)


In [15]:
# étpage 2: entraîner le modèle sur l'ensemble d'entraînement
logreg = LogisticRegression()
logreg.fit(X_train, y_train)

LogisticRegression(C=1.0, class_weight=None, dual=False, fit_intercept=True,
          intercept_scaling=1, max_iter=100, multi_class='ovr', n_jobs=1,
          penalty='l2', random_state=None, solver='liblinear', tol=0.0001,
          verbose=0, warm_start=False)

In [16]:
# étape 3: faire des prédictions sur l'ensemble de test
y_pred = logreg.predict(X_test)

# comparer les valeurs des classes actuelles (y_test) avec les valeurs des classes prédites (y_pred)
print(metrics.accuracy_score(y_test, y_pred))

0.95


Essayons avec KNN pour K=5:

In [17]:
knn = KNeighborsClassifier(n_neighbors=5)
knn.fit(X_train, y_train)
y_pred = knn.predict(X_test)
print(metrics.accuracy_score(y_test, y_pred))

0.966666666667


Essayons avec KNN pour K=1:

In [18]:
knn = KNeighborsClassifier(n_neighbors=1)
knn.fit(X_train, y_train)
y_pred = knn.predict(X_test)
print(metrics.accuracy_score(y_test, y_pred))

0.95


Comment peut-on définir la meilleure valeur de K?

In [23]:
# Essayer pour K=1 à K=25 et enregistrer les précisions des tests
k_range = list(range(1, 26))
scores = []
for k in k_range:
    knn = KNeighborsClassifier(n_neighbors=k)
    knn.fit(X_train, y_train)
    y_pred = knn.predict(X_test)
    #scores.append(metrics.accuracy_score(y_test, y_pred))
    print("Pour k =",k," Score =",metrics.accuracy_score(y_test, y_pred))

Pour k = 1  Score = 0.95
Pour k = 2  Score = 0.95
Pour k = 3  Score = 0.966666666667
Pour k = 4  Score = 0.966666666667
Pour k = 5  Score = 0.966666666667
Pour k = 6  Score = 0.983333333333
Pour k = 7  Score = 0.983333333333
Pour k = 8  Score = 0.983333333333
Pour k = 9  Score = 0.983333333333
Pour k = 10  Score = 0.983333333333
Pour k = 11  Score = 0.983333333333
Pour k = 12  Score = 0.983333333333
Pour k = 13  Score = 0.983333333333
Pour k = 14  Score = 0.983333333333
Pour k = 15  Score = 0.983333333333
Pour k = 16  Score = 0.983333333333
Pour k = 17  Score = 0.983333333333
Pour k = 18  Score = 0.966666666667
Pour k = 19  Score = 0.983333333333
Pour k = 20  Score = 0.966666666667
Pour k = 21  Score = 0.966666666667
Pour k = 22  Score = 0.966666666667
Pour k = 23  Score = 0.966666666667
Pour k = 24  Score = 0.95
Pour k = 25  Score = 0.95
