# Evaluation des modèles

## I. Classement


### I.1. Classement binaire

In [1]:
# Les classes réelles
Y_true = [0, 0, 0, 0, 1, 1, 1, 1, 1, 1]
# Les classes que le système a prédit
Y_pred = [0, 0, 0, 1, 1, 1, 1, 0, 0, 0]

In [2]:
# La matrice de confusion
from sklearn.metrics import confusion_matrix
print(confusion_matrix(Y_true, Y_pred))

[[3 1]
 [3 3]]


In [3]:
# L'exactitude (Accuracy)
from sklearn.metrics import accuracy_score
accuracy_score(Y_true, Y_pred)

0.6

In [4]:
# La precision
from sklearn.metrics import precision_score
precision_score(Y_true, Y_pred)

0.75

In [5]:
# La precision
from sklearn.metrics import recall_score
recall_score(Y_true, Y_pred)

0.5

In [6]:
# F1-score  = moyenne harmonique entre le rappel et la précision 
from sklearn.metrics import f1_score
f1_score(Y_true, Y_pred)

0.6

In [7]:
# F_beta-score  ; 
# si beta < 1 : plus d'importance à la précision
# si beta > 1 : plus d'importance au rappel
# si beta = 1 : F1-score
from sklearn.metrics import fbeta_score
fbeta_score(Y_true, Y_pred, beta=0.5)

0.6818181818181818

In [8]:
# Corrélation de Matthews
from sklearn.metrics import matthews_corrcoef

# Mieux que le random
matthews_corrcoef(Y_true, Y_pred)

0.25

In [9]:
# Rapport de classification
from sklearn.metrics import classification_report
print(classification_report(Y_true, Y_pred))

              precision    recall  f1-score   support

           0       0.50      0.75      0.60         4
           1       0.75      0.50      0.60         6

    accuracy                           0.60        10
   macro avg       0.62      0.62      0.60        10
weighted avg       0.65      0.60      0.60        10



### I.2. Classement multiclasses

In [10]:
Y_true = [0, 0, 0, 1, 1, 1, 1, 1, 2, 2]
Y_pred = [0, 0, 2, 0, 1, 1, 2, 2, 0, 2]

In [11]:
# Rapport de classification 
# target_names : les noms des différentes classes
# zero_division : s'il y a une division sur 0, on prend 0 ou 1
from sklearn.metrics import classification_report
print(classification_report(Y_true, Y_pred, target_names=['cls0', 'cls1', 'cls2'], zero_division=0))

              precision    recall  f1-score   support

        cls0       0.50      0.67      0.57         3
        cls1       1.00      0.40      0.57         5
        cls2       0.25      0.50      0.33         2

    accuracy                           0.50        10
   macro avg       0.58      0.52      0.49        10
weighted avg       0.70      0.50      0.52        10



In [12]:
# rappel avec micro-average
print('R-micro = ', recall_score(Y_true, Y_pred, average='micro'))
# rappel avec macro-average
print('R-macro = ', recall_score(Y_true, Y_pred, average='macro'))
# rappel avec weighted-average
print('R-weighted = ', recall_score(Y_true, Y_pred, average='weighted'))

R-micro =  0.5
R-macro =  0.5222222222222223
R-weighted =  0.5


In [13]:
confusion_matrix(Y_true, Y_pred)

array([[2, 0, 1],
       [1, 2, 2],
       [1, 0, 1]])

## II. Régression

In [14]:
Y_true = [1.0, 2.0, 3.0, 4.0]
Y_pred = [1.1, 2.1, 3.1, 7.0]

In [15]:
# MSE
from sklearn.metrics import mean_squared_error
mean_squared_error(Y_true, Y_pred)

2.2575

In [16]:
# RMSE
import math
from sklearn.metrics import mean_squared_error
math.sqrt(mean_squared_error(Y_true, Y_pred))

1.502497920131672

In [17]:
# Si on ne considère pas le dernier échantillon (valeur abbérante)
mean_squared_error(Y_true[:-1], Y_pred[:-1])

0.010000000000000018

In [18]:
# MAE
from sklearn.metrics import mean_absolute_error
mean_absolute_error(Y_true, Y_pred)

0.8250000000000001

In [19]:
# Si on ne considère pas le dernier échantillon (valeur abbérante)
mean_absolute_error(Y_true[:-1], Y_pred[:-1])

0.10000000000000009

## III. Regroupement (Clustering)

In [20]:
# Rand index 
# RI = (nombre des pairs dans le meme groupes pour systeme et reeel) / (nombre des pairs)
from sklearn.metrics.cluster import rand_score
# Ici, meme si nous inversons les labels c'est la meme chose
rand_score([0, 0, 1, 1], [1, 1, 0, 0])

1.0

In [21]:
rand_score([1, 1, 0, 0], [1, 1, 0, 0])

1.0

In [22]:
# Nombre des différents pairs est 6 
# Le premier 0 est similaire au deuxième et différent des deux derniers ==> 3
# Le deuxième 0 est différent aux deux derniers ==> 2
# Donc RI = 5/6
rand_score([0, 0, 1, 2], [0, 0, 1, 1])

0.8333333333333334

In [23]:
# Silouette
# un exemple


X = [
    [1, 1],
    [1, 2],
    [2, 1],
    [2, 2], 
    [4, 3], 
    
    [4, 4],
    [5, 3],
    [5, 4]
]
Y = [0] * 5 + [1] * 3

X, Y

([[1, 1], [1, 2], [2, 1], [2, 2], [4, 3], [4, 4], [5, 3], [5, 4]],
 [0, 0, 0, 0, 0, 1, 1, 1])

In [24]:
# Silouette de chaque echantillon
from sklearn.metrics import silhouette_samples

# 0 veut dire l'échantillon est dans des clusters chevauchés
# -1 veut dire que l'échantillon est dans un cluster érroné
# +1 veut dire que l'échantillon est dans un bon cluster
silhouette_samples(X, Y)

array([ 0.61612035,  0.59573378,  0.59122704,  0.55839953, -0.61526707,
        0.60506042,  0.63114906,  0.7331133 ])

In [25]:
# Silouette moyenne
from sklearn.metrics import silhouette_score

silhouette_score(X, Y)

0.4644420527977074