# Calcul du coefficient Kappa de Cohen avec Scikt-Learn

In [23]:
import numpy as np
import pandas as pd
from sklearn.metrics import confusion_matrix, cohen_kappa_score

In [5]:
# Signature de la fonction: cohen_kappa_score
# sklearn.metrics.cohen_kappa_score(y1, y2, *, labels=None, weights=None, sample_weight=None)

# Exemple 1

## Exemple précédent avec Scikit-Learn

In [24]:
actuals = np.array([4, 4, 3, 4, 4, 4, 1, 1, 2, 1])
preds   = np.array([0, 2, 1, 0, 0, 0, 1, 1, 2, 1])

In [25]:
# Calcul du Coefficient Kappa de Cohen 
print("Cohen_Kappa_Score: %.4f" % cohen_kappa_score(actuals, preds))
print("Linear_Cohen_Kappa_Score: %.4f" % cohen_kappa_score(actuals, preds, weights='linear'))
print("Quadratic_Cohen_Kappa_Score: %.4f" % cohen_kappa_score(actuals, preds, weights='quadratic'))

Cohen_Kappa_Score: 0.3023
Linear_Cohen_Kappa_Score: 0.0566
Quadratic_Cohen_Kappa_Score: -0.1392


In [15]:
# Même exemple avec des Jugement en accord à 100%

actuals = np.array([4, 4, 3, 4, 4, 4, 1, 1, 2, 0])
preds   = np.array([4, 4, 3, 4, 4, 4, 1, 1, 2, 0])
print("Quadratic_Cohen_Kappa_Score: %.4f" % cohen_kappa_score(actuals, preds, weights='quadratic'))

Quadratic_Cohen_Kappa_Score: 1.0000


# Exemple 2

In [19]:
rater1 = ['yes', 'no', 'yes', 'yes', 'yes', 'yes', 'no', 'yes', 'yes']
rater2 = ['yes', 'no', 'no', 'yes', 'yes', 'yes', 'yes', 'yes', 'yes']

### Calcul manuel

In [3]:
#Confusion matrix

![image.png](attachment:66dda43e-99cb-47a5-8e14-84265c9e2a73.png)

- Observed agreement = (6 + 1) / 10 = 0.7
- Chance agreement   = probability of randomly saying yes (P_yes) + probability of randomly saying no (P_no)
- P_yes              = (6 + 1) / 10 * (6 + 1) / 10 = 0.49
- P_no               = (1 + 1) / 10 * (1 + 1) / 10 = 0.04
- Chance agreement   = 0.49 + 0.04 = 0.53

**kappa = 1 - (1 - 0.7) / (1 - 0.53) = 0.36**

### Calcul avec Scikit-Learn

In [20]:
# Affichage du Tableau de Contingence
from sklearn.metrics.cluster import contingency_matrix
contingency_matrix(rater1,rater2)

array([[1, 1],
       [1, 6]])

In [21]:
# Calcul du Coefficient Kappa de Cohen
print("Cohen_Kappa_Score: %.2f" % cohen_kappa_score(rater1, rater2))

Cohen_Kappa_Score: 0.36


# Exemple 3: Deux Observations entre deux temps t1 et t2

**Soit les deux variables appariées suivantes:**

![image.png](attachment:4211ed9f-6461-4567-942f-c0558fb7a9e7.png)

**Le tableau des effectifs croisés entre les deux variables appariées:**

![image.png](attachment:ac13e858-03b7-40c0-aef1-fed1b4ebf6f2.png)

*Nous avons donc 20 observations, si nous décomposons la formule de calcul du coefficient Kappa de Cohen nous trouvons:*

![image.png](attachment:ef6ae295-4cbc-4bdd-8225-d08b95d0de9f.png)

**En nous reportant à la table de Landis et Koch nous en concluant quand à un accord très faible entre les observateurs des deux temps.**

In [22]:
X_t1 = np.array([1,2,....])
X_t2   = np.array([2,1......])

Cohen_Kappa_Score: 0.36


In [None]:
# Calcul du Coefficient Kappa de Cohen
print("Cohen_Kappa_Score: %.2f" % cohen_kappa_score(X_t1, X_t2))