# TD 5 : Test de comparaison de deux moyennes de deux échantillons appariés

Christelle Gonindard



**Objectifs de la séance :**
Comprendre la notion de test pour la comparaison de deux échantillons appariés.
Deux échantillons sont appariés lorsqu'ils portent sur un même échantillon, et que chacune des entités statistiques qui composent cet échantillon (les individus) a été mesurée pour les 2 variables. Ici, les **observations** ne sont pas indépendantes, puisque si les deux variables sont corrélées, le fait de connaitre la valeur pour une des 2 variables nous informe sur les valeurs probables pour les 2 variables.

Qu'il s'agisse d'un test paramétrique ou non, la logique utilisée pour gérer l'appariement est la même : le test construit une variable *Différence* entre les 2 échantillons appariés, et c'est elle qui est analysée.

En effet, 
1. si l'on considère 2 échantillons appariés $X_1$ et $X_2$, et que, *au sein de ces 2 variables*, les observations sont i.i.d. alors la différence $D_i = X_{1i} - X_{2i}$ est i.i.d.
2. l'hypothèse nulle $H_0$ $E(X_1) = E(X_2)$ est strictement équivalente à l'hypothèse nulle $H_0$ $E(D)=0$

Une fois que la variable différence $D_i$ a été construit, les tests sont *strictement* identiques que aux tests des comparaisons de moyenne que nous avons dans le fichier `TD3_notion_de_p-value_et_test_comparaison_valeur_de_référence`.


Comme pour la comparaison de deux échantillons indépendants, le choix du test, paramétrique ou non lors de la comparaison de deux échantillons appariés, va dépendre des conditions d’application.
1. si l’effectif de l’échantillon est $\geq 30$ : on applique le test de Student pour données appariées paramétrique
2. si l’effectif de l’échantillon est $< 30$, deux possibilités :
    - si les données suivent une loi normale : test de Student pour données appariées <br>
    à la différence du test de Student pour données non-appariées, celui pour données appariées ne suppose pas l'égalité des variances, car c'est la différence entre les variables qui est analysée.
    - si la normalité n’est pas vérifiée : test de Wilcoxon (non-paramétrique)

## 1. Test paramétrique de Student pour données appariées 

### 1.1. Présentation des données

Ce jeu de données contient le résultat des taux sériques d’une hormone, exprimées en ng/mL, obtenus sur $n=15$ prélèvements sanguins, à l’aide de 2 techniques de dosage A et B.

**La question posée est la suivante : Les moyenne des deux dosages diffèrent-elles ?**

Les données sont contenues dans le fichier : `data_dosage_serique.txt`.

1. Chargez les données
2. Présentez les données
3. Décrivez les échantillons

Afin d'observer les données appariées, je vous propose la fonction `pairedBoxplot` dont le code est ci-dessous.

In [1]:
pairedBoxplot = function(tab){
    boxplot(tab)
    for(j in 2:ncol(tab)){
        segments(x0 = j-1, x1 = j,y0 = tab[,j-1],y1 = tab[,j], )
        points(rep(j-1, nrow(tab)),tab[,j-1],cex=0.7)
        points(rep(j  , nrow(tab)),tab[,j  ],cex=0.7)
    }
}

In [2]:
dosage=read.table("data/data_dosage_serique.txt",h=T)

head(dosage)

Unnamed: 0_level_0,id,A,B
Unnamed: 0_level_1,<int>,<int>,<int>
1,1,22,26
2,2,27,24
3,3,12,14
4,4,33,39
5,5,14,17
6,6,52,61




Question : Sur le boxplot que vous venez de tracer, qu'indique la moustache du haut, la moustache du bas.

Réponse : <br>


### 1.2. Principe du test de Student pour données appariées

Dans le cas présent, si les deux techniques sont identiques, la différence $d$ entre les deux dosages devrait être égale à 0, ce qui revient encore à dire que la moyenne des différences $\mu_d$ devrait également être égale à 0, ce sera donc notre hypothèse $H_0$.
Le principe de ce test est le suivant : il va vérifier si $\mu_d$ est suffisamment éloigné de 0 avec un
certain risque d’erreur $\alpha$ pour que les deux techniques soient considérées comme significativement
différentes.
Le test calcule donc la différence entre $\mu_d$ et 0 et divise par son écart-type pour normaliser :

 Statistique observée $S_{obs} = \frac{\mu_d - 0}{\frac{S_d}{\sqrt {n}}}$
 
### 1.3. Hypothèse du test 

$H_0$ : les moyennes des dosages $A$ et $B$ sont égales, ce qui revient à $E(d) = 0$. <br>
$H_1$ : les moyennes des dosages $A$ et $B$ différent, ce qui revient à $E(d) \neq 0$.

### 1.4. Condition d'application

- aucune si $n \ge 30$ (enfin uniquement *individus* indépendants)
- si $n < 30$, il faut que la variable aléatoire différence $d$ soit distribuée normalement.


Dans ce cas, l’important avant de réaliser ce test est de vérifier que la différence entre les deux dosages suit un loi normale, car l'effectif de l'échantillon est de 15.

Nous allons appliquer le test de Shapiro sur la différence entre $A$ et $B$ : <br>
$H_0$ : la distribution de la différence suit une loi normale.<br>
$H_1$ : la distribution de la différence ne suit pas une loi normale.

**Conclusion** : 

### 1.5. Réalisation du test de Student pour données appariées

**Conclusion** : 

## 2. Test non paramétrique de Wilcoxon

### 2.1 Principe du test

Comme le test de Mann-Whitney, il travaille sur des rangs. Les variables (nommés $A$ et $B$) étant appariés, le test procède schématiquement ainsi :
1. Il calcule pour chaque individu la différence entre sa valeur dans la variable $A$ et sa valeur dans la variable $B$
2. il calcule le rang des différences en valeur absolue
3. il calcule la somme des rangs qui ont une différence positive ($R^+$) et la somme des rangs qui ont une valeur négative ($R^-$)
4. puis il teste si ces deux sommes sont significativement différentes1

<img src="Figures/Wilcox.png" />


### 2.2 Exemple : Comparaison de l’effet de deux drogues

On veut tester les effets de deux drogues sur le sommeil, l’hiocyamine et l’hyoscine. L’une
des deux drogues est-elle un somnifère plus puissant au seuil 5% ? Les drogues ont été administrées
à 10 patients. On mesure alors le temps pendant lequel chaque patient a dormi sans drogue
et après l’administration de 0.6 mg de l’une puis de l’autre drogue. Un délai d’une semaine est
laissé entre chaque mesure afin d’éliminer complètement l’effet des drogues. Les valeurs données
dans le tableau ci-dessous correspondent au temps supplémentaire dormi en présence de la
drogue par rapport au temps de sommeil habituel.

Comparez l’effet des deux drogues sur le sommeil.

Les données sont contenues dans le fichier `data_somnifere.txt`.

1. Chargement des données

2. Description des données :

D’après cette analyse descriptive, aucune valeur extrême aberrante ne peut être mise en évidence. On remarque que la différence entre les deux somnifères est toujours négative (le maximum de la différence est égal à $0$). Il semblerait donc que Hyoscine soit plus efficace que Hiocyamine. Toutefois, il est nécessaire de vérifier si cette différence est significative. C'était le but de l'expérience.
Les échantillons sont de petites tailles, respectivement 10 patients.

3. Vérification de la normalité de $d$

Il apparait également que la différence entre les deux échantillons ne suit pas une loi normale
(*p*-value du test de Shapiro < 0.05). Le test de Student pour comparaison de deux échantillons appariés ne peut donc pas être appliqué.

Pour cela, nous allons réaliser le test non paramétrique de Wilcoxon pour petits échantillons.

4. Réalisons le test

On souhaite vérifier si l’Hyoscine est plus efficace que l’Hiocyamine, on va donc faire un
test unilatéral : <br>
$H_0$ : les deux somnifères ont une efficacité identique <br>
$H_1$ : les deux somnifères n'ont pas la même efficacité

**Remarque : pour le test de Wilcoxon, il faut bien utiliser l’instruction wilcox.test, elle
permet la réalisation du test de wilcoxon pour données appariées en précisant l’instruction
paired = T)**

*En conclusion* : 

## 3. Exercices d'application

### Exercice 1

Le dorbienal est un nouveau somnifère. Après avoir démontré la non-dangerosité de leur
molécule, le laboratoire espère prouver son efficacité. Pour cela, il lance un test sur une cohorte
de 16 personnes. Le protocole est le suivant :
1. Le temps de sommeil des 16 personnes est mesuré tous les jours pendant une semaine (période témoin).
2. Les patients sont ensuite traités pendant 15 jours avec le dorbienal.
3. Le traitement est prolongé une semaine supplémentaire pendant laquelle leur temps de sommeil est nouveau mesuré (période de traitement).

Pendant toute l’expérience, on demande aux personnes de bien respecter une heure de coucher
constante à 23h.
- Question 1 : Ce protocole vous semble-t-il approprié à l’étude de l’efficacité du dorbienal, justifiez ?
- Question 2 : Quelle caractéristique principale à ce jeu de données et quel est l’avantage principal de ce type de jeu de données ?
- Question 3 : Le dorbienal est-il efficace ? Vous répondrez pour un seuil de 1% et 5% et concluez.

Les données sont contenues dans le fichier *data_dorbienal.txt*


### Exercice 2 : 

Chez quinze sujets, on mesure la fréquence cardiaque (FC) avant et après les avoir soumis à
une épreuve de deux minutes consistant à leur faire entendre des bruits d’intensité supérieure à
80 décibels. 


Les résultats de cette expérience, contenus dans le fichier `data_exercice_2.txt`, permettent-ils de conclure au risque d'erreur $\alpha$=5% et au risque 1%, à un effet de l’épreuve sonore sur la fréquence cardiaque ?

