# Analytique de l'apprentissage

# Signification statistique

## Test A/B

Carnet web IPython (Jupyter Notebook) en complément du **«Chapitre 6 – Vers une IENA pilotée par les données » ** du livre : **« Vers une nouvelle ingénierie des environnements numériques d’apprentissage »**, auteurs du chapitre, Claude Coulombe & Valéry Psyché, éditeurs: Josiane Basque, Gilbert Paquette, licence code source libre MIT

### Utilisation des bibliothèques Python Pandas (manipulation des données), numpy (calcul numérique), statistiques (scipy) et matplotlib (affichage graphique)

In [33]:
# -*- coding: utf-8 -*-

import pandas as pd
import numpy as np
import scipy.stats
from matplotlib import pyplot as plt

## Test de signification statistique - moyenne

Inspiré de https://rosettacode.org/wiki/Welch%27s_t-test#Using_NumPy_.26_SciPy

In [34]:
# Inspiré de https://rosettacode.org/wiki/Welch%27s_t-test#Using_NumPy_.26_SciPy
# Statistical Significance Tests

def Welch_Ttest(taille_A, taille_B, moyenne_A, moyenne_B, var_A, var_B):
    print("*** Test T de Welch ***")
    signifiant = False
    alpha = 0.05
    moyenne_B_sup = True
    print('Moyenne A = ',moyenne_A)
    print('Moyenne B = ',moyenne_B)
    if moyenne_B >= moyenne_A:
        print("Hypothèse que la moyenne B est supérieure à la moyenne A") 
    else:
        print("Hypothèse que la moyenne B est inférieure à la moyenne A") 
        moyenne_B_sup=False
    t_score = (moyenne_B - moyenne_A)/np.sqrt(var_A/taille_A + var_B/taille_B)
    df = (var_A/taille_A + var_B/taille_B)**2 / (var_A**2/(taille_A**2 * (taille_A - 1)) + var_B**2 / (taille_B**2 * (taille_B - 1)))
    print("df = " + str(df))
    p_value = 2 * scipy.stats.t.cdf(-abs(t_score), df)
    print("t = " + str(t_score))
    print("p = " + str(p_value))
    if moyenne_B_sup:
        if (t_score > 0) and ((p_value/2) < alpha):
            print("*** La différence EST statistiquement significative. ***")
            signifiant = True
        else:
            print("*** La différence N'EST PAS statistiquement significative. ***")
    else:
        if (t_score < 0) and ((p_value/2) < alpha):
            print("*** La différence EST statistiquement significative. ***")
            signifiant = True
        else:
            print("*** La différence N'EST PAS statistiquement significative. ***")
    return signifiant

In [35]:
A = [3.0, 4.0, 1.0, 2.1]
taille_A = len(A)
moyenne_A = np.mean(np.array(A))
var_A = np.var(np.array(A), ddof=1)
B = [490.2, 340.0, 433.9]
taille_B = len(B)
moyenne_B = np.mean(np.array(B))
var_B = np.var(np.array(B), ddof=1)
Welch_Ttest(taille_A, taille_B, moyenne_A, moyenne_B, var_A, var_B)

*** Test T de Welch ***
Moyenne A =  2.525
Moyenne B =  421.3666666666666
Hypothèse que la moyenne B est supérieure à la moyenne A
df = 2.0008523488562844
t = 9.559497721932658
p = 0.01075156114978449
*** La différence EST statistiquement significative. ***


True

In [36]:
A = [490.2, 340.0, 433.9]
taille_A = len(A)
moyenne_A = np.mean(np.array(A))
var_A = np.var(np.array(A), ddof=1)
B = [3.0, 4.0, 1.0, 2.1]
taille_B = len(B)
moyenne_B = np.mean(np.array(B))
var_B = np.var(np.array(B), ddof=1)
Welch_Ttest(taille_A, taille_B, moyenne_A, moyenne_B, var_A, var_B)

*** Test T de Welch ***
Moyenne A =  421.3666666666666
Moyenne B =  2.525
Hypothèse que la moyenne B est inférieure à la moyenne A
df = 2.0008523488562844
t = -9.559497721932658
p = 0.01075156114978449
*** La différence EST statistiquement significative. ***


True

In [37]:
taille_A = 100
moyenne_A = 75
var_A = 30**2
taille_B = 100
moyenne_B = 80
var_B = 30**2
Welch_Ttest(taille_A, taille_B, moyenne_A, moyenne_B, var_A, var_B)

*** Test T de Welch ***
Moyenne A =  75
Moyenne B =  80
Hypothèse que la moyenne B est supérieure à la moyenne A
df = 198.0
t = 1.1785113019775793
p = 0.24000719258136277
*** La différence N'EST PAS statistiquement significative. ***


False

In [38]:
size_A = 500
mean_A = 75
var_A = 30**2
size_B = 500
mean_B = 80
var_B = 40**2
Welch_Ttest(size_A, size_B, mean_A, mean_B, var_A, var_B)

*** Test T de Welch ***
Moyenne A =  75
Moyenne B =  80
Hypothèse que la moyenne B est supérieure à la moyenne A
df = 925.4451038575669
t = 2.23606797749979
p = 0.025584996125442044
*** La différence EST statistiquement significative. ***


True

## Test A/B 

* Page A visitée 100 fois avec 4 clics
* Page B visitée 40 fois avec 2 clics

La page B est-elle meilleure que la page A?


In [39]:
size_A = 100
mean_A = 4/100
var_A = 0.01
size_B = 40
mean_B = 2/40
var_B = 0.01
Welch_Ttest(size_A, size_B, mean_A, mean_B, var_A, var_B)

*** Test T de Welch ***
Moyenne A =  0.04
Moyenne B =  0.05
Hypothèse que la moyenne B est supérieure à la moyenne A
df = 71.90763968072976
t = 0.5345224838248488
p = 0.5946290087206201
*** La différence N'EST PAS statistiquement significative. ***


False

On obtient les mêmes taux de clics mais cette fois le nombre de visites est de 1000 pour les deux pages A et B.

* Page A visitée 1000 fois avec 40 clics
* Page B visitée 1000 fois avec 50 clics

In [40]:
size_A = 1000
mean_A = 40/1000
var_A = 0.01
size_B = 1000
mean_B = 50/1000
var_B = 0.01
Welch_Ttest(size_A, size_B, mean_A, mean_B, var_A, var_B)

*** Test T de Welch ***
Moyenne A =  0.04
Moyenne B =  0.05
Hypothèse que la moyenne B est supérieure à la moyenne A
df = 1998.0000000000002
t = 2.23606797749979
p = 0.025457331632895753
*** La différence EST statistiquement significative. ***


True