Le test d’hypothèse est une méthode statistique utilisée pour faire des inférences ou prendre des décisions sur une population en fonction des données de l’échantillon. Cela commence par une hypothèse nulle (H0), qui représente une position par défaut ou aucun effet, et une hypothèse alternative (H1 ou Ha), qui représente ce que nous cherchons à prouver ou à nous attendre à trouver. Le processus consiste à utiliser des données d’échantillon pour déterminer s’il faut rejeter l’hypothèse nulle en faveur de l’hypothèse alternative, en fonction de la probabilité d’observer les données d’échantillon sous l’hypothèse nulle. Donc, si vous voulez apprendre à effectuer des tests d’hypothèse, cet article est pour vous. Dans cet article, je vais vous expliquer la tâche de test d’hypothèses à l’aide de Python.

# Test d’hypothèse : processus que nous pouvons suivre

Ainsi, le test d’hypothèse est un processus fondamental de la science des données pour prendre des décisions et des inférences basées sur des données sur les populations en fonction des données d’échantillonnage. Vous trouverez ci-dessous le processus que nous pouvons suivre pour la tâche de test d’hypothèse :

Rassemblez les données nécessaires au test d’hypothèse.
Définissez l’hypothèse nulle (H0) et l’hypothèse alternative (H1 ou Ha).
Choisissez le niveau de signification (α), qui est la probabilité de rejeter l’hypothèse nulle lorsqu’elle est vraie.
Sélectionnez les tests statistiques appropriés. Les exemples incluent les tests t pour comparer les moyennes, les tests du chi carré pour les données catégorielles et l’ANOVA pour comparer les moyennes de plus de deux groupes.
Effectuez le test statistique choisi sur vos données.
Déterminez la valeur p et interprétez les résultats de vos tests statistiques.

# Test d’hypothèses à l’aide de Python

In [1]:
import pandas as pd
from scipy.stats import ttest_ind

In [2]:
df = pd.read_csv("website_ab_test.csv")

print(df.head())

         Theme  Click Through Rate  Conversion Rate  Bounce Rate  \
0  Light Theme            0.054920         0.282367     0.405085   
1  Light Theme            0.113932         0.032973     0.732759   
2   Dark Theme            0.323352         0.178763     0.296543   
3  Light Theme            0.485836         0.325225     0.245001   
4  Light Theme            0.034783         0.196766     0.765100   

   Scroll_Depth  Age   Location  Session_Duration Purchases Added_to_Cart  
0     72.489458   25    Chennai              1535        No           Yes  
1     61.858568   19       Pune               303        No           Yes  
2     45.737376   47    Chennai               563       Yes           Yes  
3     76.305298   58       Pune               385       Yes            No  
4     48.927407   25  New Delhi              1437        No            No  


Ainsi, le jeu de données est basé sur les performances de deux thèmes sur un site web. Notre tâche consiste à trouver quel thème fonctionne le mieux à l’aide de tests d’hypothèses. Passons en revue le résumé de l’ensemble de données, y compris le nombre d’enregistrements, la présence de valeurs manquantes et les statistiques de base pour les colonnes numériques :

In [3]:
# dataset summary
summary = {
    'Number of Records': df.shape[0],
    'Number of Columns': df.shape[1],
    'Missing Values': df.isnull().sum(),
    'Numerical Columns Summary': df.describe()
}

summary

{'Number of Records': 1000,
 'Number of Columns': 10,
 'Missing Values': Theme                 0
 Click Through Rate    0
 Conversion Rate       0
 Bounce Rate           0
 Scroll_Depth          0
 Age                   0
 Location              0
 Session_Duration      0
 Purchases             0
 Added_to_Cart         0
 dtype: int64,
 'Numerical Columns Summary':        Click Through Rate  Conversion Rate  Bounce Rate  Scroll_Depth  \
 count         1000.000000      1000.000000  1000.000000   1000.000000   
 mean             0.256048         0.253312     0.505758     50.319494   
 std              0.139265         0.139092     0.172195     16.895269   
 min              0.010767         0.010881     0.200720     20.011738   
 25%              0.140794         0.131564     0.353609     35.655167   
 50%              0.253715         0.252823     0.514049     51.130712   
 75%              0.370674         0.373040     0.648557     64.666258   
 max              0.499989         0.49891

Le jeu de données contient 1 000 enregistrements répartis sur 10 colonnes, sans valeurs manquantes. Voici un bref résumé des colonnes numériques :

Taux de clics : Varie d’environ 0,01 à 0,50 avec une moyenne d’environ 0,26.
Taux de conversion : Varie également d’environ 0,01 à 0,50 avec une moyenne proche du taux de clics, environ 0,25.
Taux de rebond : Varie entre 0,20 et 0,80, avec une moyenne d’environ 0,51.
Profondeur de défilement : affiche un écart de 20,01 à près de 80, avec une moyenne de 50,32.
Âge : L’âge des utilisateurs varie de 18 à 65 ans, avec un âge moyen d’environ 41,5 ans.
Durée de la session : Cela varie considérablement de 38 secondes à près de 1800 secondes (30 minutes), avec une durée moyenne de session d’environ 925 secondes (environ 15 minutes).


Passons maintenant à la comparaison des performances des deux thèmes en fonction des mesures fournies. Nous examinerons le taux de clics moyen, le taux de conversion, le taux de rebond et d’autres mesures pertinentes pour chaque thème. Ensuite, nous pouvons effectuer des tests d’hypothèses pour identifier s’il existe une différence statistiquement significative entre les thèmes :

In [4]:
# grouping data by theme and calculating mean values for the metrics
theme_performance = df.groupby('Theme').mean()

# sorting the data by conversion rate for a better comparison
theme_performance_sorted = theme_performance.sort_values(by='Conversion Rate', ascending=False)

print(theme_performance_sorted)

             Click Through Rate  Conversion Rate  Bounce Rate  Scroll_Depth  \
Theme                                                                         
Light Theme            0.247109         0.255459     0.499035     50.735232   
Dark Theme             0.264501         0.251282     0.512115     49.926404   

                   Age  Session_Duration  
Theme                                     
Light Theme  41.734568        930.833333  
Dark Theme   41.332685        919.482490  


La comparaison entre le thème clair et le thème sombre sur les mesures de performances moyennes révèle les informations suivantes :

Taux de clics (CTR) : Le thème sombre a un CTR moyen légèrement plus élevé (0,2645) par rapport au thème clair (0,2471).
Taux de conversion : Le thème clair est en tête avec un taux de conversion moyen légèrement plus élevé (0,2555) que le thème sombre (0,2513).
Taux de rebond : Le taux de rebond est légèrement plus élevé pour le thème sombre (0,5121) que pour le thème clair (0,4990).
Profondeur de défilement : Les utilisateurs du thème clair défilent légèrement plus loin en moyenne (50,74 %) par rapport à ceux du thème sombre (49,93 %).
Âge : L’âge moyen des utilisateurs est similaire dans tous les thèmes, avec le thème clair à environ 41,73 ans et le thème sombre à 41,33 ans.

Durée de la session : La durée moyenne de la session est légèrement plus longue pour les utilisateurs du thème clair (930,83 secondes) que pour ceux du thème sombre (919,48 secondes).
D’après ces informations, il apparaît que le thème clair surpasse légèrement le thème sombre en termes de taux de conversion, de taux de rebond, de profondeur de défilement et de durée de session, tandis que le thème sombre est en tête du taux de clics. Cependant, les différences sont relativement mineures dans tous les indicateurs.

# Démarrer avec les tests d’hypothèses

Nous utiliserons un niveau de signification (alpha) de 0,05 pour notre test d’hypothèse. Cela signifie que nous considérerons un résultat comme statistiquement significatif si la valeur p de notre test est inférieure à 0,05.

Commençons par des tests d’hypothèses basés sur le taux de conversion entre le thème clair et le thème sombre. Nos hypothèses sont les suivantes :

Hypothèse nulle (H0) : Il n’y a pas de différence de taux de conversion entre le thème clair et le thème sombre.
Hypothèse alternative (Ha) : Il existe une différence de taux de conversion entre le thème clair et le thème sombre.

Nous utiliserons un test t à deux échantillons pour comparer les moyennes des deux échantillons indépendants. Poursuivons le test :

In [5]:
# extracting conversion rates for both themes
conversion_rates_light = df[df['Theme'] == 'Light Theme']['Conversion Rate']
conversion_rates_dark = df[df['Theme'] == 'Dark Theme']['Conversion Rate']

# performing a two-sample t-test
t_stat, p_value = ttest_ind(conversion_rates_light, conversion_rates_dark, equal_var=False)

t_stat, p_value

(0.4748494462782632, 0.6349982678451778)

Le résultat du test t à deux échantillons donne une valeur p d’environ 0,635. Comme cette valeur p est beaucoup plus grande que notre niveau de signification de 0,05, nous n’avons pas suffisamment de preuves pour rejeter l’hypothèse nulle. Par conséquent, nous concluons qu’il n’y a pas de différence statistiquement significative dans les taux de conversion entre le thème clair et le thème sombre sur la base des données fournies.



Maintenant, effectuons des tests d’hypothèse basés sur le taux de clics (CTR) pour voir s’il existe une différence statistiquement significative entre le thème clair et le thème sombre en ce qui concerne la fréquence à laquelle les utilisateurs cliquent. Nos hypothèses restent structurées de manière similaire :

Hypothèse nulle (H0) : Il n’y a pas de différence dans les taux de clics entre le thème clair et le thème sombre.
Hypothèse alternative (Ha) : Il existe une différence dans les taux de clics entre le thème clair et le thème sombre.
Nous effectuerons un test t à deux échantillons sur le CTR pour les deux thèmes. Poursuivons le calcul :

In [6]:
# extracting click through rates for both themes
ctr_light = df[df['Theme'] == 'Light Theme']['Click Through Rate']
ctr_dark = df[df['Theme'] == 'Dark Theme']['Click Through Rate']

# performing a two-sample t-test
t_stat_ctr, p_value_ctr = ttest_ind(ctr_light, ctr_dark, equal_var=False)

t_stat_ctr, p_value_ctr

(-1.9781708664172253, 0.04818435371010704)

Le test t à deux échantillons pour le taux de clics (CTR) entre le thème clair et le thème sombre donne une valeur p d’environ 0,048. Cette valeur p est légèrement inférieure à notre niveau de signification de 0,05, ce qui indique qu’il existe une différence statistiquement significative dans les taux de clics entre le thème clair et le thème sombre, le thème sombre ayant probablement un CTR plus élevé compte tenu de la direction de la statistique de test.

Maintenant, effectuons des tests d’hypothèse basés sur deux autres métriques : le taux de rebond et la profondeur de défilement, qui sont des métriques importantes pour analyser les performances d’un thème ou d’un design sur un site web. Je vais d’abord effectuer ces tests statistiques, puis créer un tableau pour afficher le rapport de tous les tests que nous avons effectués :

In [7]:
# extracting bounce rates for both themes
bounce_rates_light = df[df['Theme'] == 'Light Theme']['Bounce Rate']
bounce_rates_dark = df[df['Theme'] == 'Dark Theme']['Bounce Rate']

# performing a two-sample t-test for bounce rate
t_stat_bounce, p_value_bounce = ttest_ind(bounce_rates_light, bounce_rates_dark, equal_var=False)

# extracting scroll depths for both themes
scroll_depth_light = df[df['Theme'] == 'Light Theme']['Scroll_Depth']
scroll_depth_dark = df[df['Theme'] == 'Dark Theme']['Scroll_Depth']

# performing a two-sample t-test for scroll depth
t_stat_scroll, p_value_scroll = ttest_ind(scroll_depth_light, scroll_depth_dark, equal_var=False)

# creating a table for comparison
comparison_table = pd.DataFrame({
    'Metric': ['Click Through Rate', 'Conversion Rate', 'Bounce Rate', 'Scroll Depth'],
    'T-Statistic': [t_stat_ctr, t_stat, t_stat_bounce, t_stat_scroll],
    'P-Value': [p_value_ctr, p_value, p_value_bounce, p_value_scroll]
})

comparison_table

Unnamed: 0,Metric,T-Statistic,P-Value
0,Click Through Rate,-1.978171,0.048184
1,Conversion Rate,0.474849,0.634998
2,Bounce Rate,-1.201888,0.229692
3,Scroll Depth,0.756228,0.449692


Voici donc un tableau comparant les performances du thème clair et du thème sombre sur différentes mesures basées sur des tests d’hypothèse :

Taux de clics : Le test révèle une différence statistiquement significative, le thème sombre étant probablement plus performant (valeur P = 0,048).
Taux de conversion : Aucune différence statistiquement significative n’a été trouvée (valeur p = 0,635).
Taux de rebond : Il n’y a pas de différence statistiquement significative dans les taux de rebond entre les thèmes (valeur P = 0,230).
Profondeur de défilement : De même, aucune différence statistiquement significative n’est observée dans les profondeurs de défilement (valeur p = 0,450).


En résumé, alors que les deux thèmes fonctionnent de manière similaire dans la plupart des mesures, le thème sombre a un léger avantage en termes d’engagement des utilisateurs à cliquer. Pour d’autres indicateurs de performance clés tels que le taux de conversion, le taux de rebond et la profondeur de défilement, le choix entre un thème clair et un thème sombre n’affecte pas de manière significative le comportement des utilisateurs selon les données fournies.

Résumé
Ainsi, le test d’hypothèse est une méthode statistique utilisée pour faire des inférences ou prendre des décisions sur une population en fonction de données d’échantillonnage. Cela commence par une hypothèse nulle (H0), qui représente une position par défaut ou aucun effet, et une hypothèse alternative (H1 ou Ha), qui représente ce que nous cherchons à prouver ou à nous attendre à trouver. Le processus consiste à utiliser des données d’échantillon pour déterminer s’il faut rejeter l’hypothèse nulle en faveur de l’hypothèse alternative, en fonction de la probabilité d’observer les données d’échantillon sous l’hypothèse nulle.