In [66]:
from scipy import stats

import numpy as np


# Questions

1. Calcule la moyenne et l'écart-type des poids.
2. Formule H₀ et H₁.
3. Vérifie la normalité des données (Shapiro-Wilk).
4. Réalise le test t à 1 échantillon. Le fournisseur dit-il la vérité ?

In [67]:
data = [248, 253, 246, 251, 249, 255, 247, 252, 250, 248, 254, 246, 251, 249, 253]

print("Moyennne : ", np.mean(data))
print("Ecart-type : ", np.std(data, ddof=1))

Moyennne :  250.13333333333333
Ecart-type :  2.8751811537130436


## Test de Shapiro-Wilk

- H₀ : La distribution des données est normale
- H₁ : La distribution des données n'est pas normale

In [68]:
stat, p_norm = stats.shapiro(data)
print(f"Normalité : p={p_norm:.4f}")

Normalité : p=0.6292


Le test de normalité de shapiro-Wilk n'échoue pas, on ne rejette pas la normalité.

## Test t de Student

- H₀ : La moyenne de l'échantillon vaut 250
- H₁ : La moyenne de l'échantillon ne vaut pas 250

In [69]:
t_stat, p_value = stats.ttest_1samp(data, popmean=250)
print(f"Statistique t: {t_stat:.3f}")
print(f"p-value: {p_value:.4f}")

Statistique t: 0.180
p-value: 0.8600


Le test t de Student n'échoue pas, on ne rejette pas l'hypothèse H₀.

Conclusion : Le fournisseur dit probablement la véritée.

# Questions

1. Calcule la moyenne de chaque groupe.
2. Formule H₀ et H₁.
3. Vérifie la normalité de chaque groupe (Shapiro-Wilk).
4. Vérifie l'homogénéité des variances (Levene).
5. Choisis et applique le bon test.
6. Calcule la taille d'effet (Cohen's d).
7. Rédige une conclusion pour le directeur.

In [70]:
grp1 = [7, 6, 8, 5, 7, 6, 7, 8, 6, 5, 7, 6]
grp2 = [8, 9, 7, 8, 9, 8, 7, 9, 8, 9, 8, 7]

print("Moyennne groupe 1 : ", np.mean(grp1))
print("Ecart-type groupe 1 : ", np.std(grp1, ddof=1))
print("Moyennne groupe 2 : ", np.mean(grp2))
print("Ecart-type groupe 2 : ", np.std(grp2, ddof=1))

Moyennne groupe 1 :  6.5
Ecart-type groupe 1 :  1.0
Moyennne groupe 2 :  8.083333333333334
Ecart-type groupe 2 :  0.7929614610987591


## Test de Shapiro-Wilk

- H₀ : La distribution des données est normale
- H₁ : La distribution des données n'est pas normale

In [71]:
stat1, p_norm1 = stats.shapiro(grp1)
print(f"Normalité groupe 1 : p={p_norm1:.4f}")

stat2, p_norm2 = stats.shapiro(grp2)
print(f"Normalité groupe 2 : p={p_norm2:.4f}")

Normalité groupe 1 : p=0.1874
Normalité groupe 2 : p=0.0180


- Pour le groupe 1, le test de normalité de Shapiro-Wilk n'échoue pas, on ne rejette pas la normalité.
- Pour le groupe 2, le test de normalité de Shapiro-Wilk échoue, on rejette la normalité.

## Test de Levene

- H₀ : Les variances des groupes sont égales
- H₁ : Les variances des groupes ne sons pas égales

In [72]:
stat, p_var = stats.levene(grp1, grp2)
print(f"Homogénéité variances : p={p_var:.4f}")

Homogénéité variances : p=0.2370


Le test de Levene n'échoue pas, on ne rejette pas l'égalité des variances

## Test Man-Whitney

- H₀ : Les moyennes sont égales
- H₁ : Les moyennes sont différentes

In [73]:
stat, p_value = stats.mannwhitneyu(grp1, grp2, alternative="two-sided")
print(f"Statistique: {stat:.3f}")
print(f"p-value: {p_value:.4f}")

Statistique: 17.000
p-value: 0.0012


Le test de man-Whitney néchoue, donc on ne rejette pas H₀.

Conclusion : Les deux groupe ont des moyennes différents.

## Cohen's d

In [74]:
def cohens_d(group1, group2):
    # Calculating means of the two groups
    mean1, mean2 = np.mean(group1), np.mean(group2)

    # Calculating pooled standard deviation
    std1, std2 = np.std(group1, ddof=1), np.std(group2, ddof=1)
    n1, n2 = len(group1), len(group2)
    pooled_std = np.sqrt(((n1 - 1) * std1**2 + (n2 - 1) * std2**2) / (n1 + n2 - 2))

    # Calculating Cohen's d
    return abs(mean1 - mean2) / pooled_std


# Calculating Cohen's d
effect_size = cohens_d(grp1, grp2)
print("Cohen's d:", effect_size)

Cohen's d: 1.7545069317741133


d >> 0.8 donc l'effet est très grand.

Conclusion :
- L'écart de moyenne entre les échantillons est significatif
- L'impact est fort

### Questions

1. Calcule la différence (après - avant) pour chaque barista.
2. Calcule la moyenne des différences.
3. Formule H₀ et H₁.
4. Vérifie la normalité des différences.
5. Réalise le test t apparié.
6. La formation a-t-elle été efficace ?

In [75]:
avant = [25, 28, 22, 30, 26, 24, 27, 23, 29, 25]
apres = [30, 33, 28, 34, 31, 29, 32, 28, 35, 30]

diff = [i - j for i, j in zip(apres, avant)]
print("Evolution : ", diff)

print("Moyennne groupe 1 : ", np.mean(avant))
print("Ecart-type groupe 1 : ", np.std(avant, ddof=1))
print("Moyennne groupe 2 : ", np.mean(apres))
print("Ecart-type groupe 2 : ", np.std(apres, ddof=1))

Evolution :  [5, 5, 6, 4, 5, 5, 5, 5, 6, 5]
Moyennne groupe 1 :  25.9
Ecart-type groupe 1 :  2.6012817353502227
Moyennne groupe 2 :  31.0
Ecart-type groupe 2 :  2.449489742783178


## Test de Shapiro-Wilk

- H₀ : La distribution des données est normale
- H₁ : La distribution des données n'est pas normale

In [76]:
stat, p_norm = stats.shapiro(diff)
print(f"Normalité avant : p={p_norm:.4f}")

Normalité avant : p=0.0037


Les test de normalité pour les différences échoue, donc on rejette la normalité.

## Test de Wilcoxon

- H₀ : Les groupes ont la même moyenne
- H₁ : Les groupes ont des moyennes différentes

In [77]:
t_stat, p_value = stats.wilcoxon(avant, apres)
print(f"p-value: {p_value:.4f}")

amelioration = np.mean(np.array(apres) - np.array(avant))
print(f"Amélioration moyenne: {amelioration:.1f} points")

p-value: 0.0020
Amélioration moyenne: 5.1 points


Le test de Wilcoxon echoue, donc on rejette l'hypothèse H0

Conclusion : Les groupes n'ont pas la même moyenne.

Bilan : La fomation a été efficace.