# Définition d'un test paramétrique

Un test paramétrique suppose que les données suivent une distribution particulière (souvent une distribution normale) et que les paramètres de cette distribution (moyenne, variance, etc.) sont connus ou peuvent être estimés. Ces tests sont généralement plus puissants que les non paramétriques lorsque leurs conditions sont remplies.

## 1. Test t pour échantillon unique

### Quand l'utiliser ?

Comparer la moyenne d'un échantillon à une valeur théorique.

### Conditions :

- Données normalement distribuées (ou grand échantillon, n > 30).

- Variance connue ou estimée.

### Hypothèses :

- #### H₀ : μ = μ₀

- #### H₁ : μ ≠ μ₀ (ou >, <)

#### Code python

In [None]:
from scipy.stats import ttest_1samp
t_stat, p_val = ttest_1samp(data, popmean=μ₀)

## 2. Test t pour échantillons indépendants

### Quand l'utiliser ?

Comparer les moyennes de deux groupes indépendants.

### Conditions :

- Normalité des données.

- Homogénéité des variances (test de Levene).

### Hypothèses :

- #### H₀ : μ₁ = μ₂

- #### H₁ : μ₁ ≠ μ₂

#### Code python

In [None]:
from scipy.stats import ttest_ind
t_stat, p_val = ttest_ind(group1, group2, equal_var=True)

## 3. Test t apparié

### Quand l'utiliser ?

Comparer deux mesures sur les mêmes sujets (avant/après).

### Conditions :

Différences normalement distribuées.

### Hypothèses :

- #### H₀ : μ_diff = 0

- #### H₁ : μ_diff ≠ 0

#### Code Python :

In [None]:
from scipy.stats import ttest_rel
t_stat, p_val = ttest_rel(before, after)

## 4. ANOVA à un facteur

### Quand l'utiliser ?

Comparer les moyennes de ≥ 3 groupes indépendants.

### Conditions :

- Normalité dans chaque groupe.

- Homogénéité des variances.

### Hypothèses :

- #### H₀ : Toutes les moyennes sont égales.

- #### H₁ : Au moins une moyenne diffère.

#### Code Python :

In [None]:
from scipy.stats import f_oneway
f_stat, p_val = f_oneway(group1, group2, group3)

## 5. ANOVA à mesures répétées

### Quand l'utiliser ?

Comparer ≥ 3 mesures sur les mêmes sujets.

### Conditions :

- Sphéricité (test de Mauchly).

- Normalité des différences.

### Hypothèses :

- #### H₀ : Pas de différence entre les mesures.

- #### H₁ : Au moins une mesure diffère.

#### Code Python :

In [None]:
import pingouin as pg
aov = pg.rm_anova(data=df, dv='score', within='time', subject='subject')

## 6. Test Z pour une proportion

### Quand l'utiliser ?

Comparer une proportion observée à une valeur théorique.

### Conditions :

np ≥ 5 et n(1-p) ≥ 5.

### Hypothèses :

- #### H₀ : p = p₀

- #### H₁ : p ≠ p₀

#### Code Python :

In [None]:
from statsmodels.stats.proportion import proportions_ztest
z_stat, p_val = proportions_ztest(count, nobs, value=p₀)

## 7. Test du chi² d'ajustement

### Quand l'utiliser ?

Vérifier si une distribution suit une loi théorique.

### Conditions :

Fréquences attendues ≥ 5.

### Hypothèses :

- #### H₀ : La distribution suit le modèle théorique.

- #### H₁ : La distribution ne suit pas le modèle.

#### Code Python :

In [None]:
from scipy.stats import chisquare
chi_stat, p_val = chisquare(observed, f_exp=expected)

## 8. Test du chi² d'indépendance

### Quand l'utiliser ?

Tester l'association entre deux variables catégorielles.

### Conditions :

Fréquences attendues ≥5.

### Hypothèses :

- #### H₀ : Les variables sont indépendantes.

- #### H₁ : Les variables sont dépendantes.

#### Code Python :

In [None]:
from scipy.stats import chi2_contingency
chi_stat, p_val, dof, expected = chi2_contingency(contingency_table)

## 9. Corrélation de Pearson

### Quand l'utiliser ?

Mesurer la relation linéaire entre deux variables continues.

### Conditions :

- Normalité des données.

- Linéarité.

### Hypothèses :

- #### H₀ : ρ = 0

- #### H₁ : ρ ≠ 0

#### Code Python :

In [None]:
from scipy.stats import pearsonr
r, p_val = pearsonr(x, y)

## 10. Régression linéaire (test t sur les coefficients)

### Quand l'utiliser ?

Tester si un prédicteur influence une variable réponse.

### Conditions :

- Résidus normalement distribués.

- Homoscédasticité.

### Hypothèses :

- #### H₀ : β = 0

- #### H₁ : β ≠ 0

#### Code Python :

In [None]:
import statsmodels.api as sm
model = sm.OLS(y, X).fit()
print(model.summary())

## Tests non paramétriques

- Données non normales (test de Shapiro/Anderson rejette H₀).

- Données ordinales ou catégorielles.

- Petits échantillons (n < 30).

- Variances inégales (si test paramétrique sensible à l'hétéroscédasticité).

## 11. Test de Mann-Whitney U

### Quand l'utiliser ?

Comparer deux groupes indépendants (alternative non paramétrique au test t indépendant).

### Conditions :

Données ordinales ou non normales.

### Hypothèses :

- #### H₀ : Les distributions sont identiques.

- #### H₁ : Les distributions diffèrent.

#### Code Python :

In [None]:
from scipy.stats import mannwhitneyu
u_stat, p_val = mannwhitneyu(group1, group2)

## 12. Test de Wilcoxon signé

### Quand l'utiliser ?

Comparer deux mesures appariées (alternative non paramétrique au test t apparié).

### Conditions :

Données ordinales ou non normales.

### Hypothèses :

- #### H₀ : Pas de différence entre les paires.

- #### H₁ : Différence significative.

#### Code Python :

In [None]:
from scipy.stats import wilcoxon
w_stat, p_val = wilcoxon(before, after)

## 13. Test de Kruskal-Wallis

### Quand l'utiliser ?

Comparer ≥ 3 groupes indépendants (alternative non paramétrique à l'ANOVA).

### Conditions :

Données ordinales ou non normales.

### Hypothèses :

- #### H₀ : Tous les groupes ont la même distribution.

- #### H₁ : Au moins un groupe diffère.

#### Code Python :

In [None]:
from scipy.stats import kruskal
h_stat, p_val = kruskal(group1, group2, group3)

## 14. Test de Friedman

### Quand l'utiliser ?

Comparer ≥ 3 mesures répétées (alternative non paramétrique à l'ANOVA répétée).

### Conditions :

Données ordinales ou non normales.

### Hypothèses :

- #### H₀ : Pas de différence entre les mesures.

- #### H₁ : Au moins une mesure diffère.

#### Code Python :

In [None]:
from scipy.stats import friedmanchisquare
chi_stat, p_val = friedmanchisquare(group1, group2, group3)

## 15. Test des rangs signés de Wilcoxon

### Quand l'utiliser ?

Alternative non paramétrique au test t pour échantillon unique.

### Conditions :

Données non normales.

### Hypothèses :

- #### H₀ : Médiane = valeur théorique.

- #### H₁ : Médiane ≠ valeur théorique.

#### Code Python :

In [None]:
from scipy.stats import wilcoxon
w_stat, p_val = wilcoxon(data - μ₀)

## 16. Corrélation de Spearman

### Quand l'utiliser ?

Mesurer une relation monotone (non nécessairement linéaire).

### Conditions :

Données ordinales ou non normales.

### Hypothèses :

- #### H₀ : ρ = 0

- #### H₁ : ρ ≠ 0

#### Code Python :

In [None]:
from scipy.stats import spearmanr
rho, p_val = spearmanr(x, y)

## 17. Corrélation de Kendall

### Quand l'utiliser ?

Alternative à Spearman pour petits échantillons avec nombreux ex-aequos.

### Conditions :

Données ordinales.

### Hypothèses :

- #### H₀ : τ = 0

- #### H₁ : τ ≠ 0

#### Code Python :

In [None]:
from scipy.stats import kendalltau
tau, p_val = kendalltau(x, y)

## 18. Test de Kolmogorov-Smirnov (à 1 échantillon)

### Quand l'utiliser ?

Comparer une distribution observée à une distribution théorique.

### Conditions :

Données continues.

### Hypothèses :

- #### H₀ : Les distributions sont identiques.

- #### H₁ : Les distributions diffèrent.

#### Code Python :

In [None]:
from scipy.stats import kstest
ks_stat, p_val = kstest(data, 'norm')

## 19. Test de Kolmogorov-Smirnov (à 2 échantillons)

### Quand l'utiliser ?

Comparer deux distributions empiriques.

### Conditions :

Données continues.

### Hypothèses :

- #### H₀ : Les distributions sont identiques.

- #### H₁ : Les distributions diffèrent.

#### Code Python :

In [None]:
from scipy.stats import ks_2samp
ks_stat, p_val = ks_2samp(group1, group2)

## 20. Test de McNemar

### Quand l'utiliser ?

Comparer deux proportions appariées (données binaires).

### Conditions :

Données catégorielles appariées.

### Hypothèses :

- #### H₀ : Pas de changement dans les proportions.

- #### H₁ : Changement significatif.

#### Code Python :

In [None]:
from statsmodels.stats.contingency_tables import mcnemar
result = mcnemar(table, exact=True)

## 21. Test de Cochran Q

### Quand l'utiliser ?

Comparer ≥ 3 proportions appariées (données binaires, extension de McNemar).

### Conditions :

- Données binaires (0/1) pour plusieurs mesures répétées.

- ≥ 3 groupes appariés.

### Hypothèses :

- #### H₀ : Aucune différence entre les proportions.

- #### H₁ : Au moins une proportion diffère.

#### Code Python :

In [None]:
from statsmodels.stats.contingency_tables import cochrans_q
q_stat, p_val = cochrans_q(data)

## 22. Test de Mood pour les médianes

### Quand l'utiliser ?

Comparer les médianes de ≥2 groupes indépendants (alternative non paramétrique à l'ANOVA).

### Conditions :

- Données ordinales ou non normales.

- Distributions de forme similaire.

### Hypothèses :

- #### H₀ : Tous les groupes ont la même médiane.

- #### H₁ : Au moins un groupe a une médiane différente.

#### Code Python :

In [None]:
from scipy.stats import median_test
stat, p_val, med, tbl = median_test(group1, group2, group3)

## 23. Test de Fligner-Killeen

### Quand l'utiliser ?

Tester l'homogénéité des variances entre ≥2 groupes (non paramétrique, robuste à la non-normalité).

### Conditions :

- Données continues ou ordinales.

- Plus robuste que Levene pour les non-normales.

### Hypothèses :

- #### H₀ : Les variances sont égales.

- #### H₁ : Au moins une variance diffère.

#### Code Python :

In [None]:
from scipy.stats import fligner
stat, p_val = fligner(group1, group2, group3)

## 24. Test de Shapiro-Wilk

### Quand l'utiliser ?

Tester la normalité d'un échantillon (petits échantillons, n < 50).

### Conditions :

Échantillon de taille modérée (5 < n < 5000).

### Hypothèses :

- #### H₀ : Les données suivent une loi normale.

- #### H₁ : Les données ne sont pas normales.

#### Code Python :

In [None]:
from scipy.stats import shapiro
stat, p_val = shapiro(data)

## 25. Test de Anderson-Darling

### Quand l'utiliser ?

Tester la normalité (plus sensible que Shapiro-Wilk pour les queues de distribution).

### Conditions :

- Données continues.

- Comparaison à plusieurs distributions (normale, exponentielle, etc.).

### Hypothèses :

- #### H₀ : Les données suivent la distribution spécifiée.

- #### H₁ : Les données ne suivent pas la distribution.

#### Code Python :

In [None]:
from scipy.stats import anderson
result = anderson(data, dist='norm')

## 26. Test de Lilliefors

### Quand l'utiliser ?

Tester la normalité (variante de Kolmogorov-Smirnov pour moyennes et variances estimées).

### Conditions :

- Petits échantillons.

- Moyenne et variance inconnues.

### Hypothèses :

- #### H₀ : Les données sont normales.

- #### H₁ : Les données ne sont pas normales.

#### Code Python :

from statsmodels.stats.diagnostic import lilliefors
stat, p_val = lilliefors(data, dist='norm')

## 27. Test de Runs de Wald-Wolfowitz

### Quand l'utiliser ?

Tester si une séquence est aléatoire (ex : détection de patterns dans des données binaires).

### Conditions :

Données binaires ou dichotomisées.

### Hypothèses :

- #### H₀ : La séquence est aléatoire.

- #### H₁ : La séquence n'est pas aléatoire.

#### Code Python :

In [None]:
from statsmodels.sandbox.stats.runs import runstest_1samp
stat, p_val = runstest_1samp(data, cutoff='mean')

## 28. Test de Page

### Quand l'utiliser ?

Détecter une tendance croissante/décroissante dans ≥3 groupes appariés (alternative à Friedman pour données ordonnées).

### Conditions :

- Données ordinales ou continues.

- Hypothèse de tendance linéaire.

### Hypothèses :

- #### H₀ : Pas de tendance ordonnée.

- #### H₁ : Tendance croissante/décroissante.

#### Code Python :

In [None]:
import pingouin as pg
pg.page_test(data, ranked=True)

### 29. Test de Jonckheere-Terpstra

### Quand l'utiliser ?

Détecter une tendance monotone entre ≥3 groupes ordonnés (ex : doses croissantes d'un médicament).

### Conditions :

- Groupes ordonnés (ex : faible, moyen, fort).

- Données ordinales ou non normales.

### Hypothèses :

- #### H₀ : Pas de tendance.

- #### H₁ : Tendance monotone.

#### Code Python :

In [None]:
from scipy.stats import jonckheere
stat, p_val = jonckheere(group1, group2, group3, alternative='increasing')

## 30. Test de Durbin

### Quand l'utiliser ?

ANOVA non paramétrique pour blocs incomplets (alternative à Friedman quand des données manquent).

### Conditions :

- Plans expérimentaux déséquilibrés.

- Données ordinales ou non normales.

### Hypothèses :

- #### H₀ : Aucune différence entre les traitements.

- #### H₁ : Au moins un traitement diffère.

#### Code Python :

In [None]:
from scipy.stats import friedmanchisquare  # Approximatif si données manquantes
# Pas de fonction native pour Durbin dans scipy/statsmodels, implémentation manuelle nécessaire.

## Test de Sphéricité de Mauchly

### Quand l'utiliser ?

- Le test de Mauchly évalue l'hypothèse de sphéricité dans les ANOVA à mesures répétées ou les analyses de variance multivariées (MANOVA).

- Sphéricité signifie que les variances des différences entre toutes les paires de conditions sont égales.

- Si cette hypothèse est violée, les résultats de l'ANOVA répétée peuvent être trop liberals (augmentation du risque de faux positifs).

### Conditions d'utilisation

- ANOVA à mesures répétées (plus de 2 mesures sur les mêmes sujets).

- Les données doivent être normalement distribuées (sinon, utiliser des corrections ou des alternatives non paramétriques comme le test de Friedman).

### Hypothèses

- #### H₀ (Hypothèse nulle) : La condition de sphéricité est respectée (les variances des différences sont égales).

- #### H₁ (Hypothèse alternative) : La condition de sphéricité n'est pas respectée (les variances des différences ne sont pas égales).

### Interprétation

- Si p-value < α (0.05) → Rejeter H₀ → La sphéricité est violée → Appliquer une correction (Greenhouse-Geisser ou Huynh-Feldt).

- Si p-value ≥ α → Ne pas rejeter H₀ → La sphéricité est acceptable.

### Corrections si sphéricité violée

- Correction de Greenhouse-Geisser (GG) : Réduit les degrés de liberté (conservateur).

- Correction de Huynh-Feldt (HF) : Moins conservateur que GG, utilisé si l'estimation GG est trop sévère.

#### Code python

In [None]:
import pingouin as pg  
# Exemple : ANOVA à mesures répétées avec test de sphéricité  
aov = pg.rm_anova(data=df, dv='score', within='temps', subject='sujet', detailed=True)  
print(aov)  

# Test de Mauchly (intégré dans `pg.rm_anova` si `detailed=True`)  
# Si sphéricité violée, utiliser les corrections :  
aov_gg = pg.rm_anova(data=df, dv='score', within='temps', subject='sujet', correction='gg')  
aov_hf = pg.rm_anova(data=df, dv='score', within='temps', subject='sujet', correction='hf')  