In [None]:
import pandas as pd
import statsmodels.formula.api as smf
import seaborn as sns
import matplotlib.pyplot as plt

mesures = pd.read_excel(r"~/Données/Mesures_au_LNE.xlsx")
display(mesures)

**Problématique**

On veut tester l’effet de deux facteurs hiérarchiques (campagne, aliquot) sur une mesure, avec potentiellement plusieurs matériaux.

**Modèle statistique choisi**

Une ANOVA à effets mixtes est adaptée :

- Matériau : effet fixe (comparaison explicite des matériaux)
- Campagne : effet aléatoire (échantillonnage de toutes les campagnes possibles)
- Aliquot : effet aléatoire imbriqué dans campagne (chaque aliquot appartient à une campagne)
- Répétition : bruit expérimental

**Formule mathématique**

$$
Y_{ijkl} = \mu + Matériau_i + Campagne_j + Aliquot_{k(j)} + ε_{l(ijk)}
$$

- $\mu$ : moyenne générale
- $Matériau_i$ : effet fixe du matériau $i$
- $Campagne_j$ : effet aléatoire de la campagne $j$
- $Aliquot_{k(j)}$ : effet aléatoire de l’aliquot $k$ dans la campagne $j$
- $ε_{l(ijk)}$ : erreur résiduelle

In [None]:
md = smf.mixedlm("Values ~ Material", mesures,
                 groups = mesures["Campaign"],
                 re_formula = "~ Aliquot")
mdf = md.fit()
print(mdf.summary())

In [None]:
plt.figure(figsize = (12,6))
sns.boxplot(x = "Campaign", y = "Values", hue = "Aliquot", data = mesures)
plt.title("Distribution des mesures par campagne et aliquot")
plt.show()