# ANOVA - Multiple Comparisons

---

Grazie all'ANOVA possiamo affermare che almeno una coppia di medie è diversa tra loro, ma non sappiamo quali. Per capire quali medie sono effettivamente diverse tra loro, dobbiamo applicare i cosiddetti **multiple comparisons**.

Ricordiamo che, per stabilire se due *mean* sono diverse tra loro, utilizziamo i *t-tests*. In ognuno di questi test rischiamo di commettere un *type 1 error*, di conseguenza eseguendone diversi uno dopo l'altro andiamo ad aumentare esponenzialmente il *type 1 error rate*. Per risolvere il problema, è necessario applicare la cosiddetta **Bonferroni Correction**, cioè un adattamento del *significance level* $\alpha$ per mantenere basso il *type 1 error rate*.

Il nuovo *significance level* sarà uguale al rapporto fra il valore originale di $\alpha$ e il numero totale di *confronti* fra medie $K$.

$$\large K=\frac{k(k-1)}{2}\;\;\;\;k=numero\;di\;gruppi$$

$$\large \alpha^*=\frac{\alpha}{K}$$

Un ulteriore accorgimento: dovendo rispettare il vincolo di *equal variance*, dobbiamo rivedere la formula dello *standard error* e dei *degrees of freedom*.

Per quanto riguarda lo *standard error*, utilizziamo una formula simile a quella vista per il confronto fra due medie, ma basata sul *mean squared error* (*MSE*) dell'*anova table* e non sulle varianze dei singoli gruppi. In questo modo possiamo usare un solo valore per tutti i test.

$$\large SE=\sqrt{\frac{MSE}{n_1}+\frac{MSE}{n_2}}$$

Stessa cosa per i *degrees of freedom*: è necessario utilizzare i $df_E$, cioè i gradi di libertà della riga *Error* dell'*Anova Table*, al posto del valore minimo fra i due *sample size* dei gruppi analizzati.

$$\large df=df_E$$

Il *t score*, quindi, può essere calcolato così:

$$\large t = \frac{(\bar{x}_1-\bar{x}_2)-\mu_{H_0}}
{\sqrt{\frac{MSE}{n_1}+\frac{MSE}{n_2}}}$$

Con il *t score* e i corretti *df* possiamo calcolare il *p-value* e concludere l'inferenza.

---

**[Esempio]** Multiple Comparisons applicata in seguito all'esempio precedente di ANOVA.

In [58]:
df = pd.DataFrame({"person": np.arange(1, 16),
                   "dose": [1,1,1,1,1,2,2,2,2,2,3,3,3,3,3],
                   "libido": [3,2,1,1,4,5,2,4,2,3,7,4,5,3,6]})
df["dose"].replace({1: "placebo", 2: "low", 3: "high"}, inplace = True)
df.head()

Unnamed: 0,person,dose,libido
0,1,placebo,3
1,2,placebo,2
2,3,placebo,1
3,4,placebo,1
4,5,placebo,4


In [59]:
comp = sm.stats.multicomp.MultiComparison(df["libido"], df["dose"])
tbl, a1, a2 = comp.allpairtest(stats.ttest_ind, method= "bonf")
tbl

group1,group2,stat,pval,pval_corr,reject
high,low,1.964,0.0851,0.2554,False
high,placebo,3.0551,0.0157,0.0471,True
low,placebo,1.2127,0.2598,0.7795,False


La differenza statisticamente significativa è solo fra chi ha preso l'*high dose* e la *placebo dose*.

---