## 多重比較法(Multiple-Comparison Procedure)
目的 : 若ANOVA分析結果為顯著時，可以用來找出哪幾組和其他組間有顯著差異。


### Fisher 最小顯著差異法 (least significant difference, LSD) 
參考 : 統計學 - 李德治、童惠玲 p616

*   優點 : 簡單
*   缺點 :
    1.  需要進行 $\tbinom{k}{2}$ 次LSD，所以容易發生型Ｉ誤差。(參考FDR)
    2.  若多數組樣本數不相同，則計算速度相對於傳統統計來得慢。

此 $H_0 $ 皆為母體平均數相等
1.  單一母體平均數之區間估計\
    因為ANOVA過程假設每個小母體的變異數都相等，所以若要估計某個小母體平均數的信賴區間時，須以 MSE 取代母體變異數。\
    單一母體 (第k組) 的 95% 信賴區間 :\
     <font size =5>$ \bar{x}_k - t_{\frac{\alpha}{2},n-k} \sqrt{\frac{MSE}{n_k}}\leq \mu_k \leq \bar{x}_k + t_{\frac{\alpha}{2},n-k}\sqrt{\frac{MSE}{n_k}}$</font>

2.  $\mu_i - \mu_j$ 之區間估計\
    因為已知兩獨立母體之平均數差的信賴區間 : 
    <font size =4>$ (\bar{x}_1 - \bar{x}_2) - t_{\frac{\alpha}{2},n_1+n_2-2} \sqrt{\frac{s_p^2}{n_1}+\frac{s_p^2}{n_2}}\leq \mu_1-\mu_2 \leq 
    (\bar{x}_1 - \bar{x}_2) + t_{\frac{\alpha}{2},n_1+n_2-2}\sqrt{\frac{s_p^2}{n_1}+\frac{s_p^2}{n_2}}$</font>
    
    所以把樣本變異數 $s_p^2$ 修改為MSE即可 : \
    <font size =5>$ (\bar{x}_i - \bar{x}_j) - t_{\frac{\alpha}{2},n-k} \sqrt{\frac{MSE}{n_i}+\frac{MSE}{n_j}}\leq \mu_i-\mu_j \leq 
    (\bar{x}_i - \bar{x}_j) + t_{\frac{\alpha}{2},n-k} \sqrt{\frac{MSE}{n_i}+\frac{MSE}{n_j}}$</font>
    
3.  LSD \
    由(2)可得<font size =4>$t^* = \frac{(\bar{x}_i - \bar{x}_j)}{\sqrt{\frac{MSE}{n_i}+\frac{MSE}{n_j}}}$</font> ，所以當$|t^*| > t_{\frac{\alpha}{2},n-k}$ (信賴區間不包含$H_0$) 時，拒絕虛無假設(reject $H_0$)。
    
    可以改寫成 : 當$  |\bar{x}_i - \bar{x}_j| > t_{\frac{\alpha}{2},n-k} \sqrt{\frac{MSE}{n_i}+\frac{MSE}{n_j}}$ 時，拒絕虛無假設(reject $H_0$)。
    
    而此定義LSD為 :\
    <font color = red>$LSD = t_{\frac{\alpha}{2},n-k} \sqrt{\frac{MSE}{n_i}+\frac{MSE}{n_j}} $</font>



### 聯合信賴區間(simultaneous confidence intervals)
為了解決 LSD 進行多重檢定出現全體型I錯誤 (overall type I error) 的問題，調整各信賴區間對的機率相當於 $1-\alpha$ ，而調整後的信賴區間就稱為聯合信賴區間。

以下為聯合信賴區間檢定法。

#### Bonferroni 多重比較法
*   摘要 : 

    假設型I錯誤發生機率為$\alpha$，若有 k 個小母體，需檢定 $m = C^k_2$ 次。\
    Bonferroni 認為此會<font color = red> 造成型 I 錯誤的累積，使得型I錯誤膨脹成 $m\alpha$ ，所以必須將顯著水準改為 $\frac{\alpha}{m}$</font>。

依照 Bonferroni ，$m = C^k_2$ 個母體平均數差的 $1-\alpha$ 聯合信賴區間為 : \
    <font size =5>$ (\bar{x}_i - \bar{x}_j) - t_{\frac{\alpha}{2m},n-k} \sqrt{\frac{MSE}{n_i}+\frac{MSE}{n_j}}\leq \mu_i-\mu_j \leq 
    (\bar{x}_i - \bar{x}_j) + t_{\frac{\alpha}{2m},n-k} \sqrt{\frac{MSE}{n_i}+\frac{MSE}{n_j}}$</font>

虛無假設為 : $H_0 : \mu_i = \mu_j$
1.  若 $\mu_1-\mu_2$ 之聯合信賴區間包含 0，則不拒絕虛無假設。
2.  若 $\mu_1-\mu_2$ 之聯合信賴區間皆為負值，則表示 $\mu_i < \mu_j$。
3.  若 $\mu_1-\mu_2$ 之聯合信賴區間皆為正值，則表示 $\mu_i > \mu_j$。

#### Scheffe 多重比較法
*   摘要 :

    把傳統信賴區間法中的 $t$ 分配改用 $F$ 分配 (因為 $t_{\frac{\alpha}{2},n} = \sqrt{F_{\alpha,1,n}}$)。為了避免顯著水準膨脹，因此在 $F$ 值前增加調整係數 $(k-1)$，使得信賴區間加大縮小型I錯誤。

依照 Scheffe ， k 個小母體的母體平均數差之 $1-\alpha$ 聯合信賴區間為 : \
    <font size =4>$ (\bar{x}_i - \bar{x}_j) - \sqrt{(k-1)F_{\alpha,k-1,n-k}} \sqrt{\frac{MSE}{n_i}+\frac{MSE}{n_j}}\leq \mu_i-\mu_j \leq 
    (\bar{x}_i - \bar{x}_j) + \sqrt{(k-1)F_{\alpha,k-1,n-k}} \sqrt{\frac{MSE}{n_i}+\frac{MSE}{n_j}}$</font>

*   缺點 :

    因 Scheffe 過於保守，雖然使得 type I error 機率降低，但卻造成型 II 錯誤的發生機率上生，導致檢定力減弱。此方法比較適用於非成對處理之檢定，例如虛無假設為：$H_0 = c_1\mu_1+c_2\mu_2+...+c_k\mu_k = 0$。

虛無假設為 : $H_0 : \mu_i = \mu_j$
1.  若 $\mu_1-\mu_2$ 之聯合信賴區間包含 0，則不拒絕虛無假設。
2.  若 $\mu_1-\mu_2$ 之聯合信賴區間皆為負值，則表示 $\mu_i < \mu_j$。
3.  若 $\mu_1-\mu_2$ 之聯合信賴區間皆為正值，則表示 $\mu_i > \mu_j$。

#### Tukey 公正顯著差異法 (Tukey honest significant difference, HSD), 或稱 Tukey's T 法

*   摘要 :

    和 LSD 類似，但是 HSD 使用的並非 t dis. 而是 t 的全距分配 $q_{\alpha,k,n-k}$ (studentized range distribution)。

*   t 全距分配 :

    假設 $x_1,x_2,...,x_k \stackrel{i.i.d}{\sim} N(\mu,\sigma^2)$，則 t 的全距分配為 : $q_{k,n-k} = \frac{R}{s}$ ， 其中 $R = \max\limits_{i} x_i - \min\limits_{i} x_i$，$s$ 為樣本標準差，k、n-k 為自由度。

*   缺點 :

    <font color = red>必須在各組樣本數相同時才可以進行檢定</font>。

依照 HSD 多重比較法 ， k 個小母體的母體平均數差之 $1-\alpha$ 聯合信賴區間為 :\
    <font size =4>$ (\bar{x}_i - \bar{x}_j) - q_{\alpha,k,n-k} \sqrt{\frac{MSE}{n}+\frac{MSE}{n}}\leq \mu_i-\mu_j \leq 
    (\bar{x}_i - \bar{x}_j) + q_{\alpha,k,n-k} \sqrt{\frac{MSE}{n}+\frac{MSE}{n}}$</font>

在虛無假設 $H_0 = \mu_i = \mu_j $  成立的情況下，不等式可以改成 $|\bar{x}_i - \bar{x}_j| > q_{\alpha,k,n-k} \sqrt{\frac{MSE}{n}+\frac{MSE}{n}}$。\
令 $HSD = q_{\alpha,k,n-k} \sqrt{\frac{MSE}{n}+\frac{MSE}{n}} $ ，則決策法則變成 : 若 $|\bar{x}_i - \bar{x}_j| > HSD $，則拒絕虛無假設。

決策結果 : 
1.  若 $\mu_1-\mu_2$ 之聯合信賴區間包含 0，則不拒絕虛無假設。
2.  若 $\mu_1-\mu_2$ 之聯合信賴區間皆為負值，則表示 $\mu_i < \mu_j$。
3.  若 $\mu_1-\mu_2$ 之聯合信賴區間皆為正值，則表示 $\mu_i > \mu_j$。



#### Tukey-Karamer 檢定程序
*   摘要 :

    改良 HSD 法，使它不受樣本數需相同的限制。此方法將 $HSD$ 法的 $q_{\alpha,k,n-k}$ 改為 $\frac{q_{\alpha,k,n-k}}{\sqrt{2}}$。

$1-\alpha$ 信賴區間 : \
    <font size =4>$ (\bar{x}_i - \bar{x}_j) - \frac{q_{\alpha,k,n-k}}{\sqrt{2}} \sqrt{\frac{MSE}{n_i}+\frac{MSE}{n_j}}\leq \mu_i-\mu_j \leq 
    (\bar{x}_i - \bar{x}_j) +\frac{q_{\alpha,k,n-k}}{\sqrt{2}} \sqrt{\frac{MSE}{n_i}+\frac{MSE}{n_j}}$</font>

令 $\omega = \frac{q_{\alpha,k,n-k}}{\sqrt{2}}$，則決策法則變為 : 若 $|\bar{x}_i - \bar{x}_j| > \omega $，則拒絕虛無假設。

決策結果 : 
1.  若 $\mu_1-\mu_2$ 之聯合信賴區間包含 0，則不拒絕虛無假設。
2.  若 $\mu_1-\mu_2$ 之聯合信賴區間皆為負值，則表示 $\mu_i < \mu_j$。
3.  若 $\mu_1-\mu_2$ 之聯合信賴區間皆為正值，則表示 $\mu_i > \mu_j$。

#### 其他
待補 : 
*   Newman – Keuls法 : Newman- Keuls法與Tukey法非常相似，但是Newman- Keuls法對於每一個比較可以都有各自的α值。此方法因此可以執行更多的比對，因此其檢定力比Tukey法更強大。
[參考網址2](https://en.wikipedia.org/wiki/Newman%E2%80%93Keuls_method)
