### 變異數分析 (Analysis of variance, ANOVA)

#### 1. 目的: 檢定三個或三個以上的母體平均數是否相等的統計方法

(1) 若以 $t$ 檢定互相分析，需要檢定 $C^{k}_{2}$ 次 ($k$: 母體總數)

(2) 若每個假設檢定的接受機率為 0.95 (顯著水準 = 0.05)，則 $m$ 次檢定的接受機率會變成 $0.95^{m}$ (顯著水準 = $1-0.95^{m}$) 

$\rightarrow$ 接受機率變小，顯著水準增大

#### 2. 原理: 組間變異與各組組內變異各自除以其自由度服從 F 分配的性質

$$\frac{\chi_{SSB}/df_{SSB}}{\chi_{SSW}/df_{SSW}}\sim F$$

$$總變異(SST)=組間變異(SSB)+組內變異(SSW)$$

- 總變異(SST): $x_{i}-\bar{x}$


- 組間變異(SSB): $\bar{x}_{i}-\bar{x}$


- 組內變異(SSW): $x_{i}-\bar{x}_{i}$


[Note] $\bar{x}$: 所有樣本的平均數，$\bar{x}_{i}$: 第 $i$ 個母體的樣本平均數。

#### 3. 單因子變異數分析

(1) 基本條件

- 常態性: 母體必須為常態分配


- 獨立性: 樣本為獨立的簡單隨機抽樣


- 同質性: 變異數要同質


(2) 單因子 ANOVA 模型

單因子 ANOVA 模型的資料來源來自 k 個母體中，每個母體的簡單隨機樣本，而第 j 個母體抽出 $n_{j}$ 個觀察值:

- $x_{1, 1}, x_{2, 1}, ... , x_{n_{1}, 1}$: 第 1 個母體，有 $n_{1}$ 個觀察值，母體平均數 $\mu_{1}$


- $x_{1, 2}, x_{2, 2}, ... , x_{n_{2}, 2}$: 第 2 個母體，有 $n_{2}$ 個觀察值，母體平均數 $\mu_{2}$

  ...

- $x_{1, j}, x_{2, j}, ... , x_{n_{j}, j}$: 第 $j$ 個母體，有 $n_{j}$ 個觀察值，母體平均數 $\mu_{j}$

  ...

- $x_{1, k}, x_{2, k}, ... , x_{n_{k}, k}$: 第 $k$ 個母體，有 $n_{k}$ 個觀察值，母體平均數 $\mu_{k}$


[Note] :  $x_{ij} = \mu_{j} + \epsilon_{ij}$ where $\epsilon_{ij} \sim N(0, \sigma)$


(3) 變異數之間的關係

- 總樣本平均數:

$$\bar{\bar{x}}=\frac{1}{N}\sum_{j=1}^{k}\sum_{i=1}^{n_{i}}x_{ij},\ \text{where}\ N=\sum_{j=1}^{k}n_{j}$$

- 第 $j$ 個母體的樣本平均數 $\bar{x}_{j}$:

$$\bar{x_{j}}=\frac{1}{n_{j}}\sum_{i=1}^{n_{j}}x_{ij}$$

- 總變異(SST) = 組間變異(SSB) + 組內變異(SSW)

$$\left ( x_{ij}-\bar{\bar{x}} \right )=\left ( \bar{x}_{j}-\bar{\bar{x}} \right )+\left ( x_{ij}-\bar{x}_{j} \right )$$

$$\Rightarrow \sum_{j=1}^{k}\sum_{i=1}^{n_{i}}\left ( x_{ij}-\bar{\bar{x}} \right )^{2}=\sum_{j=1}^{k}\left ( \bar{x}_{j}-\bar{\bar{x}} \right )^{2}+\sum_{j=1}^{k}\sum_{i=1}^{n_{i}}\left ( x_{ij}-\bar{x}_{j} \right )^{2}$$

(4) ANOVA 分析表

| **變異來源** |  **平方和**  |  **自由度**  | **均方和**  | ** F 值 ** |
|:------------:|:------------:|:-----------:|:-----------:|:----------:|
| **組間** | SSB | k-1 | MSB = SSB/(k-1) | F = MSB/MSW |
| **組內** | SSW | N-k | MSW = SSW/(N-k) |             |
| **總和** | SST | N-1 |                 |             |

#### 4. 平均數的多重比較

若虛無假設 $H_{0}: \mu_{1}=\mu_{2}=...=\mu_{k}$ 在 $F$ 檢定時遭受拒絕，則表示有母體之樣本平均數不相等，此時需進一步做**事後比較檢定(Post-hoc tests)**

方法:

(1) 使用信賴區間的觀念，若有 $k$ 個母體，需進行 $C^{k}_{2}$ 組檢定

(2) 在小樣本中，母體為常態且變異數未知時，$\bar{X}_{i}-\bar{X}_{j}$ 之抽樣分配為 $t$ 分配，$\mu_{i}-\mu_{j}$ 的 $(1-\alpha)$ 信賴區間為

$$(\bar{X}_{i}-\bar{X}_{j})\pm t_{\alpha/2}\cdot s_{p}\cdot \sqrt{\frac{1}{n_{i}}+\frac{1}{n_{j}}}$$

[Note] 加權標準差:

(1) 兩母體之標準差已知為 $\sigma_{1}$、$\sigma_{2}$: 

$$Var\left ( \bar{x}-\bar{y} \right )=Var\left ( \bar{x} \right )+Var\left ( \bar{y} \right )=\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}$$

(2) 兩母體之標準差未知: 

$$Var\left ( \bar{x}-\bar{y} \right )=Var\left ( \bar{x} \right )+Var\left ( \bar{y} \right )=\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}$$

(3) 兩母體之標準差未知，但確認兩者相等: 

$$Var\left ( \bar{x}-\bar{y} \right )=Var\left ( \bar{x} \right )+Var\left ( \bar{y} \right )=\frac{s_{p}^{2}}{n_{1}}+\frac{s_{p}^{2}}{n_{2}}=s_{p}^{2}\cdot(\frac{1}{n_{1}}+\frac{1}{n_{2}})\\
混合樣本標準差\ s_{p}=\sqrt{\frac{\left ( n_{1}-1 \right )s_{1}^{2}+\left ( n_{2}-1 \right )s_{2}^{2}}{n_{1}+n_{2}-2}}$$

**- $Bonferroni$ 事後比較 -**

(1) 建立虛無假設 $H_{0}: \mu_{i}=\mu_{j}$

(2) 信賴區間:

$$(\bar{X}_{i}-\bar{X}_{j})\pm t_{\alpha/2}\cdot s_{p}\cdot \sqrt{\frac{1}{n_{i}}+\frac{1}{n_{j}}}$$

(3) 計算 $s_{p}=\sqrt{MSE}$ $\ (Note: MSE=MSW)$

(4) 若有 $k$ 個母體交互比較，信賴區間 $1-\alpha$ 會變成 $1-\alpha/C^{k}_{2}$ (聯合信賴區間)

說明:

$E_{i} (i=1, 2,..., m)$ 為信賴區間之顯著水準，$P\left ( E_{1}\cap...\cap E_{m} \right )=P\left ( E_{i} \right )^{m}$。若希望信賴區間 $P\left ( E_{i} \right )^{m}$ 維持在 $1-\alpha$，則 $P\left ( E_{i} \right )=\left ( 1-\alpha  \right )^{1/m}\approx 1-\alpha /m$ 且 $E_{i} (i=1, 2,..., m)\approx \alpha/m$，其中 $m=C^{k}_{2}$

**- $Sheff\acute{e}$ 事後比較 -**

(1) 建立虛無假設 $H_{0}: \mu_{i}=\mu_{j}$

(2) 信賴區間:

$$(\bar{X}_{i}-\bar{X}_{j})\pm \sqrt{\left ( k-1 \right )F_{\alpha}\left (k-1, N-k \right )}\cdot s_{p}\cdot \sqrt{\frac{1}{n_{i}}+\frac{1}{n_{j}}}$$

(3) 計算 $s_{p}=\sqrt{MSE}$ $\ (Note: MSE=MSW)$

(4) 利用 $t^{2}=F$，$t_{\alpha/2}$ 改成 $\sqrt{\left ( k-1 \right )F_{\alpha}\left (k-1, N-k \right )}$

**- Least Significant Difference (LSD) 事後比較 -**

(1) 建立虛無假設 $H_{0}: \mu_{i}=\mu_{j}$

(2) LSD:

$$t_{\alpha/2}\cdot \sqrt{MSE}\cdot \sqrt{\frac{1}{n_{i}}+\frac{1}{n_{j}}}$$

(3) 若 $\left | \bar{X}_{i}-\bar{X}_{j} \right |> LSD$，則拒絕虛無假設

#### 5. 雙因子變異數分析

雙因子無交互作用之假設檢定

- $H_{0,\ A}: \mu_{1}=\mu_{2}=...=\mu_{a}$


- $H_{0,\ B}: \mu_{1}=\mu_{2}=...=\mu_{b}$

**A. 無交互作用**

(1) 實驗設計

目的: 控制不是研究對象的因子，以獲得要研究對象的因子的影響結果

| **因子 B** \ **因子 A** |  **處理 1**  |  **處理 2**  | **處理 3**  | **...** |
|:------------:|:------------:|:-----------:|:-----------:|:----------:|
| **處理 1** | $樣本_{11}$ | $樣本_{12}$ | $樣本_{13}$ | ... |
| **處理 2** | $樣本_{21}$ | $樣本_{22}$ | $樣本_{23}$ | ... |
| **處理 3** | $樣本_{31}$ | $樣本_{32}$ | $樣本_{33}$ | ... |
|  **...**   | ... | ... | ... | ... | 

(2) 樣本資料

| **區塊(block) B** \ **處理(treatment) A** |  ** 1 **  |  ** 2 **  | **...** | ** a **  | **列總和** |
|:-:|:-:|:-:|:-:|:-:|:-:|
| **1** | $x_{11}$ | $x_{12}$ | ... | $x_{1a}$ | $B_{1}$ = $\sum_{j=1}^{a}x_{1j}$ |
| **2** | $x_{21}$ | $x_{22}$ | ... | $x_{2a}$ | $B_{2}$ = $\sum_{j=1}^{a}x_{2j}$ |
|  **...**   | ... | ... | ... | ... | ... |
| **b** | $x_{b1}$ | $x_{b2}$ | ... | $x_{ba}$ | $B_{b}$ = $\sum_{j=1}^{a}x_{bj}$ |
| **行總和** | $T_{1}$ = $\sum_{i=1}^{b}x_{i1}$ | $T_{2}$ =$ \sum_{i=1}^{b}x_{i2}$ | ... | $T_{a}$ = $\sum_{i=1}^{b}x_{ia}$ | $S$ = $\sum_{j=1}^{a}$$\sum_{i=1}^{b}x_{ij}$ |

[Note] 符號說明:

- $\bar{T}_{j}=T_{j}/b$


- $\bar{B}_{i}=B_{i}/a$


- $\bar{\bar{X}}=S/ab$


$$ 總差異(SST) = 處理方式差異(SSA) + 區集差異(SSB) + 殘差(SSE) $$

$$X_{ij}-\bar{\bar{X}}=(\bar{T}_{j}-\bar{\bar{X}})+(\bar{B}_{i}-\bar{\bar{X}})+(X_{ij}-\bar{T}_{j}-\bar{B}_{i}+\bar{\bar{X}})$$

$$\Rightarrow \sum_{j=1}^{a}\sum_{i=1}^{b}\left ( X_{ij}-\bar{\bar{X}} \right )^{2}=b\cdot \sum_{j=1}^{a}(\bar{T}_{j}-\bar{\bar{X}})^{2}+a\cdot \sum_{i=1}^{b}(\bar{B}_{i}-\bar{\bar{X}})^{2}+\sum_{j=1}^{a}\sum_{i=1}^{b}(X_{ij}-\bar{T}_{j}-\bar{B}_{i}+\bar{\bar{X}})^{2}$$

(3) 雙因子無交互作用之 ANOVA 分析表

| **變異來源** |  **平方和**  |  **自由度**  | **均方和**  | ** F 值 ** |
|:------------:|:------------:|:-----------:|:-----------:|:----------:|
| **處理(A)** | SSA |     a-1    | MSA = SSA/(a-1)       | $F_{A}$ = MSA/MSE |
| **區集(B)** | SSB |     b-1    | MSB = SSB/(b-1)       | $F_{B}$ = MSB/MSE |
| **殘差(E)** | SSE | (a-1)(b-1) | MSE = SSE/[(a-1)(b-1)]|                   |
|  **總和**   | SST |     ab-1   |                       |                   |

**B. 有交互作用**

(1) 實驗設計

應變數同時受到 A 與 B 因子的影響，若考慮 AB 間的交叉影響，則每個區塊應施予兩個以上的樣本(重複試驗)，每個區塊的樣本數可以不同，而相同數目的處理會較容易(均衡實驗設計)

| **因子 B** \ **因子 A** |  **處理 1**  |  **處理 2**  | **處理 3**  | **...** |
|:------------:|:------------:|:-----------:|:-----------:|:----------:|
| **處理 1** | $區塊_{11}$ | $區塊_{12}$ | $區塊_{13}$ | ... |
| **處理 2** | $區塊_{21}$ | $區塊_{22}$ | $區塊_{23}$ | ... |
| **處理 3** | $區塊_{31}$ | $區塊_{32}$ | $區塊_{33}$ | ... |
|  **...**   | ... | ... | ... | ... | 

(2) 樣本資料

| **區塊(block) B** \ **處理(treatment) A** |  ** 1 **  |  ** 2 **  | **...** | ** a **  | **列總和** |
|:-:|:-:|:-:|:-:|:-:|:-:|
| **1** | $x_{111}, x_{112},..., x_{11n}$ | $x_{121}, x_{122},..., x_{12n}$ | ... | $x_{1a1}, x_{1a2},..., x_{1an}$ | $B_{1}$ = $\sum_{j=1}^{a}$$\sum_{k=1}^{n}x_{1jk}$ |
| **2** | $x_{211}, x_{212},..., x_{21n}$ | $x_{221}, x_{222},..., x_{22n}$ | ... | $x_{2a1}, x_{2a2},..., x_{2an}$ | $B_{2}$ = $\sum_{j=1}^{a}$$\sum_{k=1}^{n}x_{2jk}$ |
|  **...**   | ... | ... | ... | ... | ... |
| **b** | $x_{b11}, x_{b12},..., x_{b1n}$ | $x_{b21}, x_{b22},..., x_{b2n}$ | ... | $x_{ba1}, x_{ba2},..., x_{ban}$ | $B_{b}$ = $\sum_{j=1}^{a}$$\sum_{k=1}^{n}x_{bjk}$ |
| **行總和** | $T_{1}$ = $\sum_{i=1}^{b}$$\sum_{k=1}^{n}x_{i1k}$ | $T_{2}$ =$ \sum_{i=1}^{b}$$\sum_{k=1}^{n}x_{i2k}$ | ... | $T_{a}$ = $\sum_{i=1}^{b}$$\sum_{k=1}^{n}x_{iak}$ | $S$ = $\sum_{j=1}^{a}$$\sum_{i=1}^{b}$$\sum_{k=1}^{n}x_{ijk}$ |

[Note] 符號說明:

- $\bar{X}_{\cdot j}=T_{j}/b$


- $\bar{X}_{i\cdot}=B_{i}/a$


- $\bar{X}_{ij}=(x_{ij1}+ x_{ij2}+...+ x_{ijn})/n$


- $\bar{\bar{X}}=S/abn$


$$ 總變異(SST) = A\ 因子變異(SSA) + B\ 因子變異(SSB) + AB\ 交互作用變異(SSAB) + 殘差變異(SSE) $$

$$X_{ijk}-\bar{\bar{X}}=(\bar{X}_{\cdot j}-\bar{\bar{X}})+(\bar{X}_{i\cdot}-\bar{\bar{X}})+(\bar{X}_{ij}-\bar{X}_{i\cdot }-\bar{X}_{j\cdot }+\bar{\bar{X}})+(X_{ijk}-\bar{X}_{ij})$$

$$\Rightarrow \sum_{j=1}^{a}\sum_{i=1}^{b}\sum_{k=1}^{n}\left ( X_{ijk}-\bar{\bar{X}} \right )^{2}=b\cdot \sum_{j=1}^{a}(\bar{X}_{\cdot j}-\bar{\bar{X}})^{2}+a\cdot \sum_{i=1}^{b}(\bar{X}_{i\cdot}-\bar{\bar{X}})^{2}+\sum_{j=1}^{a}\sum_{i=1}^{b}(\bar{X}_{ij}-\bar{X}_{i\cdot }-\bar{X}_{j\cdot }+\bar{\bar{X}})^{2}+\sum_{j=1}^{a}\sum_{i=1}^{b}\sum_{k=1}^{n}(X_{ijk}-\bar{X}_{ij})^{2}$$

(3) 雙因子交互作用之 ANOVA 分析表

| **變異來源** |  **平方和**  |  **自由度**  | **均方和**  | ** F 值 ** |
|:------------:|:------------:|:-----------:|:-----------:|:----------:|
| **因子 A**  | SSA  |     a-1    | MSA = SSA/(a-1)         | $F_{A}$ = MSA/MSE   | 
| **因子 B**  | SSB  |     b-1    | MSB = SSB/(b-1)         | $F_{B}$ = MSB/MSE  |
| **因子 AB** | SSAB | (a-1)(b-1) | MSAB = SSAB/[(a-1)(b-1)]| $F_{AB}$ = MSAB/MSE |
| **殘差(E)** | SSE  |   ab(n-1)  | MSE = SSE/[ab(n-1)]     |                     |
|  **總和**   | SST  |    abn-1   |                         |                     |

(4) 檢定結果說明

a. 若檢定交互作用的結果不顯著，則主效應的檢定較具效力，即具解釋性

b. 若檢定交互作用的結果為顯著，表示兩因子聯合對應變數產生效應，因此單獨執行主效應的檢定變成無意義

c. 若有交互作用時，應以其他方法作更深入的分析，例如: 固定某因子去分析另一因子的效應