### 假設檢定(hypothesis testing)

**1. 對母體參數作一個假設**

- 虛無假設(Null hypothesis): $H_{0}$


- 對立假設(Alternative hypothesis): $H_{1}$


**2. 利用樣本所獲得的樣本統計量來檢定母體參數是否符合假設**

**3. 對此假設作出決策(接受或拒絕假設)**

### 誤差與檢定力

#### 1. 誤差

- Type 1 error: $\alpha$ (顯著水準)

$$\alpha=P(\text{reject}\ |\ \text{True})$$

- Type 2 error: $\beta$

$$\beta=P(\text{accept}\ |\ \text{False})$$

#### 2. 檢定力

$$\text{檢定力}=1-\beta$$

### 誤差控制

**降低 Type 1 error 的方法**

(1) 加寬接受域 $\Rightarrow$ 會增加 Type 2 error

(2) 增加樣本數 $\Rightarrow$ 可以同時降低 Type 1 與 Type 2 error

### 假設檢定的基本步驟

**1. 依照檢定內容建立虛無假設 $H_{0}$**

**2. 依照檢定內容建立對立假設 $H_{1}$ (拒絕域: 雙尾或單尾)**

**3. 判斷使用何種分配檢定:** *Z test*、*t test*、*$\chi^{2}$ test*、*F test*...

**4. 依據顯著水準 $\alpha$ 找出拒絕域(接受域)的理論值**

**5. 將觀察值轉換成樣本統計量並計算 p 值，再與理論值比較來判定結果**

### 單母體假設檢定

**1. 母體平均數之假設檢定**

(1) 大樣本 (雙尾 & 單尾)

a. 建立虛無假設 $H_{0}$ 與對立假設 $H_{1}$

b. 使用 Z 分配

c. 依據顯著水準 $\alpha$ 找出理論 Z 值

d. 將觀察值轉換成樣本統計量: $z=\left ( \bar{x}-\mu  \right )/\left ( \sigma /\sqrt{n} \right )$

e. 比較樣本統計量與理論 Z 值來判定檢定結果

(2) 小樣本 (雙尾 & 單尾)

a. 建立虛無假設 $H_{0}$ 與對立假設 $H_{1}$

b. 小樣本檢定的基本要求: 在母體近似常態分配的前提之下，使用 t 分配

c. 依據顯著水準 $\alpha$ 與自由度(df) 找出理論 t 值

d. 將觀察值轉換成樣本統計量(觀測 t 值): $t=\left ( \bar{x}-\mu  \right )/\left ( s /\sqrt{n} \right )$

e. 比較樣本統計量(觀測 t 值)與理論 t 值來判定檢定結果

**2. 母體比例之假設檢定**

(1) 原始方法: 二項分配法

(2) 母體比例假設檢定常用的方式:

a. 建立虛無假設 $H_{0}$ 與對立假設 $H_{1}$

b. 大樣本($np>5$ & $nq>5$)使用 Z 分配; 小樣本($np<5$ or $nq<5$)使用 Possion 分配

c. 依據顯著水準 $\alpha$ 找出理論 Z 值

d. 將觀察值轉換成樣本統計量: $z=\left ( \hat{p}-p \right )/\sqrt{pq/n}$

e. 比較樣本統計量與理論 Z 值來判定檢定結果

**3. 母體變異數之假設檢定**

(1) 雙尾 & 單尾

a. 建立虛無假設 $H_{0}$ 與對立假設 $H_{1}$

b. 在母體近似常態分配的前提之下，使用**卡方分配**

c. 依據顯著水準 $\alpha$ 與自由度(df) 找出理論 $\chi_{n-1}^{2}$ 值

d. 將觀察值轉換成樣本統計量(觀測 $\chi_{n-1}^{2}$ 值): $\chi_{n-1}^{2}=\left ( n-1 \right )s^{2}/\sigma^{2}$

e. 比較樣本統計量(觀測 $\chi_{n-1}^{2}$ 值)與理論 $\chi_{n-1}^{2}$ 值來判定檢定結果

### 雙母體假設檢定

**1. 兩母體平均數差之假設檢定**

- 母體 1 參數: $\mu_{1}$、$\sigma_{1}$; 樣本 1 統計量: $\bar{x}_{1}$、$s_{1}$、$n_{1}$


- 母體 2 參數: $\mu_{2}$、$\sigma_{2}$; 樣本 2 統計量: $\bar{x}_{2}$、$s_{2}$、$n_{2}$


設 $X_{1}$、$X_{2}$ 分別表示兩母體，若 $X_{1}$ 與 $X_{2}$ 統計獨立，則虛無假設 $H_{0}$ :

$$E\left ( \bar{x}_{1}-\bar{x}_{2}\right )=E\left ( \bar{x}_{1}\right )-E\left ( \bar{x}_{2}\right )=\mu_{1}-\mu_{2}=0$$

兩母體平均數差之變異數:

$$Var\left ( \bar{x}_{1}-\bar{x}_{2}\right )=Var\left ( \bar{x}_{1} \right )+Var\left ( \bar{x}_{2} \right )=\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}$$

(1) 獨立大樣本

- 兩母體之標準差已知: 

$$\sigma_{\bar{x}_{1}-\bar{x}_{2}}=\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}$$

- 兩母體之標準差未知: 

$$\sigma_{\bar{x}_{1}-\bar{x}_{2}}=\sqrt{\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}}$$

- 兩母體之標準差未知，但確認兩者相等: 

$$\sigma_{\bar{x}_{1}-\bar{x}_{2}}=\sqrt{\frac{s^{2}}{n_{1}}+\frac{s^{2}}{n_{2}}}=s_{p}\sqrt{\frac{1}{n_{1}}+\frac{1}{n_{2}}}\\
混合樣本標準差\ s_{p}=\sqrt{\frac{\left ( n_{1}-1 \right )s_{1}^{2}+\left ( n_{2}-1 \right )s_{2}^{2}}{n_{1}+n_{2}-2}}$$

假設檢定的步驟:

a. 建立虛無假設 $H_{0}$ ($\mu_{1}-\mu_{2}=0$) 與對立假設 $H_{1}$ ($\mu_{1}-\mu_{2} \neq 0$)

b. 使用 Z 分配

c. 依據顯著水準 $\alpha$ 找出理論 Z 值

d. 將觀察值轉換成樣本統計量: (兩母體之標準差未知)

$$z=\frac{\left ( \bar{x}_{1}-\bar{x}_{2} \right )-\left( \mu_{1}-\mu_{2} \right)}{\sigma_{\bar{x}_{1}-\bar{x}_{2}}}=\frac{\left ( \bar{x}_{1}-\bar{x}_{2} \right )}{\sqrt{\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}}}$$

e. 比較樣本統計量與理論 Z 值來判定檢定結果

(2) 獨立小樣本 ($n_{1}<30$、$n_{2}<30$)

- 兩母體之標準差已知: 

$$\sigma_{\bar{x}_{1}-\bar{x}_{2}}=\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}$$

- 兩母體之標準差未知，但確認兩者不相等: 

$$s_{\bar{x}_{1}-\bar{x}_{2}}=\sqrt{\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}}\\
自由度\ df=\frac{\left ( \frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}} \right )^{2}}{\frac{\left ( \frac{s_{1}^{2}}{n_{1}} \right )^{2}}{n_{1}-1}+\frac{\left ( \frac{s_{2}^{2}}{n_{2}} \right )^{2}}{n_{2}-1}}$$

- 兩母體之標準差未知，但確認兩者相等: 

$$s_{\bar{x}_{1}-\bar{x}_{2}}=\sqrt{\frac{s^{2}}{n_{1}}+\frac{s^{2}}{n_{2}}}=s_{p}\sqrt{\frac{1}{n_{1}}+\frac{1}{n_{2}}}\\
混合樣本標準差\ s_{p}=\sqrt{\frac{\left ( n_{1}-1 \right )s_{1}^{2}+\left ( n_{2}-1 \right )s_{2}^{2}}{n_{1}+n_{2}-2}},\ 自由度\ df=n_{1}+n_{2}-2$$

假設檢定的步驟:

a. 檢查母體標準差是否已知，若未知則建立虛無假設 $H_{0}$ ($\sigma_{1}^{2}=\sigma_{2}^{2}$) 與對立假設 $H_{1}$ ($\sigma_{1}^{2} \neq \sigma_{2}^{2}$) 並使用 F 檢定 ($F=s_{1}^{2}/s_{2}^{2}$) 確認兩者是否相等

b. 建立虛無假設 $H_{0}$ ($\mu_{1}-\mu_{2}=0$) 與對立假設 $H_{1}$ ($\mu_{1}-\mu_{2} \neq 0$)

c. 若母體標準差已知，依據顯著水準 $\alpha$ 找出理論 Z 值;

若母體標準差未知:

(i) 兩母體之標準差不相等 $\Rightarrow$ 計算自由度 $df$ 並依據顯著水準 $\alpha$ 找出理論 t 值 

$$df=\frac{\left ( \frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}} \right )^{2}}{\frac{\left ( \frac{s_{1}^{2}}{n_{1}} \right )^{2}}{n_{1}-1}+\frac{\left ( \frac{s_{2}^{2}}{n_{2}} \right )^{2}}{n_{2}-1}}$$

(ii) 兩母體之標準差相等 $\Rightarrow$ 計算混合樣本標準差 $s_{p}$、由自由度 $df=n_{1}+n_{2}-2$ 與顯著水準 $\alpha$ 找出理論 t 值

d. 將觀察值轉換成樣本統計量

觀測 Z 值:

$$z=\frac{\left ( \bar{x}_{1}-\bar{x}_{2} \right )-\left( \mu_{1}-\mu_{2} \right)}{\sigma_{\bar{x}_{1}-\bar{x}_{2}}}=\frac{\left ( \bar{x}_{1}-\bar{x}_{2} \right )}{\sqrt{\frac{\sigma_{1}^{2}}{n_{1}}+\frac{\sigma_{2}^{2}}{n_{2}}}}$$

觀測 t 值:

(i) 兩母體之標準差不相等

$$t=\frac{\left ( \bar{x}_{1}-\bar{x}_{2} \right )-\left( \mu_{1}-\mu_{2} \right)}{s_{\bar{x}_{1}-\bar{x}_{2}}}=\frac{\left ( \bar{x}_{1}-\bar{x}_{2} \right )}{\sqrt{\frac{s_{1}^{2}}{n_{1}}+\frac{s_{2}^{2}}{n_{2}}}}$$

(ii) 兩母體之標準差相等

$$t=\frac{\left ( \bar{x}_{1}-\bar{x}_{2} \right )-\left( \mu_{1}-\mu_{2} \right)}{s_{\bar{x}_{1}-\bar{x}_{2}}}=\frac{\left ( \bar{x}_{1}-\bar{x}_{2} \right )}{s_{p}\sqrt{\frac{1}{n_{1}}+\frac{1}{n_{2}}}}$$

e. 比較樣本統計量 (觀測 Z 值/觀測 t 值) 與 理論 Z 值/理論 t 值 來判定檢定結果

(3) 相依樣本

$\Rightarrow$ 將 $D_{i}=X_{1i}-X_{2i}$ 視為一個樣本處理

分類:

a. 大樣本，母體變異數已知

$$z=\frac{\bar{D}-\mu_{D}}{\sigma_{\bar{D}}}=\frac{\bar{D}-\mu_{D}}{\sigma_{D}/\sqrt{n}}$$

b. 大樣本，母體變異數未知

$$z=\frac{\bar{D}-\mu_{D}}{s_{\bar{D}}}=\frac{\bar{D}-\mu_{D}}{s_{D}/\sqrt{n}}$$

c. 小樣本，母體常態、母體變異數已知

$$z=\frac{\bar{D}-\mu_{D}}{\sigma_{\bar{D}}}=\frac{\bar{D}-\mu_{D}}{\sigma_{D}/\sqrt{n}}$$

d. 小樣本，母體常態、母體變異數未知

$$t=\frac{\bar{D}-\mu_{D}}{s_{\bar{D}}}=\frac{\bar{D}-\mu_{D}}{s_{D}/\sqrt{n}}$$

假設檢定的步驟: 與**單母體平均數之假設檢定**的方式相同

**2. 兩母體比例差之假設檢定**

- 母體 1 之比例: $p_{1}$; 從母體 1 抽出樣本 1 之比例: $\hat{p}_{1}$


- 母體 2 之比例: $p_{2}$; 從母體 2 抽出樣本 2 之比例: $\hat{p}_{2}$


- 母體比例差: $p_{1}-p_{2}$; 樣本比例差: $\hat{p}_{1}-\hat{p}_{2}$


- 大樣本中，根據中央極限定理(C.L.T)，樣本比例(差)之抽樣分配:

$$\hat{p}_{1}\sim N\left ( p_{1}, \sqrt{\frac{p_{1}q_{1}}{n_{1}}} \right )$$

$$\hat{p}_{2}\sim N\left ( p_{2}, \sqrt{\frac{p_{2}q_{2}}{n_{2}}} \right )$$

$$\hat{p}_{1}-\hat{p}_{2}\sim N\left ( p_{1}-p_{2}, \sqrt{\frac{p_{1}q_{1}}{n_{1}} +\frac{p_{2}q_{2}}{n_{2}}} \right )$$

- 母體比例差檢定之樣本統計量: 

$$z=\frac{\left ( \hat{p}_{1}-\hat{p}_{2} \right )-\left ( p_{1}-p_{2} \right )}{s_{\hat{p}_{1}-\hat{p}_{2}}},\ 其中\ s_{\hat{p}_{1}-\hat{p}_{2}}=\sqrt{\frac{\hat{p}_{1}\hat{q}_{1}}{n_{1}} +\frac{\hat{p}_{2}\hat{q}_{2}}{n_{2}}}\ (以 \hat{p}_{1}、\hat{p}_{2} 估計未知的 p_{1}、p_{2})\\
若虛無假設\ H_{0}: p_{1}=p_{2}，則\ s_{\hat{p}_{1}-\hat{p}_{2}}=\sqrt{pq\left ( \frac{1}{n_{1}} +\frac{1}{n_{2}} \right )},\ 其中\ p=\frac{n_{1}\hat{p}_{1}+n_{2}\hat{p}_{2}}{n_{1}+n_{2}}$$

假設檢定之步驟:

a. 建立虛無假設 $H_{0}$ 與對立假設 $H_{1}$

b. 大樣本($np>5$ & $nq>5$)使用 Z 分配

c. 依據顯著水準 $\alpha$ 找出理論 Z 值

d. 將觀察值轉換成樣本統計量: $z=\frac{\left ( \hat{p}_{1}-\hat{p}_{2} \right )-\left ( p_{1}-p_{2} \right )}{s_{\hat{p}_{1}-\hat{p}_{2}}}$

e. 比較樣本統計量與理論 Z 值來判定檢定結果

**3. 兩母體變異數比之假設檢定**

- 母體 1 之變異數: $\sigma_{1}^{2}$; 從母體 1 抽出樣本 1 之變異數: $s_{1}^{2}$


- 母體 2 之變異數: $\sigma_{2}^{2}$; 從母體 2 抽出樣本 2 之變異數: $s_{2}^{2}$


- 統計量 $F$:

$$F\left ( n_{1}-1,n_{2}-1 \right )=\frac{s_{1}^{2}/\sigma_{1}^{2}}{s_{2}^{2}/\sigma_{2}^{2}}=\frac{s_{1}^{2}}{s_{2}^{2}},\ (虛無假設\ H_{0}: \sigma_{1}^{2}=\sigma_{2}^{2})$$

假設檢定之步驟:

a. 建立虛無假設 $H_{0}$ 與對立假設 $H_{1}$

b. 使用 **F 分配** 計算出 F 值: $s_{1}^{2}/s_{2}^{2}$

c. 依據顯著水準 $\alpha$ 與自由度 ($df$) 找出理論 F 值

d. 比較統計量 F 值與理論 F 值來判定檢定結果

**4. McNemar 檢定 (非獨立/相依樣本比例之卡方檢定)**

(1) 主要檢定事件發生前後的比例是否改變 (檢定事件發生前後 $\text{true}\rightarrow \text{false}$ 與 $\text{true}\rightarrow \text{false}$ 的比例是否相等)

(2) 檢定方法:

a. 以二階列聯表表示:

|事件前 \ 事件後|  **成功**  |  **失敗**  |
|:------:|:------:|:------:|
| **成功** | A | B |
| **失敗** | C | D |

b. 虛無假設 $H_{0}: p_{2}=p_{3}$，對立假設 $H_{1}: p_{2}\neq p_{3}\ |\ H_{1}: p_{2} > p_{3}\ |\ H_{1}: p_{2} < p_{3}$

($p_{2}=\frac{B}{A+B+C+D}$，$p_{3}=\frac{C}{A+B+C+D}$)

c. 檢定統計量: $Z=\frac{B-C}{\sqrt{B+C}}$

(3) 假設檢定的步驟:

a. 建立虛無假設 $H_{0}$ 與對立假設 $H_{1}$

b. 在大樣本前提下，使用 Z 分配 ($B+C\geq 10$)

c. 依據顯著水準 $\alpha$ 找出理論 Z 值

d. 計算樣本統計量: $Z=\frac{B-C}{\sqrt{B+C}}$

e. 比較樣本統計量與理論 Z 值來判定檢定結果