<a href="https://colab.research.google.com/github/hank199599/data_science_from_scratch_reading_log/blob/main/Chapter7.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 統計假設檢定

* ## 零假設(H₀,null hypothesis)：表達我們預設的立場
* ## 替代假設(H₁,alternative hypothesis)：與預設立場對比的立場



### 範例：擲硬幣測試
假設我們想知道一枚硬幣是否是公正的，假設正面朝上的機率是p：
* 零假設(H₀)：認為硬幣是公正的，即p=0.5 
* 替代假設(H₁)：認為硬幣是不公正的，即p≠0.5 
  
**檢定方法**：  
丟擲硬幣N次，然後計算正面朝上的次數。
而每一次丟擲硬幣都代表一次伯努利測試，則X是一個二項式隨機變數Binomial(n,p)。  
因此可以用常態分佈來當作近似結果。  

In [8]:
from typing import Tuple
import math

def normal_approximation_to_binomial(n:int,p:float) -> Tuple[float,float]:
  #送回Binominal(n,p)對應的平均值mu和標準差sigma
  mu = n*p
  sigma = math.sqrt(p*(1-p)*n)
  return mu,sigma

只要隨機變數確實依循常態分佈，我們就可以用normal_cdf算出其值落在特定區間內(或之外)的機率

In [9]:
import math
SQRT_TWO_PI = math.sqrt(2* math.pi)

# 機率密度函數 (PDF,probability density function)
def normal_pdf(x:float,mu:float=0,sigma:float=1) ->float:
  return (math.exp(-(x-mu)**2/2/sigma**2)/(SQRT_TWO_PI*sigma))

# 累積分佈函數 (CDF,cumulative density function)
def normal_cdf(x:float,mu:float=0,sigma:float=1)->float:
  return (1+math.erf((x-mu)/math.sqrt(2)/sigma))/2

In [10]:
# normal_cdf 代表的是變數落在某個門檻值以下的機率
normal_probability_below = normal_cdf

#若不在門檻值以下，就表示在門檻值以上 
def normal_probability_above(lo:float,
               mu:float = 0,
               sigma:float = 1) ->float:
  return 1 - normal_cdf(lo,mu,sigma) # N(mu,sigma)大於lo的機率

#若低於 hi 且不低於 lo ，就表示落在區間之內
def normal_probability_between(lo:float,
               hi:float,
               mu:float = 0,
               sigma:float = 1) ->float:
  return normal_cdf(hi,mu,sigma) - normal_cdf(lo,mu,sigma) # N(mu,sigma)介於 hi 與 lo的機率

#若不在區間之內，就表示落在區間之外 
def normal_probability_above(lo:float,
               mu:float = 0,
               sigma:float = 1) ->float:
  return 1 - normal_probability_between(lo,hi,mu,sigma) # N(mu,sigma)不介於 hi 與 lo 之間的機率

或是自機率反推常態分佈中相對應**「非尾區間」(nontail region)**

In [11]:
def inverse_normal_cdf(p:float,
            mu:float = 0,
            sigma:float=1,
            tolerance:float=0.00001) -> float:
  # 如果不是標準常態分佈，就先轉換成標準常態分佈
  if mu != 0 or sigma != 1:
    return mu + sigma*inverse_normal_cdf(p,tolerance = tolerance)
  
  low_z = -10.0 # normal_cdf(-10)是(趨近於) 0
  hi_z =  10.0 # normal_cdf(10)是(趨近於) 1
  while hi_z - low_z > tolerance:  
    mid_z = (low_z + hi_z) / 2   # 計算出中間值
    mid_p = normal_cdf(mid_z)     # 以及累積分佈函數在該處所應對的值
    if mid_p < p :
      low_z = mid_z        #中間的值太低，就往上繼續搜尋
    else:
      hi_z = mid_z        #中間的值太高，就往下繼續搜尋
  
  return mid_z

In [29]:

#送回一個 z 值，使的 P(Z <= z)等於某機率值
def normal_upper_bound(probability:float,
            mu:float = 0,
            sigma:float = 1) -> float:
  
  return inverse_normal_cdf(probability,mu,sigma) 

#送回一個 z 值，使的 P(Z >= z)等於某機率值
def normal_lower_bound(probability:float,
            mu:float = 0,
            sigma:float = 1) -> float:
  
  return inverse_normal_cdf( 1 - probability,mu,sigma)

def normal_two_sided_bounds(probability:float,
               mu:float = 0,
               sigma:float = 1) -> Tuple[float,float]:
  #送回一組(以平均值為中心的)對稱邊界，其中所涵蓋的區域正好等於指定的機率值
  tail_probability = ( 1 - probability) /2

  #高於上邊界的機率，應恰好等於tail_probabiity
  upper_bound = normal_lower_bound(tail_probability,mu,sigma)

  #低於上邊界的機率，也應恰好等於tail_probabiity
  lower_bound = normal_upper_bound(tail_probability,mu,sigma)

  return upper_bound,lower_bound

進行測試，假設我們選擇丟擲硬幣n=1000次，如果「硬幣是公正的」這個假設是正確的，  
X的分布應該就會趨近於平均值500、標準差15.8的常態分佈。

In [27]:
mu_0,sigma_0 = normal_approximation_to_binomial(1000,0.5)

print("平均值:",mu_0)
print("標準差:",sigma_0)

平均值: 500.0
標準差: 15.811388300841896


## 顯著性與檢定力

|---|實際為真|實際為假|  
|---|---|---|
|預測為真| 真陽性|偽陽性(type I error)
|預測為假| 偽陰性(type II error)|真陰性


### 顯著性 (significant)
允許多大的機率犯下**第一類型錯誤(type I error)**  
即 H₀假設為真，但我們卻否決掉它 (假陽性)
  
通常將允許的機率值設為1%或5%

In [31]:
#(469,531)
mu_0=500
sigma_0=15.811388300841896

lower_bound,upper_bound = normal_two_sided_bounds(0.95,mu_0,sigma_0)
print("下界:",lower_bound)
print("上界:",upper_bound)

下界: 530.9897335951244
上界: 469.01026640487555


如果p真的是0.5(即H₀假設為真)，將觀測到的X就應該只有5%的機率會落在此區間之外。  
即每做20次檢定，大概就有19次能給出正確的答案。

### 檢定力 (power)
允許多大的機率犯下**第二類型錯誤(type II error)**  
即 H₀假設為假，但我們卻沒有否決掉它 (假陰性)
  
通常將允許的機率值設為1%或5%

假設p實際上是0.55，則硬幣的確是較容易擲出正面。

In [2]:
#根據 p = 0.5的零假設，所得到的95%邊界
lo,hi = normal_two_sided_bounds(0.95,mu_0,sigma_0)

#因為實際上 p = 0.55，可根據此情況算出真實的mu與sigma
mu_1,sigma_1 = normal_approaimation_to_binominal(1000,0.55)

#第二類型錯誤代表我們應該否決，卻為否決零假設(使其成為偽陰性)
type_2_probability = normal_probability_between(li,hi,mu_1,sigma_1)
power = 1 - type_2_probability  #0.8887,這就是「不」犯下第二類錯誤的機率

NameError: ignored

# p值 (p-values)
根據檢定方法實際上所得到的結果，反向計算出性的機率值。  
即假設H₀為真，那麼針對我們實際觀測到的數字而言，要出現這種程度以上的值機率為多少?



## 雙邊檢定方法(two_sided test)

In [1]:
def two_sided_p_value(x:float,mu:float=0,sigma:float=1) ->float:
  #假設我們的值依循N(mu.sigma)的分布，理論上要出現X這種程度的值機率究竟多大?
  if x >= mu:
    #如果x大於平均值，我們計算大於x那邊的上尾部
    return 2*normal_probability_above(x,mu,sigma)

  else:
    #如果x小於平均值，我們計算大於x那邊的下尾部
    return 2*normal_probability_below(x,mu,sigma)

假設看到檢定的結果出現530次，我們就可以計算出相應的p值。

In [None]:
two_sided_p_value(529.5,mu_0,sigma_0)

# 信賴區間

# p-Hacking

# 貝氏推論