# 範例1:單母體平均值檢定

In [384]:
#讀入NYSE本益比資料
import pandas as pd
NYSE= pd.read_csv("NYSE.csv")
NYSE.head()

Unnamed: 0,P/E ratio
0,27.96
1,22.9
2,8.3
3,49.78
4,24.68


In [385]:
#單母體平均值檢定
#檢定NYSE的本益比是否平均數為30
from scipy import stats 
stats.ttest_1samp(NYSE, 30,alternative="two-sided")

Ttest_1sampResult(statistic=array([-3.76327226]), pvalue=array([0.00082506]))

結論:

(1)statistic=-3.76327226
   拒絕域為 /t/> 2.052
   
   abs(-3.76327226) = 3.76327226 > 2.052，檢定統計量的值落於拒絕域中
   
(2)pvalue=0.00082506 < 0.05，在0.05顯著水準下，拒絕虛無假設

在0.05的顯著水準下，NYSE本益比平均值不為30。

# 範例2:單母體變異數檢定 

In [386]:
#讀入NYSE本益比資料
import pandas as pd
NYSE= pd.read_csv("NYSE.csv")
NYSE.head()

Unnamed: 0,P/E ratio
0,27.96
1,22.9
2,8.3
3,49.78
4,24.68


In [387]:
import numpy as np
#單母體變異數檢定
#檢定NYSE的本益比是否變異數為100

#計算樣本變異數
var=np.var(NYSE,ddof = 1) 

#計算統計量
chi_square=((27)*var)/100
chi_square

P/E ratio    24.334802
dtype: float64

In [389]:
#計算p-vaule，自由度為27
from scipy.stats import chi2
p_value=chi2.cdf(x=chi_square,df=27)
p_value

array([0.38831321])

結論:

(1)statistic=24.334802
   拒絕域為 卡方統計量 > 43.1945 或 < 14.5734
   檢定統計量的值並未落於拒絕域中
   
(2)pvalue=0.38831321 > 0.05，在0.05顯著水準下，不拒絕虛無假設

在0.05的顯著水準下，NYSE本益比變異數為100。


# 範例3:單母體比例檢定

In [390]:
#讀入NYSE本益比資料
import pandas as pd
NYSE= pd.read_csv("NYSE.csv")
NYSE.head()

Unnamed: 0,P/E ratio
0,27.96
1,22.9
2,8.3
3,49.78
4,24.68


In [395]:
#調查本益比大於20的比例約0.5，隨機抽取28位，得知本益比大於25的比例為0.32，查調查結果是否可靠?
p=0.5
q=1-p
sigma=((p*q)/28)**0.5
z=(0.32-0.5)/sigma
z
#z=-1.9049409439665053 ， 臨界值-1.96，不落入拒絕域 

-1.9049409439665053

# 範例4:雙母體的平均值檢定

In [203]:
#讀入NYSE與TWSE本益比資料
import pandas as pd
PE_ratio= pd.read_csv("PE_RATIO.csv")
PE_ratio.head()

Unnamed: 0,TWSE,NYSE
0,15.13,27.96
1,13.48,22.9
2,23.74,8.3
3,22.4,49.78
4,15.45,24.68


In [205]:
# 個別指派變數
TWSE_PE_ratio=[PE_ratio.TWSE]
NYSE_PE_ratio=[PE_ratio.NYSE]

In [206]:
from scipy import stats
stats.ttest_ind(NYSE, TWSE, equal_var = True, alternative='two-sided')

Ttest_indResult(statistic=array([1.76677961]), pvalue=array([0.0812801]))

結論:

(1)statistic=1.76677961 ，檢定統計量的值並未落於拒絕域中
   
(2)pvalue=0.0812801 > 0.05，在0.05顯著水準下，不拒絕虛無假設

在0.05的顯著水準下，NYSE與TWSE本益比平均數沒有不同。

# 範例5:雙母體的變異數檢定

In [400]:
#讀入NYSE與TWSE本益比資料
import pandas as pd
PE_ratio= pd.read_csv("PE_RATIO.csv")
PE_ratio.head()

Unnamed: 0,TWSE,NYSE
0,15.13,27.96
1,13.48,22.9
2,23.74,8.3
3,22.4,49.78
4,15.45,24.68


In [241]:
# 個別指派變數
TWSE_PE_ratio=[PE_ratio.TWSE]
NYSE_PE_ratio=[PE_ratio.NYSE]

In [401]:
#左尾檢定
from scipy.stats import f
n1=50; n2=28
alpha=0.05
var_NYSE=np.var(NYSE,ddof = 1) 
var_TWSE=np.var(TWSE,ddof = 1)
fc=f.ppf(alpha,n1-1,n2-1)
fc #臨界值

0.583314124057284

In [402]:
f0=var_TWSE/var_NYSE
f0 #檢定統計量   
#統計量>臨界值，不落入拒絕域

P/E ratio    3.377378
dtype: float64

In [290]:
#p-value
pvalue = f.cdf(f0,n1-1,n2-1)
pvalue
#pvale>0.05，不落入拒絕域

array([0.99944467])

結論:NYSE與TWSE整體本益比變異數相等

# 範例6:雙母體比例檢定

In [357]:
#讀入NYSE本益比資料
import pandas as pd
NYSE= pd.read_csv("NYSE.csv")
NYSE.head()

Unnamed: 0,P/E ratio
0,27.96
1,22.9
2,8.3
3,49.78
4,24.68


In [404]:
#讀入TWSE本益比資料
import pandas as pd
TWSE= pd.read_csv("TWSE.csv")
TWSE.head()

Unnamed: 0,P/E ratio
0,15.13
1,13.48
2,23.74
3,22.4
4,15.45


In [405]:
#右尾檢定
#調查建議投資NYSE還是TWSE，隨機抽出NYSE 28家，本益比大於20，有19家
#再隨機抽出TWSE 50家，本益比大於20，有10家
#檢定NYSE中本益比大於20的比例是否大於TWSE
p0=0
n1=50; n2=28
pbar1=19/28
pbar2=10/50
pbar=(n1*pbar1+n2*pbar2)/(n1+n2)
se=np.sqrt(pbar*(1-pbar)*(1/n1+1/n2))
pbar0=pbar1-pbar2
alpha=0.05
zc=norm.ppf(1-alpha,0,1)
zc #臨界值

1.6448536269514722

In [375]:
#pbarc=p0+zc*se
z0=(pbar0-p0)/se
z0

4.05539694760702

In [376]:
#p-value
1-norm.cdf(pbar0,p0,se)
1-norm.cdf(z0,0,1)
#落入拒絕域，代表NYSE的本益比大於20的比例高於TWSE

2.502461739117834e-05