In [1]:
import numpy as np
from scipy import stats

# 仮説検定の枠組み

In [2]:
dat = np.random.normal(loc=1.1, size=50)      # データ生成
Z,pval = stats.ttest_1samp(dat,1)                    # 両側 t-検定
Z                      # 検定統計量

-1.3655372233831584

In [3]:
pval                   # p値

0.17832039959597645

In [4]:
dat = np.random.normal(loc=1.1, size=200)    # データ数200
Z,pval = stats.ttest_1samp(dat,1)            # 両側 t-検定
pval                  # p値

0.14512543371001402

In [5]:
dat = np.random.normal(loc=1.1, size=200)   # データ生成
Z,pval = stats.ttest_1samp(dat,1)           # 両側 t-検定

In [6]:
pval      # 両側検定のp値

0.15457504436319963

In [7]:
pval/2   # 片側検定のp値

0.07728752218159982

In [8]:
# データ生成
x = np.random.normal(loc=1.1, size=100)  
y = np.random.normal(loc=1,   size=500)

In [9]:
# 二標本検定：等分散を仮定
Z,pval = stats.ttest_ind(x,y)         
pval

0.7470156791362829

In [10]:
# 二標本検定：等分散を仮定しない
Z,pval = stats.ttest_ind(x,y,equal_var=False)  
pval

0.740239349831558

In [11]:
# データ生成
x = np.random.normal(loc=1.1, scale=1,   size=1000)
y = np.random.normal(loc=1,   scale=1.1, size=1000)

In [12]:
# 二標本検定：等分散を仮定しない
Z,pval = stats.ttest_ind(x,y,equal_var=False)
pval

0.032117190939548075

In [13]:
# 二標本検定(ペア)
Z,pval = stats.ttest_rel(x,y)
pval

0.03079816945119196

In [14]:
# 二標本検定(ペア)：データを変換し ttest_1samp で計算
Z,pval = stats.ttest_1samp(x-y,0)
pval

0.03079816945119196

# ノンパラメトリック検定

## U検定

In [15]:
# 例1. 同じ分布にしたがう標本．
x = np.random.normal(loc=1,size=500)
y = np.random.normal(loc=1,size=300)
r,pval = stats.mannwhitneyu(x,y,alternative='two-sided')  # 両側検定
r      # U統計量

74165.0

In [16]:
pval   # p値

0.7919900633453141

In [17]:
# 例2. 同じ期待値の分布にしたがう標本．分散は異なる．
x = np.random.normal(loc=1,scale=2,size=500)
y = np.random.normal(loc=1,scale=1,size=300)
r,pval = stats.mannwhitneyu(x,y,alternative='two-sided')  # 両側検定  
r      # U統計量

71461.0

In [18]:
pval   # p値

0.26345030906086975

In [19]:
# 例3. 異なる期待値の分布にしたがう標本．
x = np.random.normal(loc=1.2, size=500)
y = np.random.normal(loc=1  , size=300)
r,pval = stats.mannwhitneyu(x,y,alternative='two-sided')
r      # U統計量

79470.0

In [20]:
pval   # p値

0.15780353658180246

## KS検定

In [21]:
# 同じ分布にしたがう標本
x = np.random.normal(loc=1,size=500)
y = np.random.normal(loc=1,size=300)
D,pval = stats.ks_2samp(x,y)

D      # 検定統計量

0.07800000000000001

In [23]:
pval   # p値

0.19550788788921677

In [24]:
# 同じ期待値で分散が異なる分布にしたがう標本
x = np.random.normal(loc=1,scale=2,size=500)
y = np.random.normal(loc=1,scale=1,size=300)
D,pval = stats.ks_2samp(x,y)         
D               # 検定統計量

0.20866666666666667

In [25]:
pval            # p値

1.1928012082186726e-07