In [1]:
from scipy import stats
import numpy as np
import pandas as pd

In [2]:
%matplotlib inline
import seaborn as sns

sns.set()

#### 62. 母平均の検定（t検定）

In [3]:
n = 9 #標本数
mu = 170 #標本平均 
sigma = 5.2 #不偏分散

#帰無仮説: 母平均は165cmである
#対立仮説: 母平均は165cmより高い

expected = 165

alpha = 0.95 #y有意水準

In [4]:
t = (mu - expected)/np.sqrt(sigma**2/n) #検定統計量
dof = n-1 #自由度
p = stats.t.sf(t, n-1) #検定統計量より高い事象の起こる確率

print(f"t値: {t}")
print(f"p値: {p}")
print(f"棄却: {p < (1-alpha)}")

t値: 2.8846153846153846
p値: 0.010183372003112291
棄却: True


#### 63. 母平均の差の検定（ウェルチのｔ検定）

In [5]:
n_a = 9
mu_a = 170
sigma_a = 5.2

n_b = 12
mu_b = 167
sigma_b = 4.9

#帰無仮説: AとBの平均の差はない
#対立仮説: Aの平均はBの平均より高い

alpha = 0.05 #有意水準

In [6]:
t = ((mu_a - mu_b) - 0)/np.sqrt(sigma_a**2/n_a + sigma_b**2/n_b) #検定統計量
dof = round((sigma_a**2/n_a + sigma_b**2/n_b)**2/((sigma_a**2/n_a)**2/(n_a-1) + (sigma_b**2/n_b)**2/(n_b-1))) #自由度
p = stats.t.sf(t, dof) #検定統計量より高い事象の起こる確率

print(f"t値: {t}")
print(f"p値: {p}")
print(f"棄却: {p < alpha}")

t値: 1.3409332583841793
p値: 0.09879269944696872
棄却: False


In [7]:
t, p = stats.ttest_ind_from_stats(
    mu_a, sigma_a, n_a, 
    mu_b, sigma_b, n_b, 
    equal_var=False, alternative="greater")

print(f"t値: {t}")
print(f"p値: {p}")
print(f"棄却: {p < alpha}")

t値: 1.3409332583841793
p値: 0.09890216210944502
棄却: False


#### 67. カイ二乗検定（独立性の検定）

In [8]:
data = np.array([
    [7, 3],
    [13, 27]
]) #標本データ

#帰無仮説: 独立である
#対立仮説: 独立でない

alpha = 0.05 #有意水準

In [9]:
sum_0 = np.sum(data, axis=0).reshape(1, -1)
sum_1 = np.sum(data, axis=1).reshape(-1, 1)
sum = np.sum(data)
expected = np.dot(sum_1, sum_0)/sum #帰無仮説のデータ

t = np.sum((data - expected)**2 / expected) #検定統計量
dof = np.prod(np.array(data.shape) - 1) #自由度
p = stats.chi2.sf(t, dof) #検定統計量より高い事象の起こる確率

print("帰無仮説:")
print(expected)
print(f"t値: {t}")
print(f"p値: {p}")
print(f"棄却: {p < alpha}")

帰無仮説:
[[ 4.  6.]
 [16. 24.]]
t値: 4.6875
p値: 0.030382821976577483
棄却: True


In [10]:
t, p, dof, expected = stats.chi2_contingency(data, correction=False)

print("帰無仮説:")
print(expected)
print(f"t値: {t}")
print(f"p値: {p}")
print(f"棄却: {p < alpha}")

帰無仮説:
[[ 4.  6.]
 [16. 24.]]
t値: 4.6875
p値: 0.030382821976577483
棄却: True
