# 数理統計学 10節解答

## 使うモジュールのインポート
この節では、`scipy.stats.norm, scipy.stats.t, scipy.stats.chi2`を使う。  
それぞれが、正規分布、t分布、カイ自乗分布に対応している。  
`scipy.stats.norm.interval(alpha, loc, scale)`は$\mathcal{N}\left(\text{loc}, \text{scale}\right)$の両側$\alpha$点を出力する。  
詳細については、[stats.norm](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.norm.html), [stats.t](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.t.html), [stats.chi2](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.chi2.html)を参照。

In [1]:
import numpy as np
from scipy import stats

## 10.1

In [15]:
samples1 = np.array([70, 69, 72, 74, 66, 68, 69, 70, 71, 69, 73, 72, 68, 72, 67])
samples2 = np.array([69, 72, 71, 74, 68, 67, 72, 72, 72, 70, 75, 73, 71, 72, 69])
diff = samples1 - samples2
n = len(diff)
t_975 = stats.t.ppf(0.975, n-1)
t = np.mean(diff)*np.sqrt(n/np.var(diff, ddof=1))

print('|T|: ', np.abs(t))
print('t_975: ', t_975)
if np.abs(t) > t_975:
    print('棄却')
else:
    print('採択')

|T|:  3.011934408137695
t_975:  2.1447866879169273
棄却


## 10.2

In [38]:
mu_1 = np.mean(samples1)
mu_2 = np.mean(samples2)
sigma2 = ((n-1)*np.var(samples1, ddof=1) + (n-1)*np.var(samples2, ddof=1)) / (2*n-2)
t_975 = stats.t.ppf(0.975, 2*n-2)
t = (mu_1 - mu_2)/np.sqrt((2/n)*sigma2)

print('|T|: ', np.abs(t))
print('t_975: ', t_975)
if np.abs(t) > t_975:
    print('棄却')
else:
    print('採択')

1.3795305076179911
2.048407141795244
accept


## 10.3

In [18]:
sigma_1 = np.var(samples1, ddof=1)
sigma_2 = np.var(samples2, ddof=1)
f = sigma_1 / sigma_2
f_left = stats.f.ppf(0.05, n-1, n-1)
f_right = stats.f.ppf(0.95, n-1, n-1)

print('F: ',f)
print('F_left, F_right: ', f_left, f_right)
if f < f_left or f > f_right:
    print('棄却')
else:
    print('採択')

F:  1.0925196850393701
F_left, F_right:  0.40262094298131085 2.483725741128222
採択


## 10.4

In [19]:
sample1 = [150, 163, 161, 130, 147, 145, 138, 168, 164, 147]
sample2 = [145, 134, 115, 122, 101, 147, 130, 112, 126, 129]
n = len(sample1)
mu_1 = np.mean(sample1)
mu_2 = np.mean(sample2)
sigma2 = (n-1) * (np.var(sample1, ddof=1) + np.var(sample2, ddof=1)) / (2*n-2)
t_975 =  stats.t.ppf(0.975, 2*n-2)
t = (mu_1-mu_2) / np.sqrt(sigma2*2/n)


print('|T|: ', np.abs(t))
print('t_975: ', t_975)
if np.abs(t) > t_975:
    print('棄却')
    print('差があると言える')
else:
    print('採択')
    print('差があると言えない')

|T|:  4.207147835294249
t_975:  2.10092204024096
棄却
差があると言える


## 10.5

In [20]:
sigma_1 = np.var(sample1, ddof=1)
sigma_2 = np.var(sample2, ddof=1)
f = sigma_2 / sigma_1
f_left = stats.f.ppf(0.05, n-1, n-1)
f_right = stats.f.ppf(0.95, n-1, n-1)

print('F: ',f)
print('F_left, F_right: ', f_left, f_right)
if f < f_left or f > f_right:
    print('棄却')
    print('同じと言えない')
else:
    print('採択')
    print('同じと言える')

F:  1.339685530034055
F_left, F_right:  0.31457490615130795 3.178893104458269
採択
同じと言える


## 10.6

In [21]:
m = 100
n = 200
mu_1 = 16/100
mu_2 = 50/100

t = (mu_1 - mu_2) / np.sqrt(mu_1*(1-mu_1)/m + mu_2*(1-mu_2)/n)
z = stats.norm.ppf(0.975)

if abs(z) > t:
    print('棄却')
    print('差があると言える')
else:
    print('採択')
    print('差がないと言えない')

棄却
差があると言える


In [11]:
# 棄却域を求める
def calculate_beta(n):
    right = stats.norm.ppf(0.95, 160, np.sqrt(15/n))
    beta = stats.norm.cdf(right, 165, np.sqrt(15/n))
    return beta

n = 1
while(calculate_beta(n) > 0.05):
    n += 1
print('the answer is ', n)

the answer is  7


In [12]:
calculate_beta(8)

0.022394532475292373

In [4]:
right

167.59090787128997