### ■ 問2　母比率の区間推定

In [5]:
import math
from scipy.stats import norm

# データ
n = 200
x = 20
p_hat = x / n  # 点推定

# 95%信頼区間の計算
z = norm.ppf(0.975)  # 1.96
se = math.sqrt(p_hat * (1 - p_hat) / n)

lower = p_hat - z * se
upper = p_hat + z * se

print("点推定（不良品率）:", p_hat)
print("95%信頼区間:", (lower, upper))


点推定（不良品率）: 0.1
95%信頼区間: (np.float64(0.058422885269509665), np.float64(0.14157711473049034))


In [7]:
#------------------------------
#------------------------------
#------------------------------
#------------------------------

### ■ 問2　母比率の区間推定

In [10]:
import numpy as np
from scipy import stats

## １.点推定

In [28]:
n = 200
x = 20
p_hat = x / n

## 2.区間推定
##### 二項分布の区間推定を行う

In [29]:
ci = 0.95 #信頼区間(confidence interval)
n = 200 #サンプル数


In [30]:
u_0025, u_0975 = stats.binom.interval(ci, n, p_hat) 
u_0025, u_0975

(np.float64(12.0), np.float64(29.0))

##### 二項分布に従う確率変数が出てくるので、母比率はサンプル数で割る

In [31]:
lower = u_0025 / n
upper = u_0975 / n

In [34]:
print(f"下限={lower:.2f}\n上限={upper:.2f}")

下限=0.06
上限=0.14


### ■ 問3 相関係数の区間推定

In [44]:
import numpy as np
from statsmodels.stats.proportion import proportions_ztest, confint_proportions_2indep

# データ
n_A = 200   # Aの製造数
x_A = 20    # Aの不良数

n_B = 100   # Bの製造数
x_B = 11    # Bの不良数

# 比率
p_A = x_A / n_A
p_B = x_B / n_B

print("装置A 不良率:", p_A)
print("装置B 不良率:", p_B)
print("不良率の差 (A - B):", p_A - p_B)

# 95%信頼区間
ci_low, ci_high = confint_proportions_2indep(
count1=x_A, nobs1=n_A,
count2=x_B, nobs2=n_B,
method="wald", alpha=0.05
)

print("95%信頼区間（A - B）:", (ci_low, ci_high))

装置A 不良率: 0.1
装置B 不良率: 0.11
不良率の差 (A - B): -0.009999999999999995
95%信頼区間（A - B）: (np.float64(-0.08409078657142133), np.float64(0.06409078657142134))


## 問4.相関係数の区間推定

In [47]:
import math
import scipy.stats as st

# 与えられたデータ（標本サイズはペア数）
n = 20
var_x = 20.0      # V(X)
var_y = 30.0      # V(Y)
cov_xy = 10.0     # Cov(X, Y)

# 1) 標本相関係数 r の点推定
r = cov_xy / math.sqrt(var_x * var_y)

# 2) Fisher の z 変換による 95% 信頼区間
#   z = 0.5 * ln((1+r)/(1-r))
#   se_z = 1 / sqrt(n - 3)
#   z_ci = z +/- z_{alpha/2} * se_z
#   最後に tanh に戻して r の区間に変換（逆変換）
z = 0.5 * math.log((1 + r) / (1 - r))
se_z = 1.0 / math.sqrt(n - 3)
z_crit = st.norm.ppf(0.975)  # 1.96... (95% の両側臨界値)

z_low = z - z_crit * se_z
z_high = z + z_crit * se_z

r_low = math.tanh(z_low)
r_high = math.tanh(z_high)

# 出力
print(f"標本相関係数 r (点推定) : {r:.6f}")
print(f"Fisher z = {z:.6f}")
print(f"z の標準誤差 se_z = {se_z:.6f}")
print(f"95% z-区間: [{z_low:.6f}, {z_high:.6f}]")
print(f"95% 信頼区間（相関 r に逆変換）: [{r_low:.6f}, {r_high:.6f}]")

標本相関係数 r (点推定) : 0.408248
Fisher z = 0.433507
z の標準誤差 se_z = 0.242536
95% z-区間: [-0.041854, 0.908868]
95% 信頼区間（相関 r に逆変換）: [-0.041829, 0.720589]


### ■ 問5　母平均の検定（母分散既知）

In [54]:
import numpy as np
from scipy.stats import norm

# --- データ ---
data = np.array([10.3, 10.5, 9.8, 10.2, 10.4, 10.8, 10.7, 10.7, 9.7, 9.9,
                 10.2, 10.6, 9.8, 10.2, 10.5, 10.8, 10.5, 10.9, 9.7, 9.8])

sigma = 0.6               # 母標準偏差
mu0 = 10                  # 既定値 = 10cm
n = len(data)             # 標本サイズ
x_bar = np.mean(data)     # 標本平均

print("1. 母平均の点推定（標本平均） =", x_bar)

# --- z検定 ---
z = (x_bar - mu0) / (sigma / np.sqrt(n))
print("\n検定統計量 z =", z)


# === 2. 有意水準5% 両側検定 ===
alpha = 0.05
critical_5 = norm.ppf(1 - alpha/2)
p_value_5 = 2 * (1 - norm.cdf(abs(z)))

print("\n2. 両側検定（5%）")
print("  臨界値 ±", critical_5)
print("  p値 =", p_value_5)
print("  結論：", "帰無仮説を棄却（差あり）" if abs(z) > critical_5 else "棄却できない（差があるとは言えない）")


# === 3. 有意水準1% 両側検定 ===
#棄却できないからと言って「H0である」と判断することはできない
alpha = 0.01
critical_1 = norm.ppf(1 - alpha/2)
p_value_1 = 2 * (1 - norm.cdf(abs(z)))

print("\n3. 両側検定（1%）")
print("  臨界値 ±", critical_1)
print("  p値 =", p_value_1)
print("  結論：", "帰無仮説を棄却" if abs(z) > critical_1 else "棄却できない")


# === 4. 片側検定（母平均 > 10） ===
alpha = 0.05
critical_one = norm.ppf(1 - alpha)
p_one = 1 - norm.cdf(z)

print("\n4. 片側検定（5%）")
print("  臨界値 =", critical_one)
print("  p値 =", p_one)
print("  結論：", "帰無仮説を棄却（平均は10より大きい）" if z > critical_one else "棄却できない（10より大きいとは言えない）")


1. 母平均の点推定（標本平均） = 10.3

検定統計量 z = 2.236067977499795

2. 両側検定（5%）
  臨界値 ± 1.959963984540054
  p値 = 0.025347318677467978
  結論： 帰無仮説を棄却（差あり）

3. 両側検定（1%）
  臨界値 ± 2.5758293035489004
  p値 = 0.025347318677467978
  結論： 棄却できない

4. 片側検定（5%）
  臨界値 = 1.6448536269514722
  p値 = 0.012673659338733989
  結論： 帰無仮説を棄却（平均は10より大きい）


### ■ 問6　検定における2種類の過誤と検出力

In [61]:
import numpy as np
from scipy.stats import norm

# ---- パラメータ ----
mu0 = 0     # 帰無仮説の平均
mu1 = 3     # 対立仮説の平均
sigma = 1   # 共通の標準偏差
n = 20      # 標本サイズ
alpha = 0.05  # 有意水準（右片側）

# ---- 1. 有意水準に基づく棄却域（右片側） ----
# 標本平均の標準誤差
se = sigma / np.sqrt(n)

# 棄却域の閾値（右側）
critical_value = mu0 + norm.ppf(1 - alpha) * se

# ---- 2. 第一種の過誤（H0が正しいのに棄却）----
# H0: X ~ N(mu0, se^2) で X > critical_value
α = 1 - norm.cdf(critical_value, loc=mu0, scale=se)

# ---- 3. 第二種の過誤（H1が正しいのにH0を棄却できない）----
# H1: X ~ N(mu1, se^2) で X <= critical_value
β = norm.cdf(critical_value, loc=mu1, scale=se)

# ---- 4. 検出力（1 - 第二種の過誤）----
power = 1 - β

print("標本数 n =", n)
print("臨界値（棄却域の境界） =", critical_value)
print("第一種の過誤 α =", α)
print("第二種の過誤 β =", β)
print("検出力 (1 - β) =", power)


標本数 n = 20
臨界値（棄却域の境界） = 0.3678004522900572
第一種の過誤 α = 0.050000000000000044
第二種の過誤 β = 2.7353600735530095e-32
検出力 (1 - β) = 1.0
