# サンプルサイズ設計

## モジュールインポート

In [11]:
import numpy as np
import pandas as pd
from statsmodels.stats.power import TTestIndPower
from scipy.stats import ttest_ind
from tqdm import tqdm

## サンプルサイズ設計の1例を計算してみる

In [35]:
# パラメータ設定
mu1 = 15                          # 1群の平均
mu2 = 10                          # 2群の平均
sigma = 10                        # 1群・2群の標準偏差
effect_size = (mu1 - mu2) / sigma # 効果量: Cohen's d
alpha = 0.05                      # 有意水準
power = 0.9                       # 検出力

# サンプルサイズの計算
analysis = TTestIndPower()
sample_size = analysis.solve_power(effect_size=effect_size, alpha=alpha, power=power, alternative='larger')

print(f"必要なサンプルサイズ: {sample_size:.2f}")

必要なサンプルサイズ: 69.20


## 上記サンプルサイズ設計の結果をもとに、データ生成->検定を行なって意図通りの検出力になっているか確認を行う

In [42]:
# シミュレーション用設定
n = 69               # データのサイズ
p_value_thres = 0.05 # 有意水準
n_trials = 10000     # 試行回数

# パラメータ設定
mu1   = 15      # 1群の真の平均
mu2   = 10      # 2群の真の平均
sigma = 10      # 1・2群の真の標準偏差

significant_list = []
for i in tqdm(range(n_trials)):
    significant_flag = 0
    np.random.seed(i) # ランダムシード
    # データ生成
    data1 = np.random.normal(loc=mu1, scale=sigma, size=n)
    data2 = np.random.normal(loc=mu2, scale=sigma, size=n)
    
    # t検定を実施
    t_stat, p_value = ttest_ind(data1, data2, equal_var=True, alternative='greater')  # 等分散を仮定
    
    if p_value < p_value_thres:
        significant_flag = 1
    significant_list.append(significant_flag)
significant_ratio = np.array(significant_list).mean()
print(f'有意と判定している割合: {significant_ratio:,.3f}')

100%|█████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 4769.82it/s]

有意と判定している割合: 0.891





意図通り検出力が約90%になっている

## 標準偏差を過小に見積もった場合どうなるか実験

In [39]:
# パラメータ設定
mu1 = 15                          # 1群の平均
mu2 = 10                          # 2群の平均
sigma = 7                         # 1群・2群の標準偏差
effect_size = (mu1 - mu2) / sigma # 効果量: Cohen's d
alpha = 0.05                      # 有意水準
power = 0.9                       # 検出力

# サンプルサイズの計算
analysis = TTestIndPower()
sample_size = analysis.solve_power(effect_size=effect_size, alpha=alpha, power=power, alternative='larger')

print(f"必要なサンプルサイズ: {sample_size:.2f}")

必要なサンプルサイズ: 34.27


In [43]:
# シミュレーション用設定
n = 34               # データのサイズ
p_value_thres = 0.05 # 有意水準
n_trials = 10000     # 試行回数

# パラメータ設定
mu1   = 15      # 1群の真の平均
mu2   = 10      # 2群の真の平均
sigma = 10      # 1・2群の真の標準偏差: 上記サンプルサイズ設計では「7」と過小に見積もっているという設定

significant_list = []
for i in tqdm(range(n_trials)):
    significant_flag = 0
    np.random.seed(i) # ランダムシード
    # データ生成
    data1 = np.random.normal(loc=mu1, scale=sigma, size=n)
    data2 = np.random.normal(loc=mu2, scale=sigma, size=n)
    
    # t検定を実施
    t_stat, p_value = ttest_ind(data1, data2, equal_var=True, alternative='greater')  # 等分散を仮定
    
    if p_value < p_value_thres:
        significant_flag = 1
    significant_list.append(significant_flag)
significant_ratio = np.array(significant_list).mean()
print(f'有意と判定している割合: {significant_ratio:,.3f}')

100%|█████████████████████████████████████████████████████████████████████████████████████| 10000/10000 [00:02<00:00, 4911.04it/s]

有意と判定している割合: 0.657





検出力90%のつもりが、約66%になってしまっている