In [14]:
import matplotlib.pyplot as plt
import numpy as np
from scipy.stats import ttest_ind

# グループAのデータ
groupA = np.array([1.2, 1.5, 0.8, 1.0, 1.3, 1.1, 1.6, 0.9, 1.2, 1.3])

# グループBのデータ
groupB = np.array([0.9, 1.1, 0.7, 1.2, 1.0, 1.3, 1.1, 1.0, 0.8, 1.4])

# 2つのグループの平均値の差を求める
mean_diff = np.mean(groupA) - np.mean(groupB)

# ブートストラップ法を使って、平均値の差の分布を求める
n_bootstrap = 10000 # サンプル数
bootstrap_diffs = np.zeros(n_bootstrap)
for i in range(n_bootstrap):
    sampleA = np.random.choice(groupA, size=len(groupA), replace=True)
    sampleB = np.random.choice(groupB, size=len(groupB), replace=True)
    bootstrap_diffs[i] = np.mean(sampleA) - np.mean(sampleB)

# 分布からp値を求める
# 元の平均値の差以上の差が出たサンプルの確率を求めている
# 帰無仮説（２つのグループの平均値に差はない）が成立する確率を求める（元の統計量以上の値が得られる確率）
# これが0.05以上なら帰無仮説は採択、0.05未満なら棄却される
p_value = np.sum(bootstrap_diffs >= mean_diff) / n_bootstrap

# t検定を行う
t_statistic, t_p_value = ttest_ind(groupA, groupB, equal_var=False)

# 結果を表示する
print("ブートストラップ法によるp値：", p_value)
print("t検定によるp値：", t_p_value)

ブートストラップ法によるp値： 0.5235
t検定によるp値： 0.19977342364114456
