![%E4%BA%8C%E7%BE%A4%E6%AF%94%E8%BC%83%E3%81%BE%E3%81%A8%E3%82%81.jpeg](attachment:%E4%BA%8C%E7%BE%A4%E6%AF%94%E8%BC%83%E3%81%BE%E3%81%A8%E3%82%81.jpeg)

## 対応なしの2群比較

### [ステューデントのt検定](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html)

Python：`scipy.stats.ttest_ind(a, b)`、スプレッドシート：`TTEST(a, b, 2, 2)`

- 正規性：○
- 等分散：○

In [1]:
import numpy as np
from scipy.stats import shapiro
from scipy.stats import bartlett
from scipy.stats import ttest_ind

A = np.array([75, 87, 89, 80, 84, 81, 88, 83, 88, 88, 82, 72, 74, 93, 77, 67, 88, 84, 68, 84, 80, 78, 75, 71, 82, 74, 84, 77, 79, 76, 83, 75, 86, 76, 80, 76, 68, 72, 75, 85])
B = np.array([64, 77, 79, 73, 89, 82, 59, 85, 80, 75, 65, 79, 65, 74, 73, 72, 69, 83, 90, 73, 88, 59, 62, 80, 64, 74, 81, 70, 69, 67, 81, 67, 72, 71, 72, 78, 78, 82, 72, 71])

# 1. シャピロ・ウィルク検定
# 共に『p値>=0.05』なので正規性がある
print('- シャピロ・ウィルク検定')
print(shapiro(A).pvalue, shapiro(B).pvalue)

# 2. バートレット検定
# 『p値>=0.05』なので等分散
print('\n- バートレット検定')
print(bartlett(A, B).pvalue)

# 3. ステューデントのt検定
# 『p値<0.05』なので帰無仮説は棄却され、2群間には差があると言える
print('\n- ステューデントのt検定')
print(ttest_ind(A, B).pvalue)

- シャピロ・ウィルク検定
0.5576284527778625 0.7473049163818359

- バートレット検定
0.20480902929484998

- ステューデントのt検定
0.0009998130384233285


### [ウェルチのt検定](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html)

Python：`scipy.stats.ttest_ind(a, b, equal_var=False)`、スプレッドシート：`TTEST(a, b, 2, 3)`

- 正規性：○
- 等分散：×

In [51]:
import numpy as np
from scipy.stats import shapiro
from scipy.stats import bartlett
from scipy.stats import ttest_ind

A = np.array([13.8, 10.2, 4.6, 10.0, 4.2, 16.1, 14.4, 4.9, 7.7, 11.4])
B = np.array([3.3, 2.6, 4.0, 4.7, 1.9, 2.9, 4.7, 5.3, 4.3, 3.0, 2.0])

# 1. シャピロ・ウィルク検定
# 共に『p値>=0.05』なので正規性がある
print('- シャピロ・ウィルク検定')
print(shapiro(A).pvalue, shapiro(B).pvalue)

# 2. バートレット検定
# 『p値<0.05』なので不等分散
print('\n- バートレット検定')
print(bartlett(A, B).pvalue)

# 3. ウェルチのt検定
# 『p値<0.05』なので帰無仮説は棄却され、2群間には差があると言える
print('\n- ウェルチのt検定')
print(ttest_ind(A, B, equal_var=False).pvalue)

- シャピロ・ウィルク検定
0.4218745231628418 0.5946778655052185

- バートレット検定
0.00032581391769216547

- ウェルチのt検定
0.0012285738375064346


### [マン・ホイットニーのU検定（ウィルコクソンの順位和検定）](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.mannwhitneyu.html)

Python：`scipy.stats.mannwhitneyu(a, b, alternative='two-sided')`、スプレッドシート：なし

- 正規性：×

In [52]:
import numpy as np
from scipy.stats import shapiro
from scipy.stats import mannwhitneyu

A = np.array([1.83, 1.55, 1.62, 2.48, 1.68, 1.88, 1.55, 3.06, 1.30, 2.01, 3.11])
B = np.array([0.88, 0.65, 0.60, 1.05, 1.06, 1.29, 1.06, 2.14, 1.29])

# 1. シャピロ・ウィルク検定
# 『p値<0.05』なので、正規性がない
print('- シャピロ・ウィルク検定')
print(shapiro(A).pvalue, shapiro(B).pvalue)

# 2. マン・ホイットニーのU検定
# 『p値<0.05』なので帰無仮説は棄却され、2群間には差があると言える
print('\n- マン・ホイットニーのU検定')
print(mannwhitneyu(A, B, alternative='two-sided').pvalue)

- シャピロ・ウィルク検定
0.04772886633872986 0.10264518857002258

- マン・ホイットニーのU検定
0.0018181026262219177


## 対応ありの2群比較

### [対応のあるt検定](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_rel.html)

Python：`scipy.stats.ttest_rel(a, b)`、スプレッドシート：`TTEST(a, b, 2, 1)`

- 正規性：○

In [55]:
import numpy as np
from scipy.stats import shapiro
from scipy.stats import ttest_rel

A = np.array([0.7, -1.6, -0.2, -1.2, -0.1, 3.4, 3.7, 0.8, 0.0, 2.0])
B = np.array([1.9, 0.8, 1.1, 0.1, -0.1, 4.4, 5.5, 1.6, 4.6, 3.4])

# 1. シャピロ・ウィルク検定
# 共に『p値>=0.05』なので正規性がある
print('- シャピロ・ウィルク検定')
print(shapiro(A).pvalue, shapiro(B).pvalue)

# 2. 対応のあるt検定
# 『p値<0.05』なので帰無仮説は棄却され、2群間には差があると言える
print('\n- 対応のあるt検定')
print(ttest_rel(A, B).pvalue)

- シャピロ・ウィルク検定
0.40793028473854065 0.35113534331321716

- 対応のあるt検定
0.00283289019738427


### [ウィルコクソンの符号順位検定](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.wilcoxon.html)

Python：`scipy.stats.wilcoxon(a, b)`、スプレッドシート：なし

- 正規性：×

In [70]:
import numpy as np
from scipy.stats import shapiro
from scipy.stats import wilcoxon

A = np.array([1.83, 1.56, 1.55, 2.48, 1.68, 1.88, 1.55, 3.06, 1.30])
B = np.array([0.88, 0.65, 0.60, 1.05, 1.06, 1.29, 1.06, 2.14, 1.29])

# 1. シャピロ・ウィルク検定
# 『p値<0.05』なので正規性がない
print('- シャピロ・ウィルク検定')
print(shapiro(A).pvalue, shapiro(B).pvalue)

# 2. ウィルコクソンの符号順位検定
# 『p値<0.05』なので帰無仮説は棄却され、2群間には差があると言える
print('\n- ウィルコクソンの符号順位検定')
print(wilcoxon(A, B).pvalue)

- シャピロ・ウィルク検定
0.04784062132239342 0.10264518857002258

- ウィルコクソンの符号順位検定
0.00390625


## クロス集計表からの2群比較

### 対応なし：[カイ二乗検定](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.chi2_contingency.html)

Python：`scipy.stats.chi2_contingency(df)`、スプレッドシート：`CHITEST(観測度数表, 期待度数表)`

- デフォルトは、ピアソンのカイ二乗検定、イエーツの補正あり(観測度数表のどこかに5以下の値があるときに使用する)

In [79]:
import pandas as pd
from scipy.stats import chi2_contingency

df = pd.DataFrame(data=[[30, 970], [25, 470]], index=['A', 'B'], columns=['購入した', '購入していない'])
display(df)

t, p, dof, e = chi2_contingency(df, correction=False)
print('\n- ピアソンのカイ二乗検定（イエーツの補正なし）')
print(p)

Unnamed: 0,購入した,購入していない
A,30,970
B,25,470



- ピアソンのカイ二乗検定（イエーツの補正なし）
0.047470150228670224


### 対応なし：[フィッシャーの直接確率検定（フィッシャーの正確確率検定）](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.fisher_exact.html)

Python：`scipy.stats.fisher_exact(df)`、スプレッドシート：なし

In [2]:
import pandas as pd
from scipy.stats import fisher_exact

df = pd.DataFrame(data=[[30, 970], [25, 470]], index=['A', 'B'], columns=['購入した', '購入していない'])
display(df)

odds, p = fisher_exact(df)
print('\n- フィッシャーの直接確率検定')
print(p)

Unnamed: 0,購入した,購入していない
A,30,970
B,25,470



- フィッシャーの直接確率検定
0.057146362281724906


### 対応あり：[マクネマー検定](https://www.statsmodels.org/stable/generated/statsmodels.stats.contingency_tables.mcnemar.html)

Python：`statsmodels.stats.contingency_tables.mcnemar(df)`、スプレッドシート：なし

- デフォルト：二項分布、カイ二乗分布を選ぶとイエーツの補正がかかる

In [37]:
import pandas as pd
from  statsmodels.stats.contingency_tables import mcnemar

index = pd.MultiIndex.from_tuples([('施術前', '腰痛あり'), ('施術前', '腰痛なし')])
columns = pd.MultiIndex.from_tuples([('施術後', '腰痛あり'), ('施術後', '腰痛なし')])
df = pd.DataFrame(data=[[47, 16], [5, 32]], index=index, columns=columns)
display(df)

print(f'カイ二乗分布（イエーツの補正あり） : {mcnemar(df.values, exact=False, correction=True).pvalue}')

Unnamed: 0_level_0,Unnamed: 1_level_0,施術後,施術後
Unnamed: 0_level_1,Unnamed: 1_level_1,腰痛あり,腰痛なし
施術前,腰痛あり,47,16
施術前,腰痛なし,5,32


カイ二乗分布（イエーツの補正あり） : 0.029096331741252267
