[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/snishiyama/intro-psych-stats-exercises/blob/main/13_t-test.ipynb)

# 第13回演習の概要

今回の演習では，以下の2種類の差の検定に取り組む。

- 差の平均値の検定（対応のあるt検定）
- 平均値差の検定（対応のないt検定）

どちらも，比較したい2つの条件に関して得られたデータの差について検討するものである。ただし，差の平均値の検定は（心理学研究の文脈では）同じ人物からその2条件のデータを収集した場合に用いることができるもので，同一人物の2条件間の数値の差を計算してからその平均値が0でないかどうかを検定する。

一方，平均値差の検定は，2つの条件の一方ずつを実施する群（グループ）を設定し，各群の平均値の差が0でないことを検定することを指す。（心理学研究の文脈では）ある人物からはどちらか一方の条件のデータしか収集することができない場合に，このデータ収集・検定方法を利用する。

前回取り組んだ差の推定に数ステップ付け加えるだけでt検定を実施することができる。

In [None]:
# 必要なパッケージの読み込み
import matplotlib.pyplot as plt
from scipy.stats import t as t_dist

# 様々な関数の準備（復習）

復習も兼ねて，以下の関数を作成する。できるかぎり，記憶を頼りに書いてほしい。変数を中心化する関数などを自作しても構わない。

$$
Mean_x = \bar{x} = \frac{1}{n}\sum^n_{i=1}x_i
$$

In [None]:
# 平均
def mean(atai_list):


（標本）分散を計算する関数を書け。分散は以下の数式で計算される統計量である。

$$
Var = \frac{1}{n}\sum_{i = 1}^{n}(x_i-\bar{x})^2
$$

In [None]:
# 標本分散 mean()を使っても良い
def var(atai_list):


分散 var 関数を用いて，（標本）標準偏差を求める関数を書け。

$$
SD = \textstyle\sqrt{\frac{1}{n}\sum_{i = 1}^{n}(x_i-\bar{x})^2}
$$


In [None]:
# 標本標準偏差。var()を使うこと。
def sd(atai_list):


不偏分散を計算する関数を作成せよ。標本分散の関数`var()`を用いても良い。

$$
Var_{unbiased} = \frac{1}{n - 1}\sum_{i = 1}^{n}(x_i-\bar{x})^2
$$

In [None]:
# 不偏分散
def var_unbiased(atai_list):


不偏標準偏差を計算する関数を作成せよ。

$$
SD_{unbiased} = \textstyle\sqrt{\frac{1}{n-1}\sum_{i = 1}^{n}(x_i-\bar{x})^2}
$$


In [None]:
# 不偏標準偏差。var_unbiased()を使うこと。
def sd_unbiased(atai_list):


# 演習1: 差の平均値の検定（対応のあるt検定）

ある心理実験を実施し，比較したい2つの条件のデータを同じ参加者から収集することができた場合，条件間の差を検討するには，同一参加者の条件Aと条件Bの差を計算する。計算された差が，母平均$\mu$, 母分散$\sigma^2$の正規分布から得られたと考える。母平均の不偏推定値である差の平均値とその標準誤差を用いて，条件間の差がある，つまり，$\mu=0$でないことについて検定を行う。

以下のデータは，前回と同様，30人の参加者を対象に，2つの条件が設定された記憶実験を行った時の結果であると考えてほしい（実際にはコンピュータで生成した数値である）。30人の参加者は2つの条件の課題をどちらも遂行しており，それぞれの数値リストで同じ位置（インデックス）にある値は同じ人物の課題成績であるとする。例えば，`kiokuA[0]`と`kiokuB[0]`はID0の参加者のデータである。

In [None]:
kioku_a = [41, 56, 56, 44, 50, 57, 55, 51, 49, 38, 54, 59, 64, 47, 61, 42, 41, 65, 36, 47, 56, 38, 74, 42, 57, 43, 49, 54, 71, 36]
kioku_b = [44, 43, 68, 47, 61, 50, 60, 64, 57, 45, 60, 56, 54, 40, 59, 48, 48, 66, 36, 45, 59, 59, 65, 53, 66, 45, 39, 75, 75, 46]

## ステップ1: 差の計算（復習）

対応する位置の値の差が入った新しいリストを作成せよ。for文で複数のリストから対応する位置の要素を取り出すには，`zip`を使う（第7回の演習を参照のこと）。

## ステップ2: 各種統計量の計算（復習）

ステップ1で計算した差のリストに関して，各種統計量を計算せよ。

In [None]:
# 差の母平均の推定値 -3.33333... となる


In [None]:
# 差の母標準偏差の推定値 8.623677643... となる


差の母平均推定値の標準誤差は，以下の式で計算される（前回と同じ）。

$$
SE = \sqrt{\frac{Var_{unbiased}}{n}} = \frac{SD_{unbiased}}{\sqrt{n}}
$$



In [None]:
# 差の母平均の標準誤差 1.5744609... となる


## ステップ3: t値の計算

t値を計算せよ。t値は以下の式で求まる検定統計量である。

$$
t = \frac{Mean_{diff}}{SE}
$$

In [None]:
# t値 -2.1171267455865506


また，自由度を計算せよ。対応のあるt検定の場合，自由度（degree of freedom, 以下df）は以下の式で求まる。

$$
df = n - 1
$$

In [None]:
# 自由度。あとのサンプルコードのために，ここの変数名はdfのままにしておくこと
df = 

## ステップ4: t値の図示

In [None]:
# t値の確率密度分布を図示
# まず，-4から4まで（4を含む）を0.08ずつ均等に区切ったの101の点を作成する
xs = []
x = -4.0
for i in range(101):
    xs.append(x)
    x = x + 0.08
print(xs) # 小さい計算誤差が生じているがここでは問題ない

In [None]:
# 作成した101個の点に対応する確率密度を計算し，折れ線グラフとして図示する
plt.plot(xs, t_dist.pdf(xs, df))
plt.show()

上のコードを実行して表示されたグラフが自由度29のt分布である。この分布は母平均が0，分散（標準偏差）1の母集団正規分布から30個の値（今回でいえば2条件間の差）を標本抽出する場合に，そこから計算されるt値がある値になる理論的な確率密度（確率のようなもの）を示している。

横軸がt値で，縦軸がそのt値が得られる確率密度である。グラフを見る限り，t = 0 付近となる確率が最も高いことがわかる。

さて，これから，このグラフに追加で，先ほど計算したt値の位置に縦線を引く。以下のコードの指定された行に，縦線を描画する処理を追加せよ。

`plt.axvline(値)`でその値の位置に縦線を描くことができる。計算されたt値に加え，**そのt値に`-1`をかけた値の位置にも縦線を書くこと。**つまり，上の分布の図に2本縦線を追加することになる。

追加された縦線とx軸の交点を確認し，得られたt値（および-t値）におおよそ一致していることを確認すること。

In [None]:
plt.plot(xs, t_dist.pdf(xs, df))
# 以下に追記


# ここまで
plt.show()

## ステップ5: p値の計算

ステップ4で作成したグラフを見てほしい。追加した縦線の位置が得られたt値（および-t値）を示している。t分布のうち，これら縦線の外側の面積の合計が「得られたt値またはそれよりも極端な値が得られる確率」，つまりp値となる。

以下の関数がその確率を計算する関数である。ステップ3で計算したt値と自由度を関数の引数に使用し，p値を計算せよ。

In [None]:
# t値と自由度を入れるとp値を計算する関数
def pvalue(t_value, df):
    # t_dist.cdf() は，-∞から引数に指定したt値までの面積（その範囲の値が得られる確率）を計算する関数
    # t_dist.cdf(2, 29)とすると，自由度29のt分布において-∞から2までの面積を計算する
    # 1 - t_dist.cdf(2, 29) とすると，t値が2よりも大きい部分（上の図で言う右の縦線のさらに右の範囲）の面積が得られる。
    return (1 - t_dist.cdf(abs(t_value), df)) * 2 # 両側検定

In [None]:
# p値の計算


計算結果が0.05（5%）以下であれば条件間の間に**有意な**差があった，と判断される。

↓に「2条件の間に差がある」と主張できるかどうか述べよ。

# 演習2: 平均値差の検定（各群の母平均が等しいと仮定する場合）

**スチューデントのt検定と呼ばれる**

（前回の演習3と同じシナリオ）
教授法Aと教授法Bのどちらが，統計学の学習に有効かどうかについて検討した。ある学生にはどちらか一方の教授法しか提供することができないため，2つを比較するには学生たちを2つの群（グループ）に無作為に分け，一方の群は教授法Aで，もう一方の群は教授法Bで授業を実施した。期末テストの点数について各群の平均値を計算し，その差を推定することで，教授法A，Bでどれくらいの差が生じるのかを検討した。

以下のデータはそのような状況を模したデータである。ただし，偶然，2つの群の人数が異なるという事態が発生した。`score_a`は教授法Aでの授業を受けた35人の期末テストの点数であり，`score_b`には教授法Bでの授業を受けた25人のものである。演習1の時と異なり，数値リストの間にインデックスによる対応はない。すべて，別々の学生のデータである。

この時，各群のデータはそれぞれ母平均$\mu_A$, 母分散$\sigma^2_A$（教授法A），そして母平均$\mu_B$, 母分散$\sigma^2_B$（教授法B）の正規分布から生成されたと仮定した上で，平均値差の標本分布を考えて，母平均の差とその標準誤差を推定し，検定を行う。

In [None]:
score_a = [47, 53, 41, 59, 42, 42, 48, 38, 50, 38, 51, 62, 53, 45, 33, 52, 50, 38, 45, 55, 58, 64, 23, 66, 69, 45, 65, 71, 57, 53, 59, 38, 39, 56, 47]
score_b = [54, 55, 41, 48, 73, 49, 58, 43, 53, 54, 45, 53, 56, 63, 52, 55, 56, 57, 68, 48, 52, 64, 58, 61, 50]

## ステップ1: 平均値差の計算（復習）

各群の母平均の推定値と，それらの差を計算せよ

In [None]:
# A群の母平均


In [None]:
# B群の母平均


In [None]:
# 母平均の差


## ステップ2: 標準誤差の計算（2群の母分散が等しいと想定［復習］

2群の母分散が異なる（$\sigma^2_A = \sigma^2_B$）と想定される場合の標準誤差を計算せよ。この時，推定される母平均の差の標準誤差は以下の式で計算される

$$
\sqrt{Var_{pooled}\big(\frac{1}{n_A} + \frac{1}{n_B}\big)}
$$

ただし，

$$
Var_{pooled} = \frac{(n_A - 1)Var^{unbiased}_A + (n_B - 1)Var^{unbiased}_B}{n_A + n_B - 2}
$$

$n_A$, $n_B$ は各群のデータ数である

### ステップ2-1: 全体の不偏分散を計算する

$Var_{pooled}$ を計算する関数`var_pooled()`を作成せよ。引数として数値リストを二つ渡すものとする。

In [None]:
def var_pooled(atai_list1, atai_list2):


`var_pooled()`の動作確認として，引数に`score_a`, `score_b` を入れて，全体の不偏分散を計算せよ。

In [None]:
# 91.95940886699508 になる


### ステップ2-2: 標準誤差を計算する

`var_pooled()` を用いて母分散が等しいと仮定される場合の平均値差の標準誤差を計算せよ。

ここからの手順は演習1と同様である。

## ステップ3: t値の計算（演習1とほぼ同じ）

t値を計算せよ。t値は以下の式で求まる検定統計量である。

$$
t = \frac{Mean_A - Mean_B}{SE}
$$

In [None]:
# t値 -1.8250158285052351


また，自由度を計算せよ。等分散を仮定する対応のないt検定の場合，自由度（degree of freedom, 以下df）は以下の式で求まる。

$$
df = n_A + n_B - 2
$$

In [None]:
# 自由度。あとのサンプルコードのために，ここの変数名はdf2のままにしておくこと
df2 = 

## ステップ4: t値の図示

In [None]:
# 演習2の自由度でt分布を図示する
plt.plot(xs, t_dist.pdf(xs, df2))
plt.show()

上のコードを実行して表示されたグラフは演習2のデータで参照する自由度58のt分布である。図の見方は，演習1と同じである。

演習1と同様に，このグラフに追加で，先ほど計算したt値の位置に縦線を引く。以下のコードの指定された行に，縦線を描画する処理を追加せよ。

`plt.axvline(値)`でその値の位置に縦線を描くことができる。計算されたt値に加え，**そのt値に`-1`をかけた値の位置にも縦線を書くこと。**つまり，上の分布の図に2本縦線を追加することになる。

追加された縦線とx軸の交点を確認し，得られたt値（および-t値）におおよそ一致していることを確認すること。

In [None]:
plt.plot(xs, t_dist.pdf(xs, df2))
# 以下に追記


# ここまで
plt.show()

## ステップ5: p値の計算

ステップ4で作成したグラフを見て考えてほしいことは演習1と同様である。追加した縦線の位置が得られたt値（および-t値）を示している。t分布のうち，これら縦線の外側の面積の合計が「得られたt値またはそれよりも極端な値が得られる確率」，つまりp値となる。

演習1で使用した関数`pvalue`に対して，ステップ3で計算したt値と自由度を関数の引数に使用し，p値を計算せよ。

In [None]:
# p値の計算


計算結果が0.05（5%）以下であれば条件間の間に**有意な**差があった，と判断される。

↓に「2条件の間に差がある」と主張できるかどうか述べよ。

さて，演習2では2群の母分散が等しいと仮定した場合の平均値差の検定（スチューデントのt検定）を実施した。しかしながら，等分散を考えるのはいささか強いすぎる仮定に思える。**実際のデータ分析では，始めから母分散が異なることを想定して分析することが多い**。等分散を仮定しないt検定は**ウェルチのt検定**と呼ばれる。ウェルチのt検定の実施は発展問題とするが，自由度の計算がすこしややこしいだけなので，ぜひ取り組んでみてほしい。取り組まない場合でも，その名前は覚えておいてほしい。

# 発展問題: 平均値差の検定（2群の母分散が異なると仮定）

**ウェルチのt検定と呼ばれる**

演習2では2群の母分散が等しいと想定した場合のt検定を実施した。この問題では，母分散が異なることを仮定した場合のt検定を実施する。等分散性を仮定する場合と比較して，自由度の計算がかなり複雑である。ただし，それ以外の手続きは同じである。

サンプルデータは演習2のものを使用し，検定結果について**演習2の結果と比較せよ**。

## ステップ1: 標準誤差の計算（2群の母分散が異なると想定［復習］

2群の母分散が異なる（$\sigma^2_A \neq \sigma^2_B$）と想定される場合の標準誤差を計算せよ。2群の母分散が異なると想定される時，推定される母平均の差の標準誤差は以下の式で計算される

$$
\sqrt{\frac{Var^{unbiased}_A}{n_A} + \frac{Var^{unbiased}_B}{n_B}}
$$

$n_A$, $n_B$ は各群のデータ数である。

## ステップ2: t値の計算（演習2と同じ式）

t値を計算せよ。t値は以下の式で求まる検定統計量である。

$$
t = \frac{Mean_A - Mean_B}{SE}
$$

In [None]:
# t値 -1.9410757334779327（b - a の場合は正負が逆転）


## ステップ3: 自由度の計算

自由度を計算せよ。等分散を仮定しない対応のないt検定の場合，自由度（degree of freedom, 以下df）は以下の式で求まる（近似される）。

$$
df \approx \frac{\big(\frac{Var_A}{n_A}+\frac{Var_B}{n_B}\big)^2}
{\frac{Var^2_A}{n_A^2\times(n_A-1)}+\frac{Var^{2}_B}{n_B^2\times(n_B-1)}}
$$

この式の$Var$は**不偏分散**である。

参考サイト：https://ja.wikipedia.org/wiki/ウェルチのt検定 

In [None]:
# 等分散を仮定しない場合の自由度 57.91743091572098


## ステップ4: p値の計算

演習1で使用した関数`pvalue`に対して，ステップ3, 4で計算したt値と自由度を関数の引数に使用し，p値を計算せよ。

In [None]:
# p値の計算 0.05712050287735715


計算結果が0.05（5%）以下であれば条件間の間に**有意な**差があった，と判断される。

使っているデータは同じであるにもかかわらず，演習2で計算されたp値と異なることを確認せよ。