# 心理統計について勉強していきましょう。

- 教科書: 山田剛史、村井純一郎著[よくわかる心理統計](https://www.amazon.co.jp/dp/4623039994/)ミネルヴァ書房

[このノートブック](https://mybinder.org/v2/gh/wakita/psycostat.git/HEAD?filepath=psycostat-06-04.ipynb)は
[![Binder](https://mybinder.org/badge_logo.svg)](https://mybinder.org/v2/gh/wakita/psycostat.git/HEAD?filepath=psycostat-06-04.ipynb) で実行できます。

## 2021-06-09 95%信頼区間 - 2021年度心理学統計法2 第6回 04

- pp. 92-95 (標準偏差)
- pp. 104-107 (95%信頼区間)
- [YouTube](https://www.youtube.com/watch?v=UfMP7OXlvYM) (32:32)

---
**データ**

- 日本人20歳女性の身長は平均: 154.9cm, 標準偏差: 6.9, n=23
    **出典** 政府統計：([e-Stat 統計で見る日本 (2017年)](https://www.e-stat.go.jp/dbview?sid=0003224177))
    サンプルが少なすぎる…
- 日本人20歳女性の身長は平均: 158.6cm, 標準偏差: 4.2, n=14
    出典：厚生労働省：[第2部 身体情況調査の結果](https://www.mhlw.go.jp/content/000711007.pdf), p. 116
    [令和元年国民健康・栄養調査報告](https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/kenkou_iryou/kenkou/eiyou/r1-houkoku_00002.html)
- 日本の17歳になる女子高生の平均身長は157.9cm (2,994校／7,755校 - 回収率: 386.% - Nは不明)
文部科学省
- 2019年度: 日本の17歳になる女子高生の平均身長は157.9cm、標準偏差 5.34
    [学校保健統計調査 平成２７年度以降 全国表 - 年齢別　都市階級別　設置者別　身長・体重の平均値及び標準偏差](https://www.e-stat.go.jp/dbview?sid=0003146500), e-Stat (女 - 2019年度 - 計 **高等学校(17歳)の項**)

以下では文部科学省の統計にしたがって平均身長157.9cm、標準偏差5.34を用いました。

In [78]:
import numpy as np
import pandas as pd
from bokeh.plotting import figure, output_notebook, show
from bokeh.models import ColumnDataSource, HoverTool
output_notebook()

μ, σ = 157.9, 5.34 # 文部科学省学校保健統計調査より

# 10,000回サンプリングした結果をヒストグラムで表示してみる
試行 = np.random.normal(loc=μ, scale=σ, size=10000)
hist, edges = np.histogram(試行, bins=50)

p = figure(plot_width=400, plot_height=400)
p.quad(top=hist, bottom=0, left=edges[:-1], right=edges[1:])

show(p)

In [79]:
サンプル数, 調査員数 = 200, 100
調査 = np.array(np.random.normal(loc=μ, scale=σ, size=サンプル数 * 調査員数)).reshape((サンプル数, 調査員数))
調査結果 = 調査.mean(axis=0)

p = figure(plot_width=400, plot_height=400, y_range=(1, 調査員数),
          title=f'{調査員数}人の調査員が{サンプル数}の女性の平均身長を調べてきました')
p.xaxis.axis_label = '調査対象者の平均身長'
p.yaxis.axis_label = '調査員'
p.scatter(x=調査結果, y=np.arange(調査員数) + 1, marker='square', size=5)
show(p)

hist, edges = np.histogram(調査結果, bins=20)
p = figure(plot_width=400, plot_height=200)
p.xaxis.axis_label = '調査対象者の平均身長'
p.yaxis.axis_label = '度数'
p.quad(top=hist, bottom=0, left=edges[:-1], right=edges[1:])
show(p)