[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/snishiyama/intro-psych-stats-exercises/blob/main/10_unbiased-estimator.ipynb)


# 第10回演習の概要

前回に引き続き，乱数生成用のパッケージを利用した仮想実験を通して，不偏性に対する理解を深める。

In [1]:
# パッケージの読み込み
import matplotlib.pyplot as plt
from numpy.random import default_rng

rng = default_rng() # rng: Random Number Generator 乱数生成器

# 様々な関数の準備（復習 + α）

復習も兼ねて，以下の関数を作成する。できるかぎり，記憶を頼りに書いてほしい。変数を中心化する関数などを自作しても構わない。

$$
Mean = \frac{1}{n}\sum^n_{i=1}x_i
$$

In [None]:
# 平均
def mean(atai_list):


（標本）分散を計算する関数を書け。分散は以下の数式で計算される統計量である。

$$
Var = \frac{1}{n}\sum_{i = 1}^{n}(x_i-\bar{x})^2
$$

In [None]:
# 標本分散 mean()を使っても良い
# var の由来は，分散の英語 variance の最初の3文字
def var(atai_list):


分散 var 関数を用いて，（標本）標準偏差を求める関数を書け。

$$
SD = \textstyle\sqrt{\frac{1}{n}\sum_{i = 1}^{n}(x_i-\bar{x})^2}
$$


In [None]:
# 標本標準偏差。var()を使うこと。
def sd(atai_list):


## 不偏分散・不偏標準偏差

不偏分散を計算する関数を作成せよ。

$$
Var_{unbiased} = \frac{1}{n - 1}\sum_{i = 1}^{n}(x_i-\bar{x})^2
$$

In [None]:
# 不偏分散
def var_unbiased(atai_list):


不偏標準偏差を計算する関数を作成せよ。

$$
SD_{unbiased} = \textstyle\sqrt{\frac{1}{n-1}\sum_{i = 1}^{n}(x_i-\bar{x})^2}
$$


In [None]:
# 不偏標準偏差
def sd_unbiased(atai_list):


# 演習1: 不偏性を仮想実験で体験する

母平均・母分散がわかっている母集団から標本抽出・統計量の計算を繰り返す仮想実験を通じて，不偏性について理解を深めてほしい。

In [None]:
# 平均身長 170 cm，SD 7 (分散 49) だとすでにわかっている集団から30人を抽出する関数
def sampling_height():
    return list(rng.normal(170, 7, 30))

## 平均（先週の復習）

平均の場合，標本平均は母平均の不偏推定値である。したがって，標本平均の期待値（平均）は母平均（170）となる。以下の手順でそれを確認せよ。

### ステップ 1

`sampling_height()`を使って30個のデータからなる標本を抽出し，平均を求めることを10000回繰り返し，10000個の標本平均のリストを作成せよ

### ステップ 2

作成した標本平均のリストのヒストグラムを書くとともに，10000個の標本平均の平均を計算せよ。計算結果が 170 に近い値になることを確認せよ。

## 分散

### 標本分散

先ほどの平均の時と同様に，標本の標本分散を求めることを10000回繰り返して，10000個の標本分散のリストを作成せよ。

標本分散のヒストグラムを作成するとともに，その平均を計算せよ。母分散 49 (7 の二乗）とはそれほど近い値ではないことを確認せよ。

### 不偏分散

先ほどの平均の時と同様に，標本の**不偏**分散を求めることを10000回繰り返して，10000個の**不偏**分散のリストを作成せよ。

**不偏**分散のヒストグラムを作成するとともに，その平均を計算せよ。母分散 49 (7 の二乗）と近い値となることを確認せよ。

# 演習2: 不偏性を利用して母集団の平均と分散を当てる

正規分布に従っていると考えられるデータについて，母数（母平均・母分散）はわからないが，好きなだけ標本抽出できるとする。演習1で行ったように，標本抽出を何度も繰り返し，各回の不偏推定量の平均を計算することで，母平均・母分散を推定せよ。

In [None]:
# 母集団（ある平均と標準偏差の正規分布）から標本抽出する関数
def random_sampling():
    m = 0x6e # 平均
    sd = 0o36 # 標準偏差
    N = 20 # サンプルサイズ
    return list(rng.normal(m, sd, N))

平均と標準偏差はあえて難読化している。とはいえ，Pythonが認識できるということは，何らかの手段によって見慣れた数字に変換することができるということである。調べても構わないが，解き終わってからにしてほしい。

## 平均

## 分散

標準偏差が知りたい場合は，分散の推定値の平方根をとる

# 発展問題: 正規分布を書いてみよう

授業中に簡単に紹介した通り，確率分布は母数と確率関数（など）で定義される。したがって，（基本的には）確率関数をPythonの関数として作成すれば，任意の母数における確率分布を作図することができる。

正規分布の確率密度関数（pdf; probability density funciton）は以下の通りである。

$$
f(x) = \frac{1}{\sqrt{2\pi\sigma^2}}exp\{-\frac{(x - \mu)^2}{2\sigma^2}\}
$$

$pi$は円周率, $exp$ は指数関数である。ここでは深く言及しない。正規分布の実装のためには，Pythonにすでに用意されているものを使う。

この関数の $\mu$ と $\sigma$ を定めた上で，ある任意の実数 x を入れると，対応する確率（密度）が得られる


In [None]:
from math import exp, pi # 指数関数と円周率を読み込む

pi は変数として扱えば良い

In [None]:
pi

exp は関数なので，以下のように`()`内に数値を入れる

In [None]:
exp(1)

## ステップ 1

正規分布の確率密度関数をPythonの関数として書け

In [None]:
# 正規分布（normal distribution）の確率密度関数（pdf）
# muとsigmaも自由に変更できるように，引数として用意しておく
def normal_pdf(x, mu, sigma):
    

## ステップ 2

- `for ... in range()` を使って，0から99までの整数からなる数値リストを作成せよ。
- また，for文を使って，0から99までの各値について，mu = 50, sigma = 10 の正規分布における確率密度を計算し，その結果が入った新しいリストを作成せよ

## ステップ 3

0~99までを横軸，対応する確率密度を縦軸とする，折れ線グラフを作成せよ。

## ステップ 4

余裕があれば，mu, sigma の値を変えてステップ2, 3 を行い，さまざまに作図してみること