# **Chapter2** (2.3) 統計入門

***

## (2.3.3) 最尤推定

### ベルヌーイ分布

**表が出る確率が p の特殊なコイン**があるとし、このコインを**10回投げて表が8回出た**とき、pを最尤法で推定することを考える。

pが低くても10回の試行くらいでは偶然表が8回出るかもしれない。しかし、**表が8回出たというデータが観測されたとき** p=0.8 以上に妥当な**（もっともらしい（尤もらしい））**推定があるのだろうか……

#### 確率と尤度、そして最尤法（イメージ版）

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy.special import comb

In [2]:
N = 10
p_list = np.arange(1, 10)/10 #浮動小数点への対策
k_list = np.arange(0, N+1)
print(f"p_list: {p_list}") #表が出る確率 p の候補
print(f"k_list: {k_list}") #表が出た回数 k のパターン

p_list: [0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9]
k_list: [ 0  1  2  3  4  5  6  7  8  9 10]


In [3]:
matrix = pd.DataFrame(p_list)
matrix.columns = ["p"]
for k in k_list:
    #pの下での、kの発生確率を計算する（ベルヌーイ試行を10回行う二項分布）
    matrix[k] = comb(N, k, exact=True)*(matrix["p"]**k)*((1-matrix["p"]))**(N-k)*100
matrix = matrix.set_index("p")
matrix["ALL"] = matrix.sum(axis=1)
matrix.style.bar(subset=[8], color='#d65f5f')

Unnamed: 0_level_0,0,1,2,3,4,5,6,7,8,9,10,ALL
p,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
0.1,34.8678,38.742,19.371,5.73956,1.11603,0.148803,0.0137781,0.0008748,3.645e-05,9e-07,1e-08,100
0.2,10.7374,26.8435,30.199,20.1327,8.80804,2.64241,0.550502,0.0786432,0.0073728,0.0004096,1.024e-05,100
0.3,2.82475,12.1061,23.3474,26.6828,20.0121,10.2919,3.67569,0.900169,0.14467,0.0137781,0.00059049,100
0.4,0.604662,4.03108,12.0932,21.4991,25.0823,20.0658,11.1477,4.24673,1.06168,0.157286,0.0104858,100
0.5,0.0976562,0.976562,4.39453,11.7188,20.5078,24.6094,20.5078,11.7188,4.39453,0.976562,0.0976562,100
0.6,0.0104858,0.157286,1.06168,4.24673,11.1477,20.0658,25.0823,21.4991,12.0932,4.03108,0.604662,100
0.7,0.00059049,0.0137781,0.14467,0.900169,3.67569,10.2919,20.0121,26.6828,23.3474,12.1061,2.82475,100
0.8,1.024e-05,0.0004096,0.0073728,0.0786432,0.550502,2.64241,8.80804,20.1327,30.199,26.8435,10.7374,100
0.9,1e-08,9e-07,3.645e-05,0.0008748,0.0137781,0.148803,1.11603,5.73956,19.371,38.742,34.8678,100


【確率（上表を横向きに見る考え方）】とあるパラメータ（ここでは p=0.1~0.9）の分布の下で、コインの表が出る回数（k=0~10）の得られやすさ。確率なので合計は1（上表の横合計）

【尤度（上表を縦向きに見る考え方）】とある観測データ（ここではコインの表が出る回数 k=0~10）が得られたとき、パラメータ（ここでは p=0.1~0.9）ごとの、そのデータが得られることに対する尤もらしさ

【最尤法】得られたデータに対して、尤度が最も高くなるパラメータの推定値を計算して探す手法

**今回の例では、コインを10回投げて表が8回出たときの、表が出る確率 p の最尤推定値は 0.8**

#### 計算でやってみる（尤度関数の最大化 ⇒ 実際は、負の対数尤度関数の最小化）

In [4]:
#10回中8回表が出たデータ
X = np.array([0.,1.,1.,1.,0.,1.,1.,1.,1.,1.])
X.dtype

dtype('float64')

In [5]:
#負の対数尤度関数
def log_likelihood(p, X):
    return -1.* np.sum(X*np.log(p)+(1.-X)*np.log(1.-p))

In [6]:
from scipy import optimize
from functools import partial

In [7]:
#最小化
partial_func = partial(log_likelihood, X=X)
MLE = optimize.minimize(partial_func, 0.5, method='nelder-mead')
print(f"Maximal Likelihood Estimator = {MLE['x'][0]}")

Maximal Likelihood Estimator = 0.8000000000000009


### 正規分布

#### 計算でやってみる

In [8]:
#正規乱数でデータを取得
X = np.random.normal(50, 30, 10)
X.dtype

dtype('float64')

In [9]:
#あらかじめ、妥当な推定量だと分かっている標本平均、不偏分散、標本分散を計算しておく
print(f"mean = {np.mean(X)}")
print(f"unbiased variance = {sum(np.square(X-np.mean(X)))/(N-1)}")
print(f"biased variance = {sum(np.square(X-np.mean(X)))/N}")

mean = 35.34261915486313
unbiased variance = 944.8823398748835
biased variance = 850.3941058873952


In [10]:
#負の対数尤度関数
def log_likelihood(params, X):
    return -1.* (-len(X)*np.log(params[1]) - np.sum((X-params[0])**2 / (2*(params[1]**2))))

In [11]:
#最小化
partial_func = partial(log_likelihood, X=X)
MLE = optimize.minimize(partial_func, [100, 100], method='nelder-mead')
print(f"MLE(mu) = {MLE['x'][0]}")
print(f"MLE(var) = {MLE['x'][1]**2}")

MLE(mu) = 35.342625109989655
MLE(var) = 850.3920960366654


正規分布の母平均に対する最尤推定量は、標本平均と一致した</br>
正規分布の母分散に対する最尤推定量は、標本分散と一致した（不偏分散ではない）

### 最尤推定量の性質

これまでは、具体的なデータを与えて最尤推定値を求めることをしていた

尤度関数さえ特定すれば、それを最大化するパラメータは最尤推定量である

最尤推定量にも、前回資料の○○性のような性質が概ね備わっている（証明には立ち入らない）

#### （一般の）最尤推定量の性質：メリット

1. 一致推定量である
2. 漸近的に不偏（一般に最尤推定量は不偏ではない）
3. 一致推定量の中で漸近的に最小の分散を持つ（漸近的有効性）

#### （一般の）最尤推定量の性質：デメリット？

1. 分布の仮定が必要
2. 小標本では不偏でない

**最尤法は分布の仮定が正しければ、広い範囲のモデルのあらゆる推定量の中で、漸近的には最も良い推定方法**