# パラメタ推定

## パラメタ推定の方法を学ぶ意義

* 計算の実行時にerrorやwarningが出た際、原因の当たりをつけることができるのは、パラメタ推定の原理を知っておく必要がある
* 新しい技術が生まれた際に、それをいち早く活用する能力があるのは、もともとある技術の原理を知っているものだけ


## パラメタ推定: 尤度の最大化

### 尤度

*  **尤度**: パラメタが決まった時における、標本が得られる確率(密度)
  * 尤=尤もらしい(もっともらしい)という意味
  * 尤もらしさの度合い

例:
 表が出る確率が1/2であるコインがあったとする.この1/2がパラメタ
 このコインを2回投げて、1回目が表、2回目が裏だったする(=標本)

標本が得られる確率は、1/2*1/2 = 1/4
表が出る確率が1/3のコインだった場合は、尤度は 1/3*2/3 = 2/9

### 尤度関数

* **尤度関数**: パラメタを指定すると尤度が計算される関数
* 上記のコイン投げの例を使うと、コインを投げて表が出る確率をパラメタを`\theta`とおく。`\theta`を指定すると尤度が計算される尤度関数を`L(\theta)`と書くこととする。この時の尤度関数は以下のようになる

$$ \mathcal{L}(\theta) = \theta(1-\theta) $$

また、尤度の対数をとったものを**対数尤度**と呼ぶ(後々の計算を楽にするために利用されることが多い)

### 対数の性質

#### 性質1: 単調増加する

f(x)=logxという関数があったとして、中身のxを変化させたとする。この時、xが大きくなるとlogxの値も必ず大きくなる
この性質があるため、尤度を最大にするパラメタを探した結果は対数尤度を最大にするパラメタを探した結果と一致する


#### 性質2: 掛け算が足し算に変わる

$$
2 \times 4 = 8
$$
上記の式の左辺と右辺の対数をとっても、上記式の等号は成り立つ
$$
\log_{2}(2 * 4) = \log_{2}2 + \log_{2}4
 & = & \log_{2}8 =3
$$
よって、一般に以下の関係が成り立つ

$$
\log{xy}= \log{x} + \log{y}
$$

`\prod` -> `\sum`記号の対数変換にも利用可能
$$
\sum^{5}_{i=1}i=1+2+3+4+5
$$
に対して、`\prod`は掛け合わせるという意味
$$
\prod^{5}_{i=1}i=1\times2\times3\times 4\times5
$$

よって、`\prod`演算において大数をとると`\sum`に変わる

\begin{eqnarray}
\log{\prod^{5}_{i=1}i} \\
 & = & \log(\times2\times3\times 4\times5) \\
 & = & \log(1)+\log(2)+\log(3)+\log(4)+\log(5) \\
 & = & \sum^{5}_{i=1}\log{i}
\end{eqnarray}


#### 性質3: 絶対値が極端に小さな値になりにくい

* 対数をとると、絶対値が極端に小さくなりにくいというメリットがある
* Programによる計算をするときに非常に重要になる。0.00000000000000000000001のような数値はプログラムでは処理できず0として見なされる場合がある

尤度は確率をどんどん掛け算するため、0に近い値になることがしばしばある。大数をとることでプログラムが計算しやすい値に変換することができる


### 最尤法

**最尤法**: 尤度や対数尤度を最大にするパラメタを、パラメタの推定値として採用する方法

例: 先のコイン投げの例を用いると

- パラメタ`\theta`が1/2の時の尤度は1/4
- パラメタ`\theta`が1/3の時の尤度は2/9

1/4と2/9では、1/4の方が大きいため、`\theta`としては1/2が好ましいといえる。様々なパラメタを試すと`\theta=1/2`の時、尤度は最大となる

**最尤推定量**: 最尤法によって推定されたパラメタ
**最大化対数尤度**: 最尤推定量を採用した時の対数`\log{L(\hat{\theta})}`


### 正規分布に従うデータの尤度

ビールの売上を変数yと表記し、yは平均`\mu`、分散`\sigma^2`の正規分布に従っていると仮定

$$ \mathcal{y \sim N(\beta_0 + \beta_1 \times 気温, \sigma^2)} $$
