# 確率変数と確率分布

## 用語

### 確率変数
- 確率変数 random variable
- 実現値　realization
- 離散型確率変数 discrete random variable
- 確率分布　probability distribution
- 期待値 expectation value
- 分散 variance
- 標準偏差 standard deviation, sd

### 離散型確率分布関数
- 理論分布 theoretical distribution
- ベルヌーイ試行 Bernoulli trial
- ベルヌーイ分布 Bernoulli distribution
- 確率質量関数 probability mass function, PMF
- 母数 parameter
- 二項分布 binomial distribution
- 累積分布関数 cumluative distribution function, CDF

### 連続型確率密度関数
- 連続型確率変数 continuous random variable
- 確率密度関数 probability density function, PDF
- 連続一様分布 continuous uniform distribution
- 正規分布 normal distribution
- ベータ分布 beta distribution
- 標本分布 sample distribution

### 最尤推定法
- 最尤推定法（最尤法） maximum likelihood estimation, MLE
- 尤度 likelihood
- 尤度関数 likelihood function
- 定数 constant
- 対数尤度関数 log likelihood function
- 尤度方程式 likelihood equation
- 推定値 estimate
- 推定量 estimator

---
# ノート

## 確率変数
期待値と分散の説明

## 離散型確率分布関数
### ベルヌイ分布
$$ f(x|\theta) = \theta^x(1-\theta)^{1-x}, \ x=0, 1 $$

分布に与える値である$\theta$は母数と呼ぶ。母数は確率分布を特徴づける数的指標。  
ベルヌイ分布において、母数$\theta$が与えられたときの$x=0$または$x=1$のとき、とりうる値は次の通り。

$$ f(x=1|\theta) = \theta^1(1-\theta)^0 = \theta $$
$$ f(x=1|\theta) = \theta^0(1-\theta)^1 = 1-\theta $$

ベルヌイ分布の平均と分散は次の通り。

$$ E[X] = \theta $$
$$ V[X] = \theta (1-\theta)$$

### 二項分布
$n$個ベルヌイ試行の和に拡張する。$n$回のベルヌイ試行の和が$x$になる確率は次の通り。この確率分布を2項分布という。

$$ f(x|\theta) = {}_n \mathrm{C}_x \theta^x(1-\theta)^{n-x}$$

2項分布の平均と分散は次の通り。

$$ E[X] = n\theta $$
$$ V[X] = n\theta(1-\theta) $$

## 連続型確率密度関数
### 一様分布
省略

### 正規分布
正規分布の確率密度関数は母数$\theta$を$\theta=(\mu, \sigma^2)$として下記の通り。

$$f(x|\mu, \sigma^2) = \frac{1}{\sqrt{2\pi}\sigma}\exp \biggl[ \frac{-1}{2\sigma^2}(x_i-\mu)^2 \biggr]$$

男性の身長が平均170, 標準偏差7.0の正規分布に従っているとすると165cm以上175cm未満の男性は下式より全体の52.5%と見積もれる。

$$F(175) - F(165) = \int^{175}_{165} f(x|170, 7.0^2) dx \simeq 0.525$$

### ベータ分布
範囲0から1までで様々な形状の分布を表現するときはベータ分布を使う。　　
ベータ分布の確率密度関数は母数 $\theta=(p, q)$として下記の通り表される。

$$ f(x|p, q) = B(p, q)^{-1}x^{p-1}(1-x)^{q-1}$$

平均と分散は下記の通り。

$$ E[X] = \frac{p}{p+1},~V[X] = \frac{pq}{(p+q)^2(p+q+1)}$$

逆に母数を平均と分散で表現しておくと便利である。ただし$r = \frac{E[X](1-E[X])}{V[X]}-1$。


$$ p = rE[X],~q = r(1-E[X]) $$


## 最尤推定法
多くの場合、母数$\theta$は未知である。観測データから理論分布の母数を推定するための一般的な方法として**最尤推定法(MLE)**がある。

### 二項分布
データを定数、母数を変数として計算した値を尤度という。見かけ上は確率関数と同じだが、その関数を尤度関数という。  
二項分布の関数式を**xの関数としてみた時が確率、$\theta$（母数）の関数として観た時が尤度**である。  
最尤法では尤度が最も高くなったときの変数の値を母数の推定値として利用する。　　
つまり、最尤法は手元のデータが最も観察されやすいような母数の値を推定する方法である。

二項分布の式を$\theta$に関して最大化する。
$$ f(x|\theta) = {}_n \mathrm{C}_x \theta^x(1-\theta)^{n-x}$$

直接最大化するのは難しいため対数変換した式、対数尤度関数で最大化をする。

$$ \log f(x|\theta) = x \log(\theta) + (n-x)\log (1-\theta) + C$$

最大化する方法は母数で微分して0になる方程式、尤度方程式を解く。

$$ \frac{d}{d\theta} \log f(x|\theta) = \frac{x}{\theta} - \frac{n-x}{1-\theta} = 0$$

この方程式を解いた結果 $\theta = \frac{x}{n}$が得られる。

### 正規分布
正規分布における母数、平均$\mu$と分散$\sigma$の最尤推定量を求める。  
同一の正規分布から標本 $\pmb{x} =(x_1, x_2, \dots, x_i, \dots, x_n)$ が互いに独立に観察されたとする。  
独立な確率変数に対する同時分布の式よりこの標本に関する同時分布は下記の通り。

$$f(\pmb{x}|\mu, \sigma^2)=\prod^{n}_{i=1}\frac{1}{\sqrt{2\pi}\sigma}\exp \biggl[ \frac{-1}{2\sigma^2}(x_i-\mu)^2 \biggr]$$

上式に関して対数を取り、それぞれの母数について方程式を解くと、平均と分散の最尤推定量が下記のように得られる。

$$\mu = \frac{1}{n} \sum^n_{i=1}x_i ,~ \sigma^2 = \frac{1}{n}\sum^n_{i-1}(x_i-\mu)^2$$

つまり正規分布に関しては標本平均と標本分散が最尤推定値となる。

---
## 章末問題

## 確率変数「3枚のコインを投げたときの表の枚数」の確率分布を示せ

## 3枚の過去員を投げたときの表の枚数の期待値を求めよ

## 「2枚のコインを投げたときの表の枚数」という確率変数Yの分散を求めよ

## 期待値に関する下記の公式を証明せよ
1. $E[a] = a$
2. $E[X+Y] = E[X] + E[Y]$
3. $aE[X] = E[aX]$

## 期待値と分散に関する下記の公式を証明せよ

## ベルヌイ分布の平均と分散を導け

## 2項分布の平均と分散を導け

## 2項分布の面積が1になることを示せ

## ベータ分布の平均と分散が与えられた時、下記の母数との関係式を導け

## 4つの密度関数を書く際に用いたベータ分布関数(p, q)の4つ組を示せ

## 期待値を変えずに標準偏差をもっと大きくしたらどうなるか

## 確率変数が3つの場合の同時分布の2つの式の意味を例を挙げて説明せよ

## 確率変数が3つの場合の周辺分布の2つの式の意味を例を挙げて説明せよ

## 2項分布の対数尤度関数式を母数で微分せよ。また方程式を解け。

## 正規分布の対数尤度関数を母数で微分せよ。また方程式を解け。