# 機率分配

我們可以將機率分配想成：描述各個**隨機變數**的值發生機率的函數。

以`連續投擲兩次公正銅板的正面次數`這個隨機變數 $X$ 為例:

- 樣本空間為 $\mathcal{S} = \{(T, T), (T, H), (H, T), (H, H)\}$
- 隨機變數為函數 $X: \mathcal{S} \rightarrow \mathbb{R}$ ，我們將樣本空間 $\mathcal{S}$ 的**事件**映射到**實數**上，變成 $\{0, 1, 1, 2\}$
- 樣本空間 $\mathcal{S}$ 的樣本點發生機率都相同 (因為每次丟銅板出現正面或反面的機率都是相同的，舉例來說: `連續兩次反面`的機率會等於`第一次正面，第二次反面`的機率。)
- 我們可以看作:

$$
\begin{cases}
\frac{1}{4} & E = (T, T) \\
\frac{1}{4} & E = (T, H) \\
\frac{1}{4} & E = (H, T) \\
\frac{1}{4} & E = (H, H)
\end{cases}
\underset{\implies}{映射}
\begin{cases}
\frac{1}{4} & X = 0 \\
\frac{1}{4} & X = 1 \\
\frac{1}{4} & X = 1 \\
\frac{1}{4} & X = 2
\end{cases}
\underset{\implies}{合併}
\begin{cases}
\frac{1}{4} & X = 0 \\
\frac{1}{2} & X = 1 \\
\frac{1}{4} & X = 2
\end{cases}
$$

- 最後得到的式子，就是隨機變數 $X$ 的機率分配，在**離散隨機變數**的情況下，又可以稱作**機率質量函數**。

附上用程式碼畫出分佈的範例


In [None]:
from typing import Tuple
from itertools import groupby

import plotly.graph_objects as go

# 樣本空間
S = {('T', 'T'), ('T', 'H'), ('H', 'T'), ('H', 'H')}

# 隨機變數
def X(event: Tuple[str, str]) -> int:
    '''隨機變數 - 連續投擲兩次公正硬幣，正面的次數

    Args:
        event (Tuple[str, str]): 連續投擲兩次公正銅板的事件

    Returns:
        head (int): 正面的次數
    '''
    head = 0

    for trial in event:
        if trial == 'H':
            head += 1

    return head

# 將樣本空間映射
S_new = sorted([X(event) for event in S])

# 製作機率分配
distribution = []

for x, outcomes in groupby(S_new):
    distribution.append({
        'x': x,
        'prob': len([out for out in outcomes]) / len(S_new)
    })

# 畫圖
bar = go.Bar(
    x=[pt['x'] for pt in distribution],
    y=[pt['prob'] for pt in distribution],
)
fig = go.Figure(data=[bar])
fig.update_layout(
    title="連續投擲兩次公正銅板出現正面次數的機率分配",
    xaxis_title="正面的次數",
    yaxis_title="機率",
)
fig


## 離散型機率分配

```{admonition} 機率質量函數 (probability mass function)
給定離散型隨機變數 $X$ ，若函數 $f_X(x)$ 滿足

- $0 \leq f_X(x) \leq 1, \forall x \in \mathbb{R}$
- $\sum_{x \in \mathbb{R}} f_X(x) = 1$
- $f_X(x \in A) = \sum_{x \in A} f_X(x)$

我們稱其為隨機變數 $X$ 的機率質量函數。
```

- 機率質量函數的值<span style="color:red">**就是**</span>機率。

## 連續型機率分配

```{admonition} 機率密度函數 (probability density function)
給定連續型隨機變數 $X$ ，若函數 $f_X(x)$ 滿足

- $f_X(x) \geq 0$
- $\int_{\mathbb{R}}f_X(x)dx = 1$
- $\mathbb{P}(X \in A) = \int_{A} f_X(x) dx, A \subset \mathbb{R}$


我們稱其為隨機變數 $X$ 的機率密度函數。

```

- 機率密度函數的值<span style="color:red">**不是**</span>機率，機率需要對特定區域**積分**獲得。