# 確率の定義

本資料では確率を公理的な立場で議論する。

---
## Def 1.1: $\sigma$-加法族
標本空間$\Omega$の部分集合族$\mathcal{B}$が以下の性質を満たす時、$\sigma$加法族(sigma algebra)という。

1. $\emptyset \in \mathcal{B}$
2. $A \in \mathcal{B} \Longrightarrow A^c \in \mathcal{B}$
3. $A_1, A_2 \cdots \in \mathcal{B} \Longrightarrow \bigcup_{A_i \in \mathcal{B}} A_i \in \mathcal{B} $
---

In [5]:
# define empty-set
Ø = Set([])
# judged σ-additive class
function sigma_addtive_class(Ω, B)
    # def01-1: 1. ∅ ∈ B
    if Ø ∉ B
        return false
    end
    
    # def01-1: 2. A ∈ B → Aᶜ ∈ B
    for a ∈ B
        if setdiff(Ω, a) ∉ B
            return false
        end
    end
    
    # def01-1: 3. A₁, A₂, ⋯ ∈ B → ⋃(Aᵢ ∈ B) Aᵢ ∈ B
    addtive_sets = Set()
    for a ∈ B
        addtive_sets = addtive_sets ∪ a
    end
    if addtive_sets ∉ B
        return false
    end
    # welldefined
    return true
end

sigma_addtive_class (generic function with 1 method)

標本空間$\Omega := \{ 1,2,3 \}$,

その部分集合族$\mathcal{B} := \{ \emptyset, \{ 1 \}, \{ 2 \}, \{ 3 \}, \{ 1,2 \}, \{ 2,3 \}, \{ 1,3 \}, \Omega \}$

で定義すると、$\mathcal{B}$は$\sigma$-加法族となる。

それを上のプログラムを用いて証明する。

In [6]:
Ω = Set([1,2,3]);                                                                     # 標本空間 Ω := {1,2,3}を定義
B = Set([Ø, Set([1]), Set([2]), Set([3]), Set([1,2]), Set([1,3]), Set([2,3]), Ω]);    # 部分集合族 B := {A | ∀A ⊂ Ω}を定義 
sigma_addtive_class(Ω, B)                                                             # Bはσ-加法族であることがわかる

true

---
## Def 1.2: コルモゴロフ

空でない標本空間$\Omega$と$\sigma$加法族$\mathcal{B}$上の関数$P$が以下を満たす時、$P$を$\Omega$上の確率と定義する。
1. $P(A) \ge 0, \ \forall A \in \mathcal{B}$
2. $P(\Omega) = 1$
3. $A_1, \dots  \in \mathcal{B}$それぞれが互いに排反である時、
  $$\sum_{A_i \in \mathcal{B}}P(A_i) = P\left( \bigcup_{A_i \in \mathcal{B}} A_i \right)$$
 
さらに、$(\Omega, \mathcal{B}, P)$を確率空間と呼ぶ。

---

In [7]:
# judged probability
function probability(Ω, B, P)
    # def 01-2: 1. P(A) ≥ 0, ∀A ∈ B
    for a ∈ B
        if P(a) < 0
            return false
        end
    end
    
    # def 01-2: 2. P(Ω) = 1
    if P(Ω) ≠ 1
        return false
    end
    
    # def 01-2: 3. A₁, ⋯ ∈ B に対して、Aᵢ ∩ Aⱼ = Ø (i ≠ j) → ∑(Aᵢ ∈ B) P(Aᵢ) = P(⋃(Aᵢ ∈ B) Aᵢ)
    for aᵢ ∈ B
        for aⱼ ∈ setdiff(B, aᵢ)
            if aᵢ ∩ aⱼ == Ø && P(aᵢ) + P(aⱼ) != P(aᵢ ∪ aⱼ)
                return false
            end
        end
    end
    return true
end

probability (generic function with 1 method)

ここで、標本空間$\Omega$と$\sigma$-加法族$\mathcal{B}$に対して、写像$P:\mathcal{B} \ni A \longmapsto P(A) \in \mathbb{R}$を、

$$P(A) := \frac{|A|}{|\Omega|}$$

で定義する。

すると、上記プログラムを実行することで確率空間$(\Omega, \mathcal{B}, P)$定まる。

In [9]:
P(A) = length(A)/3;        # 写像P:A → R を　P（A） := {Aの元の数} / 3 で定義
probability(Ω, B, P)       # 写像Pは確率であるとわかる

true

---

# Th 1.1: 加法法則

$A, B \in \mathcal{A}$に対して、以下が成り立つ。
$$P(A \cap B) = P(A) + P(B) - P(A \cup B)$$

---

( **証明** )
- $(A \cap B^c)$と$(A \cap B)$は排反で、$$A = (A \cap B^c) \cup (A \cap B)$$
- $(A^c \cap B)$と$(A \cap B)$は排反で、$$B = (A^c \cap B) \cup (A \cap B)$$
- $(A \cap B^c)$と$(A^c \cap B)$と$(A \cap B)$は排反で、$$A \cup B = (A \cap B^c) \cup (A^c \cap B) \cup (A \cap B)$$
が成り立つ。

$A,B \in \mathcal{A}$であるから、コルモゴロフの公理３により

$$P(A) = P(A \cap B^c) + P(A \cap B)$$
$$P(B) = P(A^c \cap B) + P(A \cap B)$$
$$P(A \cup B) = P(A \cap B^c) + P(A^c \cap B) + P(A \cap B)$$

以上により、$$P(A) + P(B) - P(A \cup B) = P(A \cap B)$$


**<p style="text-align: right;">============== 証明終 ==============<p>**

定義を用いれば、上記のように、高校でベン図で証明したような曖昧な等式を証明することが可能になる。

しかし、図的に理解することは重要である。

![加法法則](data/加法法則.png)

---

## Def 1.3.1: 確率変数と確率分布

確率空間$(\Omega, \mathcal{A}, P)$において、写像$X$：$\Omega \rightarrow \mathbb{R}$が任意の$x \in \mathbb{R}$に対して、

$$X^{-1} ((- \infty, x]) = \{\ s \in \Omega \ | \ X(s) \in (- \infty, x] \ \} \in \mathcal{A}$$

を満たす$X$を確率変数という。

---

例えば、確率空間$(\Omega, \mathcal{B}, P)$において、例えば3面体の

---

## Def 1.3.2: 確率変数

確率空間$(\Omega, \mathcal{A}, P)$上の確率変数$X$が任意の$x \in \mathbb{R}$に対して、$F_X(x)$を以下で定義する。

$$F_X(x) = P( \{ s \in \Omega \ | \ X(s) \in (- \infty, x] \} )$$

また、$X(s) \le x$を満たすため、一般に$P(X \le x)$と記す。 

---

---

## Def 1.3.3: 連続型・離散型確率変数

累積分布関数$P(X \le x)$が連続関数であれば確率変数$X$を連続型、階段関数であれば離散型とよぶ。

---

---

### Def 1.3.3.1 指示関数

$A \subset \Omega$を集合とする。写像：$\chi_A: \Omega \ni x \longmapsto \chi_A(x) \in \{ 0,1 \}$を以下で定める。
$$
  \chi_A(x) :=
  \left\{
    \begin{array}{ll}
      1 & x \in A \\
      0 & x \notin A
    \end{array}
  \right.
$$
これを指示関数と呼ぶ。

---

---

### Def 1.3.3.2 階段関数

$E_j (j = 1,2, \cdots, N)$を$\mathbb{R}$上のルベーグ可測集合とする。

正の実数列$\{a_j\}_{j=1}^N$と、互いに排反な$\{E\}_{j=1}^N$に対して、写像：$\phi: \Omega \ni x \longmapsto \phi(x) \in \mathbb{R}$を以下で定める。
$$
  \phi(x) := \sum_{j=1}^{N}a_j \chi_{E_j}(x)
$$
これを階段関数と呼ぶ。

---

## Def 1.4.1 確率質量関数

確率空間$(\Omega, \mathcal{A}, P)$上の離散型確率変数$X$の確率関数$f_X(x)$が
$$\forall x \in X, \ f_X(x) = P(X = x)$$
を満たすものを確率質量関数という。

---

## Def 1.4.2 確率密度関数

---

確率空間$(\Omega, \mathcal{A}, P)$上の連続型確率変数$X$の確率関数$f_X(x)$が
$$\forall x \in X, \ F_X(x) = \int_{- \infty}^x f_X(t) dt$$
を満たすものを確率密度関数という。

---