GithubUrl: https://github.com/karino2/MLProbability
FileName: p_space.ipynb
Title: 確率空間

# 確率空間

最初に測度とかボレル集合族とか可測とかの話をしておきたいので、
確率空間について話す所から始めます。

## 古典的な定義

普通、標本空間と事象と確率の話からぼんやりと確率空間の話をするのが古典的な確率論の入門書の始まりなのだが、これがなんだか良く分からない。
というのはボレル集合族と確率測度を出さずにその話をしようとするからだ。

確率空間とは、$$(\Omega, \mathscr{B}, P)$$の3つの構成要素からなる空間を言う。
で、この3つは古典的には標本空間、事象、そしてPと呼ばれる。

Pには古典的な世界ではたぶん名前が無いが、確率測度の事だ。

まずこの定義を見ていく事から始めよう。

### 標本空間

まず、サイコロを一つ振る、という事を考える。
この時、標本空間とは出る可能性がある全てのサイコロの目の事です。
この場合は

$$\{1, 2, 3, 4, 5, 6\}$$

となります。普通$$\Omega$$で表すので、

$$\Omega = \{1, 2, 3, 4, 5, 6\}$$

と書いておこう。

イメージとしては、確率的出来事のとりうる、全要素の事です。
この標本空間からなにか一つの要素を取り出す事が、確率的な試行に対応します。

### 事象族

さて、良くわからなくなるのが事象族です。これは本質的にはボレル集合族の事なのに、
入門書ではそれを持ち出さないでぼんやりと定義される。

事象というのは、確率を求めたい、標本空間の何らかの部分集合の事と言われる。
普通は「偶数の目が出る」などが事象の例となる。

事象は標本空間の部分集合なので、集合です。
例えば「偶数の目が出る」の場合は、

$$\{2, 4, 6\}$$

となります。

で、この事象を全部集めた物を事象族といいます。
事象が集合なので、その事象を集めた物は、集合の集合という事になります。
集合の集合は集合族と呼ばれるから、事象族と呼びます。

事象族の表記としては花文字Bとか花文字Fとかで書く。
FはF集合族から来ているのか？Bはボレル集合族だね。

花文字というのは下みたいな文字の事です。

$$\mathscr{B}$$

で、その事象族の要素となる事象は、普通の大文字Bで書く。

$$B \in \mathscr{B}$$

なお、集合体も集合族と同じ意味。
シグマ集合族はシグマ集合体と言っても良い。
体をなしているかどうか、とか細かい話はあるかもしれないが、このシリーズでは細かい事は気にしない。

花文字、手描きでうまく書けないからやめて欲しいのだけれど、業界の習慣なので仕方ない。

### 確率P

古典的にはなんて呼ぶのか良く知らないけれど、事象を引数として、その事象が起こる確率を返す関数をPと呼ぶ。

確率測度の事なんだけど、測度が無い状態ではぼやっと定義される。
なのでそもそも定義もごまかしなので、それを正しくはなんと呼ばれるかとか全然興味湧かない。なので調べない。どうせこの辺はいい加減な誤魔化しなので、細かい事はどうでもいいんです。

だが、このPは割と具体的なので、厳密な定義は入門書では謎でも、感覚的には何なのかはわかりやすい。
だから入門者が入門書を読んでいる段階でも、あまり苦労は無いはず。

例えば、

$$P(偶数の目) = \frac{1}{2}$$

とか、そういうものだ。
こういう風に、事象Bを引数として、その確率を返す関数だ。

ただそもそも事象とは何かとかぼやっとしてるので、
その対象に対する関数も古典的な世界ではあんまり細かくは議論出来ない。
だからぼやっとそういうもんだ、とわかれば、このレベルでは十分と言える。

入門書は、確率測度を元とした定式化を分かっている人が、それを古典的な言葉に翻訳して書いてある。
でも、ボレル集合族を出さないので結局測度論を分かっている人だけが分かる自己満足な記述で、そんな物に、分かるはずの無い入門者は苦労する事になる。
酷い話だ。

という事でこの辺わからない人は気にせずとっとと測度論に行くのがオススメです。

### 古典的な確率空間

さて、さっぱり定義出来ていない物を合わせて定義もクソも無いのだが、
これら3つを合わせて確率空間と呼ぶ。

$$(\Omega, \mathscr{B}, P)$$

ちゃんと定義は出来てないから理解は出来てなくて当然だが、それぞれ何を指しているかをちゃんと識別出来ておく必要はある。

| 記号 | 意味 |
| ---- | ---- |
| $$\Omega$$ |  標本空間、$$\{1, 2, 3, 4, 5, 6\}$$ の事 |
| $$\mathscr{B}$$ |  事象族、 $$\{\{偶数の目\}, \{4以上の目\}, \{2, 3, 5\} \}$$など。標本空間の部分集合の集まり。 |
| $$P$$ | 呼び方は知らないけど、事象を引数にその事象が起こる確率を返す関数 |

なお、古典的なこれらの定義が何を指しているかをちゃんと理解しておけば、
理論的には機械学習的な事は全部説明出来ると思う。
説明には、本当は測度論とかは一切要らない。

ただ、誰も古典的な言葉で説明なんてしてくれないので、
一人分働くには測度論とかが要るのだ。
誰か流行りの論文を全部古典的な言葉に翻訳してくれればいいのにねぇ。

このアイデアを伝達する為に皆が使っているからここから先の数学が必要、
というのが、ほとんどの実務家の現実だと思う。

## 入門的な測度論的確率空間

2012年とかその辺の時代なら、このセクションのタイトルに「入門的な」は要らなかったと思う。
「測度論的な確率空間を理解すれば機械学習に必要な確率論は全て理解出来たと言って良い（キリッ」  
で、難しい数学の話は「測度論」という単語を出してイキっておけば分かってるフリが出来ている、という事になっていた。

平和な時代だった…

もちろん今は測度論的な確率空間の初歩を知っている程度では流行りの論文などさっぱり何を言っているか理解出来ないのだが、
一応この辺の事を知っている人ならさわり位は分かるように書くのがマナーとなっている気がするので、
入門的な測度論的確率空間をちゃんと知っている意味はある。

という事で2018年現在ではもはや「入門的な」とつけなくてはいけない測度論的な確率空間の話を簡単にしてみよう。

そもそもに古典的な確率空間はこの測度論的な確率空間を誤魔化して説明しているだけなので、だいたい同じ物である。
測度論的な確率空間も以下の3つの要素からなる。

$$(\Omega, \mathscr{B}, P)$$

このうち、標本空間は古典的な物も測度論的な物も変わらない。

違うのは事象族とPだ。

事象族はボレル集合族であり、Pは確率測度となる。
このボレル集合族と測度は、このシリーズで重要なので、
「[ボレル集合族と測度](borel.md)」の章で扱う。

ちょっと前後するが、一旦そちらを読んでから続きを読んでほしい。

### 事象族とボレル集合族

確率空間を構成する3つの文字の一つ、事象族について。

厳密な定義はおいといて、事象族というのがどんな物なのかイメージしておくのは大切だ。
特にこれが標本空間の部分集合の集まり、という事はちゃんと理解しておかないと、
論文が読めない。

事象族はサイコロの目の例なら「サイコロの目が偶数」といか、「サイコロの目が4以上」とかそういう物だ。
書き方はいろいろだが、最終的には必ず$$\Omega$$の部分集合になる。

ボレル集合族はある数学の性質を持った集合族の事だが、事象族をちゃんと定式化するとボレル集合族の性質を持ってないとまずいから要請されるだけで、
同じ物と思っておいて良い。詳細はボレル集合族の章を参照されたい。