# 頻度主義とベイズ主義統計学

ここではベイズ統計学を学ぶ上で、統計学そのものの枠組みと、頻度主義とベイズ主義の差異について述べる。

統計学は大まかに次のように分類できる。
- 統計学
    - 推測統計学
        - 頻度主義的統計学
        - ベイズ統計学
    - 記述統計

記述統計学は得られたデータの平均や標準偏差を計算することでデータを要約し、そのデータの統計的性質を捉えるものである。しかし、我々は集めたデータを用いて未来の事象を予測したり、データが発生する構造を知ることで未来のための意思決定に役立てたいと考えている。全てのデータを集めることができればそのデータが発生する構造を求めることはできるが、現実的にはそれは不可能であるため何かしらの帰納的推論が必要になる。記述統計学は「現在得られたデータから言えることは何か」ということしか言えず、たとえ親と子の身長の関係が相関係数1であるからといって未来に生まれてくる子供と親の身長が同じ関係にあるとは言えない。これでは科学やビジネスの世界で何かしらの仮説を検証したり、意思決定を行うことはできない。（現在売上が上がり続けているからといって未来も売上は上がるとは限らないじゃないかと言われたら、記述統計学の枠組みでは反論できない。）そこで、推測統計学を用いることで得られたデータから未来を予測、その背後の構造を推測することを正当化し、帰納的推論を可能にする。

## 推測統計学の枠組み

推測統計学は限られたデータによる帰納的推論を数学的に正当化した枠組みであると言える。推測統計学における数学的枠組みとは次の2つである。
- 自然の斉一性を数学的に定式化した確率モデル
- 不確実性を数学的に定式化した確率

### 確率モデル

確率モデルとは自然の斉一性を数学的に定式化したものである。自然の斉一性とは「世の中で起きる事象は完全にランダムに起きるのではなく、何かしらの秩序に基づいて生じており、この秩序が変わらない限り過去、現在、未来全てにおいて同じような事象が生じるだろう」という考えである。この考えを前提とすることで、現在のデータから未来についての帰納的推測をすることが可能になる。推測統計学では、この自然の斉一性を確率モデルとして数学的に定式化することで、帰納的推論の説得性を強めている。

推測統計学の枠組みではデータは確率モデルからランダムに得られるものであるため得られるデータは常に微妙に異なるが、その背後にある確率モデルは変化しないと考える。しかし、確率モデル自体は観測することができないため、得られたデータから確率モデルの構造を推測する。得られたデータから推測された確率モデルは統計モデルと呼ばれ、この構造は変化しないため未来の予測や、自然の構造の推定が可能になる。確率モデルの推定には不確実性の数学的な取り扱いが不可欠であり、これを定式化したものが次に述べる確率である。

### 確率

データが確率モデルからランダムに得られると仮定する以上、得られたデータの不確実性を数学的に扱う必要がある。このような不確実性について数学的に定式化したものが確率になる。後述するが、この確率に対する解釈の違いが頻度主義とベイズ主義の最も大きな違いである。コルモゴロフの確率の公理系は確率の数学的な定式化であり、大雑把に次の公理からなる。
1. ある事象が起きる確率は0以上1以下の実数になる。
2. $A,B,C\dots$が事象であれば、$\bar{A}, \bar{B}, \bar{C}\dots, A\cap B\cap C\cap \dots, A\cup B\cup C\cup \dots$も事象である。
3. $A,B,C\dots$が排反な可算個の有限事象であれば、次の和の法則が成り立つ。$P(A\cup B\cup C\cup\dots)=P(A)+P(B)+P(C)+\dots$

これは数学的公理であるため、この公理を満たすものはどんなものでも確率として扱うことができるが、頻度主義ではこの確率を「試行を限りなく増やした場合の事象の相対頻度の極限値」として解釈し、ベイズ主義では「あるエージェントが持つ信念の度合い」として解釈する。この解釈の違いは確率モデルを推定するという前述の手続きの数学的定式化に大きく影響する。

## 頻度主義とベイズ主義

前述した確率モデルと確率の数学的定式化は、それのみではただの数式であり、何かしらの「解釈」を与えないと現実の帰納的推論を行うことはできない。我々の多くは確率の解釈を、「起こりやすさの度合い」を定量的に評価するものとしている。では、この「起こりやすさ」とは何なのか？起こりやすさとは事象がもつ性質として客観的に定義されるものなのか、もしくは主観的に事象に割り当てられるものなのか、そうであれば誰にとっての起こりやすさであり、またどのように割り当てられるのか？これらの確率の解釈の違いが統計学では主義として表れており、頻度主義とベイズ主義の2種類に分けられる。

前述の通り、頻度主義では確率を「試行を限りなく増やした場合の事象の相対頻度の極限値」として解釈し、ベイズ主義では「あるエージェントが持つ信念の度合い」として解釈する。

### 頻度主義

#### 頻度主義の確率の解釈
頻度主義では確率を「試行を限りなく増やした場合の事象の相対頻度の極限値」として解釈する。確率をこのように解釈することで、我々は事象の起こりやすさを客観的に直接観測できる頻度なるもので定義することができる。確率を事象の頻度して定義すれば、ある事象を何度も起こす実験を行いその実験結果に基づいて確率を定義できるため、誰にとってもある事象の確率を一意に決定することができる。

このような頻度による確率の解釈は二つの特徴がある。

一つは、頻度による確率は事象の集合にのみ定義できるということである。これは、頻度的な確率は何度も実験して観測できる事象にしか割り当てることができないということである。たとえば、「明日隕石が日本に起きる確率」や「来年の今日の東京の天気が雨である確率」などのように一度しか起きない事象に関しては頻度的な確率を割り当てることができない。これは、頻度的な確率を決定するためには、その事象を複数回（実際は無限回）観測することで相対頻度を決定する必要があるためである。

もう一つの特徴は、仮に複数回繰り返すことができる事象であっても、その事象の一回一回についての確率については何も言えないということである。これは「コインを投げて表が出る確率は1/2」ということは言えるが、「今、私がこのコインを投げて表が出るかどうか」ということについては何も言えないということである。

#### 頻度主義における帰納推論の枠組み
このような特徴から、頻度主義における帰納推論の枠組みはやや周りくどいものとなる。頻度主義における帰納推論の枠組みは次のようになる。
1. 世界のある事象についての真理をもつ母集団とその性質（母平均や母分散などのパラメータ）は決して観測できないが、すでに決定している。
2. 我々が得られるのはこの母集団からサンプリングされるある事象についての複数の実現値（標本）である。
3. 我々は標本から計算できる統計量が母集団の性質（母平均や母分散）の近似として妥当であるということを数学的に説明することで、標本統計量からパラメータを推測する。

このような枠組みであることから、頻度主義における95%信頼区間の95%とは「パラメータがこの区間に含まれる確率」ではなく、「仮にある母集団から得られる標本の集団が複数あって信頼区間を計算できた時、100個中95個くらいは信頼区間の中にパラメータの値を含む」と定義される。信頼区間を確率として定義すると、パラメータを何度も観測した時その値はサンプリングごとに異なるが、100回中95回のパラメータは信頼区間に含まれるということになる。しかし、母集団のパラメータは決して観測することはできず、さらにすでに決定されている固定値である。そのため、ある信頼区間がパラメータを含むかどうかは、含むか含まないかの二元論であり、確率としては定義されない。そのため信頼区間は、別々の標本からいくつも信頼区間を計算したとき、パラメータが含まれる信頼区間の数の「割合」として定義される。[参考資料](https://tjo.hatenablog.com/entry/2021/07/16/190000)

また、頻度主義では「ある仮説が正しい確率」というものが定義できない。たとえば、相対性理論が正しい確率を頻度主義的に定義するのであれば、相対性理論が正しい世界と正しくない世界の複数の世界を観測し、その頻度を観測する必要がある。しかし、我々の住むこの世界では相対性理論が正しいか正しくないかは（観測できるかできないかに関わらず）決まっているため、頻度的な確率を定義することはできない。そのため、頻度主義では仮説が正しいかを検証するためにも周りくどい方法を取る必要がある。これは仮説検定と呼ばれ、次のような手続きをとる。
1. ある課題について、検証したい仮説（対立仮説）とその反対の仮説（帰無仮説）を立てる。
2. 分析者は帰無仮説の立場に立って、帰無仮説が正しいと仮定した場合の確率モデルから今得られたデータが得られる確率（p値）を計算する。
3. p値がある水準（有意水準）より低ければ、「帰無仮説が正しいとしたら手元のデータが得られる確率はほとんど起こらないぐらい低いのだから、帰無仮説は正しくないだろう」と考え帰無仮説を棄却する。

頻度主義ではこのように仮説の正しさを検証する。しかし、このような仮説検定には個人的には4つ問題があると考えている。

一つは検証したい仮説が正しいと言い切れない点である。仮説検定で帰無仮説が棄却されたときに言えることは、「少なくとも帰無仮説が正しいとすると今手元にあるデータが得られる確率は非常に低い」ということだけである。これは検証したい仮説（対立仮説）を積極的に支持すること意味しない。このような言い回しは絶対的な正しさを求める科学の世界では謙虚で良い姿勢だろうが、ビジネスの世界では相手を説得するには非常に弱い言い回しになる。

二つ目は仮説の正しさを定量的に評価することができない点である。これは頻度主義の立場を取る以上どうしようもないことで、前述した通り頻度主義では仮説の正しさに対して確率を割り当てることができず、仮説がどのくらい正しいと言えるのか定量的に評価することができない。

三つ目は有意水準の恣意性である。多くの研究では有意水準は5%と決められているが、これは何か明確な基準があって決められたものでなく、慣例的に5%とされただけで何となく決められたものである。実際ミドルのパチンコの初当たり確率は1/319であり、5%より低いが、一回転目から当たりを引くことはままあり、個人的にはそんなに低い確率ではないと感じる。

四つ目は不正のしやすさと再現性の問題である。仮説検定では第一種の過誤と第二種の過誤の確率を低くするために実験の前に有意水準、検出力、サンプルサイズを慎重に決定する必要があるが、これを適切に行えるのは相当統計学に詳しい専門家のみであり、故意か過失かに関わらず簡単に不正することができる。代表的な不正にはp-hackingやdata dredging、harkingなどがあり、研究の世界では再現性問題として深刻な問題となっている。

以上が頻度主義の確率の解釈とそこから広がる頻度主義の枠組みである。

### ベイズ主義

#### ベイズ主義の確率の解釈
頻度主義では確率の解釈として、試行を限りなく増やした場合の事象の相対頻度の極限値と定義した。これは全ての人にとって一意に決まるため「客観確率」とも呼ばれる。一方で、ベイズ主義では確率を「あるエージェントが事象に対して持つ信念の度合い」として解釈する。

信念の度合いは、ある仮説が正しいかという賭けの公正な賭け金によって測ることができる。たとえば、「仮説Aが正しかったら1万円もらえるが、間違っていたらもらえない」というくじがあったとする。このとき、このくじが公正であると感じる賭け金の値段が信念の度合いである。くじが公正であるとは、あなたがくじを買うことにも売ることにも同意できる値段のことである。くじを売ることも買うことも考える場合、あなたはそのくじで得も損もしない値段が公正であると感じるはずである。たとえばくじが5千円であれば公正であるとあなたが感じるならば、5000/10000=1/2の確率で仮説Aが正しいとあなたが信じているということになり、くじが100円であれば公正であると感じるならば、1/100の確率で仮説Aっが正しいと感じているということになる。

このようにベイズ主義における確率は、エージェントがある事象、仮説が起こる、正しいと感じている信念の度合いを数値的に表すことができる関数であると解釈する。ベイズ主義における確率はエージェントそれぞれが主観的に決定するため「主観確率」と呼ばれる。

主観確率では客観確率と異なり、一度しか起きない事象に対しても確率を割り当てることができる。客観確率では何度も観測できない事象や、観測できないが成否が決定している仮説については相対頻度を観測できないため確率を割り当てることができないが、主観確率は各々が信じている度合いであるため「明日雨が降る確率」や「相対性理論が正しい確率」などに確率を割り当てることができる。そのため、ベイズ主義では仮説が正しい確率を定量的に評価することができる。

一方で、頻度主義者からは主観確率の「主観性」が批判の的になっている。主観確率の定義は「あるエージェントが事象に対して持つ信念の度合い」であるが、ここでいるエージェントとは人間個々人や仮説について同じ知識を持った集団のことである。つまり、Aさんはある事象が起きる確率が10%であると思っているが、Bさんは100%だと思っているというように一つの事象に対して二人が割り当てる確率が異なるということが主観確率では許される。このような主観性は客観性を求める科学的研究には不適切であると批判されてきた。

#### ベイズ主義における帰納推論の枠組み
頻度主義では仮説の正しさやパラメータはこの世に固定値として（観測できないが）存在し、得られたデータから数学的に妥当であるとされる統計量を計算して近似することで帰納推論を行なっていた。ベイズ主義では、仮説の正しさやパラメータのように観測できないものがどんな値かという信念（事前分布）を得られたデータを用いて更新して修正された信念（事後分布）を得ることで帰納推論を行う。このデータを用いて信念を更新するルールが「ベイズの定理」である。ベイズの定理は意思決定理論における最も合理的な信念の更新方法であることがわかっている。

ベイズの定理は次のように表される。
$$
p(\theta|y) = \frac{p(y|\theta)p(\theta)}{p(y)}=\frac{p(y|\theta)p(\theta)}{\int p(y|\theta)d\theta}
$$
ここで$p(\theta)$を事前分布、$p(\theta|y)$を事後分布、$p(y|\theta)$を尤度、$p(y)=\int p(y|\theta)d\theta$を事後分布が確率分布になるための正規化定数という。事後分布は$\theta$の関数なので次のように事前分布と尤度の積に比例する。
$$
p(\theta|y) \propto p(y|\theta)p(\theta)
$$
事前分布はデータが得られる前に分析者が信じているパラメータの確率分布である。尤度はパラメータの関数として見ると、データだ得られたときデータが得られたときそのデータがどのような値のパラメータの母集団から得られたと考えるのが尤もらしいかを表す関数である。事後分布はデータが得られた上で分析者が信じるパラメータの確率分布である。事前分布と尤度の積をとることで事前分布を尤度の値が大きくなる方へ修正することができ、それが事後分布となる。ベイズの定理ではこのようにデータによってパラメータについての信念を更新する。

#### ベイズの定理の問題点
ベイズの定理による信念の更新には二つ問題点がある。それは正規化定数の積分が複雑で計算不可能であることがほとんどである点と、事前分布の恣意性である。

ベイズの定理の正規化定数は尤度のパラメータについての積分である。これはほとんどの場合において陽に書くことが不可能で、解析的に積分することも難しい。そこで数値積分によって近似したいが、パラメータの数に応じて指数関数的に計算量が増大するため単純な数値積分は実質不可能である。これに対する解決法は三つあり、一つは共役性のある事前分布を設定することで解析的に積分を解いて事後分布を得る方法である。しかし、全ての問題に共役事前分布が存在するわけではないので限られた問題にしか利用できない。そのような場合には次の二つの方法で解決できる。一つは変分法によって事後分布を別の簡単な確率分布で近似する変分ベイズで、もう一つの方法はベイズの定理の分子からランダムなサンプリングを行い正規化することで事後分布を近似的に得る方法である。特に後者の方法は、計算機技術とMCMCなどのサンプリングアルゴリズムの発展により現実的な時間と資源で非常に多くの問題に対処できる。

二つ目の事前分布の恣意性は主観確率と関連して批判の的となっている。事前分布は分析者が恣意的に決めることができ、事前分布の設定によって分析結果が変わってしまうことから科学の世界では一部批判が集まっている。これに対するベイズ主義の対応は、知識がない場合にはできるだけ客観的にするべきだという考えから情報をできるだけ持たない弱情報事前分布を利用することや、データから事前分布のパラメータを決め打ちする経験ベイズなどがある。（経験ベイズはデータの二度漬けになるのでデータを予測ではなく説明するという観点からは個人的には間違ったやり方だと思う）一方、事前分布が恣意的に決められることを利用して、分析者と異なる事前分布を持つ人を説得するための分析を行うこともできる。（1章の感度分析がまさにそれである）

このようにベイズ主義は（計算上の煩雑さを除いて）非常に直感的で豊かな分析を可能にしてくれる

## 