In [None]:
# Chapter20: 条件付き確率とベイズ統計
# Chapter19までは、頻度主義の立場。(結果を得るのに標本データから導かれる頻度や比率を用いる)

In [7]:
# 20.1 ベイズ更新
def calcBayes(priorA, probBifA,probB):
    """priorA: 事象Aの事前確率
       probBifA: Aが与えられた条件付きのBの確率
       probB: 事象Bの確率"""
    return priorA*probBifA/probB

priorA = 1/3 # タイプAのサイコロである確率
prob6ifA = 1/5 # タイプAのサイコロで6が出る確率
prob6 = (1/5+1/6+1/7)/3 # 6が出る確率

#2回とも共に6が出た場合
postA = calcBayes(priorA,prob6ifA,prob6)
print('タイプAである確率 =', round(postA,4))
postA = calcBayes(postA,prob6ifA,prob6)
print('タイプAである確率 =', round(postA,4))

タイプAである確率 = 0.3925
タイプAである確率 = 0.4622


In [10]:
# 2回振ったサイコロの目が共に6ではない場合
postA = calcBayes(priorA,1-prob6ifA,1-prob6)
print('タイプAである確率 =', round(postA,4))
postA = calcBayes(postA,1-prob6ifA, 1-prob6)
print('タイプAである確率 =', round(postA,4))

タイプAである確率 = 0.3212
タイプAである確率 = 0.3096


In [12]:
# 事前に袋の中のサイコロが90%の確率でタイプAだという何らかの情報があった場合
priorA = 0.9 # タイプAのサイコロである確率
prob6ifA = 1/5 # タイプAのサイコロで6が出る確率
prob6 = (1/5+1/6+1/7)/3 # 6が出る確率

#2回とも共に6が出た場合
postA = calcBayes(priorA,1-prob6ifA,1-prob6)
print('タイプAである確率 =', round(postA,4))
postA = calcBayes(postA,1-prob6ifA, 1-prob6)
print('タイプAである確率 =', round(postA,4))

タイプAである確率 = 0.8673
タイプAである確率 = 0.8358


In [14]:
# 事前確率の値が悪い場合のベイズ更新
import random
numRolls = 200
postA = priorA
for i in range(numRolls+1):
    if i%(numRolls//10) == 0:
        print(i,'回振った時点でタイプAである確率=',round(postA,4))
    isSix = random.random() <= 1/7 # サイコロはタイプCである: Booleanで格納
    if isSix:
        postA = calcBayes(postA, prob6ifA, prob6)
    else:
        postA = calcBayes(postA, 1-prob6ifA, 1-prob6)

0 回振った時点でタイプAである確率= 0.9
20 回振った時点でタイプAである確率= 0.7834
40 回振った時点でタイプAである確率= 0.4567
60 回振った時点でタイプAである確率= 0.3253
80 回振った時点でタイプAである確率= 0.2317
100 回振った時点でタイプAである確率= 0.2017
120 回振った時点でタイプAである確率= 0.2146
140 回振った時点でタイプAである確率= 0.3408
160 回振った時点でタイプAである確率= 0.5413
180 回振った時点でタイプAである確率= 0.2582
200 回振った時点でタイプAである確率= 0.2248


- 良い見方：事前確率に誤りがあっても、更新回数が増加するに従い事後確率が真の確率に収束する
- 注意点としては、収束は単調増加もしくは単調減少ではないこと。タイプAであるっぽいという目をサイコロが出していること
- 良い事後確率から開始した方がよいし、収束もはやい

In [15]:
# 事前確率の値が悪い場合のベイズ更新
import random
priorA = 1/3 
numRolls = 200
postA = priorA
for i in range(numRolls+1):
    if i%(numRolls//10) == 0:
        print(i,'回振った時点でタイプAである確率=',round(postA,4))
    isSix = random.random() <= 1/7 # サイコロはタイプCである: Booleanで格納
    if isSix:
        postA = calcBayes(postA, prob6ifA, prob6)
    else:
        postA = calcBayes(postA, 1-prob6ifA, 1-prob6)

0 回振った時点でタイプAである確率= 0.3333
20 回振った時点でタイプAである確率= 0.2374
40 回振った時点でタイプAである確率= 0.1691
60 回振った時点でタイプAである確率= 0.1205
80 回振った時点でタイプAである確率= 0.1049
100 回振った時点でタイプAである確率= 0.0611
120 回振った時点でタイプAである確率= 0.0436
140 回振った時点でタイプAである確率= 0.031
160 回振った時点でタイプAである確率= 0.027
180 回振った時点でタイプAである確率= 0.0157
200 回振った時点でタイプAである確率= 0.0167
