# 袋から取り出す問題でベイズ推定
- 観測結果から袋の選好（どの袋を好んで選んでいるか）推定したい
- 各袋の中身は、袋１：白玉１、赤玉４、袋２：白玉３、赤玉３、袋３：白玉４、赤玉２とする
- 袋を選ぶ人は実は袋１だけをやたら選ぶ人だとして、観測結果からそれを推定してみよう
- 重みつき乱数選択には、Walker's Alias Methodという効率の良い方法があります。興味があれば調べてみてください

In [59]:
# 真の選好（袋１だけ妙に好き）これを推定したい
true_p_b = [1/3,1/3,1-2/3]

In [60]:
#事前確率（各袋を選ぶ確率、観測する前の思い込み）
p_b = [1/3,1/3,1-2/3]

In [61]:
#条件付き確率(各袋で白玉が出る確率)
p_c1_bs = [1/5,1/2,2/3] #袋１で白玉が出る確率・・・

In [62]:
import random
import numpy as np

class SimpleChoiceByWeight():
    def __init__(self, weights):
        self.weights = np.array(weights)
        self.weight_sum = sum(weights)
        self.weights = self.weights / self.weight_sum

    def choice(self):
        r = random.random()

        num = 0
        for i, weight in enumerate(self.weights):
            num += weight
            if r <= num:
                return i

In [63]:
# 10回ばかり袋を選び、玉を取り出してみる

In [64]:
bg_sel = SimpleChoiceByWeight(true_p_b) #袋の選択

def ball_sampling():
    # 袋を選んで、玉を取り出す
    bag_id = bg_sel.choice()
    p_c1_b = p_c1_bs[bag_id]
    r = random.random()
    if r < p_c1_b:
        return '白玉'
    else:
        return '赤玉'  

In [65]:
results = []
for i in range(10):
    res = ball_sampling()
    results.append(res)

In [66]:
import pandas as pd
df = pd.DataFrame(results)

In [67]:
df

Unnamed: 0,0
0,白玉
1,白玉
2,赤玉
3,赤玉
4,赤玉
5,赤玉
6,赤玉
7,赤玉
8,赤玉
9,白玉


In [68]:
df.describe()

Unnamed: 0,0
count,10
unique,2
top,赤玉
freq,7


## 観測結果をもとにベイズ推定してみる
- $P(袋|観測された玉の色)=\frac{P(観測された玉の色|袋)P(袋)}{P(観測された玉の色)} \propto P(観測された玉の色|袋)P(袋)$

In [69]:
def bayesest(d,p_b):
    p_b_posteriors = np.zeros(shape=len(p_b))
    for i, p_b_i in enumerate(p_b):
        # P(観測された玉の色|袋)
        if d == "白玉":
            p_c_b = p_c1_bs[i]
        else:
            p_c_b = 1 - p_c1_bs[i]
            
        # P(観測された玉の色|袋)P(袋)
        p_b_data = p_c_b * p_b_i
        p_b_posteriors[i] = p_b_data

#    p_b_posteriors = p_b_posteriors / sum(p_b_posteriors)
#    print(p_b_posteriors)
#    for i in range(p_b_posteriors.shape[0]):
#        print(i)
#        p_b_p = p_b_posteriors[i]
#        if p_b_p < 0.1:
#            p_b_posteriors[i] = 0.1
        
    return p_b_posteriors/sum(p_b_posteriors)

In [70]:
p_c1_bs

[0.2, 0.5, 0.6666666666666666]

In [71]:
print(p_b)

[0.3333333333333333, 0.3333333333333333, 0.33333333333333337]


In [72]:
new_p_b = p_b
for i, res in enumerate(results):
    new_p_b = bayesest(res, new_p_b)
    print(new_p_b)

[0.14634146 0.36585366 0.48780488]
[0.05446293 0.34039334 0.60514372]
[0.1048671  0.40963709 0.48549581]
[0.18620522 0.4546026  0.35919218]
[0.30033331 0.45827226 0.24139444]
[0.43695364 0.41671147 0.14633489]
[0.57617385 0.34342638 0.08039977]
[0.6989727  0.26038762 0.04063968]
[0.7955092  0.18521892 0.01927188]
[0.6013846  0.35005191 0.04856349]


In [73]:
new_p_b

array([0.6013846 , 0.35005191, 0.04856349])

In [74]:
true_p_b

[0.3333333333333333, 0.3333333333333333, 0.33333333333333337]

In [75]:
new_p_b = bayesest('白玉', new_p_b)
print(new_p_b)

[0.36705768 0.53413922 0.09880311]
