# Bayers's Theorem

$$ P(A|B) = \frac{P(A)P(B|A)}{P(B)} $$

## 쿠키 문제
다음은 요청하신 내용을 번역한 것입니다:

우리는 [항아리 문제](https://en.wikipedia.org/wiki/Urn_problem)의 변형된 버전으로 시작하겠습니다:

> 두 개의 쿠키 그릇이 있다고 가정해봅시다.
>
> * 1번 그릇에는 바닐라 쿠키 30개와 초콜릿 쿠키 10개가 있습니다.
>
> * 2번 그릇에는 바닐라 쿠키 20개와 초콜릿 쿠키 20개가 있습니다.
>
> 이제 그 중 하나의 그릇을 무작위로 선택하고, 보지 않고 무작위로 쿠키를 하나 선택했다고 가정합시다. 선택한 쿠키가 바닐라 쿠키라면, 그 쿠키가 1번 그릇에서 나온 확률은 얼마일까요?

우리가 구하고 싶은 것은 바닐라 쿠키를 선택했다는 조건 하에 1번 그릇에서 선택했을 확률, 즉 $ P(B_1 | V) $입니다.

하지만 문제의 서술에서 얻을 수 있는 정보는 다음과 같습니다:

* 1번 그릇에서 선택했을 때 바닐라 쿠키를 선택할 조건부 확률, $ P(V | B_1) $
* 2번 그릇에서 선택했을 때 바닐라 쿠키를 선택할 조건부 확률, $ P(V | B_2) $


**베이즈 정리**는 이들이 어떻게 관련되는지를 알려줍니다:

$$P(B_1|V) = \frac{P(B_1)~P(V|B_1)}{P(V)}$$

왼쪽 항은 우리가 구하고자 하는 값입니다. 오른쪽 항들의 의미는 다음과 같습니다:

- $P(B_1)$: 우리가 어떤 종류의 쿠키를 얻었는지에 상관없이 1번 그릇을 선택했을 확률입니다.
  문제에서 우리는 그릇을 무작위로 선택했다고 했으므로, $P(B_1) = 1/2$로 가정할 수 있습니다.

- $P(V|B_1)$: 1번 그릇에서 바닐라 쿠키를 선택할 확률은 3/4입니다.

- $P(V)$: 두 그릇 중 어느 그릇에서든 바닐라 쿠키를 뽑을 확률입니다.


$P(V)$를 계산하기 위해, **전체 확률의 법칙**을 사용할 수 있습니다:

$$P(V) = P(B_1)~P(V|B_1) ~+~ P(B_2)~P(V|B_2)$$

문제에서 제공된 수치를 대입하면,

$$P(V) = (1/2)~(3/4) ~+~ (1/2)~(1/2) = 5/8$$

또한 이 결과를 직접적으로 계산할 수도 있습니다. 다음과 같습니다:

- 두 그릇 중 하나를 선택할 확률이 같았고, 그릇마다 쿠키 개수가 동일하므로 어떤 쿠키를 선택할 확률도 동일합니다.

- 두 그릇을 합하면 바닐라 쿠키는 50개, 초콜릿 쿠키는 30개이므로, $P(V) = 5/8$입니다.



마지막으로, 베이즈 정리를 적용하여 1번 그릇의 사후 확률을 계산할 수 있습니다:

$$P(B_1|V) = (1/2)~(3/4)~/~(5/8) = 3/5$$

이 예시는 베이즈 정리의 한 가지 용도를 보여줍니다: 베이즈 정리는 $P(B|A)$에서 $P(A|B)$로 가는 방법을 제공합니다.  
이 전략은 왼쪽 항보다 오른쪽 항을 계산하는 것이 더 쉬운 경우, 이와 같은 문제에서 유용하게 사용됩니다.



## 요약

$P(B_1|V)$ : 랜덤한 그릇에서 바닐라를 꺼쟀을때 $B_1$인 확률

$P(V|B_1)$ : $B_1$ 그릇 중에서 바닐라를 꺼낼 확률 (3/4)

$P(V|B_2)$ : $B_2$ 그릇 중에서 바닐라를 꺼낼 확률 (1/2)

$P(B_1)$ : $B_1$ 확률 (1/2)

$P(B_2)$ : $B_2$ 확률 (1/2)

$P(V)$ : 바닐라를 꺼낼 전체 확률 $ P(V) = P(B_1)~P(V|B_1) ~+~ P(B_2)~P(V|B_2) = (1/2)~(3/4) ~+~ (1/2)~(1/2) = 5/8$


따라서 $ P(B_1|V) = \frac{P(B_1)P(V|B_1)}{P(V)}  = (1/2)~(3/4)~/~(5/8) = 3/5$


## **통시적 베이즈 (Diachronic Bayes)**

베이즈 정리를 생각하는 또 다른 방법이 있습니다: 어떤 데이터 $D$를 바탕으로 가설 $H$의 확률을 갱신하는 방법을 제공합니다.

이 해석은 "통시적"이라는 뜻으로, "시간에 따른 변화와 관련된" 것을 의미합니다. 이 경우, 가설의 확률은 새로운 데이터를 접할 때마다 변화합니다.

베이즈 정리를 $H$와 $D$로 다시 쓰면:

$$P(H|D) = \frac{P(H)~P(D|H)}{P(D)}$$

이 해석에서 각 항의 이름은 다음과 같습니다:

- $P(H)$는 데이터를 보기 전에 가설의 확률로, **사전 확률** (prior probability) 또는 간단히 **사전 확률**이라 부릅니다.

- $P(H|D)$는 데이터를 본 후 가설의 확률로, **사후 확률** (posterior probability)이라 부릅니다.

- $P(D|H)$는 가설 하에서 데이터의 확률로, **우도** (likelihood)라 부릅니다.

- $P(D)$는 **데이터의 총 확률**로, 모든 가설을 고려한 데이터의 확률입니다.

때때로 우리는 사전 확률을 배경 정보에 기반하여 계산할 수 있습니다. 예를 들어, 쿠키 문제에서는 그릇을 무작위로 동일한 확률로 선택한다고 명시되어 있습니다.

다른 경우에 사전 확률은 주관적일 수 있습니다. 즉, 합리적인 사람들끼리도 서로 다른 배경 정보를 사용하거나, 같은 정보를 다르게 해석하기 때문에 의견이 다를 수 있습니다.

우도는 일반적으로 가장 계산하기 쉬운 부분입니다. 쿠키 문제에서 우리는 각 그릇에 있는 쿠키의 수를 알고 있기 때문에, 각 가설 하에서 데이터의 확률을 계산할 수 있습니다.


데이터의 총 확률을 계산하는 것은 까다로울 수 있습니다.  
데이터를 **어떤 가설 하에서도** 볼 수 있는 확률이어야 하지만, 그것이 정확히 무엇을 의미하는지 명확히 하기가 어려울 수 있습니다.

대부분의 경우, 우리는 다음과 같은 가설 세트를 명시하여 문제를 단순화합니다:

- **상호 배타적**이라는 것은, 오직 하나의 가설만이 참일 수 있다는 의미입니다.
- **모두 포괄적**이라는 것은, 가설 중 하나는 반드시 참이라는 의미입니다.

이 조건들이 적용되면, 우리는 **전체 확률의 법칙**을 사용하여 $P(D)$를 계산할 수 있습니다. 예를 들어, 두 가지 가설 $H_1$과 $H_2$가 있을 때:

$$P(D) = P(H_1)~P(D|H_1) + P(H_2)~P(D|H_2)$$

좀 더 일반적으로, 어떤 수의 가설이 있을 때:

$$P(D) = \sum_i P(H_i)~P(D|H_i)$$

이 섹션에서 설명한 과정, 즉 데이터를 사용하여 사전 확률을 바탕으로 사후 확률을 계산하는 과정을 **베이지안 업데이트** (Bayesian update)라고 부릅니다.



1. $P(H)$ : prior 사전확률 hypothesis(가설)
2. $P(D|H)$ : likelihood(가능도) 가설H에서 데이터D가 나올 확률
3. $P(H)P(D|H)$ : 사전확률 * 가능도
3. $P(D) = \sum_i P(H_i)~P(D|H_i)$ : 사건D의 전체확률 data
3. $P(H|D)$ : posterior 사후확률

## **베이즈 테이블**(Bayes Tables)

베이지안 업데이트를 수행하는 데 편리한 도구는 **베이즈 테이블**입니다. 베이즈 테이블을 종이에 작성할 수도 있고, 스프레드시트를 사용할 수도 있지만, 이 섹션에서는 Pandas의 `DataFrame`을 사용할 것입니다.

우선 각 가설마다 하나의 행을 가진 빈 `DataFrame`을 만들겠습니다.


$P(H)$

In [2]:
import pandas as pd

table = pd.DataFrame(index=['Bowl 1', 'Bowl 2'])
table['prior'] = 1/2, 1/2 # 사전확률 여기서는 1/2로 가정
table

Unnamed: 0,prior
Bowl 1,0.5
Bowl 2,0.5


$P(D|H)$ 

In [3]:
table['likelihood'] = 3/4, 1/2 # 가능도(우도)
table

Unnamed: 0,prior,likelihood
Bowl 1,0.5,0.75
Bowl 2,0.5,0.5


여기서 이전 방법과의 차이점이 있습니다: 1번 그릇뿐만 아니라 두 가설에 대해 모두 우도를 계산합니다.

- 1번 그릇에서 바닐라 쿠키를 얻을 확률은 3/4입니다.

- 2번 그릇에서 바닐라 쿠키를 얻을 확률은 1/2입니다.

우도 값들이 1로 합쳐지지 않는다는 것을 눈치챘을 수도 있습니다. 괜찮습니다; 각각은 서로 다른 가설에 조건부된 확률이기 때문에 1로 합쳐질 필요가 없으며, 합쳐지지 않아도 문제가 되지 않습니다.

다음 단계는 베이즈 정리를 사용했던 것과 비슷합니다. 사전 확률에 우도를 곱합니다.


 $P(H)P(D|H)$

In [4]:
table['unnorm'] = table['prior'] * table['likelihood']
table

Unnamed: 0,prior,likelihood,unnorm
Bowl 1,0.5,0.75,0.375
Bowl 2,0.5,0.5,0.25



저는 이 결과를 `unnorm`이라고 부르는데, 이는 "정규화되지 않은 사후 확률 (unnormalized posteriors)"이기 때문입니다. 각각은 사전 확률과 우도의 곱입니다:

$$P(H_i)~P(D|H_i)$$

이는 베이즈 정리의 분자에 해당합니다. 이 값을 모두 더하면,

$$P(H_1)~P(D|H_1) + P(H_2)~P(D|H_2)$$

이는 베이즈 정리의 분모인 $P(D)$에 해당합니다.

따라서 다음과 같이 데이터의 총 확률을 계산할 수 있습니다:


$P(D) = \sum_i P(H_i)~P(D|H_i)$

In [5]:
prob_data = table['unnorm'].sum()
prob_data

0.625

우리가 5/8을 얻는 것을 확인할 수 있는데, 이는 $P(D)$를 직접 계산하여 얻은 값과 동일합니다.

그리고 사후 확률은 다음과 같이 계산할 수 있습니다:

 $P(H|D) = \frac{P(H)~P(D|H)}{P(D)}$

In [6]:
table['posterior'] = table['unnorm'] / prob_data # normalization
table

Unnamed: 0,prior,likelihood,unnorm,posterior
Bowl 1,0.5,0.75,0.375,0.6
Bowl 2,0.5,0.5,0.25,0.4


1번 그릇에 대한 사후 확률은 0.6으로, 이는 베이즈 정리를 명시적으로 사용하여 얻은 값과 동일합니다. 보너스로, 2번 그릇에 대한 사후 확률도 0.4임을 알 수 있습니다.

정규화되지 않은 사후 확률을 모두 더하고 이를 나누면, 사후 확률의 합이 1이 되도록 합니다. 이 과정을 "정규화 (normalization)"라고 부르며, 이 때문에 데이터의 총 확률을 "정규화 상수 (normalizing constant)"라고도 합니다.

## **주사위 문제** (The Dice Problem)

베이즈 테이블은 두 가지 이상의 가설이 있는 문제도 해결할 수 있습니다. 예를 들어:

> 내가 6면체 주사위, 8면체 주사위, 그리고 12면체 주사위가 들어 있는 상자를 가지고 있다고 가정해 봅시다. 나는 주사위 중 하나를 무작위로 선택하여 굴린 후, 결과가 1이라고 보고했습니다. 내가 선택한 주사위가 6면체 주사위일 확률은 얼마일까요?

이 예에서는 세 가지 가설이 있으며, 각 가설의 사전 확률은 동일합니다. 데이터는 결과가 1이라는 나의 보고입니다.

6면체 주사위를 선택했다면 데이터의 확률은 1/6이고, 8면체 주사위를 선택했다면 1/8, 12면체 주사위를 선택했다면 1/12입니다.

다음은 정수로 가설을 표현한 베이즈 테이블입니다:


In [7]:
from fractions import Fraction

table2 = pd.DataFrame(index=[6, 8, 12])
table2['prior'] = Fraction(1, 3)
table2

Unnamed: 0,prior
6,1/3
8,1/3
12,1/3


사전 확률과 우도를 나타내기 위해 분수를 사용할 것입니다. 이렇게 하면 값이 부동 소수점 숫자로 반올림되지 않게 됩니다.

In [8]:
table2['likelihood'] = [Fraction(1, 6), Fraction(1, 8), Fraction(1, 12)]
table2

Unnamed: 0,prior,likelihood
6,1/3,1/6
8,1/3,1/8
12,1/3,1/12


사전 확률과 우도를 설정하면, 남은 단계는 항상 동일하므로 이를 함수로 작성하겠습니다.

In [9]:
def update(table):
    table['unnorm'] = table['prior'] * table['likelihood']
    prob_data = table['unnorm'].sum()
    table['posterior'] = table['unnorm'] / prob_data
    return prob_data

In [10]:
prob_data = update(table2)
prob_data

Fraction(1, 8)

In [11]:
table2

Unnamed: 0,prior,likelihood,unnorm,posterior
6,1/3,1/6,1/18,4/9
8,1/3,1/8,1/24,1/3
12,1/3,1/12,1/36,2/9


6면체 주사위의 사후 확률은 4/9로, 다른 주사위의 확률인 3/9와 2/9보다 약간 더 높습니다. 직관적으로, 6면체 주사위가 우리가 본 결과를 가장 높은 확률로 만들어낼 수 있었기 때문에 가장 가능성이 높다고 할 수 있습니다.

## **몬티 홀 문제** (The Monty Hall Problem)

다음으로, 베이즈 테이블을 사용하여 확률 이론에서 가장 논쟁적인 문제 중 하나를 해결해 보겠습니다.

**몬티 홀 문제**는 *Let's Make a Deal*이라는 게임 쇼에 기반을 두고 있습니다. 당신이 이 쇼의 참가자라고 가정했을 때, 게임의 진행 방식은 다음과 같습니다:

- 사회자인 몬티 홀은 세 개의 닫힌 문 (번호는 1, 2, 3번) 앞에 당신을 세우고, 각 문 뒤에 상금이 있다고 알려줍니다.

- 한 개의 상금은 가치가 높은 상품 (전통적으로 자동차)이고, 나머지 두 개는 가치가 낮은 상품 (전통적으로 염소)입니다.

- 게임의 목표는 자동차가 있는 문을 맞추는 것입니다. 만약 당신이 맞추면, 자동차를 가질 수 있습니다.

당신이 1번 문을 선택했다고 가정합시다. 당신이 선택한 문을 열기 전에, 몬티가 3번 문을 열어 염소를 보여줍니다. 그러고 나서 몬티는 원래 선택을 유지할지, 아니면 남은 열리지 않은 문으로 바꿀지를 선택할 기회를 제공합니다.

자동차를 얻을 확률을 최대화하려면, 1번 문을 유지하는 것이 좋을까요, 아니면 2번 문으로 바꾸는 것이 좋을까요?

이 질문에 답하기 위해 우리는 사회자의 행동에 대해 몇 가지 가정을 해야 합니다:

1.  몬티는 항상 문을 하나 열고, 당신에게 선택을 바꿀 기회를 제공합니다.

2.  그는 당신이 선택한 문이나 자동차가 있는 문은 절대 열지 않습니다.

3.  당신이 자동차가 있는 문을 선택했을 경우, 그는 나머지 두 문 중 하나를 무작위로 선택하여 엽니다.

이 가정 하에서는, 선택을 바꾸는 것이 유리합니다.  
선택을 유지하면 당신이 이길 확률은 $1/3$입니다. 선택을 바꾸면 이길 확률은 $2/3$입니다.

이 문제를 처음 접했다면 이 답이 놀랍게 느껴질 수 있습니다. 혼자만의 느낌은 아닙니다; 많은 사람들이 선택을 유지하든 바꾸든 확률이 같다고 강하게 직관적으로 느낍니다. 남은 문이 두 개이기 때문에, 자동차가 A 문 뒤에 있을 확률이 50%라고 생각할 수도 있습니다. 하지만 그것은 잘못된 판단입니다.

이유를 이해하기 위해 베이즈 테이블을 사용하는 것이 도움이 될 수 있습니다. 우리는 세 가지 가설로 시작합니다: 자동차가 1번, 2번, 또는 3번 문 뒤에 있을 수 있습니다. 문제 설명에 따르면, 각 문이 선택될 사전 확률은 $1/3$입니다.


$P(D_1)$ $P(D_2)$ $P(D_3)$ 각각의 문뒤에 자동차가 있을 사전 확률은 1/3

In [12]:
table3 = pd.DataFrame(index=['door 1', 'door 2', 'door 3'])
table3['prior'] = Fraction(1, 3)
table3

Unnamed: 0,prior
door 1,1/3
door 2,1/3
door 3,1/3



데이터는 몬티가 3번 문을 열어 염소를 보여주었다는 것입니다. 그러므로 각 가설 하에서 데이터의 확률을 고려해 보겠습니다:

- 자동차가 1번 문 뒤에 있다면, 몬티는 2번 문이나 3번 문을 무작위로 선택합니다. 따라서 그가 3번 문을 여는 확률은 $1/2$입니다.

- 자동차가 2번 문 뒤에 있다면, 몬티는 반드시 3번 문을 열어야 하므로 이 가설 하에서 데이터의 확률은 1입니다.

- 자동차가 3번 문 뒤에 있다면, 몬티는 그것을 열지 않으므로 이 가설 하에서 데이터의 확률은 0입니다.

여기서 우도 값들이 나옵니다.


* $P(M_3|D_1)$ : 문1에 차가 있을 때 몬티가 문3를 열었을 확률은 1,3 중 하나 1/2
* $P(M_3|D_2)$ : 문2에 차가 있을 때 몬티가 문3를 열었을 확률은 1
* $P(M_3|D_3)$ : 문3에 차가 있을 때 몬티가 문3를 열었을 확률은 0

In [13]:
table3['likelihood'] = [Fraction(1, 2), 1, 0]
table3

Unnamed: 0,prior,likelihood
door 1,1/3,1/2
door 2,1/3,1
door 3,1/3,0


$ P(D_i)P(M_3|D_i) $

In [14]:
table3['unnorm'] = table3['prior'] * table3['likelihood']
table3

Unnamed: 0,prior,likelihood,unnorm
door 1,1/3,1/2,1/6
door 2,1/3,1,1/3
door 3,1/3,0,0


$P(M_3) = \sum_i P(D_i)P(M_3|D_i) $

In [15]:
prob_data = table3['unnorm'].sum()
prob_data

Fraction(1, 2)

$P(D_i|M_3) = \frac{P(D_i)P(M_3|D_i)}{P(M_3)}$

In [16]:
table3['posterior'] = table3['unnorm'] / prob_data
table3

Unnamed: 0,prior,likelihood,unnorm,posterior
door 1,1/3,1/2,1/6,1/3
door 2,1/3,1,1/3,2/3
door 3,1/3,0,0,0


몬티가 3번 문을 연 후, 1번 문의 사후 확률은 $1/3$이고, 2번 문의 사후 확률은 $2/3$입니다. 따라서 1번 문에서 2번 문으로 바꾸는 것이 더 유리합니다.

In [17]:
prob_data = update(table3)
prob_data

Fraction(1, 2)

In [18]:
table3

Unnamed: 0,prior,likelihood,unnorm,posterior
door 1,1/3,1/2,1/6,1/3
door 2,1/3,1,1/3,2/3
door 3,1/3,0,0,0


이 예에서 알 수 있듯이, 확률에 대한 우리의 직관이 항상 신뢰할 만한 것은 아닙니다.  
베이즈 정리는 문제를 나누어 푸는 전략을 제공하여 도움을 줄 수 있습니다:

1. 먼저, 가설과 데이터를 작성합니다.

2. 다음으로, 사전 확률을 구합니다.

3. 마지막으로, 각 가설 하에서 데이터의 우도를 계산합니다.

베이즈 테이블이 나머지 계산을 수행합니다.


## 요약

이 장에서는 쿠키 문제를 베이즈 정리를 명시적으로 사용하여 풀어 보았고, 베이즈 테이블을 사용하여도 풀어 보았습니다. 이 두 방법 사이에는 실질적인 차이는 없지만, 베이즈 테이블은 특히 두 개 이상의 가설이 있는 문제에서 데이터의 총 확률을 계산하는 과정을 더 쉽게 해줄 수 있습니다.

그 후, 다음 장에서 다시 다룰 주사위 문제와, 두 번 다시 보고 싶지 않을 수도 있는 몬티 홀 문제를 해결해 보았습니다.

몬티 홀 문제로 머리가 아프다면 혼자가 아닙니다. 하지만 이 문제는 베이즈 정리가 복잡한 문제를 해결하는 데 있어서 강력한 분할 정복 전략이 될 수 있음을 보여준다고 생각합니다. 또한, 답이 왜 그런지에 대한 통찰을 제공해주기를 바랍니다.

몬티가 문을 열면, 우리는 자동차의 위치에 대한 믿음을 갱신하는 데 사용할 수 있는 정보를 얻습니다. 이 정보의 일부는 명백합니다. 예를 들어, 그가 3번 문을 열었다면, 우리는 자동차가 3번 문 뒤에 없다는 것을 압니다. 그러나 정보의 일부는 더 미묘합니다. 자동차가 2번 문 뒤에 있을 경우 몬티가 3번 문을 열 확률이 더 높고, 1번 문 뒤에 있을 경우 확률이 낮습니다. 따라서 데이터는 2번 문에 유리한 증거가 됩니다. 우리는 앞으로의 장에서 증거의 개념을 다시 다룰 것입니다.

다음 장에서는 쿠키 문제와 주사위 문제를 확장하여, 기본 확률에서 베이즈 통계로 나아가는 다음 단계를 탐구할 것입니다.

하지만 먼저, 연습 문제를 풀어보는 것이 좋겠습니다.

## 연습문제

연습 문제: 상자 안에 두 개의 동전이 있다고 가정해봅시다.
하나는 한쪽은 앞면이고 다른 한쪽은 뒷면인 일반 동전이고, 다른 하나는 양쪽이 모두 앞면인 속임수 동전입니다.
당신은 동전 하나를 무작위로 선택하여 한 면이 앞면임을 보았습니다.
이때, 선택한 동전이 속임수 동전일 확률은 얼마일까요?

In [19]:
coin = pd.DataFrame(index=['normal', 'trick'])
coin['prior'] = 1/2, 1/2
coin

Unnamed: 0,prior
normal,0.5
trick,0.5


In [20]:
coin['likelihood'] = 1/2, 1
coin

Unnamed: 0,prior,likelihood
normal,0.5,0.5
trick,0.5,1.0


In [21]:
coin['unnorm'] = coin['prior'] * coin['likelihood']
coin

Unnamed: 0,prior,likelihood,unnorm
normal,0.5,0.5,0.25
trick,0.5,1.0,0.5


In [22]:
prob_data = coin['unnorm'].sum()
prob_data

0.75

In [23]:
coin['posterior'] = coin['unnorm'] / prob_data
coin

Unnamed: 0,prior,likelihood,unnorm,posterior
normal,0.5,0.5,0.25,0.333333
trick,0.5,1.0,0.5,0.666667


**연습 문제**: 누군가를 만났고, 그에게 자녀가 두 명 있다는 것을 알게 되었다고 가정해봅시다.
자녀 중 한 명이 여자 아이인지 묻자, 그는 그렇다고 대답했습니다.
두 자녀 모두 여자일 확률은 얼마일까요?

힌트: 네 가지의 동일하게 가능성이 있는 가설로 시작해보세요.

In [24]:
s = pd.DataFrame(index=['bb', 'bg', 'gb', 'gg'])
s['prior'] = 1/4
s

Unnamed: 0,prior
bb,0.25
bg,0.25
gb,0.25
gg,0.25


In [25]:
s['likelihood'] = 0, 1, 1, 1
s['unnorm'] = s['prior'] * s['likelihood']
prob_data = s['unnorm'].sum()
s['posterior'] = s['unnorm'] / prob_data
s

Unnamed: 0,prior,likelihood,unnorm,posterior
bb,0.25,0,0.0,0.0
bg,0.25,1,0.25,0.333333
gb,0.25,1,0.25,0.333333
gg,0.25,1,0.25,0.333333



**연습 문제:** [몬티 홀 문제](https://en.wikipedia.org/wiki/Monty_Hall_problem)에는 여러 변형이 있습니다.  
예를 들어, 몬티가 선택할 수 있다면 항상 2번 문을 선택하고, 어쩔 수 없는 경우에만 (자동차가 2번 문 뒤에 있는 경우) 3번 문을 선택한다고 가정해봅시다.
1번 문을 선택했을 때 몬티가 2번 문을 열었다면, 자동차가 3번 문 뒤에 있을 확률은 얼마일까요?

문1,2,3에 차가 있을 사전 확률은 전부 1/3

In [26]:
monty1 = pd.DataFrame(index=['D1', 'D2', 'D3'])
monty1['prior'] = 1/3, 1/3, 1/3
monty1

Unnamed: 0,prior
D1,0.333333
D2,0.333333
D3,0.333333


문1을 선택시 몬티가 문2를 열었을 확률
* 문1에 차가 있으면 무조건 문2를 열음 따라서 1
* 문2에 차가 있으면 문2를 열지 않으므로 0
* 문3에 차가 있으면 항상 문2를 열것이므로 1

In [27]:
monty1['likelihood'] = 1, 0, 1
monty1

Unnamed: 0,prior,likelihood
D1,0.333333,1
D2,0.333333,0
D3,0.333333,1


In [28]:
monty1['unnorm'] = monty1['prior'] * monty1['likelihood']
monty1

Unnamed: 0,prior,likelihood,unnorm
D1,0.333333,1,0.333333
D2,0.333333,0,0.0
D3,0.333333,1,0.333333


In [35]:
prob_data = monty1['unnorm'].sum()
prob_data

0.6666666666666666

In [30]:
monty1['posterior'] = monty1['unnorm'] / prob_data
monty1

Unnamed: 0,prior,likelihood,unnorm,posterior
D1,0.333333,1,0.333333,0.5
D2,0.333333,0,0.0,0.0
D3,0.333333,1,0.333333,0.5


문1을 선택했을 경우 몬티가 문2를 열었다면 문1과 문3에 있을 확율은 각각 1/2


문1을 선택했을 경우 몬티가 문3을 열었을 경우 문2에 차가 있을 확율은?

In [36]:
monty2 = pd.DataFrame(index=['D1', 'D2', 'D3'])
monty2['prior'] = 1/3, 1/3, 1/3
monty2

Unnamed: 0,prior
D1,0.333333
D2,0.333333
D3,0.333333


In [32]:
monty2['likelihood'] = 0, 1, 0
monty2

Unnamed: 0,prior,likelihood
D1,0.333333,0
D2,0.333333,1
D3,0.333333,0


In [33]:
monty2['unnorm'] = monty2['prior'] * monty2['likelihood']
prob_data = monty2['unnorm'].sum()
monty2['posterior'] = monty2['unnorm'] / prob_data
monty2

Unnamed: 0,prior,likelihood,unnorm,posterior
D1,0.333333,0,0.0,0.0
D2,0.333333,1,0.333333,1.0
D3,0.333333,0,0.0,0.0


이 경우 문2에 차가 있을 확률은 100프로

이 문제의 교훈은 누군가 몬티쇼를 오랫동안 봤더니 몬티가 2번에 차가 없는 경우 2번을 여는 교칙을 가지고 있다는 것을 파악함. 

**연습 문제:** M&M's는 다양한 색상의 코팅된 작은 초콜릿 사탕입니다.  
M&M's를 만드는 Mars, Inc.는 때때로 색상 혼합 비율을 변경합니다.  
1995년에 파란색 M&M's가 도입되었습니다.  

* 1994년, 일반 M&M's 한 봉지의 색상 구성은 갈색 30\%, 노란색 20\%, 빨간색 20\%, 녹색 10\%, 주황색 10\%, 황갈색 10\%였습니다.

* 1996년에는 파란색 24\%, 녹색 20\%, 주황색 16\%, 노란색 14\%, 빨간색 13\%, 갈색 13\%로 변경되었습니다.

제 친구가 두 봉지의 M&M's를 가지고 있다고 가정해 봅시다. 한 봉지는 1994년의 것이고 다른 봉지는 1996년의 것이라고 합니다. 그는 어느 봉지가 어느 해의 것인지 말해주지 않고, 각 봉지에서 M&M's를 하나씩 주었습니다. 하나는 노란색이고 하나는 녹색입니다. 노란색이 1994년 봉지에서 나왔을 확률은 얼마일까요?

힌트: 이 문제의 핵심은 가설과 데이터를 신중하게 정의하는 것입니다.


### 풀이

가설:
* A: 94에서 노란색 & 96에서 녹색
* B: 96에서 노란색 & 94에서 녹색

- 각 년도 봉지를 선택할 확률
    - P(1994) 1/2
    - P(1996) 1/2

- 94에서 노란색
    - P(Y|1994) 0.2
    
- 96에서 노란색
    - P(Y|1996) 0.14
    
- 94에서 녹색
    - P(G|1994) 0.1
    
- 96에서 녹색
    - P(G|1996) 0.2
    
- P(Y) = P(Y|1994) + P(Y|1996) = 0.34
- P(G) = P(G|1994) + P(G|1996) = 0.26

In [34]:
MnM = pd.DataFrame(index=['Y94&G96', 'G94&Y96'])
MnM['prior'] = 1/2, 1/2
MnM['likelihood'] = 0.2*0.2, 0.1*0.14
MnM['unnorm'] = MnM['prior'] * MnM['likelihood']
prob_data = MnM['unnorm'].sum()
MnM['posterior'] = MnM['unnorm'] / prob_data
MnM

Unnamed: 0,prior,likelihood,unnorm,posterior
Y94&G96,0.5,0.04,0.02,0.740741
G94&Y96,0.5,0.014,0.007,0.259259


가설은 노란색이 94에서 나오고 **동시에** 녹색이 96에서 나오는 확률.
따라서 우도는 P(Y|1994) * P(G|1996)가 되며 이를 구하면 74.04%