# 02. 베이즈 정리

- 베이즈 정리

$$P(A|B) = \frac{P(A) P(B|A)}{P(B)}$$

<br>

## 02.01. 쿠키 문제

> 쿠키 그릇 두 개가 있다고 가정
>
> * 첫 번째 그릇(그릇 1)에는 바닐라 쿠키 30개와 초콜릿 쿠키 10개가 들어있음
>
> * 두 번째 그릇(그릇 2)에는 바닐라 쿠키와 초콜릿 쿠키가 20개씩 들어있음
>
> 어떤 그릇인지 확인하지 않고, 임의로 그릇을 하나 골라서 거기에서 쿠키를 하나 집었다고 했을 떄, 그 때 그 쿠키가 바닐라 쿠키였다면, 이 바닐라 쿠키가 1번 그릇에서 나왔을 확률은?

- 현재 필요한 것은 '바닐라 쿠키를 꺼냈다는 전제 조건이 주어졌을 때, 그릇 1에서 나온 것인지를 구하는 **조건부 확률 $P(B_1|V)$'**
- 현재 주어진 정보

    * 그릇 1이라는 조건에서 바닐라 쿠키를 꺼낼 조건부확률, $P(V | B_1) = 3/4$
    
    * 그릇 2라는 조건에서 바닐라 쿠키를 꺼낼 조건부확률 $P(V | B_2) = 1/2$.


**베이즈 정리를 통하여**

$$P(B_1|V) = \frac{P(B_1)~P(V|B_1)}{P(V)}$$


-   $P(B_1)$ : 어떤 쿠키를 골랐던지 상관 없이 그릇 1을 골랐을 확률. 문제에서는 그릇을 임의로 선택하였으므로, $P(B_1) = 1/2$라고 가정.

-   $P(V|B_1)$ : 그릇 1에서 바닐라 쿠키를 고를 확률 (= 3/4)

-   $P(V)$ : 각 그릇에서 바닐라 쿠키를 고를 확률

**$P(V)$는 전체확률의 법칙을 사용하여 계산**

$$P(V) = P(B_1)~P(V|B_1) ~+~ P(B_2)~P(V|B_2)$$

$$ = P(V) = (1/2)~(3/4) ~+~ (1/2)~(1/2) = 5/8$$

<br>

추가적으로 

* 각 그릇을 고를 확률은 동일하고 그릇에는 쿠키가 동일한 개수로 잇으므로, 각 쿠키를 고를 확률은 동일

* 두 그릇에는 총 50개의 바닐라 쿠키과 30개의 초콜릿 쿠키가 있으므로 $P(V) = 5/8$.

<br>

베이즈 정리를 사용하여, 그릇 1의 사후확률을 구하면

$$P(B_1|V) = (1/2)~(3/4)~/~(5/8) = 3/5$$


<br>

## 02.02. 통시적 베이즈
- 베이즈 이론을 다른 각도에서 볼 수 있는 방법
- 데이터 일부 $D$가 주여졌을 때, 가설 $H$의 확률을 갱신하는 방법으로 사용

- **이런 식의 해석을 '통시적' (diachronic)이라고 하며, 이는 '시간에 따라 변한다'는 뜻**

- 베이즈 정리를 $H$와 $D$를 사용해서 쓰면

$$P(H|D) = \frac{P(H)~P(D|H)}{P(D)}$$


-  **$P(H)$ : 데이터를 확인하기 전에 구한 가설 확률, 사전확률**
    - 사전 배경 지식을 기반으로 사전확률을 구할 수 있으며, 주관적일 수도 있음

-  **$P(H|D)$ : 데이터를 확인한 후의 가설 확률, 사후확률**.

-  **$P(D|H)$ : 가설 하에서 해당 데이터가 나올 확률, 가능도(우도)**

-  **$P(D)$ : 어떤 가설에서든 해당 데이터가 나올 확률, 데이터의 전체확률**

<br>

**다음과 같은 성격의 가설 집단을 정의하여 내용을 단순화 시킴**
- 상호 배제 : 집합 중 하나의 가설만 참
- 전체 포괄 : 집합 중 하나 이상의 가설이 참

<br>

**이 조건이 만족되면, 전체확률의 법칙을 이용하여 $P(D)$를 구할 수 있음**
- 예를 들어 $H_1$과 $H_2$라는 두 개의 가설이 있는 경우, 다음을 만족

$$P(D) = P(H_1)~P(D|H_1) + P(H_2)~P(D|H_2)$$

- 이를 가설의 개수에 상관없는 보다 일반적 형태로 나타내면

$$P(D) = \sum_i P(H_i)~P(D|H_i)$$

#### 데이터와 사전확률을 사용해서 사후확률을 구하는 과정을 베이즈 갱신 (Bayesian Update)

## 02.03. 베이즈 테이블
- 베이즈 갱신을 보다 편리하게 할 수 있는 도구

In [1]:
import pandas as pd

table = pd.DataFrame(index=['Bowl 1', 'Bowl 2'])

- 사전확률을 나타내는 열을 추가

In [2]:
table['prior'] = 1/2, 1/2
table

Unnamed: 0,prior
Bowl 1,0.5
Bowl 2,0.5


- 가능도 열 추가

In [3]:
table['likelihood'] = 3/4, 1/2
table

Unnamed: 0,prior,likelihood
Bowl 1,0.5,0.75
Bowl 2,0.5,0.5


<br>

**이전에서 그릇 1만이 아니라 양쪽의 경우에 대한 모든 가능도를 계산**

* 그릇 1에서 바닐라 쿠키를 집을 확률은 3/4.

* 그릇 2에서 바닐라 쿠키를 잡을 확률은 1/2

**전체 가능도 확률의 합이 1이 아니지만, 각각의 확률은 서로 다른 가설 하에서의 확률이므로, 합이 1이 될 필요가 없음** 

<br>

- 가능도와 사전확률을 곱하여 표준화되지 않은 사후확률을 계산

In [4]:
table['unnorm'] = table['prior'] * table['likelihood']
table

Unnamed: 0,prior,likelihood,unnorm
Bowl 1,0.5,0.75,0.375
Bowl 2,0.5,0.5,0.25


각 `unnorm`값은 사전확률과 가능도의 곱 
(`unnorm`은 표준화되지 않은 사후확률)

$$P(B_i)~P(D|B_i)$$

이는 베이즈 정리의 분자로써, 결과를 더하면

$$P(B_1)~P(D|B_1) + P(B_2)~P(D|B_2)$$

베이즈 정리의 분모인 $P(D)$.

아래와 같이 전체확률을 계산

In [5]:
prob_data = table['unnorm'].sum()
prob_data 

0.625

0.625 = (5/8)로써 이전의 결과와 동일

<br>

- 사후확률 계산

In [7]:
table['posterior'] = table['unnorm'] / prob_data
table

Unnamed: 0,prior,likelihood,unnorm,posterior
Bowl 1,0.5,0.75,0.375,0.6
Bowl 2,0.5,0.5,0.25,0.4


**표준화되지 않은 사후확률을 더한 값으로 각 사후확률의 값을 나눠서 구한 사후확률을 더하면 1이 됨을 확인**

**$\rightarrow$ 이 과정을 표준화(normaliztion)이라고 하며, 이 때 데이터의 총 확률을 표준화 상수 (normalizing constant)**

<br>

## 02.04. 주사위 문제
- 베이즈 테이블은 두 개 이상의 가설을 가진 문재를 해결하는 데에도 유용


> **육면체, 팔면체, 십이면체 주사위가 든 상자가 존재, 이 중 주사위 하나를 임의로 집어서 굴렸더니 1이 나왔다**
>
> **이 경우 육면체 주사위를 골랐을 확률은?**

여기서 동일한 사전확률을 가지는 세 가지 가설이 존재 $\rightarrow$ 데이터는 주사위를 굴린 결과가 1이 나왔다는 것

- 만약 육면체 주사위를 골랐다면, 최종 값의 확률은 1/6
- 팔면체 주사위를 골랐다면, 최종 값의 확률은 1/8
- 십이면체 주사위를 골랐다면 최종 값의 확률은 1/12

<br>

### 베이즈 테이블 연산 과정

In [11]:
table2 = pd.DataFrame(index=[6, 8, 12])

- 사전확률과 가능도를 분수로 표현

In [12]:
from fractions import Fraction

table2['prior'] = Fraction(1, 3)
table2['likelihood'] = Fraction(1, 6), Fraction(1, 8), Fraction(1, 12)
table2

Unnamed: 0,prior,likelihood
6,1/3,1/6
8,1/3,1/8
12,1/3,1/12


- 가능도를 사전확률과 곱하고 표준화되지 않은 사후확률 계산
- 표준화되지 않은 사후확률을 더하여 전체확률 계산
- 표준화되지 않은 사후확률을 전체확률로 나누어 사후확률 계산

In [20]:
def update(table):
    
    """Compute the posterior probabilities."""
    
    table['unnorm'] = table['prior'] * table['likelihood']
    prob_data = table['unnorm'].sum()
    table['posterior'] = table['unnorm'] / prob_data
    
    return prob_data

In [21]:
prob_data = update(table2)

table2

Unnamed: 0,prior,likelihood,unnorm,posterior
6,1/3,1/6,1/18,4/9
8,1/3,1/8,1/24,1/3
12,1/3,1/12,1/36,2/9


- 육면체 주사위일 사후확률은 4/9로, 이는 다른 주사위의 사후확률보다 높다
- 육면체 주사위에서 1이 나올 가능도가 가장 크다고 알고 있으므로 직관적으로 육면체 주사위라고 생각 할 수 있음

<br>

## 02.05. 몬티홀 문제

몸티홀 문제는 'Let's Make a Deal'이라는 게임 쇼에서 나온 문제

> 진행자 몬티 홀은 당신에게 1, 2, 3이라고 번호가 붙은 3개의 문을 보여주고, 각 문 뒤에 상품이 존재
>
> 하나의 상품은 비싼 것, 나머지 두 상품은 덜 비싼 것
>
> 게임의 목적은 어떤 문 뒤에 비싼 선물이 있는 지를 맞추는 데 있으며, 제대로 맞추면 비싼 선물을 가질 수 있음

<br>

만약 1번 문을 선택했을 때, 진행자는 3번 문을 열어 싼 선물이 있다는 것을 보여줄 것.

그 후 진행자는 그대로 원래의 선택을 고수할지, 열리지 않은 나머지 문으로 바꿀 것인지를 다시 물음

비싼 선물을 받을 확률을 극대화하고자 할 때, 1번 문을 그대로 고수할 것인가? 2번 문으로 바꿀 것인가?

<br>

**이에 답하려면, 진행자의 행동에 대해 몇 가지를 가정해야 함**

1. **진행자는 언제나 문을 열고 선택을 바꿀 기회를 줌**

2. **진행자는 당신이 고른 문이나 비싼 문이 있는 문을 열지 않음**

3. **당신이 고른 문 뒤에 비싼 선물이 있는 경우에는 나머지 문을 임의로 염**

<br>

**이 가정 하에서는 선택을 바꾸는 것이 좋음**
- **만약 선택을 고수했을 때는 1/3의 확률로 비싼 선물을 받지만, 선택을 변경한다면 2/3확률로 비싼 선물을 받을 수 있음**

#### Why? 베이즈 테이블을 통하여 이를 증명

<br>

**3가지의 가설 : 비싼 선물은 문 1,2,3 중 하나의 뒤에 존재**
- 문제의 정의에 따라 각 문에 대한 사전확률은 1/3

In [22]:
table3 = pd.DataFrame(index=['Door 1', 'Door 2', 'Door 3'])
table3['prior'] = Fraction(1, 3)
table3

Unnamed: 0,prior
Door 1,1/3
Door 2,1/3
Door 3,1/3


진행자가 3번 문을 열어 싼 선물을 보여주었다는 데이터가 존재 $\rightarrow$ 각 가설 하에서 이 데이터의 확률을 다음과 같이 고려

> **만약 비싼 선물이 문 1뒤에 있다면, 진행자는 문 2나 3 중의 하나를 임의로 고를 것이므로, 진행자가 3번 문을 열 확률은 1/2**
>
> **만약 비싼 선물이 문 2뒤에 있다면, 진행자는 무조건 문 3을 열었을 것이므로, 이 가설 하에서 진행자가 3번 문을 열 확률은 1**
>
> **만약 비싼 선물이 문 3뒤에 있다면, 진행자는 이 문을 열 수 없음. 따라서 이 가설 하에서 진행자가 3번 문을 열 확률은 0**

<br>

가능도는 다음과 같음

In [23]:
table3['likelihood'] = Fraction(1, 2), 1, 0
table3

Unnamed: 0,prior,likelihood
Door 1,1/3,1/2
Door 2,1/3,1
Door 3,1/3,0


- 사전확률가 가능도를 구하고 사후확률을 계산

In [24]:
update(table3)
table3

Unnamed: 0,prior,likelihood,unnorm,posterior
Door 1,1/3,1/2,1/6,1/3
Door 2,1/3,1,1/3,2/3
Door 3,1/3,0,0,0


**문 1에 대한 사후확률은 1/3이고, 문 2에대한 사후확률은 2/3 $\rightarrow$ 그러므로 1번 문에서 2번 문으로 변경하는 것이 나음**

<br>

#### 확률에 대한 인간의 직관은 항상 믿어서는 안되며, 베이즈 이론을 통해 다음과 같은 분할-정복(divide and conquer)전략을 사용하면 도움이 됨
1. 가설과 데이터를 정리
2. 사전확률을 계산
3. 각 가설 하에서의 데이터 가능도를 계산

<br>

### 변형 몬티홀 문제

다른 가정

1. 진행자는 가능한 2번 문을 염
2. 어쩔 수 없을 때 (비싼 선물이 2번 문 뒤에 있을 때)만 3번 문을 염

<br>

Q. 만약 1번 문을 골랐는데, 진행자가 2번문을 열었다면, 비싼 선물이 3번 문 뒤에 있을 확률은?
> **만약 비싼 선물이 문 1뒤에 있다면, 진행자는 무조건 문 2를 열었을 것이므로, 진행자가 2번 문을 열 확률은 1**
>
> **만약 비싼 선물이 문 2뒤에 있다면, 진행자는 문 3을 열었을 것이므로, 이 가설 하에서 진행자가 2번 문을 열 확률은 0**
>
> **만약 비싼 선물이 문 3뒤에 있다면, 진행자는 무조건 문 2를 열었을 것이므로, 따라서 이 가설 하에서 진행자가 2번 문을 열 확률은 1**

In [33]:
table4 = pd.DataFrame(index=['Door 1', 'Door 2', 'Door 3'])
table4['prior'] = Fraction(1, 3)
table4['likelihood'] = 1, 0, 1

- 비싼 선물이 문 3뒤에 있을 확률은 1/2

In [35]:
update(table4)
table4

Unnamed: 0,prior,likelihood,unnorm,posterior
Door 1,1/3,1,1/3,1/2
Door 2,1/3,0,0,0
Door 3,1/3,1,1/3,1/2


<br>

Q. 만약 1번 문을 골랐고, 진행자가 3번 문을 열었다면, 비싼 선물이 2번 문 뒤에 있을 확률은?
> **만약 비싼 선물이 문 1뒤에 있다면, 진행자는 무조건 문 2를 열었을 것이므로, 이 가설 하에서 진행자가 3번 문을 열 확률은 0**
>
> **만약 비싼 선물이 문 2뒤에 있다면, 진행자는 문 3을 열었을 것이므로, 이 가설 하에서 진행자가 3번 문을 열 확률은 1**
>
> **만약 비싼 선물이 문 3뒤에 있다면, 진행자는 무조건 문 2를 열었을 것이므로, 따라서 이 가설 하에서 진행자가 3번 문을 열 확률은 0**

- 비싼 선물이 문 2 뒤에 있을 확률은 100%

In [36]:
table5 = pd.DataFrame(index=['Door 1', 'Door 2', 'Door 3'])
table5['prior'] = Fraction(1, 3)
table5['likelihood'] = 0, 1, 0

update(table5)
table5

Unnamed: 0,prior,likelihood,unnorm,posterior
Door 1,1/3,0,0,0
Door 2,1/3,1,1/3,1
Door 3,1/3,0,0,0
