### 1. 베이즈 정리와 분류 문제

1) 베이즈 정리 - 머신러닝 중 분류 문제를 해결하는데 사용

2) 분류(Classfication) - 입력자료 $X$의 값부터 출력자료 $Y$를 예측(prediction)하는 문제

[1] 경계선을 구해서 분류

[2] 조건부 확률 : $\hat{f}(X) = \arg\max_{Y} P(Y | X)$ (확률적 방법, 모델)

### 2. 과일 선택 문제

1) 상황 설명

 [1] 과일가게에서 사과와 오렌지는 Red 농장과 Blue 농장에서 공급받음

[2] Red 농장에서 붉은 상자에 사과 2개, 오렌지 6개를, Blue 농장에서는 푸른 상자에 사과가 3, 오렌지가 1개를 담아서 공급받음

[3] 어떤 손님이 와서 오렌지를 하나 선택했을때, 오렌지가 Red 농장 것일까 Blue 농장 것일까?

[4] 하나의 답을 정해야 한다면 어느 농장을 선택할 것인가?

2) 변수 설정

- 선택한 과일이 사과인 사건 $X=A$
- 선택한 과일이 오렌지인 사건 $X=O$
- 선택한 과일이 Red 농장에서 왔을 사건 $Y=R$
- 선택한 과일이 Blue 농장에서 왔을 사건 $Y=B$

3) 문제 풀이

[1] $ P(Y=R) = \dfrac{8}{8 + 4}  = \dfrac{8}{12} $

[2] $ P(Y=B) = \dfrac{4}{8 + 4}  = \dfrac{4}{12} $

[3] $ P(X=O | Y=R) = \dfrac{6}{2 + 6}  = \dfrac{6}{8} $

[4] $ P(X=O | Y=B) = \dfrac{1}{1 + 3}  = \dfrac{1}{4} $

[5] 문제 풀이

$$ 
\begin{eqnarray}
P(Y=R|X=O) 
&=& \dfrac{P(X=O|Y=R)P(Y=R)}{P(X=O)} \\\\
&=& \dfrac{P(X=O|Y=R)P(Y=R)}{P(X=O|Y=R)P(Y=R) + P(X=O|Y=B)P(Y=B)} \\\\
&=& \dfrac{6/8 \cdot 8/12}{6/8 \cdot 8/12 + 1/4 \cdot 4/12 } \\\\
&=& \dfrac{1/2}{1/2 + 1/12} = 6/7\\\\
\end{eqnarray}
$$

4) 생성론적 방법(generative method)

[1] 베이즈 정리와 likelihood를 이용하여 각각의 $Y$ 값에 대한 확률 값을 모두 구한 후

[2] 가장 확률 값이 높은 $Y$값을 선택하여 분류 문제를 푸는 방법 (위의 문제 풀이 방법)

In [7]:
# 베이즈 정리 문제 풀이
from pgmpy.factors.discrete import TabularCPD

In [8]:
cpd_Y = TabularCPD('Y', 2, [[8/12, 4/12]])
print(cpd_Y) #Y _0 : Red, Y_1 : Blue

╒═════╤══════════╕
│ Y_0 │ 0.666667 │
├─────┼──────────┤
│ Y_1 │ 0.333333 │
╘═════╧══════════╛


In [9]:
cpd_XY = TabularCPD('X', 2, np.array([[6/8, 1/4], [2/8, 3/4]]),
                    evidence=['Y'], evidence_card=[2])
print(cpd_XY)

╒═════╤══════╤══════╕
│ Y   │ Y_0  │ Y_1  │
├─────┼──────┼──────┤
│ X_0 │ 0.75 │ 0.25 │
├─────┼──────┼──────┤
│ X_1 │ 0.25 │ 0.75 │
╘═════╧══════╧══════╛


In [10]:
from pgmpy.models import BayesianModel

model = BayesianModel([('Y', 'X')])
model.add_cpds(cpd_Y, cpd_XY)
model.check_model()

True

In [5]:
from pgmpy.inference import VariableElimination

infer = VariableElimination(model)
posterior = infer.query(['Y'], evidence={'X': 0})
print(posterior['Y'])

╒═════╤══════════╕
│ Y   │   phi(Y) │
╞═════╪══════════╡
│ Y_0 │   0.8571 │
├─────┼──────────┤
│ Y_1 │   0.1429 │
╘═════╧══════════╛


### 3. 아들과 딸 파라독스

1) 두 아이가 있는 어떤 집에서 첫째 아이가 남자이다. 두 아이가 모두 남자일 확률은?

<table class="table-bordered">
<tbody><tr>
<tr>
<td></td>
<td>둘째=Boy</td>
<td>둘째=Girl</td>
</tr>
<tr>
<td>첫째=Boy</td>
<td>BB</td>
<td>BG</td>
</tr>
<tr>
<td><s>첫째=Girl</s></td>
<td><s>GB</s></td>
<td><s>GG</s></td>
</tr>
</tbody></table>

첫번째 문제의 답은 BB, BG 두가지 중 BB, $\dfrac{1}{2}$

2) 두 아이가 있는 어떤 집에서 두 아이 중 한 명이 남자일때, 두 아이가 모두 남자일 확률은?

[1] "두 아이 중 적어도 한 명이 남자인가요"라는 질문에 부모가 "네"라고 대답한 경우

<table class="table-bordered">
<tbody><tr>
<tr>
<td></td>
<td>둘째=Boy</td>
<td>둘째=Girl</td>
</tr>
<tr>
<td>첫째=Boy</td>
<td>BB</td>
<td>BG</td>
</tr>
<tr>
<td>첫째=Girl</td>
<td>GB</td>
<td><s>GG</s></td>
</tr>
</tbody></table>

$$ 
\begin{eqnarray}
P(BB|Y) 
&=& \dfrac{P(Y|BB)P(BB)}{P(Y)} \\\\
&=& \dfrac{P(Y|BB)P(BB)}{P(Y|BB)P(BB) + P(Y|BG)P(BG) + P(Y|GB)P(GB) + P(Y|GG)P(GG)} \\\\
&=& \dfrac{1\cdot 0.25}{1\cdot 0.25 + 1\cdot 0.25 + 1\cdot 0.25 + 0\cdot 0.25} \\\\
&=& \dfrac{0.25}{0.75} = \dfrac{1}{3}
\end{eqnarray}
$$

[2] 그 집에서 나오는 아이를 우연히 보았는데 그 아이가 남자인 경우 또는 그 집에 전화를 걸었는데 남자 어린 아이가 전화를 받은 경우

<table class="table-bordered">
<tbody><tr>
<tr>
<td></td>
<td>둘째=Boy</td>
<td>둘째=Girl</td>
</tr>
<tr>
<td>첫째=Boy</td>
<td>BB</td>
<td>BG (남자 목격 확률 1/2) </td>
</tr>
<tr>
<td>첫째=Girl</td>
<td>GB (남자 목격 확률 1/2) </td>
<td><s>GG</s></td>
</tr>
</tbody></table>

$$ 
\begin{eqnarray}
P(BB|Y) 
&=& \dfrac{P(Y|BB)P(BB)}{P(Y)} \\\\
&=& \dfrac{P(Y|BB)P(BB)}{P(Y|BB)P(BB) + P(Y|BG)P(BG) + P(Y|GB)P(GB) + P(Y|GG)P(GG)} \\\\
&=& \dfrac{1\cdot 0.25}{1\cdot 0.25 + 0.5\cdot 0.25 + 0.5\cdot 0.25 + 0\cdot 0.25} \\\\
&=& \dfrac{0.25}{0.50} = \dfrac{1}{2}
\end{eqnarray}
$$