# 6.5 결합확률과 조건부확률
## pgmpy 패키지
- pgmpy(probablistic graphical models in python) 패키지
- 이산확률모델을 쉽게 구현할 수 있다

### `JointProbabilityDistribution` 클래스
- 결합확률 모형을 만드는 데 사용하는 클래스
- `JointProbabilityDistribution(variables, cardinality, values)`
    - `variables` : 확률변수의 이름 문자열 리스트. 정의하려는 확률변수가 하나인 경우에도 List로 넣어야 함
    - `cardinality` : 각 확률변수의 표본 혹은 배타적 사건의 수의 리스트
    - `values` : 확률변수의 모든 표본(조합)에 대한 (결합)확률값 리스트
    
- `variables`에 들어가는 인수는 사건의 이름이 아니라 확률변수의 이름!
- pgmpy에서는 사건의 이름을 명시하여 지정할 수 없다
    - 임력 사건의 수가 K일 때, 0, 1, ..., K-1 등 숫자로 지정됨


In [7]:
import numpy as np
from pgmpy.factors.discrete import JointProbabilityDistribution as JPD

In [2]:
px = JPD(['X'], [2], np.array([12, 8]) / 20)
print(px)

+------+--------+
| X    |   P(X) |
| X(0) | 0.6000 |
+------+--------+
| X(1) | 0.4000 |
+------+--------+


In [4]:
px = JPD(['X'], [2], [0.4, 0.6])
print(px)

+------+--------+
| X    |   P(X) |
| X(0) | 0.4000 |
+------+--------+
| X(1) | 0.6000 |
+------+--------+


In [22]:
py = JPD(['Y'], [2], [0.5, 0.5])
print(py)

+------+--------+
| Y    |   P(Y) |
| Y(0) | 0.5000 |
+------+--------+
| Y(1) | 0.5000 |
+------+--------+


In [6]:
# joint
pxy = JPD(['X', 'Y'], [2, 2], np.array([3, 9, 7, 1])/20)
print(pxy)

+------+------+----------+
| X    | Y    |   P(X,Y) |
| X(0) | Y(0) |   0.1500 |
+------+------+----------+
| X(0) | Y(1) |   0.4500 |
+------+------+----------+
| X(1) | Y(0) |   0.3500 |
+------+------+----------+
| X(1) | Y(1) |   0.0500 |
+------+------+----------+


### 연습문제 6.5.6
6장에서 다룬 범인 찾기 문제 예에서 남자 12명 중 머리카락이 긴 사람이 6명인 경우(case 2)의 결합확률 모형을 JointProbabilityDistribution 클래스 객체 pxy2로 구현하라.

- 범인찾기문제 개요
    - 살인사건용의자 20명
        - 남자 12, 여자 8
        - 머리긴사람 10, 머리짧은사람 10
    - case1 = 12명의 남자 중 머리 긴 사람 3명
    - case2 = 12명의 남자 중 머리 긴 사람 6명

In [9]:
pxy2 = JPD(['X', 'Y'], [2, 2], np.array([6, 6, 4, 4])/20)
print(pxy2)

+------+------+----------+
| X    | Y    |   P(X,Y) |
| X(0) | Y(0) |   0.3000 |
+------+------+----------+
| X(0) | Y(1) |   0.3000 |
+------+------+----------+
| X(1) | Y(0) |   0.2000 |
+------+------+----------+
| X(1) | Y(1) |   0.2000 |
+------+------+----------+


### `JointProbabilityDistribution` 객체 메서드 함수
- `marginal_distribution()`, `marginalize()` : 결합확률로부터 주변확률 계산
    - `marginal_distribution(values, inplace=True)`
        - `values` : 주변확률을 구할 확률변수의 이름 문자열 리스트
        - `inplace` : True이면 객체 자신을 주변확률 모형으로 변화, False면 주변확률 모형 객체 반환
    - `marginalize(values, inplace=True)`
        - `values` : 어떤 확률변수의 주변확률을 구하기 위해 **없앨 확률변수**의 이름 문자열 리스트
        - `inplace` : True이면 객체 자신을 주변확률 모형으로 변화,False면 주변확률 모형 객체 반환
- `conditional_distribution(values, inplace=True)` : 결합확률로부터 조건부확률 계산
    - `values` : 주변확률을 구할 확률변수의 이름 문자열과 값을 묶은 튜플 리스트
    - `inplace` : True이면 객체 자신을 조건부확률 모형으로 변화, False면 조건부확률 모형 객체 반환

In [13]:
# marginal_distribution() 메서드는 인수로 받은 확률변수에 대한 주변확률분포를 구함
# 다음 코드는 결합확률로부터 주변확률 P(A), P(A^C)를 계산한다.
pmx = pxy.marginal_distribution(['X'], inplace=False)
print(pmx)
### marginalize out = '없애라'라는 의미로 사용!

+------+--------+
| X    |   P(X) |
| X(0) | 0.6000 |
+------+--------+
| X(1) | 0.4000 |
+------+--------+


In [15]:
# marginalize() 메서드는 인수로 받은 확률변수를 주변화(marginalize)하여,
# 나머지 확률변수에 대한 주변확률분포를 구한다.
# 다음 코드도 앞과 마찬가지로 결합확률로부터 주변확률 P(A), P(A^C)를 계산한다.
pmx = pxy.marginalize(['Y'], inplace=False)
print(pmx)

+------+--------+
| X    |   P(X) |
| X(0) | 0.6000 |
+------+--------+
| X(1) | 0.4000 |
+------+--------+


In [17]:
# conditional_distribution() 메서드를 사용하면
# 어떤 확률변수가 어떤 사건이 되는 조건에 대해 조건부확률값을 계산한다
# 다음 코드는 결합확률로부터 조건부확률 P(B|A), P(B^C|A)를 계산한다
py_on_x0 = pxy.conditional_distribution([('X', 0)], inplace=False) 
#사건 A(x0, 첫번째 사건)에 대한 조건부확률
print(py_on_x0)

+------+--------+
| Y    |   P(Y) |
| Y(0) | 0.2500 |
+------+--------+
| Y(1) | 0.7500 |
+------+--------+


`check_independence()` 메서드를 이용하면 두 확률변수 간의 독립도 확인할 수 있다.

In [18]:
pxy.check_independence(['X'], ['Y'])

False

두 개의 `JointProbabilityDistribution` 객체끼리 곱하면 두 분포가 독립이라는 가정하에 결합확률을 구한다. 이 값과 원래의 결합확률을 비교하면 독립이 아니라는 것을 알 수 있다.

In [23]:
print(px * py)
print(pxy)

+------+------+----------+
| X    | Y    |   P(X,Y) |
| X(0) | Y(0) |   0.2000 |
+------+------+----------+
| X(0) | Y(1) |   0.2000 |
+------+------+----------+
| X(1) | Y(0) |   0.3000 |
+------+------+----------+
| X(1) | Y(1) |   0.3000 |
+------+------+----------+
+------+------+----------+
| X    | Y    |   P(X,Y) |
| X(0) | Y(0) |   0.1500 |
+------+------+----------+
| X(0) | Y(1) |   0.4500 |
+------+------+----------+
| X(1) | Y(0) |   0.3500 |
+------+------+----------+
| X(1) | Y(1) |   0.0500 |
+------+------+----------+


### 연습문제 6.5.8
위에서 구현한 `JointProbabilityDistribution` 클래스 객체 `pxy2`로부터 주변확률 모형 및 조건부확률 모형을 구하라. 또 `check_indenpendence()` 메서드를 이용하여 사건 A, B의 독립을 확인하라.

In [24]:
py2_on_x0 = pxy2.conditional_distribution([('X', 0)], inplace=False) 
print(py2_on_x0)

+------+--------+
| Y    |   P(Y) |
| Y(0) | 0.5000 |
+------+--------+
| Y(1) | 0.5000 |
+------+--------+


In [25]:
py2_on_x1 = pxy2.conditional_distribution([('Y', 0)], inplace=False) 
print(py2_on_x1)

+------+--------+
| X    |   P(X) |
| X(0) | 0.6000 |
+------+--------+
| X(1) | 0.4000 |
+------+--------+


In [27]:
pxy2.check_independence(['X'], ['Y'])

True

### 독립이라면, marginal만 알면 joint prob을 쉽게 계산할 수 있음

In [28]:
print(pxy2)

+------+------+----------+
| X    | Y    |   P(X,Y) |
| X(0) | Y(0) |   0.3000 |
+------+------+----------+
| X(0) | Y(1) |   0.3000 |
+------+------+----------+
| X(1) | Y(0) |   0.2000 |
+------+------+----------+
| X(1) | Y(1) |   0.2000 |
+------+------+----------+
