### 결합확률과 조건부확률
#### pgmpy 패키지¶
`pgmpy(Probabilistic Graphical Models in Python)` 패키지를 사용하면 이산 확률 모형을 쉽게 구현할 수 있다. pgmpy 패키지의 JointProbabilityDistribution 클래스는 결합 확률 모형을 만들기 위한 클래스이다.
```
JointProbabilityDistribution(variables, cardinality, values)
    variables: 확률 변수의 이름 문자열의 리스트
    cardinality: 각 확률 변수의 경우의 수(cardinality)의 리스트
    values: 각 확률 변수의 모든 경우의 조합에 대한 확률 값의 리스트
    variables에 들어가는 인수가 사건의 이름이 아니라 확률 변수의 이름이라는 점에 주의하라.
```

배타적이면서 합집합이 전체 집합이 되는 사건은 하나의 확률변수로 표현할 수 있다. 확률 변수가 특정한 값을 가지면 하나의 사건이 된다. 위의 범인 찾기 문제에서는 두 개의 확률 변수  X ,  Y 를 정의할 수 있다. 확률 변수  X 는 성별을 나타내고 확률 변수  Y 는 머리가 긴지 짧은지를 나타낸다.
```
    X=0 인 경우가 사건  A  (남자인 사건)
    X=1 인 경우가 사건  A^C  (여자인 사건)
    Y=0 인 경우가 사건  B  (머리가 긴 사건)
    Y=1 인 경우가 사건  B^C  (머리가 짧은 사건)
```

In [1]:
from pgmpy.factors.discrete import JointProbabilityDistribution as JPD

In [2]:
j1 = JPD(['X', 'Y'], [2, 2], np.array([3, 9, 7, 1]) / 20)
print(j1)

╒═════╤═════╤══════════╕
│ X   │ Y   │   P(X,Y) │
╞═════╪═════╪══════════╡
│ X_0 │ Y_0 │   0.1500 │
├─────┼─────┼──────────┤
│ X_0 │ Y_1 │   0.4500 │
├─────┼─────┼──────────┤
│ X_1 │ Y_0 │   0.3500 │
├─────┼─────┼──────────┤
│ X_1 │ Y_1 │   0.0500 │
╘═════╧═════╧══════════╛


#### 연습 문제 1¶
- 위의 범인 찾기 문제의 예에서 12명의 남자 중 머리가 긴 사람이 6명인 경우의 결합 확률 모형을 JointProbabilityDistribution 클래스 객체 j2로 구현하라.

In [46]:
j2 = JPD(["A", "B"], [2, 2], np.array([6, 6, 4, 4])/20)
print(j2)

╒═════╤═════╤══════════╕
│ A   │ B   │   P(A,B) │
╞═════╪═════╪══════════╡
│ A_0 │ B_0 │   0.3000 │
├─────┼─────┼──────────┤
│ A_0 │ B_1 │   0.3000 │
├─────┼─────┼──────────┤
│ A_1 │ B_0 │   0.2000 │
├─────┼─────┼──────────┤
│ A_1 │ B_1 │   0.2000 │
╘═════╧═════╧══════════╛


#### 연습문제2
- 위에서 구현한 JointProbabilityDistribution 클래스 객체 j2로부터 주변 확률 모형 및 조건부 확률 모형을 구하라. 또 check_independence 메서드를 이용하여 사건 A, B의 독립을 확인하라.

In [48]:
# A의 주변확률 P(A)
madis = j2.marginal_distribution(['A'], inplace=False) # inplace를 True로 하면 j2객체가 주변확률모형으로 변화
print(madis)

╒═════╤════════╕
│ A   │   P(A) │
╞═════╪════════╡
│ A_0 │ 0.6000 │
├─────┼────────┤
│ A_1 │ 0.4000 │
╘═════╧════════╛


In [49]:
# B의 주변확률 P(B)
madis = j2.marginal_distribution(['B'], inplace=False)
print(madis)

╒═════╤════════╕
│ B   │   P(B) │
╞═════╪════════╡
│ B_0 │ 0.5000 │
├─────┼────────┤
│ B_1 │ 0.5000 │
╘═════╧════════╛


In [52]:
# P(B|A) , P(B*C|A)
condis = j2.conditional_distribution([('A', 0)], inplace=False)
print(condis)

╒═════╤════════╕
│ B   │   P(B) │
╞═════╪════════╡
│ B_0 │ 0.5000 │
├─────┼────────┤
│ B_1 │ 0.5000 │
╘═════╧════════╛


In [53]:
# P(A|B) , P(A*C|B)
condis2 = j2.conditional_distribution([('B', 0)], inplace=False)
print(condis2)

╒═════╤════════╕
│ A   │   P(A) │
╞═════╪════════╡
│ A_0 │ 0.6000 │
├─────┼────────┤
│ A_1 │ 0.4000 │
╘═════╧════════╛


In [54]:
# P(A|B*C) , P(A*C|B*C)
condis3 = j2.conditional_distribution([('B', 1)], inplace=False)
print(condis3)

╒═════╤════════╕
│ A   │   P(A) │
╞═════╪════════╡
│ A_0 │ 0.6000 │
├─────┼────────┤
│ A_1 │ 0.4000 │
╘═════╧════════╛


In [57]:
# 사건 A, B의 독립여부
j2.check_independence(['A'], ['B'])

True