# JointProbabilityDistribution의 다양한 methods
### data science school 424~

**marginal_distribution() 매서드**

* values: 주변확률을 구할 확률변수의 이름 문자열 list
* inplace: True이면 객체 자신을 주변확률 모형으로 변화. False이면 주변확률 모형 객체를 반환

**marginalize(values, inplace=True)**

* values: 어떤 확률의 주변확률을 구하기 위해 없앨 확률변수의 이름 문자열 list
* inplace: True이면 객체 자신을 주변확률 모형으로 변화. False이면 주변확률 모형 객체를 반환

**conditional_distribution(values, inplace=True)**

* values: 주변확률을 구할 확률변수의 이름 문자열과 값을 묶은 tuple list
* inplace: True이면 객체 자신을 조건부확률 모형으로 변화. False이면 주변부확률 모형 객체를 반환

### marginal_distribution()
~~~
인수로 받은 확률변수에 대한 주변확률분포를 구한다.
다은 코드는 결합확률부처 주변확률 P(A), P(A 여사건)를 계산한다
~~~

In [1]:
from pgmpy.factors.discrete import JointProbabilityDistribution as JPD
import numpy as np

In [2]:
pxy=JPD(['X', 'Y'], [2, 2], np.array([3, 9, 7, 1])/20)   #각 비율은 이미 결합한 후의 비유을 직접 나타냄
print(pxy)

+------+------+----------+
| X    | Y    |   P(X,Y) |
| X(0) | Y(0) |   0.1500 |
+------+------+----------+
| X(0) | Y(1) |   0.4500 |
+------+------+----------+
| X(1) | Y(0) |   0.3500 |
+------+------+----------+
| X(1) | Y(1) |   0.0500 |
+------+------+----------+


In [3]:
pmx=pxy.marginal_distribution(['X'], inplace=False)
print(pmx)

+------+--------+
| X    |   P(X) |
| X(0) | 0.6000 |
+------+--------+
| X(1) | 0.4000 |
+------+--------+


~~~
pxy는 X와 Y 모두 고려한 계산된 상태를 입력한다. 
pxy.marginal_distribution(['X'], inplace=False)는 이 입력값을 토대로 각각 X와 Y의 개별적인 값을 계산해주는 함수이다.
~~~

### marginalize()
~~~
인수로 받은 확률변수를 주변화하여 나머지 확률변수에 대한 주변확률분포를 구한다.
다음 코드도 결합확률로부터 P(A), P(A 여사건)을 구한다.
'X'를 입력하면 'Y'의 결과가 출력된다.
~~~

In [10]:
pmx2=pxy.marginalize(['X'], inplace=False)
print(pmx2)

+------+--------+
| Y    |   P(Y) |
| Y(0) | 0.5000 |
+------+--------+
| Y(1) | 0.5000 |
+------+--------+


In [11]:
pmy2=pxy.marginalize(['Y'], inplace=False)
print(pmy2)

+------+--------+
| X    |   P(X) |
| X(0) | 0.6000 |
+------+--------+
| X(1) | 0.4000 |
+------+--------+


### conditional_distribution()
~~~
어떤 확률변수가 어떤 사건이 되는 조건에 대해 조건부확률값을 계산
조건부확률 P(B|A), P(B 여사건|A)를 계산
~~~

In [12]:
#사건 A에 대한 조건부확률
py_on_x0=pxy.conditional_distribution([('X', 0)], inplace=False)
print(py_on_x0)

+------+--------+
| Y    |   P(Y) |
| Y(0) | 0.2500 |
+------+--------+
| Y(1) | 0.7500 |
+------+--------+


In [13]:
#사건 A의 여사건에 대한 조건부확률
py_on_x1=pxy.conditional_distribution([('X', 1)], inplace=False)
print(py_on_x1)

+------+--------+
| Y    |   P(Y) |
| Y(0) | 0.8750 |
+------+--------+
| Y(1) | 0.1250 |
+------+--------+


In [14]:
#사건 B에 대한 조건부확률
py_on_y0=pxy.conditional_distribution([('Y', 0)], inplace=False)
print(py_on_y0)

+------+--------+
| X    |   P(X) |
| X(0) | 0.3000 |
+------+--------+
| X(1) | 0.7000 |
+------+--------+


### check_independence()
~~~
두 확률변수 간의 독립 확인
~~~

In [15]:
pxy.check_independence(['X'],['Y'])

False

### 두 개의 JointProbabilityDistribution 객체끼리 곱하면 두 분포가 독립이라는 가정하에 결합확률을 구한다.
~~~
이 값과 원래의 결합확률을 비교하면 독립이 아니라는 것을 알 수 있다
~~~

In [17]:
print(pmx2*pmy2)

+------+------+----------+
| Y    | X    |   P(Y,X) |
| Y(0) | X(0) |   0.3000 |
+------+------+----------+
| Y(0) | X(1) |   0.2000 |
+------+------+----------+
| Y(1) | X(0) |   0.3000 |
+------+------+----------+
| Y(1) | X(1) |   0.2000 |
+------+------+----------+


In [18]:
print(pxy)

+------+------+----------+
| X    | Y    |   P(X,Y) |
| X(0) | Y(0) |   0.1500 |
+------+------+----------+
| X(0) | Y(1) |   0.4500 |
+------+------+----------+
| X(1) | Y(0) |   0.3500 |
+------+------+----------+
| X(1) | Y(1) |   0.0500 |
+------+------+----------+


### 6.5.8 연습문제)
~~~
위에서 구현한 JointProbabilityDistribution 클래스 객체 pxy2로부터 주변확률 모형 및 조건부확률 모형을 구하라. 또 check_independence() 매서드를 이용해서 사건 A, B의 독립을 확인해라
~~~

In [20]:
pxy2=JPD(['X', 'Y'], [2, 2], np.array([6, 6, 4, 4])/20)
print(pxy2)

+------+------+----------+
| X    | Y    |   P(X,Y) |
| X(0) | Y(0) |   0.3000 |
+------+------+----------+
| X(0) | Y(1) |   0.3000 |
+------+------+----------+
| X(1) | Y(0) |   0.2000 |
+------+------+----------+
| X(1) | Y(1) |   0.2000 |
+------+------+----------+


In [21]:
myResult1=pxy2.marginalize(['X'], inplace=False)
print(myResult1)

+------+--------+
| Y    |   P(Y) |
| Y(0) | 0.5000 |
+------+--------+
| Y(1) | 0.5000 |
+------+--------+


In [22]:
pyOnX0=pxy2.conditional_distribution([('X', 0)], inplace=False)
print(pyOnX0)

+------+--------+
| Y    |   P(Y) |
| Y(0) | 0.5000 |
+------+--------+
| Y(1) | 0.5000 |
+------+--------+


In [23]:
pxy2.check_independence(['X'],['Y'])

True