[View in Colaboratory](https://colab.research.google.com/github/sungreong/Pymc3_bayseian/blob/master/Probability_Distributions.ipynb)


베이지안 모델을 구축하는 가장 근본적인 단계는 당면한 문제에 대한 완전한 확률 모델을 지정하는 것입니다

이것은 알려지지 않은 모델에서 모수적인 통계적인 분포와 크게 연관이 있다.   
게다가 데이터로부터 정보를 표현하기 위해 가능도를 위해 함수적인 형태를 적절하게  한다.  
For example, if we wish to define a particular variable as having a normal prior, we can specify that using an instance of the Normal class.


In [0]:
!pip install git+https://github.com/pymc-devs/pymc3
!pip install patsy pandas

In [0]:
import pymc3 as pm
with pm.Model() :
    
    x = pm.Normal("x", mu=0, sd=1)

변수에는 최소한 **name** argument가 필요하다. 그리고 모델 파라미  역시 필요하다.  
파라미터는 가능할 때마다 전통적인 이름을 사용하여 이름을 다양하게 지정 할 수 있다.   
a scalar 변수를 위에서 정의 한 예이다 .   
vector-valued variable 만들기 위해 a **shape argument**는 제공 되어 진다.  
예를 들어 3 x 3 matrix 도 정의 가능하다.

In [0]:
with pm.Model() :
    p = pm.Beta("p" , 1, 1 , shape=(3, 3))

Probability distributions are all subclasses of Distribution, which in turn has two major subclasses: **Discrete and Continuous**  
데이터 유형 관점에서  **continuous** random variable 는 given whichever floating point type is defined by **theano.config.floatX**  
while **Discrete variables** are given int16 types when **theano.config.floatX is float32, and int64** otherwise

### All distributions in pm.distributions will have two important methods: random() and logp() with the following signatures:

```
class SomeDistribution(Continuous):

    def random(self, point=None, size=None, repeat=None):
        ...
        return random_samples

    def logp(self, value):
        ...
        return total_log_prob
```

PyMC3 expects the **logp() method** to return a log-probability evaluated at the passed value argument.   
This method is used internally by all of the inference methods to calculate the model **log-probability** that is used for fitting models  
**The random() method** is used to simulate values from the variable, and is used internally for posterior predictive checks.

## 모델 없이 pymc 분포 사용

모델 외부에 창조한다면, 에러가 발생 할 것이다.



In [7]:
y = Binomial('y', n=10, p=0.5)

NameError: ignored

In [8]:
y = pm.Binomial.dist(n=10, p=0.5)

print(y.logp(4).eval())

print(y.random(size=3))

-1.5843639
[3 7 5]


## Auto-transformation
효율적인 mcmc 샘플링 도와주기 위해, 실제 선의 하위 구간으로 제한 된 연속 변수 자동으로 변형 되었다.  
그들의 정의역은 제한되지 않았다.  
이것은  곙계선을 제한함으로써, 샘플링 알고리즘을 자유롭게 한다.  

In [0]:
with pm.Model() as model :
    g = pm.Gamma("g",1,1)

In [10]:
model.vars

[g_log__]

변수 g 는 log-transformed  
기존의 변수는 간단히 deterministic 변수를 다룬다. 때문에 변형된 변수들의 값은 간단히 역 변형되었다.  

By default, auto-transformed variables are ignored when summarizing and plotting model output.


In [11]:
model.deterministics

[g]