### はじめに
今回はTensorFlow probabilityの基本的機能である「tensorflow_probability.distributions」について触れていこうと思います。


TensorFlow probability上で実装されている確率分布のクラスをまとめたモジュールであり、（TensorFlow本体を除いて）最も低レイヤーに位置するものだと考えて差し支えないでしょう。



In [None]:
import tensorflow as tf
import tensorflow_probability as tfp
import matplotlib.pyplot as plt
import seaborn
%matplotlib inline

### 前準備

In [3]:
tfe = tf.contrib.eager
tfd = tfp.distributions

In [4]:
tf.enable_eager_execution()

### 正規分布
下記のように`tfd.Normal`を使えば簡単に確率分布を作ることができます。また、ここで作っている確率分布は数式上では下記のようなものになります。

$$
\mathcal N(0, 1)
$$

ここで注意しておくべきなのは、「平均0」で「標準偏差が1」の確率分布となっている点です。分散を指定しているわけではないので`scale=1`なら差異はありませんが、違う値を入れるときには意図した通りになるように注意しましょう。

In [5]:
normal = tfd.Normal(loc=0., scale=1.)
normal

<tf.distributions.Normal 'Normal/' batch_shape=() event_shape=() dtype=float32>

作った確率分布の`sample`メソッドを呼び出してやれば、確率分布に従う乱数を生成してくれます。また、引数として生成したいサンプルの個数を指定できます。

In [8]:
normal.sample(10)

<tf.Tensor: id=64, shape=(10,), dtype=float32, numpy=
array([-0.04905302, -1.2052385 ,  0.52392155, -0.28327528, -0.21117926,
       -0.9016833 , -0.5387514 , -1.0236576 ,  0.00831523, -0.31143647],
      dtype=float32)>

ここで、確率分布のクラスに入っている重要なメソッド`log_prob`を紹介しておきましょう。
例えば、`log_prob(0.)`とした場合には`0.`という値が生起する確率の対数値が返ってきます。
このメソッドの引数には1次元の`tf.Tensor`を与えることも可能なので、その場合の挙動を見てみましょう。

In [12]:
samples = normal.sample(10)
log_prob = normal.log_prob(samples)
log_prob

<tf.Tensor: id=174, shape=(10,), dtype=float32, numpy=
array([-1.1259897 , -1.6028789 , -1.182483  , -0.9316357 , -5.1715817 ,
       -1.0799512 , -1.613446  , -1.0031593 , -0.9291626 , -0.94136554],
      dtype=float32)>

`samples`は10個の要素（サンプル値）を持つ`tf.Tensor`となっています。これを`log_prob`メソッドに与えたら、同様にして10個の要素を持つ`tf.Tensor`が返ってきました。
これは各要素に対してそれぞれ対数尤度を計算していることを意味しています。最尤推定などでは訓練サンプル全てが生起した場合の尤度が欲しいので、典型的にはこのメソッドで返ってくる`tf.Tensor`の和を計算することになるでしょう。

In [19]:
tf.reduce_sum(log_prob)

<tf.Tensor: id=180, shape=(), dtype=float32, numpy=-15.581654>