# Automatic marginalization of discrete variables
PyMC は、離散潜在変数を使用したサンプリング モデルに対して非常に修正可能です。
ただし、NUTS サンプラーのみを使用することに固執する場合は、何らかの方法で離散変数を削除する必要があります。
これを行う最善の方法は、それらを無視することです。そうすれば、Rao-Blackwell の定理の恩恵を受け、パラメーターの分散推定値が低くなります。

形式的には引数は次のようになります。サンプラーは、ある関数 $f$ の期待値 $\mathbb{E}_{p(x, z)} \bigl [ f(x, z) \bigr ]$ を近似するものとして理解できます。 分布 $p(x, z)$ に関して。
[総期待の法則](https://en.wikipedia.org/wiki/Law_of_total_expectation) によって、私たちは次のことを知っています。

$$
\mathbb{E}_{p(x, z)} \bigl[ f(x, z) \bigr]
=
\mathbb{E}_{p(z)} \biggl[ \mathbb{E}_{p(x| z)}\bigl[ f(x, z) \bigr] \biggr]
$$

$g(z) = \mathbb{E}_{p(x| z)}\bigl[ f(x, z) \bigr]$ とすると、[総分散の法則](https://en.wikipedia.org/wiki/Law_of_total_variance) によってわかります。

$$
\mathbb{V}_{p(x, z)} \bigl[ f(x, z) \bigr]
=
\mathbb{V}_{p(z)} \bigl[ g(z) \bigr]
+
\mathbb{E}_{p(z)} \biggl[ \mathbb{V}_{p(x| z)}\bigl[ f(x, z) \bigr] \biggr]
$$

期待値は分散を超えているため、常に正である必要があり、したがって、次のようになります。

$$
\mathbb{V}_{p(x, z)} \bigl[ f(x, z) \bigr]
\geq
\mathbb{V}_{p(z)} \bigl[ g(z) \bigr]
$$

直感的には、モデル内の変数を周辺化すると、$f$ の代わりに $g$ を使用できるようになります。
この分散の低下は、モンテカルロ標準誤差 (mcse) の低下に直接的に現れ、間接的には一般に有効サンプル サイズ (ESS) の増加に現れます。

残念ながら、これを行うための計算は退屈で直感的ではないことがよくあります。 幸いなことに、```pymc-experimental``` はこの作業を自動的に行う方法をサポートするようになりました。

In [1]:
import arviz as az
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import pymc as pm
import pytensor.tensor as pt

````
```Attention
このノートブックは PyMC 依存関係ではないライブラリを使用しているため、このノートブックを実行するには特別にインストールする必要があります。 追加のガイダンスについては、下のドロップダウンを開いてください。
```
````

**開発中の機能を使用するとみられる**ので,このノートブックはここまでとする.

## Gaussian Mixture model

## Coal mining model

## Authors

## References

## Watermark

## License notice
All the notebooks in this example gallery are provided under the MIT License which allows modification, and redistribution for any use provided the copyright and license notices are preserved.

## Citing PyMC examples