# 自己回帰モデルとフローベースモデル

深層生成モデル セクションの学習ステップ 5/8。
自己回帰モデルとフローベースモデルでは、生成の仕組みを抽象用語で終わらせず、毎段階をコードで確認します。

このステップの到達目標: 生成モデルを『何を近似しているか』で比較し、用途に応じた選択理由を説明できる状態にします。
前提: 確率分布と最適化の初歩、ニューラルネットワークの基礎が前提です。

今回の中心語: 「潜在変数」、「尤度」、「サンプリング」、「拡散」、「スコア」、「自己回帰モデルとフローベースモデル」
前ステップ「GAN」では GANノイズ入力の作成 → 単純なデコーダを書く を確認しました。
ここまでに登場した語: 「潜在変数」、「尤度」、「サンプリング」、「拡散」、「スコア」、「生成モデルの全体像」、「潜在変数モデルと混合モデル」、「VAE」、「GAN」
セクション全体のゴール: 生成モデルを『何を近似しているか』で比較し、用途に応じた選択理由を説明できる状態にします。

## 実験 1: 自己回帰系列の初期化

自己回帰とフローの違いを見るため、時系列的な潜在列を準備します。

In [None]:
import random
random.seed(23)
z = []
cur = 0.0
for _ in range(5):
    cur = 0.7 * cur + random.gauss(0, 0.4)
    z.append(round(cur, 3))
print('task = autoregressive-flow-models')
print('latent z =', z)

系列依存を持つ潜在列から生成特性を比較します。

この節では、潜在変数 が入出力のどこを決めるかを中心に読める状態になれば十分です。

## 実験 2: 単純なデコーダを書く

次に、潜在変数を観測空間へ写像する簡易デコーダを作ります。生成モデルの基本構造をコードで可視化します。

In [None]:
weights = [1.4, -0.6, 0.8, 0.5, -1.1]
bias = 0.2
x_hat = sum(zi * wi for zi, wi in zip(z, weights)) + bias
print('decoded scalar =', round(x_hat, 5))
print('abs scale =', round(abs(x_hat), 5))

実際の生成モデルは高次元ですが、構造は同じです。潜在を観測へ写像し、再構成品質を改善します。

この節では、潜在変数 が入出力のどこを決めるかを中心に読める状態になれば十分です。

## 式と実装の往復

1. $p_theta(x) = integral p_theta(x|z) p(z) dz$
2. $score(x) = grad_x log p(x)$

## 実験 3: ノイズを加えて復元する

ここで、拡散系モデルの直感を最小実験で確認します。ノイズ付加と復元の往復を短いコードで体験します。

In [None]:
x0 = 1.5
beta = 0.12
noise = -0.3
xt = ((1 - beta) ** 0.5) * x0 + (beta ** 0.5) * noise
x0_hat = (xt - (beta ** 0.5) * noise) / ((1 - beta) ** 0.5)
print('x0, xt, x0_hat =', round(x0, 5), round(xt, 5), round(x0_hat, 5))

復元誤差を観察すると、ノイズスケジュールの意味が見えてきます。理論と実装をつなぐ重要な観測点です。

この節では、潜在変数 が入出力のどこを決めるかを中心に読める状態になれば十分です。

## 実験 4: 混合分布の感覚を作る

次に、複数モードを持つ分布を手で作ります。モード崩壊の議論に入る前の下地として有効です。

In [None]:
mix = [(-2.0, 0.4), (1.5, 0.6)]
samples = []
for m, w in mix:
    samples.append(round(m + (w * 0.1), 3))
print('mode-aware samples =', samples)

混合分布の直感があると、生成結果の『多様性』を定量評価する発想が自然になります。

この節では、潜在変数 が入出力のどこを決めるかを中心に読める状態になれば十分です。

## 実験 5: 学習指標を定義する

最後に、生成品質を観察する最小指標を作ります。見た目だけで判断しない習慣を作ることが狙いです。

In [None]:
recon_errors = [0.42, 0.31, 0.29, 0.36, 0.33]
avg = sum(recon_errors) / len(recon_errors)
worst = max(recon_errors)
best = min(recon_errors)
print('avg/best/worst =', round(avg, 4), round(best, 4), round(worst, 4))

平均値と外れ値を同時に見ると、モデルが安定しているかを判断しやすくなります。

この節では、潜在変数 が入出力のどこを決めるかを中心に読める状態になれば十分です。

## 振り返り

今回のノートで押さえておくべき誤解しやすい点を整理します。

1. 見た目の良さだけで比較してしまう
2. 多様性と品質のトレードオフを観測しない
3. ノイズスケジュールの意味を理解しないまま調整する

次は学習ステップ 6/8「エネルギーベースモデル」へ進み、今回のコードとの差分を確認してください。