# セッション1: モデル選択と情報理論
PRML 第1章より、モデルの複雑さ、情報理論、次元の呪いに関する演習です。

## 目的
- 過学習と汎化誤差の違いを理解する
- 次元の呪いの影響を可視化する
- 情報理論の基礎（KLダイバージェンス）を実装で確認する

## 問題1: モデルの複雑さと過学習
多項式回帰を使って、モデルの複雑さ（次数）によって訓練誤差とテスト誤差がどのように変化するかを調べましょう。

In [None]:
import numpy as np
import matplotlib.pyplot as plt

np.random.seed(0)
N = 30
x = np.linspace(0, 1, N)
t_true = np.sin(2 * np.pi * x)
noise_sigma = 0.2
t = t_true + np.random.normal(0, noise_sigma, size=N)

# データ分割
N_train = int(0.7 * N)
x_train, x_test = x[:N_train], x[N_train:]
t_train, t_test = t[:N_train], t[N_train:]

max_degree = 9
train_errors = []
test_errors = []

for M in range(0, max_degree + 1):
    Phi_train = np.vstack([x_train ** j for j in range(M + 1)]).T
    Phi_test = np.vstack([x_test ** j for j in range(M + 1)]).T
    w, *_ = np.linalg.lstsq(Phi_train, t_train, rcond=None)
    train_pred = Phi_train.dot(w)
    train_mse = np.mean((train_pred - t_train) ** 2)
    train_errors.append(train_mse)
    test_pred = Phi_test.dot(w)
    test_mse = np.mean((test_pred - t_test) ** 2)
    test_errors.append(test_mse)

# TODO: 以下のコードを使ってプロットし、過学習の例を確認しましょう。
plt.plot(____, train_errors, marker='o', label="訓練誤差")
plt.plot(____, test_errors, marker='o', label="テスト誤差")
plt.xlabel("多項式の次数 M")
plt.ylabel("平均二乗誤差 (MSE)")
plt.title("モデルの複雑さと誤差")
plt.legend()
plt.show()

## 問題2: 次元の呪い
高次元空間における「最近傍点と最遠点の距離比」を計算し、次元が上がるとどうなるかを確認しましょう。

In [None]:
dims = [1, 2, 5, 10, 50, 100]
num_points = 1000

for d in dims:
    data = np.random.rand(num_points, d)
    query = np.random.rand(1, d)
    distances = np.linalg.norm(data - query, axis=1)
    nearest = distances.min()
    farthest = distances.max()
    ratio = ____ / ____
    print(f"{d}次元: 最近傍距離={nearest:.4f}, 最遠距離={farthest:.4f}, 比率={ratio:.4f}")

## 問題3: KLダイバージェンス
2つの離散確率分布間のKLダイバージェンスを計算してみましょう。

In [None]:
P = np.array([0.8, 0.2])
Q = np.array([0.5, 0.5])

KL_PQ = np.sum(P * np.log(P / Q))
KL_QP = np.sum(Q * np.log(Q / P))

# TODO: 結果を出力して非対称性を確認しましょう
print("KL(P||Q) =", ____)
print("KL(Q||P) =", ____)