# セッション1: 情報理論の基礎と応用

本ノートブックでは、情報理論の核心であるエントロピー・KLダイバージェンス・情報量の直感を、Pythonを用いて実験的に理解します。

## 学習目標
- 情報量とは何かを直感的・定量的に理解する
- エントロピーの定義と意味を確認する
- 確率分布間の距離としてのKLダイバージェンスを実装する


## 問題1: 情報量と確率

ある事象の情報量は、その確率が低いほど大きくなることが知られています。以下のセルで、いくつかの確率に対する情報量（驚きの度合い）を計算してみましょう。

In [None]:
import numpy as np

# 対象の確率
probabilities = [0.5, 0.25, 0.1, 0.01]

# 情報量（self-information） I(x) = -log2(p(x)) を計算
for p in probabilities:
    info = -np.log2(p)
    print(f"p = {p:.2f} -> 情報量 I(x) = {'____'}")  # <- 穴埋め


In [None]:
for p in probabilities:
    info = -np.log2(p)
    print(f"p = {p:.2f} -> 情報量 I(x) = {info:.4f} bit")


## 問題2: エントロピー計算

確率分布 \( p = [0.25, 0.25, 0.25, 0.25] \) における情報の期待値、すなわちエントロピーを計算しましょう。

In [None]:
p = np.array([0.25, 0.25, 0.25, 0.25])
entropy = -np.sum(p * np.log2(p))
print("エントロピー H(p) =", '____')  # <- 穴埋め


In [None]:
print("エントロピー H(p) =", entropy)  # 解答


## 問題3: KLダイバージェンス

真の分布 \( p = [0.5, 0.5] \)、予測分布 \( q = [0.9, 0.1] \) に対するKLダイバージェンスを計算してみましょう。

\[
\mathrm{KL}(p || q) = \sum p(x) \log\left(\frac{p(x)}{q(x)}\right)
\]


In [None]:
p = np.array([0.5, 0.5])
q = np.array([0.9, 0.1])

kl = np.sum(p * np.log2(p / q))
print("KL(p || q) =", '____')  # <- 穴埋め


In [None]:
print("KL(p || q) =", kl)  # 解答
