# E01 数值最大熵（离散状态）

目标：把“约束 → 指数族 → 拉格朗日乘子”跑通一次，并验证约束满足。

本题只用 numpy（不依赖 scipy/cvxpy）。

In [None]:
import numpy as np

from exercises.src.e01_maxent_discrete import maxent_from_moments


In [None]:
# Example 1: 约束“平均能量”
E = np.arange(5)  # energies 0..4
F = E.reshape(-1, 1)          # one feature: energy
c = np.array([2.0])           # target mean energy

p, lam = maxent_from_moments(F, c)
print("λ =", lam)
print("p =", np.round(p, 6))
print("E_p[E] =", p @ E)

# 对比：指数族形式 p ∝ exp(-β E)，这里 λ 就是 β
beta = lam[0]
p_check = np.exp(-beta * E)
p_check /= p_check.sum()
print("max|Δp| =", np.max(np.abs(p - p_check)))


In [None]:
# Example 2: 两个约束（平均能量 + 平均能量平方）
F2 = np.column_stack([E, E**2])
c2 = np.array([2.0, 6.0])  # choose some feasible targets

p2, lam2 = maxent_from_moments(F2, c2)
print("λ =", lam2)
print("E_p[E], E_p[E^2] =", p2 @ E, p2 @ (E**2))
print("p2 =", np.round(p2, 6))
