# E03：正则系综解析例子：两能级系统与 Schottky anomaly

目标：在一个完全可解析的模型里，用一条不跳步的推导链，把 \(Z\)、\(\ln Z\)、\(U\)、\(C_V\) 的关系训熟。

你将：
1. 写出两能级系统的 \(Z(\beta)\)（既可对 microstates 求和，也可按能级分组）  
2. 推导 \(p_i\)、\(U(T)\) 与 \(C_V(T)\) 的解析表达式  
3. 画出 \(C_V(T)\) 的单峰曲线（Schottky anomaly），并用 \(T\to 0\) 与 \(T\to\infty\) 解释为什么两端都趋于 0  
4. （可选）加入简并度 \(g_0,g_1\)，观察峰值位置/高度如何改变

对照：Swendsen 扫描版 `ch19.md` 的 Eq 19.17–19.18（\(P(E)\) 与 \(Z\)）以及 Eq 19.60（热容与涨落）。


In [None]:
import os
import sys

# Add statphys_urban_learning to sys.path for local imports
curr = os.path.abspath("")
while curr != os.path.dirname(curr):
    if "statphys_urban_learning" in os.listdir(curr):
        target = os.path.join(curr, "statphys_urban_learning")
        if target not in sys.path:
            sys.path.insert(0, target)
        break
    curr = os.path.dirname(curr)


In [None]:
import numpy as np
import matplotlib.pyplot as plt

plt.rcParams.update({"figure.dpi": 120})


## 1. 模型设定：两能级系统

考虑一个最简单的系统，只有两个能级：

- 基态：\(E_0=0\)，简并度 \(g_0\)
- 激发态：\(E_1=\Delta\)，简并度 \(g_1\)

注：如果 \(g_0=g_1=1\)，就是最常见的两能级演示。保留 \(g_0,g_1\) 的好处是：你能直接看到“对 microstates 求和”和“对能级求和”之间的关系。

正则系综的起点是：当系统与恒温的环境弱耦合时，每个微观态 \(j\) 的概率为
\[
p_j=\frac{e^{-\beta E_j}}{Z},\qquad \beta\equiv\frac{1}{k_BT}.
\]

### 1.1 对 microstates 求和是“底层定义”

对一个给定的系统，配分函数的底层定义是对所有 microstates 求和（或对连续状态积分）：
\[
Z=\sum_{j\in\text{microstates}} e^{-\beta E_j}.
\]

两能级模型里，microstates 就是“\(g_0\) 个能量为 0 的状态”和“\(g_1\) 个能量为 \(\Delta\) 的状态”。

### 1.2 也可对能级求和（分组压缩）

如果很多 microstates 共享同一个能量，你可以按能级对 microstates 进行分组：设能级 \(E\) 的简并度为 \(g(E)\)，则
\[
Z=\sum_E g(E)\,e^{-\beta E}.
\]
对两能级模型，\(E\in\{0,\Delta\}\)，所以
\[
Z=g_0+g_1 e^{-\beta\Delta}.
\]

从这里也能直接写出两个能级的概率：
\[
P(E=0)=\frac{g_0}{Z},\qquad P(E=\Delta)=\frac{g_1 e^{-\beta\Delta}}{Z}.
\]


## 2. 平均能量 \(U\)：两种等价路径

### 2.1 按定义直接求和

两能级模型里，\(E\) 只能取 0 或 \(\Delta\)，所以平均能量（内能）
\[
U\equiv\langle E\rangle=\sum_E E\,P(E)=0\cdot P(0)+\Delta\cdot P(\Delta)
=\Delta\,\frac{g_1 e^{-\beta\Delta}}{g_0+g_1 e^{-\beta\Delta}}.
\]

当 \(g_0=g_1=1\) 时，常写成更直观的形式：
\[
U=\Delta\,\frac{e^{-\beta\Delta}}{1+e^{-\beta\Delta}}=\frac{\Delta}{e^{\beta\Delta}+1}.
\]

### 2.2 用 \(\ln Z\) 的导数得到 \(U\)（生成函数结构）

正则系综有通用关系：
\[
U=-\frac{\partial}{\partial\beta}\ln Z.
\]
对本模型，\(\ln Z=\ln(g_0+g_1 e^{-\beta\Delta})\)，因此
\[
-\partial_\beta\ln Z
=-\frac{1}{g_0+g_1 e^{-\beta\Delta}}\cdot g_1(-\Delta)e^{-\beta\Delta}
=\Delta\,\frac{g_1 e^{-\beta\Delta}}{g_0+g_1 e^{-\beta\Delta}},
\]
与上一小节的结果完全一致。


## 3. 热容 \(C_V(T)\)：Schottky 峰从哪里来？

热容的定义（定容）是
\[
C_V\equiv\left(\frac{\partial U}{\partial T}\right)_V.
\]
由于 \(\beta=1/(k_BT)\)，
\[
\frac{d\beta}{dT}=-\frac{1}{k_BT^2}.
\]
所以用链式法则
\[
C_V=\frac{\partial U}{\partial\beta}\frac{d\beta}{dT}.
\]

### 3.1 用涨落公式一步到位

正则系综有通用的涨落–响应关系（Swendsen Eq 19.60）：
\[
\mathrm{Var}(E)=\langle E^2\rangle-\langle E\rangle^2=k_BT^2 C_V.
\]
对两能级系统，\(E\in\{0,\Delta\}\)，令
\[
p\equiv P(E=\Delta)=\frac{g_1 e^{-\beta\Delta}}{Z},\qquad 1-p=P(E=0),
\]
则
\[
\langle E\rangle=\Delta p,\qquad \langle E^2\rangle=\Delta^2 p.
\]
所以方差是
\[
\mathrm{Var}(E)=\Delta^2 p-(\Delta p)^2=\Delta^2 p(1-p).
\]
代入 \(\mathrm{Var}(E)=k_BT^2C_V\)，得到完全解析的热容表达式：
\[
C_V=\frac{\Delta^2}{k_BT^2}p(1-p)=k_B(\beta\Delta)^2 p(1-p).
\]

### 3.2 无量纲变量与峰值

当 \(g_0=g_1=1\) 时，可引入无量纲变量 \(x\equiv\beta\Delta\)，把热容写成完全只依赖 \(x\) 的形式：
\[
\frac{C_V}{k_B}=\frac{x^2 e^{x}}{(1+e^{x})^2}.
\]
这个函数在 \(x\to\infty\) （\(T\to 0\) ）时趋于 0，在 \(x\to 0\) （\(T\to\infty\) ）也趋于 0，因而中间必然有一个单峰，这就是 Schottky anomaly。


In [None]:
def Z_two_level(beta, Delta, g0=1.0, g1=1.0):
    """Two-level partition function Z(beta) = g0 + g1 exp(-beta Delta)."""
    beta = np.asarray(beta)
    return g0 + g1 * np.exp(-beta * Delta)


def p_excited(beta, Delta, g0=1.0, g1=1.0):
    """Probability of the excited energy level E=Delta."""
    Z = Z_two_level(beta, Delta, g0=g0, g1=g1)
    return (g1 * np.exp(-beta * Delta)) / Z


def U_two_level(T, Delta, kB=1.0, g0=1.0, g1=1.0):
    """Mean energy U(T) for the two-level system."""
    T = np.asarray(T)
    beta = 1.0 / (kB * T)
    return Delta * p_excited(beta, Delta, g0=g0, g1=g1)


def Cv_two_level(T, Delta, kB=1.0, g0=1.0, g1=1.0):
    """Heat capacity C_V(T) using Var(E)=kB T^2 C_V."""
    T = np.asarray(T)
    beta = 1.0 / (kB * T)
    p = p_excited(beta, Delta, g0=g0, g1=g1)
    return kB * (beta * Delta) ** 2 * p * (1.0 - p)


In [None]:
# 下面使用 k_B=1 的单位制，温度与能量同量纲。
# 若你要 SI 单位，用 kB=1.380649e-23 即可（同时 Delta 要用焦耳）。
kB = 1.0
Delta = 1.0

T = np.linspace(0.05, 5.0, 800)
U = U_two_level(T, Delta, kB=kB)
Cv = Cv_two_level(T, Delta, kB=kB)

fig, axes = plt.subplots(1, 2, figsize=(10, 3.6))

axes[0].plot(T, U)
axes[0].set_xlabel("T")
axes[0].set_ylabel("U(T)")
axes[0].set_title("Two-level mean energy")

axes[1].plot(T, Cv)
axes[1].set_xlabel("T")
axes[1].set_ylabel("C_V(T)")
axes[1].set_title("Schottky anomaly")

i_peak = int(np.argmax(Cv))
axes[1].axvline(T[i_peak], color="k", ls="--", lw=1)

fig.suptitle(f"kB={kB}, Delta={Delta}", y=1.02)
fig.tight_layout()


In [None]:
# 峰值位置（数值扫描）
T_peak = float(T[i_peak])
Cv_peak = float(Cv[i_peak])
x_peak = float(Delta / (kB * T_peak))  # x = beta*Delta

print("T_peak =", T_peak)
print("C_V(T_peak) =", Cv_peak, "(units of kB)")
print("x_peak = beta*Delta =", x_peak)

# 用数值导数检查：C_V(T) = dU/dT
Cv_num = np.gradient(U, T)
print("max |dU/dT - C_V| =", float(np.max(np.abs(Cv_num - Cv))))


## 思考题（可选）

1. 把简并度改为 \(g_0\neq g_1\) （例如 \(g_1\gg g_0\) 或 \(g_1\ll g_0\)），则
   \(Z=g_0+g_1 e^{-\beta\Delta}\)，\(p=P(E=\Delta)\) 变成 \(p=\frac{g_1 e^{-\beta\Delta}}{g_0+g_1 e^{-\beta\Delta}}\)。
   你能直接通过 \(C_V=k_B(\beta\Delta)^2 p(1-p)\) 看出峰值如何平移吗？
2. 城市二元选择（binary logit）中，设两个方案的成本分别为 \(C_0=0\), \(C_1=\Delta\)，则
   \(P(\text{choose }1)=\frac{e^{-\beta\Delta}}{1+e^{-\beta\Delta}}\)，它与上面的 \(p\) 完全同构。你能用这个对比再解释一次“为什么 \(Z\) 似乎是‘系统级总权重’”吗？
3. 把 \(\Delta\) 改大/改小，观察峰值温度 \(T_\text{peak}\) 如何随 \(\Delta\) 缩放。你能从 \(x=\beta\Delta\) 的观点给出一句话解释吗？
