# AR(1)プロセスの理解と平均の分散


このノートでは図はipynb内に表示し、画像ファイルとしては保存しません。

このノートでは、AR(1)プロセスの基本式と平均の分散を整理し、シミュレーションで確認します。
**第8章のMCMC（メトロポリス・ヘイスティングス法）** との記号の整合性をとるため、自己回帰係数を $\phi$ と表記します。

- **AR(1)プロセス**: $ y_t = \phi y_{t-1} + \varepsilon_t $, $ \varepsilon_t \sim N(0,\sigma^2) $
  - **定常 ($|\phi| < 1$)**: 平均へ回帰する。
  - **ランダムウォーク ($|\phi| = 1$)**: 非定常。分散が時間とともに増大する（第8章で提案分布として利用）。
- **定常分散 ($|\phi| < 1$)**: $ \sigma_u^2 = \dfrac{\sigma^2}{1-\phi^2} $
- **平均の分散**: 


まず平均を

$$
\bar{y}_T = 
\frac{1}{T}\sum_{t=1}^T y_t
$$

と置くと、自己共分散 $\gamma_h=\mathrm{Cov}(y_t,y_{t-h})$ を用いて

$$
\mathrm{Var}(\bar{y}_T)=
\frac{1}{T^2}\sum_{t=1}^T\sum_{s=1}^T\gamma_{|t-s|}
$$

となります。AR(1)では

$$
\gamma_h=\sigma_u^2\phi^{|h|}
$$

なので、二重和を整理すると

$$
\mathrm{Var}(\bar{y}_T)=
\frac{1}{T^2}\Big(T\gamma_0 + 2\sum_{h=1}^{T-1}(T-h)\gamma_h\Big)
$$

$$
=
\frac{1}{T^2}\Big(T\sigma_u^2 + 2\sum_{h=1}^{T-1}(T-h)\sigma_u^2\phi^h\Big)
$$

となり、本文の式を得ます。

同じ分散 $\sigma_u^2$ を持つ **iidサンプル** $ x_i \sim N(\mu, \sigma_u^2) $ の平均の分散は

$$
\mathrm{Var}(\bar{x}_T)=
\frac{\sigma_u^2}{T}
$$

であり、相関があると$\mathrm{Var}(\bar{y}_T)$ が増えることを確認します。

---


In [1]:
import numpy as np
import matplotlib.pyplot as plt
import japanize_matplotlib

np.random.seed(42)


In [2]:
def simulate_ar1(phi, sigma, T, n_simulations=1):
    """AR(1)をシミュレーションする。"""
    y = np.zeros((n_simulations, T))
    epsilon = np.random.normal(0, sigma, (n_simulations, T))

    if abs(phi) < 1:
        stationary_variance = sigma**2 / (1 - phi**2)
        y[:, 0] = np.random.normal(0, np.sqrt(stationary_variance), n_simulations)
    else:
        y[:, 0] = epsilon[:, 0]

    for t in range(1, T):
        y[:, t] = phi * y[:, t - 1] + epsilon[:, t]

    return y


def theoretical_variance_of_sample_mean(phi, sigma, T):
    """AR(1)の標本平均の理論分散を計算する。"""
    if abs(phi) >= 1:
        return np.inf

    gamma_0 = sigma**2 / (1 - phi**2)
    h = np.arange(1, T)
    sum_term = np.sum((T - h) * (phi ** h))
    variance = (gamma_0 / T**2) * (T + 2 * sum_term)
    return variance


def autocorrelation(x):
    """単純な自己相関推定。"""
    n = len(x)
    variance = x.var()
    x = x - x.mean()
    r = np.correlate(x, x, mode="full")[-n:]
    return r / (variance * np.arange(n, 0, -1))


## シミュレーションで平均の分散を確認


In [3]:
phi = 0.5
sigma = 1.0
T = 100
n_simulations = 10000

simulated_data = simulate_ar1(phi, sigma, T, n_simulations)
sample_means = np.mean(simulated_data, axis=1)
empirical_variance = np.var(sample_means, ddof=1)

theoretical_var = theoretical_variance_of_sample_mean(phi, sigma, T)
iid_variance = (sigma**2 / (1 - phi**2)) / T

print(f"理論分散: {theoretical_var:.6f}")
print(f"経験分散: {empirical_variance:.6f}")
print(f"比較用のiid分散: {iid_variance:.6f}")
print(f"比 (AR(1) / iid): {theoretical_var / iid_variance:.4f}")


In [4]:
y_single = simulated_data[0]
acf = autocorrelation(y_single)
lags = 20

plt.figure(figsize=(12, 5))

plt.subplot(1, 2, 1)
plt.plot(y_single, label=f"AR(1) phi={phi}")
plt.title(f"AR(1) 時系列 (T={T})")
plt.xlabel("時刻")
plt.ylabel("値")
plt.legend()
plt.grid(True)

plt.subplot(1, 2, 2)
plt.stem(range(lags), acf[:lags], basefmt=":", label="サンプルACF")
plt.plot(range(lags), phi ** np.arange(lags), "r--", label="理論ACF")
plt.title("自己相関")
plt.xlabel("ラグ")
plt.legend()
plt.grid(True)

plt.tight_layout()
plt.show()


## 相関行列のイメージ

$ \mathrm{Cov}(y_i, y_j) = \sigma_u^2\phi^{|i-j|} $ なので、対角から離れるほど値が減衰します。


In [5]:
T_matrix = 10
phi_matrix = 0.5

indices = np.indices((T_matrix, T_matrix))
correlation_matrix = phi_matrix ** np.abs(indices[0] - indices[1])

plt.figure(figsize=(6, 5))
img = plt.imshow(correlation_matrix, cmap="viridis")
plt.colorbar(img, label=r"$\phi^{|i-j|}$")
plt.title(f"AR(1) 相関行列 (T={T_matrix}, phi={phi_matrix})")
plt.xlabel("j")
plt.ylabel("i")
plt.xticks(np.arange(0, T_matrix, 2))
plt.yticks(np.arange(0, T_matrix, 2))
plt.tight_layout()
plt.show()


## 相関による精度の低下（平均の分散比）

同じ分散 $\sigma_u^2$ を持つ iid サンプル平均との差を比較します。


In [6]:
phis = [0.2, 0.5, 0.8]
T_max = 100
T_range = np.arange(1, T_max + 1)

plt.figure(figsize=(10, 6))

for phi_val in phis:
    h_vals = np.arange(1, T_max).reshape(-1, 1)
    t_vals = T_range.reshape(1, -1)
    t_minus_h = t_vals - h_vals
    mask = h_vals < t_vals
    sum_terms = np.sum(t_minus_h * (phi_val ** h_vals) * mask, axis=0)
    var_terms = T_range + 2 * sum_terms
    ratios = (var_terms / (T_range**2)) / (1.0 / 10.0)
    plt.plot(T_range, ratios, label=f"phi={phi_val}")

plt.axhline(y=1.0, color="steelblue", linestyle="--", alpha=0.7)
plt.axvline(x=10.0, color="steelblue", linestyle="--", alpha=0.7)
plt.title("相関による精度低下: Var(ȳ_T) / Var( x̄_10 )")
plt.xlabel("T (サンプルサイズ)")
plt.ylabel("比")
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.show()


## AR(1) とランダムウォークの比較（「酔歩」の可視化）

第8章の「酔歩連鎖（MCMC）」で使われるランダムウォーク（$\phi=1$）と、定常AR(1)（$\phi=0.5$）の挙動の違いを可視化します。
ランダムウォークは分散が時間とともに拡大し、どこまでも「ふらふらと」移動していく様子（イカの足のように広がる様子）が確認できます。


In [7]:
T_rw = 200
n_paths = 30
phi_stationary = 0.5
phi_rw = 1.0

# 複数のパスを生成
paths_stationary = simulate_ar1(phi_stationary, sigma, T_rw, n_paths)
paths_rw = simulate_ar1(phi_rw, sigma, T_rw, n_paths)

plt.figure(figsize=(12, 6))

plt.subplot(1, 2, 1)
for i in range(n_paths):
    plt.plot(paths_stationary[i], color="blue", alpha=0.3, linewidth=1)
plt.title(f"定常 AR(1) (phi={phi_stationary}): 平均回帰")
plt.xlabel("時刻")
plt.ylabel("値")
plt.ylim(-15, 15)
plt.grid(True)

plt.subplot(1, 2, 2)
for i in range(n_paths):
    plt.plot(paths_rw[i], color="red", alpha=0.3, linewidth=1)
plt.title(f"ランダムウォーク (phi={phi_rw}): 分散拡大（酔歩）")
plt.xlabel("時刻")
plt.ylabel("値")
plt.ylim(-15, 15)
plt.grid(True)

plt.tight_layout()
plt.show()


## 補足: $x_i$ は比較用の仮想データ

$ x_i $ は $ y_t $ から生成されるわけではなく、**同じ分散を持つ独立サンプル**という比較用の基準線です。


## (参考) ランダムウォークを用いたMCMC：メトロポリス法

第8章の冒頭（）で扱っているMCMC（メトロポリス・ヘイスティングス法）では、この「ランダムウォーク」を提案分布として利用します。
ランダムウォーク（$\phi=1$）は分散が拡大し続けるため、空間全体を探索する能力があります。MCMCでは、この「探索能力」を利用しつつ、目標分布 $\pi(x)$ の確率密度比に基づく「採択/棄却」のステップを入れることで、目標分布からのサンプリングを実現します。

以下は、標準正規分布 (0, 1)$ を目標分布とし、ランダムウォークを提案分布としたメトロポリス法の簡易シミュレーションです。

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm

# 目標分布: 標準正規分布
def target_pdf(x):
    return norm.pdf(x, loc=0, scale=1)

# ランダムウォーク・メトロポリス法
np.random.seed(123)
n_iter = 5000
current_x = 10.0  # 初期値（あえて分布の裾からスタート）
samples = []
trace = []

# ステップ幅（ランダムウォークの分散）
step_width = 1.0

for i in range(n_iter):
    # 1. 提案: ランダムウォーク (現在の値 + ノイズ)
    # x' = x + epsilon, epsilon ~ N(0, step_width^2)
    # これが phi=1 の AR(1) の1ステップに相当
    proposal_x = current_x + np.random.normal(0, step_width)
    
    # 2. 採択確率の計算
    # 提案分布が対称(正規分布)なので、目標分布の比だけで決まる
    ratio = target_pdf(proposal_x) / target_pdf(current_x)
    acceptance_prob = min(1.0, ratio)
    
    # 3. 採択/棄却
    if np.random.rand() < acceptance_prob:
        current_x = proposal_x  # 採択（移動）
    else:
        pass  # 棄却（現在地に留まる）
    
    trace.append(current_x)
    if i > 100: # バーンイン
        samples.append(current_x)

# 可視化
plt.figure(figsize=(12, 5))

# トレースプロット
plt.subplot(1, 2, 1)
plt.plot(trace, lw=0.5)
plt.title("MCMCのトレースプロット (ランダムウォーク探索)")
plt.xlabel("Step")
plt.ylabel("Value")
plt.grid(True, alpha=0.3)

# ヒストグラム
plt.subplot(1, 2, 2)
plt.hist(samples, bins=30, density=True, alpha=0.7, label="MCMC Samples")
x = np.linspace(-4, 4, 100)
plt.plot(x, target_pdf(x), 'r-', lw=2, label="True PDF N(0,1)")
plt.title("生成された分布")
plt.legend()
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()