In [1]:
# ================================================
# 必要なライブラリのインポート
# ================================================

# --------------------------------
# 数値計算・データ処理
# --------------------------------
import numpy as np  # 数値計算ライブラリ（ベクトル・行列演算など）
import pandas as pd  # データフレーム操作（時系列の取り扱いに必須）

# --------------------------------
# 可視化ライブラリ
# --------------------------------
from matplotlib import pyplot as plt  # グラフ描画の基本ライブラリ
import matplotlib.dates as mdates  # 時系列軸のフォーマット設定に便利
import seaborn as sns  # 統計的な可視化スタイル（美しい出力）

sns.set()  # Seabornのデフォルトスタイルを有効化（見やすいグラフに）

# --------------------------------
# 統計モデリング・時系列分析
# --------------------------------
import statsmodels.api as sm
import statsmodels.formula.api as smf
import statsmodels.tsa.api as tsa  # 時系列専用ツール（自己相関, ARIMAなど）

# --------------------------------
# sktime：時系列処理の基本モジュール
# --------------------------------
from sktime.utils.plotting import plot_series  # 時系列データの簡単な可視化
from sktime.forecasting.base import ForecastingHorizon  # 予測対象期間の指定

# --------------------------------
# sktime：指数平滑法・ETSモデル（トレンド・季節性モデル）
# --------------------------------
from sktime.forecasting.exp_smoothing import ExponentialSmoothing  # Holt-Wintersモデル
from sktime.forecasting.ets import AutoETS  # 自動ETSモデル選択

# --------------------------------
# sktime：予測性能評価（誤差指標）
# --------------------------------
from sktime.performance_metrics.forecasting import (
    mean_absolute_scaled_error,  # MASE（基準モデルとの誤差比）
    MeanAbsoluteError,  # MAE（平均絶対誤差）
    mean_absolute_percentage_error,  # MAPE（平均絶対パーセント誤差）
    mean_absolute_error,  # MAE（関数形式）
)

# --------------------------------
# sktime：予測モデルの検証（クロスバリデーション等）
# --------------------------------
from sktime.forecasting.model_selection import (
    temporal_train_test_split,  # 時系列に基づく訓練・テスト分割
    ExpandingWindowSplitter,  # 時間窓を拡張しながらCVを実行
    ForecastingGridSearchCV,  # グリッドサーチによるハイパーパラメータ最適化
)
from sktime.forecasting.model_evaluation import evaluate  # CVの自動評価関数

# --------------------------------
# sktime：データ変換（前処理）
# --------------------------------
from sktime.transformations.series.boxcox import LogTransformer  # 対数変換など

# --------------------------------
# sktime：パイプライン・アンサンブル
# --------------------------------
from sktime.forecasting.compose import (
    TransformedTargetForecaster,  # 前処理＋予測モデルを一体化
    MultiplexForecaster,  # モデルの切替・比較
    EnsembleForecaster,  # モデルを統合して予測（単純平均など）
    AutoEnsembleForecaster,  # 自動アンサンブル（性能ベース加重など）
)
from sktime.transformations.compose import OptionalPassthrough  # 前処理を有無切替できる

# ================================================
# ✅ このブロックでできること
# - Holt-WintersやETSによる時系列予測
# - グリッドサーチ＋クロスバリデーション評価
# - 前処理を含むパイプライン設計
# - モデルアンサンブル・自動モデル選択
# ================================================

In [2]:
# 表示設定
np.set_printoptions(linewidth=60)
pd.set_option("display.width", 80)

from matplotlib.pylab import rcParams

rcParams["figure.figsize"] = 8, 4

In [3]:
# 飛行機乗客数データの読み込み
air_passengers = sm.datasets.get_rdataset("AirPassengers").data

# 日付インデックスの作成(PeriodIndex)
date_index = pd.period_range(start="1949-01", periods=len(air_passengers), freq="M")
air_passengers.index = date_index

# 不要な時間ラベルの削除
air_passengers = air_passengers.drop(air_passengers.columns[0], axis=1)

In [4]:
# データの分割
train, test = temporal_train_test_split(air_passengers, test_size=36)

# 予測期間
fh = np.arange(1, len(test) + 1)

In [5]:
data = pd.Series([1, 2, 3])
data

0    1
1    2
2    3
dtype: int64

In [None]:
# ================================================
# 単純指数平滑法（Simple Exponential Smoothing）の準備
# ================================================

# 平滑化定数（α）
# 0 < α ≤ 1 の範囲で設定。
# αが大きいほど「新しいデータを重視」し、αが小さいほど「過去データを重視」する。
alpha = 0.8

# データの長さ分、(1 - α) を並べたリストを作成
# （指数平滑での過去データの重みを計算するために使用）
alpha_list = np.tile(1 - alpha, len(data))

# 結果の確認（例：0.2が3個並ぶなど）
alpha_list

array([0.2, 0.2, 0.2])

In [7]:
# --------------------------------
# 核心部分：重みの算出
# --------------------------------
#   α_list ** np.arange(0, len(data)) * α
#
# 具体的な意味：
#   np.arange(0, len(data)) → [0, 1, 2, 3, ...]
#   α_list ** np.arange(...) → [(1-α)^0, (1-α)^1, (1-α)^2, ...]
#   それに α を掛けることで：
#       [α*(1-α)^0, α*(1-α)^1, α*(1-α)^2, ...]
#   という指数的に減衰する重みが得られる。
#
# 例：α=0.8 の場合
#   → [0.8, 0.16, 0.032, 0.0064, ...] のように
#      最新ほど大きく、古いほど小さい重みになる。
weight = alpha_list ** np.arange(0, len(data)) * alpha

# 結果を確認
weight

array([0.8  , 0.16 , 0.032])

In [8]:
# ================================================
# 指数平滑法による予測値の計算
# ================================================

# 重みを逆順にする
# （理由）計算時に「古いデータ × 小さい重み」「新しいデータ × 大きい重み」
# が対応するように、重みの順序を入れ替える。
# これで最新の観測値ほど大きな重みが掛かるようになる。
weight = weight[::-1]

# --------------------------------
# 指数平滑化法による予測値の算出
# --------------------------------
# 予測値は、各データとその重みの積の総和で表される：
#
#   ŷ_t = Σ [ α * (1 - α)^(t - i) * y_i ]
#
# このコードでは「data * weight」で要素ごとの積をとり、
# np.sum() でそれを合計している。
#
# 例：
#   data = [y1, y2, y3, y4]
#   weight = [0.0064, 0.032, 0.16, 0.8]（α=0.8の場合）
#   → ŷ_4 = y1*0.0064 + y2*0.032 + y3*0.16 + y4*0.8
#
# したがって、新しい観測値ほど強く反映される。
print(f"4時点目の予測値 {np.sum(data * weight):.4g} ")

4時点目の予測値 2.752 


In [9]:
# データの並び順の変更
data_2 = pd.Series([3, 2, 1])

# 指数平滑化法による予測値
print(f"4時点目の予測値 {np.sum(data_2 * weight):.4g} ")

4時点目の予測値 1.216 


In [10]:
# 参考：単なるデータの平均
np.mean(data)

2.0