# Store Item Demand Forecasting - Feature Engineering

このノートブックでは、`src/features.py` に抽出したロジックを使用して、生成された特徴量の分布や特性を視覚的に確認します。

In [None]:
import sys
import os
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

sys.path.append("/work/competitions/demand-forecasting-kernels-only/")
from src.features import prepare_data

%matplotlib inline
sns.set(style="whitegrid")

In [None]:
DATA_DIR = "/work/competitions/demand-forecasting-kernels-only/data"
df = prepare_data(f"{DATA_DIR}/train.csv")
print(f"Data loaded and features created: {df.shape}")
df.head()

## 1. 円環構造の確認

sin/cos に変換された曜日が、数学的な単位円を描いているか確認します。

In [None]:
plt.figure(figsize=(6, 6))
sns.scatterplot(x="dayofweek_sin", y="dayofweek_cos", data=df.drop_duplicates("dayofweek"), hue="dayofweek", palette="viridis", s=100)
plt.title("Cyclic Encoding: Day of Week (Sin vs Cos)")
plt.legend(title="Day (0=Mon)")
plt.show()

## 2. ラグ特徴量の分布

「91日前の売上」など、新しい特徴量の相関を確認します。

In [None]:
sample = df[(df["store"]==1) & (df["item"]==1)]
plt.figure(figsize=(10, 6))
sns.heatmap(sample[["sales", "sales_lag_91", "sales_lag_98", "rolling_mean_30"]].corr(), annot=True, cmap="coolwarm")
plt.title("Correlation between Sales and Lag/Rolling Features")
plt.show()