## PCAによる多次元時系列データ分析

In [None]:
import numpy as np
import pandas as pd
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt

# 仮想的な多次元時系列データの生成
np.random.seed(0)
data = np.column_stack([
    np.random.random(100) + 5 * np.sin(np.linspace(0, 20, 100)),  # 第4成分（周期的な変動）
    np.random.random(100) - np.arange(100) * 0.5,  # 第1成分（一定減少の傾向）
    np.random.random(100) + np.arange(100) * 0.5,  # 第2成分（一定増加の傾向）
    np.random.random(100) - np.arange(100) * 0.1,  # 第3成分（異なる傾向）
    np.random.random(100),  # ランダムな成分
    np.random.random(100),  # ランダムな成分
])
time_series_df = pd.DataFrame(data, columns=[f'TimeSeries_{i}' for i in range(1, 7)])


# PCAオブジェクトの作成とデータに対する適用
pca = PCA(n_components=2)
principal_components = pca.fit_transform(time_series_df)

# 主成分をデータフレームに変換
principal_df = pd.DataFrame(data=principal_components, columns=['Principal Component 1', 'Principal Component 2'])

# 主成分の可視化
# 時系列データに沿って主成分の散布図をプロットし、点を線で結ぶ
plt.figure(figsize=(10, 6))
plt.scatter(principal_df['Principal Component 1'], principal_df['Principal Component 2'], c=range(len(principal_df)), cmap='viridis')
plt.plot(principal_df['Principal Component 1'], principal_df['Principal Component 2'], color='gray', alpha=0.5)
plt.colorbar(label='Time')
plt.xlabel('Principal Component 1')
plt.ylabel('Principal Component 2')
plt.title('PCA Scatter Plot with Time Series Order')
plt.show()

# 時間経過とともに主成分がどのように変化したかをプロット
plt.figure(figsize=(10, 6))
plt.plot(principal_df['Principal Component 1'], label='Principal Component 1')
plt.plot(principal_df['Principal Component 2'], label='Principal Component 2')
plt.xlabel('Time')
plt.ylabel('Principal Component Value')
plt.title('Time Series Variation in Principal Components')
plt.legend()
plt.show()