# scikit-learnでのPCA

このノートブックでは、scikit-learnのPCAクラスを使用した実装を学習します。


In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler

plt.rcParams['font.family'] = 'DejaVu Sans'
plt.rcParams['figure.figsize'] = (12, 8)

# データの準備
iris = load_iris()
X, y = iris.data, iris.target

# データの標準化
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# PCAの適用
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X_scaled)

# 可視化
plt.figure(figsize=(15, 5))

# 元データ
plt.subplot(1, 3, 1)
plt.scatter(X_scaled[:, 0], X_scaled[:, 1], c=y, cmap='viridis')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.title('Original Data')

# PCA後のデータ
plt.subplot(1, 3, 2)
plt.scatter(X_pca[:, 0], X_pca[:, 1], c=y, cmap='viridis')
plt.xlabel('First Principal Component')
plt.ylabel('Second Principal Component')
plt.title('PCA Transformed Data')

# 寄与率
plt.subplot(1, 3, 3)
plt.bar(range(1, 3), pca.explained_variance_ratio_)
plt.xlabel('Principal Component')
plt.ylabel('Explained Variance Ratio')
plt.title('Explained Variance Ratio')

plt.tight_layout()
plt.show()

print("=== scikit-learnでのPCA結果 ===")
print(f"寄与率: {pca.explained_variance_ratio_}")
print(f"累積寄与率: {np.cumsum(pca.explained_variance_ratio_)}")
print(f"主成分: {pca.components_}")
