# PCAのスクラッチ実装

このノートブックでは、PCA（主成分分析）を一から実装し、理論を深く理解します。


In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_iris
from sklearn.preprocessing import StandardScaler

plt.rcParams['font.family'] = 'DejaVu Sans'
plt.rcParams['figure.figsize'] = (12, 8)

# PCAの手動実装
def pca_manual(X, n_components=None):
    # 1. データの標準化
    X_centered = X - np.mean(X, axis=0)
    
    # 2. 共分散行列の計算
    cov_matrix = np.cov(X_centered.T)
    
    # 3. 固有値・固有ベクトルの計算
    eigenvalues, eigenvectors = np.linalg.eig(cov_matrix)
    
    # 4. 固有値の降順ソート
    idx = np.argsort(eigenvalues)[::-1]
    eigenvalues = eigenvalues[idx]
    eigenvectors = eigenvectors[:, idx]
    
    # 5. 主成分の選択
    if n_components is not None:
        eigenvectors = eigenvectors[:, :n_components]
        eigenvalues = eigenvalues[:n_components]
    
    # 6. データの変換
    X_transformed = X_centered @ eigenvectors
    
    return X_transformed, eigenvectors, eigenvalues

# データの準備
iris = load_iris()
X, y = iris.data, iris.target

# データの標準化
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# PCAの適用
X_pca, components, eigenvalues = pca_manual(X_scaled, n_components=2)

# 可視化
plt.figure(figsize=(15, 5))

# 元データ（最初の2つの特徴量）
plt.subplot(1, 3, 1)
plt.scatter(X_scaled[:, 0], X_scaled[:, 1], c=y, cmap='viridis')
plt.xlabel('Feature 1')
plt.ylabel('Feature 2')
plt.title('Original Data (First 2 Features)')

# PCA後のデータ
plt.subplot(1, 3, 2)
plt.scatter(X_pca[:, 0], X_pca[:, 1], c=y, cmap='viridis')
plt.xlabel('First Principal Component')
plt.ylabel('Second Principal Component')
plt.title('PCA Transformed Data')

# 寄与率
plt.subplot(1, 3, 3)
explained_variance_ratio = eigenvalues / np.sum(eigenvalues)
plt.bar(range(1, 5), explained_variance_ratio)
plt.xlabel('Principal Component')
plt.ylabel('Explained Variance Ratio')
plt.title('Explained Variance Ratio')

plt.tight_layout()
plt.show()

print("=== PCAの手動実装結果 ===")
print(f"固有値: {eigenvalues}")
print(f"寄与率: {explained_variance_ratio}")
print(f"累積寄与率: {np.cumsum(explained_variance_ratio)}")
