# 複数のsklearnアルゴリズムを適応して回帰を行う

このコードでは、Boston Housingデータセットを使用して5つの異なる回帰アルゴリズム（線形回帰、決定木回帰、ランダムフォレスト回帰、SVR、K最近傍法回帰）を試し、各アルゴリズムの平均二乗誤差（Mean Squared Error, MSE）を評価します。同様に、データの前処理、ハイパーパラメータの調整、評価指標の変更など、必要に応じてカスタマイズしてください。

In [8]:
import numpy as np
import pandas as pd
# データセット
from sklearn.datasets import fetch_california_housing
# 前処理
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
# 評価
from sklearn.metrics import mean_squared_error
# モデル
from sklearn.linear_model import LinearRegression
from sklearn.tree import DecisionTreeRegressor
from sklearn.ensemble import RandomForestRegressor
from sklearn.svm import SVR
from sklearn.neighbors import KNeighborsRegressor

# California Housingデータセットをロード
data = fetch_california_housing()
X = data.data
X = X[:1000] # 学習時間を減らすために最初の1000個を使用
y = data.target
y = y[:1000]

# データをトレーニングセットとテストセットに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# データを標準化
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# 使用する回帰アルゴリズムのリスト
algorithms = [
    LinearRegression(),
    DecisionTreeRegressor(),
    RandomForestRegressor(),
    SVR(),
    KNeighborsRegressor()
]

# 各アルゴリズムの評価結果を保存するためのリスト
results = []

for algorithm in algorithms:
    model = algorithm
    model.fit(X_train, y_train)
    y_pred = model.predict(X_test)
    mse = mean_squared_error(y_test, y_pred)
    results.append([algorithm.__class__.__name__, mse])

# 結果をデータフレームに変換
results_df = pd.DataFrame(results, columns=["Algorithm", "Mean Squared Error"])

results_df


Unnamed: 0,Algorithm,Mean Squared Error
0,LinearRegression,0.217196
1,DecisionTreeRegressor,0.306993
2,RandomForestRegressor,0.121709
3,SVR,0.109773
4,KNeighborsRegressor,0.121794
