# 重回帰分析

このページでは、重回帰分析を行っています。

データセットの作成から分析を行っています。今回扱うデータセットは機械学習ライブラリのscikit-learnに含まれるカルフォルニアの住宅のデータセットです。

## 注意事項

- 「Googleへのログインが必要」と出たら、自分のGoogleアカウントでログインします。

- 「警告: このノートブックは Google が作成したものではありません。」と出たら「このまま実行」をクリックします。

- 学習には数分かかる場合があります。

In [3]:
#@title ライブラリのインポート

import pandas as pd
from sklearn.datasets import fetch_california_housing
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

In [4]:
#@title 重回帰分析の実行

# データの読み込み
california = fetch_california_housing()

# データをDataFrameに変換
data = pd.DataFrame(california.data, columns=california.feature_names)
data["HousePrice"] = california.target

# 説明変数を選択（MedInc, AveRooms, AveOccup）
X = data[["MedInc", "AveRooms", "AveOccup"]]
y = data["HousePrice"]

# 重回帰モデルの作成と学習
model = LinearRegression()
model.fit(X, y)

# 予測
y_pred = model.predict(X)

# モデル評価
mse = mean_squared_error(y, y_pred)
r2 = r2_score(y, y_pred)

print(f"平均二乗誤差（MSE）: {mse:.2f}")
print(f"決定係数（R^2）: {r2:.2f}")

# 回帰係数の表示
coefficients = pd.DataFrame({"Feature": ["MedInc", "AveRooms", "AveOccup"], 
                             "Coefficient": model.coef_})
print(coefficients)


平均二乗誤差（MSE）: 0.69
決定係数（R^2）: 0.48
    Feature  Coefficient
0    MedInc     0.434683
1  AveRooms    -0.038326
2  AveOccup    -0.004174
