予測モデルの訓練の流れ

1. データセットを訓練データとテストデータに分割
2. 説明変数の標準化
3. 予測モデルの指定
4. 損失関数の指定
5. 訓練データと損失関数を用いたモデルの訓練
6. テストデータを用いたモデルの評価
---
Flow of training a predictive model

1. split the dataset into training and test data
2. standardize explanatory variables
3. specify a predictive model
4. specify a loss function
5. train the model using the training data and the loss function
6. evaluate the model using the test data

目的

* データセットの13個の説明変数を使って、**確率的勾配降下法のモデルを訓練し**、住宅価格の予測モデルを実装します。
---
Objective

* Using the 13 explanatory variables in the data set, we **train a stochastic gradient descent model** to implement a predictive model of housing prices.

In [1]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [2]:
# ライブラリのインポート/Import libraries
%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn.linear_model import SGDRegressor
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

In [3]:
# データセットの読み込み/Load dataset
df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/5data/BostonHousing.csv')

X = df.iloc[:, 0:13]
y = df['medv'].values

# 1. 訓練データとテストデータに分割/Split into training and test data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
print('Shape of X_train：',X_train.shape,'Shape of y_train：',y_train.shape,'Shape of X_test：',X_test.shape,'Shape of y_test：',y_test.shape)

Shape of X_train： (404, 13) Shape of y_train： (404,) Shape of X_test： (102, 13) Shape of y_test： (102,)


In [4]:
# 2. 説明変数の標準化/Standardize explanatory variables
sc = StandardScaler()

# 訓練データを変換器で標準化/Standardize training data with a transformer
X_train_std = sc.fit_transform(X_train)

# テストデータを作成した変換器で標準化/Standardize test data with transformer created
X_test_std = sc.transform(X_test)

SGDRegressor: https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.SGDRegressor.html
* 確率的勾配降下法（Stochastic Gradient Descent: SGD）は、パラメータを一度に求めるのではなく勾配を計算し繰り返しパラメータを更新していく方法です。
* 確率的勾配降下法にはsklearn.linear_model.SGDRegressorを使います。
* インスタンスを生成する時にパラメタを設定します。
---
* Stochastic Gradient Descent (SGD) is a method that iteratively updates parameters by calculating their gradients rather than finding them all at once.
* Use sklearn.linear_model.SGDRegressor for stochastic gradient descent.
* Parameters are set when the instance is created.

* ↓インスタンス作成後、SGDRegressor.fitというメソッドにスケーリングした学習データを渡して確率的勾配降下法の学習を行います。
* ↓After creating the instance, the scaled training data is passed to the SGDRegressor.fit method to train the stochastic gradient descent method.

In [5]:
# 3. モデルの指定 4. 損失関数の指定 5. モデルの訓練
# 3. Specify model 4. Specify loss function 5. Train the model
# 確率的勾配降下法の回帰モデルを作成/Create regression models for stochastic gradient descent
model = SGDRegressor(loss='squared_error', max_iter=100, eta0=0.01, learning_rate='constant', alpha=1e-09, penalty='l2', l1_ratio=0, random_state=0)

# モデルの訓練/Train the model
model.fit(X_train_std, y_train)

In [6]:
# 6. モデルの評価/Evaluate the model
# 訓練データ、テストデータの住宅価格を予測/Predict housing prices on training and test data
y_train_pred = model.predict(X_train_std)
y_test_pred = model.predict(X_test_std)

# MSEの計算/Calculate MSE
print('MSE train: %.2f, test: %.2f' % (
        mean_squared_error(y_train, y_train_pred),
        mean_squared_error(y_test, y_test_pred)))

MSE train: 19.57, test: 34.04


* 重回帰より僅かに大きいMSEになりました。
* 重回帰は解析解なのでMSEは不変ですが、確率的勾配降下法回帰は、勾配降下法を用いた近似計算なので、学習率などのハイパーパラメータをチューニングすることで、MSEは上下します。
---
* The MSE is now slightly larger than the multiple regression.
* Multiple regression is an analytical solution, so the MSE is invariant, but stochastic gradient descent regression is an approximate calculation using gradient descent, so the MSE can go up or down by tuning hyperparameters such as the learning rate.