# ニューラルネットワークの実装：回帰

この章では、分類と同じく教師あり学習のトピックである回帰についてもChainerで実装する方法を学びます。

## 問題設定

基本的には、分類と同じように実装することができます。分類の実装方法と違いを確認しながら進めていきます。

今回は、重回帰分析と同様の問題設定である家賃の予測に取り掛かります。


### 必要なモジュールの読み込み

下記の３つは解析の最初に読み込んでおくと便利ですので読み込んでおきます。

- Numpy
- Pandas
- Matplotlib

In [0]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

### データの読み込み

今回は[housing.csv]('data/housing.csv')を使用して回帰を実装します。ファイルをダウンロードし、**Colab Notebooks** という黄色のフォルダにの中に`data`というフォルダを作成し、その中にアップロードします。
アップロードできたら、データを確認します。


#### Driveのマウント

In [2]:
from google.colab import drive
drive.mount('/content/drive/')

Drive already mounted at /content/drive/; to attempt to forcibly remount, call drive.mount("/content/drive/", force_remount=True).


In [1]:
!ls drive/'My Drive'/'Colab Notebooks/data'

housing.csv  wine_class.csv


In [0]:
# CSVファイルの読み込み
df = pd.read_csv("drive/My Drive/Colab Notebooks/data/housing.csv")

In [10]:
df.head(3)

Unnamed: 0,x1,x2,x3,x4,x5,x6,x7,x8,x9,x10,x11,x12,x13,y
0,0.00632,18.0,2.31,0,0.538,6.575,65.2,4.09,1,296,15.3,396.9,4.98,24.0
1,0.02731,0.0,7.07,0,0.469,6.421,78.9,4.9671,2,242,17.8,396.9,9.14,21.6
2,0.02729,0.0,7.07,0,0.469,7.185,61.1,4.9671,2,242,17.8,392.83,4.03,34.7


データを確認したところ、今回は入力変数の数が13個であることがわかります。

## データの前準備
### 入力変数と教師データ（出力変数）に切り分ける

それでは、入力変数と教師データを切り分けていきます。  
Chainerで使用することも念頭に入れて、Pandasで部分抽出した後に、`.values`でNumpyの形式に変換します。  
また、回帰では入力変数と教師データともに実数値で扱うため、`float32`とします。`int32`ではエラーがでるので注意してください。

In [0]:
x = df.iloc[:, :-1].values.astype('f')
t = df.iloc[:, -1].values.astype('f')

In [12]:
x.shape

(506, 13)

In [13]:
t.shape

(506,)

ここで、回帰の際に注意しないといけないこととして、教師データのサイズが `(506,)` となっていますが、`(506, 1)` のように506行1変数ということを明確にできていないと`trainer.run()`のタイミングでエラーが出ます。  
逆に分類の場合は、`(506,)` のような形式が正しいため、区別して覚えておくことが重要です。  

正しく扱えるサイズにするため、Numpyの`reshape`を使用します。  
`t = t.reshape(506, 1)` のように数値を直接指定しても良いのですが、今後の汎用性も考えると、いろいろなデータに対応できる形式で記述しておきます。  
`len()` を用いてベクトルの長さを取得します。  

In [14]:
# ベクトルの長さを取得
len(t)

506

In [0]:
t = t.reshape(len(t), 1)

In [16]:
t.shape

(506, 1)

こちらで望ましい形式へと変換することができました。

### データセットの準備

分類の場合でも紹介した方法で、Chainerで扱える形式へと変換していきます。

In [0]:
# Chainerで使用できるデータセットの形式
dataset = list(zip(x, t))

### 訓練データ、検証データ、テストデータへ分割

ここからはChainer内のモジュールも使用しながら進めていきます。
基本的には、下記の３つを最初の段階で読み込んでおくと円滑に進められます。

In [0]:
import chainer
import chainer.links as L
import chainer.functions as F

訓練データの数は全体の70%とできるように、`n_train_val` にその数を計算して格納しておき、Chainer側で用意されている `split_dataset_random` を使用して、全体からランダムに70%を訓練データ、残りの30%を検証データとします。  

ここで、**ランダム**という言葉が出てきた際は**再現性の確保**ができているかに注意してください。  
`split_dataset_random`でも任意の引数として、`seed`があるため、しっかり固定しておきます。

In [0]:
n_train_val = int(len(dataset) * 0.7)
train_val, test = chainer.datasets.split_dataset_random(dataset, n_train_val, seed=1)

サンプル数を確認して、おかしな値が出ていないかは逐次確認します。

In [24]:
len(train_val)

354

In [25]:
len(test)

152

### 検証用（Validation）データの作成

先程作成した`train_val`を訓練用（`train`）データと検証用（`valid`）データに分割します。  
`train_valid`と`test`に分割したときと同様のやり方になります。


In [0]:
n_train = int(len(train_val) * 0.7)
train, valid = chainer.datasets.split_dataset_random(train_val, n_train, seed=1)

In [27]:
len(train)

247

In [28]:
len(valid)

107

## モデルの定義

回帰のモデル構築も前章の分類とほとんど同じ書き方でネットワークを定義することができます。  
基本的には、クラスの定義の部分は同じです。異なる部分は１変数の回帰の場合は出力 `n_out` の値が1になる点です。（複数の数値を予測するモデルを構築する際には`1`にならない場合もあります。）  
中間層のノードの数は５、活性化関数はrelu関数を使用します。つまり、`13->5->1` の流れになります。

In [0]:
class NN(chainer.Chain):

    # モデルの構造
    def __init__(self, n_mid_units=5, n_out=1):
        super().__init__()
        with self.init_scope():
            self.fc1 = L.Linear(None, n_mid_units)
            self.fc2 = L.Linear(None, n_out)            
            self.bn = L.BatchNormalization(13)
            
    # 順伝播
    def forward(self, x):
        h = self.fc1(self.bn(x))
        h = F.relu(h)
        h = self.fc2(h)
        return h

In [0]:
np.random.seed(0)

In [0]:
model = NN()

### 学習に必要な準備

Optimizer, Iteratorなどを定義して学習を実行します。  
基本的な記述内容は同じです。

In [0]:
optimizer = chainer.optimizers.SGD().setup(model)

In [0]:
batchsize = 10
train_iter = chainer.iterators.SerialIterator(train, batchsize)
valid_iter  = chainer.iterators.SerialIterator(valid,  batchsize, repeat=False, shuffle=False)
test_iter  = chainer.iterators.SerialIterator(test,  batchsize, repeat=False, shuffle=False)

In [0]:
epoch = 30

In [0]:
from chainer.dataset import concat_examples

### 学習ループの記述

前章までは分類の実装だったため、モデルの評価には`Accuracy`（正解率）を採用してきました。  
ですが、回帰の場合は正解率は使用せずに`mean_squared_error`（平均2乗誤差）を用いることが基本的です。  
また、パラメータの更新のための損失関数にも`mean_squared_error`（平均2乗誤差）を用います。  

そのため、`loss`の計算には`F.mean_squared_error`を使用します。

In [53]:
train_iter.reset()
valid_iter.reset()

while train_iter.epoch < epoch: 
  

  #　------------  学習の1イテレーション  ------------
  
  # データの取得
  train_batch = train_iter.next()
  x_train, t_train = concat_examples(train_batch)


  # 予測値の計算
  y_train = model(x_train)

  # ロスの計算
  loss_train = F.mean_squared_error(y_train, t_train)

  # 勾配の計算
  model.cleargrads()
  loss_train.backward()

  # パラメータの更新
  optimizer.update()


  
  print('epoch:{:02d} train_loss:{:.04f} '.format(train_iter.epoch, loss_train.data, end=''))
  
#   ----------------  ここまで  ----------------   


  if train_iter.is_new_epoch: # 新しいエポックに入った時のみ計算

    while True:
      # 検証データの取得   
      valid_batch = valid_iter.next() # 追加
      x_valid, t_valid = concat_examples(valid_batch)

     # 検証用データで順伝播の計算を実行
      with chainer.using_config('train', False), chainer.using_config('enable_backprop', False):
        y_valid = model(x_valid)


      # 検証データで損失関数を計算
      loss_valid = F.mean_squared_error(y_valid, t_valid)

      if valid_iter.is_new_epoch: # 追加：1エポック計算し終わると、イテレーターをリセット
        valid_iter.reset()
        break

     # 結果を表示  
    print('valid_loss:{:.04f}'.format(loss_valid.data))
    print('---')

epoch:00 train_loss:702.5154 
epoch:00 train_loss:321.9022 
epoch:00 train_loss:361.5048 
epoch:00 train_loss:285.1848 
epoch:00 train_loss:274.7160 
epoch:00 train_loss:129.9252 
epoch:00 train_loss:103.9347 
epoch:00 train_loss:83.1562 
epoch:00 train_loss:74.3521 
epoch:00 train_loss:69.2438 
epoch:00 train_loss:84.5675 
epoch:00 train_loss:257.4215 
epoch:00 train_loss:437.5584 
epoch:00 train_loss:445.4826 
epoch:00 train_loss:470.2078 
epoch:00 train_loss:337.9275 
epoch:00 train_loss:546.5707 
epoch:00 train_loss:93.5810 
epoch:00 train_loss:142.9045 
epoch:00 train_loss:90.9780 
epoch:00 train_loss:286.4223 
epoch:00 train_loss:629.7201 
epoch:00 train_loss:607.7008 
epoch:00 train_loss:529.9941 
epoch:01 train_loss:574.2902 
valid_loss:228.6444
---
epoch:01 train_loss:164.0793 
epoch:01 train_loss:240.5096 
epoch:01 train_loss:77.3323 
epoch:01 train_loss:27.1732 
epoch:01 train_loss:50.0803 
epoch:01 train_loss:90.8763 
epoch:01 train_loss:35.0075 
epoch:01 train_loss:29.8944

## 回帰の学習結果の確認

単純に`loss`の値がどれほど減少しているかで、学習がどのように行われているか考察することが可能です。  

正確にどれほど、モデルがうまく学習できているのかを理解するには、平均2乗誤差で算出された値に対して、平方し2乗を取り除いた値から確認することができます。  

Numpyの`sqrt()`関数を使用すれば簡単に算出することが可能です。  

In [57]:
np.sqrt(14.1377)

3.7600132978488254

学習済みモデルの保存やロード、学習済みモデルを使用した推論方法は分類とほとんど同じになります。

次章では、学習をよりシンプルに実装し、学習結果を容易に可視化することを可能にする`Trainer`について解説します。