# ニューラルネットワークの実装：分類

この章では、前章でお伝えしたSequentialではなく、Classを用いたディープラーニングの実装方法をお伝えします。Class内にネットワーク構造を定義していく部分が大きく異なります。

本章から読み始める方もいるかと思いますので、前章と重複のある部分もしっかりと説明しています。


## 問題設定

今回は**ワインの分類**を行います。入力変数として、ワインに含まれる10種類の化合物を使用します。そして、そのワインに対して、1等級、2等級、3等級と3クラスの分類になっています。

### データの読み込み


今回は[wine_class.csv]('data/wine_class.csv')を使用して回帰を実装します。  
ファイルをダウンロードし、**Colab Notebooks** という黄色のフォルダにの中に`data`というフォルダを作成し、その中にアップロードします。  
アップロードできたら、データを確認します。


#### Driveのマウント




In [1]:
from google.colab import drive
drive.mount('/content/drive/')

Go to this URL in a browser: https://accounts.google.com/o/oauth2/auth?client_id=947318989803-6bn6qk8qdgf4n4g3pfee6491hc0brc4i.apps.googleusercontent.com&redirect_uri=urn%3Aietf%3Awg%3Aoauth%3A2.0%3Aoob&scope=email%20https%3A%2F%2Fwww.googleapis.com%2Fauth%2Fdocs.test%20https%3A%2F%2Fwww.googleapis.com%2Fauth%2Fdrive%20https%3A%2F%2Fwww.googleapis.com%2Fauth%2Fdrive.photos.readonly%20https%3A%2F%2Fwww.googleapis.com%2Fauth%2Fpeopleapi.readonly&response_type=code

Enter your authorization code:
··········
Mounted at /content/drive/


In [2]:
!ls drive/'My Drive'/'Colab Notebooks/data'

wine_class.csv


フォルダの中にファイルを確認することができました。  
ファイルを展開し、中身を確認します。

In [0]:
import pandas as pd
import numpy as np

In [0]:
# CSVファイルの読み込み
df = pd.read_csv("drive/My Drive/Colab Notebooks/data/wine_class.csv")

In [5]:
# データの表示（先頭の３件）
df.head(3)

Unnamed: 0,Class,Alcohol,Ash,Alcalinity of ash,Magnesium,Total phenols,Flavanoids,Nonflavanoid phenols,Color intensity,Hue,Proline
0,1,14.23,2.43,15.6,127,2.8,3.06,0.28,5.64,1.04,1065
1,1,13.2,2.14,11.2,100,2.65,2.76,0.26,4.38,1.05,1050
2,1,13.16,2.67,18.6,101,2.8,3.24,0.3,5.68,1.03,1185


In [6]:
df.shape

(178, 11)

## データの前準備

この節では前章で取り扱った内容を復習を兼ねてもう一度一つ一つ確認していきます。

### 入力変数と教師データ（出力変数）に切り分ける

機械学習のプログラミングを行う上での最初のお題として、入力変数と教師データ（出力変数）の切り分けがあります。  
こちらは、毎回行うため、スムーズに出来るように練習しておくことをおすすめします。

In [0]:
# 教師データ（先頭のClass）
t = df.iloc[:, 0]
 
# 入力変数（1番目から最後まで）
x = df.iloc[:, 1:]

こちらのように、正しく切り分けられているかデータの中身を表示して確認します。

In [8]:
# 表示して確認
x.head(3)

Unnamed: 0,Alcohol,Ash,Alcalinity of ash,Magnesium,Total phenols,Flavanoids,Nonflavanoid phenols,Color intensity,Hue,Proline
0,14.23,2.43,15.6,127,2.8,3.06,0.28,5.64,1.04,1065
1,13.2,2.14,11.2,100,2.65,2.76,0.26,4.38,1.05,1050
2,13.16,2.67,18.6,101,2.8,3.24,0.3,5.68,1.03,1185


In [9]:
# サイズの確認
x.shape

(178, 10)

`.shape`を使うことで、サンプル数（今回は178）と入力変数の数（今回は10）を確認することができます。

### Chainerで計算できるデータ形式に変換

前章でもお伝えしましたが、Chainerで計算を行うために、下記の３点を満たしている必要があります。
再度確認します。

- 入力変数や教師データがNumpyで定義されているか
- 分類の場合、ラベルが0から始まっているか
- 入力変数が `float32`、教師データが回帰の場合 `float32`、分類の場合 `int32` で定義されているか

#### Numpyに変換

Pandasで読み込んだ場合、Pandasの形式となっています。

In [10]:
type(x)

pandas.core.frame.DataFrame

そのため、こちらをNumpyの形式に変換するのは、`.values`とつければ大丈夫です。

In [11]:
type(x.values)

numpy.ndarray

#### 分類で使用するラベルを0から始める

今回準備されている教師データのラベルを確認してみます。
`min`と`max`で確認すると良いです。

In [12]:
t.min()

1

In [13]:
t.max()

3

今回はラベルが`1`から始まって`3`で終わっているため、`1, 2, 3`というラベルが割り振られた3クラスの分類であることがわかります。
0から始める必要があるため、`1, 2, 3` → `0, 1, 2` とします。

Numpyでは、全体に対する引き算もサポートしているため、`t-1`とすればラベル全体に1が引かれ、`0, 1, 2`となります。

In [0]:
# Numpyにデータ型を変換し、ラベルを0から始める
t = t.values - 1
x = x.values

In [15]:
type(t)

numpy.ndarray

In [16]:
type(x)

numpy.ndarray

#### データ型を変更

現状のデータ型を確認してみます。

In [17]:
x.dtype

dtype('float64')

In [18]:
t.dtype

dtype('int64')

このように、本来であれば`32bit`型で指定しないといけないところを`64bit`版のコンピュータであれば、デフォルトが`64bit`型で定義されてしまうため、変更する必要があります。

Numpy側で準備されている`.astype()`を使用して、`32bit`型へと変換します。

In [0]:
# 32bitに変換
x = x.astype('float32')
t = t.astype('int32')

In [20]:
x.dtype

dtype('float32')

In [21]:
t.dtype

dtype('int32')

### Chainerで使用するデータセットの形式

メモリに乗る程度の小規模なデータの場合は、**入力変数と教師データをタプルで１セット**にし、それを**リスト化**しておくことがChainer推奨の形式です。

![](images/3-5/img02.png)

In [0]:
# Chainerで使用できるデータセットの形式
dataset = list(zip(x, t))

このように、`zip(x, t)`で入力変数と教師データをタプル化した後、それを`list`でリスト化します。

### 訓練データ、検証データ、テストデータに分割

機械学習には欠かせない訓練データ、検証データ、テストデータへの分割です。  
Chainerでは`chainer.datasets.split_dataset_random`にその機能が準備されています。  
ランダムでなく、前半の70%を訓練、後半の30%を検証といった分割が良い場合は、  
`chainer.datasets.split_dataset`を使用することができます。   

※ 詳しくは[こちら](https://docs.chainer.org/en/v5.0.0/reference/generated/chainer.datasets.split_dataset_random.html#chainer.datasets.split_dataset_random)のリファレンス参照


引数には`dataset`（先ほど作成した形式）、`first_size`と指定されています。

`first_size`では訓練データのサイズを指定するのですが、このとき全体の70%を訓練データと検証データにしようと決めておくと、記述が簡単かつ汎用性の高いプログラムになります。

全体のサイズを取得する時には`len()`が便利です。

In [24]:
len(dataset)

178

`split_dataset_random`を使用した`train_val`と`test`の分割は以下のようになります。

In [0]:
import chainer

In [0]:
n_train_val = int(len(dataset) * 0.7)
train_val, test = chainer.datasets.split_dataset_random(dataset, n_train_val, seed=1)

`n_train_val`を計算する際`int`と付けていますが、サイズは整数値しか受け付けません。小数が出たときは`int`によって小数値の切り捨てを行っています。

`seed=1`は、乱数のシードを1で固定しますという意味で、何度か出てきた**再現性確保**のためです。

出力として得られる`train_val`と`test`を確認します。

In [27]:
train_val

<chainer.datasets.sub_dataset.SubDataset at 0x7fb530bdcb00>

In [28]:
test

<chainer.datasets.sub_dataset.SubDataset at 0x7fb530b3ea90>

こちらのように数値が表示されず、どのような形式であるか迷いますが、`train_val[0]`のようにリストの要素番号を指定すると数値が表示され、リスト形式で保存されていることがわかります。
このあたりは、なかなかリファレンスがないため、挙動を確認しながら進めていくことが必要です。

In [29]:
train_val[0]

(array([1.369e+01, 2.540e+00, 2.000e+01, 1.070e+02, 1.830e+00, 5.600e-01,
        5.000e-01, 5.880e+00, 9.600e-01, 6.800e+02], dtype=float32), 2)

In [30]:
len(train_val)

124

In [31]:
len(test)

54

### 検証用（Validation）データの作成

先程作成した`train_val`を訓練用（`train`）データと検証用（`valid`）データに分割します。  
`train_valid`と`test`に分割したときと同様の方法で行います。


In [0]:
n_train = int(len(train_val) * 0.7)
train, valid = chainer.datasets.split_dataset_random(train_val, n_train, seed=1)

In [33]:
len(train)

86

In [34]:
len(valid)

38

## モデルの定義

それでは、分類を行うためのニューラルネットワークの定義を行います。

- 入力変数：10
- 分類数：3

10 → 5 → 3 のニューラルネットワークを組みます。

### Chainを継承したネットワークの定義

Chainerでは、ネットワークは`Chain`クラスを継承したクラスとして定義されることが一般的です。  


#### Chainクラス

Chainは、パラメータを持つ層（`Link`）をまとめておくためのクラスです。  
パラメータを持つということは、基本的にネットワークの学習の際にそれらを更新していく必要があるということです（更新されないパラメータを持たせることもできます）。  

モデルのパラメータの更新は、`Optimizer`が担います。  
その際、更新すべき全てのパラメータを簡単に発見できるように、Chainで一箇所にまとめておきます。  
そうすると、`Chain.params()`メソッドを使って更新されるパラメータ一覧が簡単に取得できます。  


#### ネットワークの定義

今回`Chain`を継承することで、10 → 5 → 3 のニューラルネットワークは下記のように定義することができます。  

前章で紹介した`sequential`を使用したネットワークの定義の方法では、1方向の連続的な流れを表すネットワークを記述する際にはシンプルに記載することができました。  

しかし、Chainを継承したネットワークの定義方法ではより複雑なネットワークを記述することが可能になります。

In [0]:
import chainer.links as L
import chainer.functions as F

In [0]:
class NN(chainer.Chain):

    # モデルの構造
    def __init__(self):
        super().__init__()
        with self.init_scope():
            self.fc1 = L.Linear(10, 5)  # 10 → 5
            self.fc2 = L.Linear(5, 3)  # 5 → 3

    # 順伝播
    def forward(self, x):
        u1 = self.fc1(x)
        z1 = F.relu(u1)
        u2 = self.fc2(z1)
        return u2

こちらのように、`__init__`にパラメータを持つリンクを宣言、つまり、モデルの構造を定義します。  
`forward`の中には順伝播の計算を記述します。  

定義したクラスの中身を確認します。  
継承した`NN`クラス内で`with self.init_scope()`が呼ばれており、その中でネットワークに登場する`Link`（具体的には、全結合層の`L.Linear`）が定義されています．このような形で記述することで、`Optimizer`はこれらが最適化対象となるパラメータを持つ層であると自動的に解釈してくれるようになります。
（継承とはクラス機能を再利用したり、追加できる機能をさします。）


In [0]:
# クラスのインスタンス化
model = NN()

また、`forward`というメソッドには、関数の名前の通り、ネットワークの順伝播を記述します。  
`forward`の引数としてデータ`x`を受け取り、出力として順伝播の計算結果を返すようにすることで、上記のように`NN`クラスをインスタンス化して作成されたオブジェクトを、関数のように使えるようになります。（例：`output = net(data)`）


### クラスの定義のブラッシュアップ

これが一番簡単な書き方ですが、さらに上級者向けの書き方にブラッシュアップしていきます。
まずは、ノードの数を変更するためにはクラス内部を変更する必要がありますが、ここを変数で置き換えて、インスタンス化のタイミングで自由に変更できるようにしておきます。

下記のように変数の初期値も設定しておくと、インスタンス化の際に何も指定しない場合にデフォルトの値が使用され便利です。

In [0]:
class NN(chainer.Chain):

    # モデルの構造
    def __init__(self, n_mid_units=5, n_out=3):
        super().__init__()
        with self.init_scope():
            self.fc1 = L.Linear(10, n_mid_units)  # 変数で置き換え
            self.fc2 = L.Linear(5, n_out)  # 変数で置き換え

    # 順伝播
    def __call__(self, x):
        u1 = self.fc1(x)
        z1 = F.relu(u1)
        u2 = self.fc2(z1)
        return u2

つぎに、`L.Linear`の最初の引数は、`None`と指定することで、入力されるデータから自動的に判断することができるため、手動で入力しなくても良いです。
今回はノードの数を簡単に把握することができるため、その恩恵は少ないのですが、この後登場する画像向けのConvolutional Neural Networkなどでは、この機能が活躍します。

In [0]:
class NN(chainer.Chain):

    # モデルの構造
    def __init__(self, n_mid_units=5, n_out=3):
        super().__init__()
        with self.init_scope():
            self.fc1 = L.Linear(None, n_mid_units)  # 10 → None で自動推定
            self.fc2 = L.Linear(None, n_out)  # 5 → None で自動推定

    # 順伝播
    def __call__(self, x):
        u1 = self.fc1(x)
        z1 = F.relu(u1)
        u2 = self.fc2(z1)
        return u2

さらに、順伝播の計算は層の数がさらに増えてくると、変数名の管理が難しくなってくるため、`h`という変数で受け渡し続けると管理する部分が減ります。

In [0]:
class NN(chainer.Chain):

    # モデルの構造
    def __init__(self, n_mid_units=5, n_out=3):
        super().__init__()
        with self.init_scope():
            self.fc1 = L.Linear(None, n_mid_units)
            self.fc2 = L.Linear(None, n_out)

    # 順伝播
    def __call__(self, x):
        h = self.fc1(x)  # hで置きかえ
        h = F.relu(h)  # hで置きかえ
        h = self.fc2(h)  # hで置きかえ
        return h

モデルの定義が完了したため、もう一度インスタンス化します。  
インスタンス化を行うとリンクの重みが定義されるため、  
インスタンス化を実行する前にランダムシードの固定を行う事を忘れないように注意しましょう。

In [0]:
# シードの固定
np.random.seed(1)

In [0]:
model = NN()  # 引数を指定しないため、デフォルトの n_mid_units=5, n_out=3 が使用される

もし、引数にデフォルトの値を使用しない場合は下記のように指定します。

In [0]:
# model = NN(n_mid_units=10, n_out=3)

### Optimizerの定義

Optimizerではパラメータの最適化を行うための最適化のアルゴリズムを選択します。

In [0]:
from chainer import optimizers

optimizer = optimizers.SGD(lr=0.01).setup(model) # 確率的勾配降下法（SGD）を使用

#### 学習率（learning rate）

今回は`SGD`の`lr`という引数に`0.01`を与えました。  
この値は学習率として知られ、モデルをうまく訓練して良いパフォーマンスを発揮させるために調整する必要がある重要なハイパーパラメータとして知られています。  
ハイパーパラメータは学習されるパラメータとは異なり人が手で与える学習の設定に関するものやネットワークの構造に関するもののことを指します。

### Iteratorの定義

前章と同様にミニバッチを使用しての学習を実行するため、Iteratorを使用して、データをミニバッチに区切って学習を行います。  

訓練用データは下記のようにミニバッチに分けられ学習が行われます。  

- データセット：86サンプル
- バッチサイズ：10
- ミニバッチの数：9（86/10 端数は補完される）
- Epoch数：10
- Iteration数：90（9×10）



In [0]:
batchsize = 10

In [0]:
train_iter = chainer.iterators.SerialIterator(train, batchsize)
valid_iter  = chainer.iterators.SerialIterator(valid,  batchsize, repeat=False, shuffle=False)
test_iter  = chainer.iterators.SerialIterator(test,  batchsize, repeat=False, shuffle=False)

In [0]:
epoch = 30

### 学習ループの実行


In [0]:
from chainer.dataset import concat_examples

In [289]:
train_iter.reset()
valid_iter.reset()

while train_iter.epoch < epoch:
  

  #　------------  学習の1イテレーション  ------------
  
  # データの取得
  train_batch = train_iter.next()
  x_train, t_train = concat_examples(train_batch)


  # 予測値の計算
  y_train = model(x_train)

  # ロスの計算
  loss_train = F.softmax_cross_entropy(y_train, t_train)

  # 勾配の計算
  model.cleargrads()
  loss_train.backward()

  # パラメータの更新
  optimizer.update()

  # 検証データで精度を計算
  accuracy_train = F.accuracy(y_train, t_train)

  
  print('epoch:{:02d} train_accuracy:{:.04f} '.format(train_iter.epoch, accuracy_train.data, end=''))
  
#   ----------------  ここまで  ----------------   


  if train_iter.is_new_epoch: # 新しいエポックに入った時のみ計算

    while True:
      # 検証データの取得   
      valid_batch = valid_iter.next()
      x_valid, t_valid = concat_examples(valid_batch)

     # 検証用データで順伝播の計算を実行
      with chainer.using_config('train', False), chainer.using_config('enable_backprop', False):
        y_valid = model(x_valid)


      # 検証データで損失関数を計算
      loss_valid = F.softmax_cross_entropy(y_valid, t_valid)

      # 検証データで精度を計算
      accuracy_valid = F.accuracy(y_valid, t_valid)

      if valid_iter.is_new_epoch: # 追加：1エポック計算し終わると、イテレーターをリセット
        valid_iter.reset()
        break

     # 結果を表示  
    print('valid_loss:{:.04f} valid_accuracy:{:.04f}'.format(loss_valid.data, accuracy_valid.data))
    print('---')

epoch:00 train_accuracy:0.4000 
epoch:00 train_accuracy:0.5000 
epoch:00 train_accuracy:0.4000 
epoch:00 train_accuracy:0.4000 
epoch:00 train_accuracy:0.2000 
epoch:00 train_accuracy:0.2000 
epoch:00 train_accuracy:0.3000 
epoch:00 train_accuracy:0.3000 
epoch:01 train_accuracy:0.3000 
valid_loss:1.0985 valid_accuracy:0.6250
---
epoch:01 train_accuracy:0.6000 
epoch:01 train_accuracy:0.4000 
epoch:01 train_accuracy:0.5000 
epoch:01 train_accuracy:0.3000 
epoch:01 train_accuracy:0.2000 
epoch:01 train_accuracy:0.1000 
epoch:01 train_accuracy:0.2000 
epoch:01 train_accuracy:0.2000 
epoch:02 train_accuracy:0.4000 
valid_loss:1.0985 valid_accuracy:0.6250
---
epoch:02 train_accuracy:0.4000 
epoch:02 train_accuracy:0.3000 
epoch:02 train_accuracy:0.5000 
epoch:02 train_accuracy:0.4000 
epoch:02 train_accuracy:0.4000 
epoch:02 train_accuracy:0.6000 
epoch:02 train_accuracy:0.4000 
epoch:03 train_accuracy:0.1000 
valid_loss:1.0984 valid_accuracy:0.6250
---
epoch:03 train_accuracy:0.3000 
epoc

学習は正常に行われていることが確認できました。  
訓練データに対しての正解率が概算して約40%弱、検証データに対して約60%程度にとどまっています。  

## うまくいかないときの対処

今回は一通りの流れを説明しましたが、まだまだ精度が良くないと不満に思った方もいるかと思います。
ここからは試行錯誤の世界になるのですが、まずいちばん手っ取り早く精度を上げることが出来る方法として、**BatchNormalization**が挙げられます。

実装としては、各バッチ毎に、平均と標準偏差を定めて正規化を行うといった非常に簡単な手法なのですが、これをかませることによって、各変数感のスケールによる差を吸収できます。

BatchNormalizationの詳しい説明は[こちら](https://qiita.com/cfiken/items/b477c7878828ebdb0387)をご覧ください。


それでは、BatchNormazliationがある場合で試してみます。

宣言していたニューラルネットワークのクラスを以下のように変更して、もう一度学習を行ってみます。

In [0]:
class NN(chainer.Chain):

    # モデルの構造
    def __init__(self, n_mid_units=5, n_out=3):
        super().__init__()
        with self.init_scope():
            self.fc1 = L.Linear(None, n_mid_units)
            self.fc2 = L.Linear(None, n_out)
            self.bn = L.BatchNormalization(10)  # Batch Normalizationは平均と分散がパラメータ

    # 順伝播
    def forward(self, x):
        h = self.bn(x)  # Batch Normalizationの処理を追加
        h = self.fc1(h)
        h = F.relu(h)
        h = self.fc2(h)
        return h

In [0]:
# 乱数のシードを固定
np.random.seed(1)

# モデルのインスタンス化
model = NN()

# Optimizerの定義
optimizer = chainer.optimizers.SGD().setup(model)  # modelと紐付ける

# Iteratorの定義
batchsize = 10
train_iter = chainer.iterators.SerialIterator(train, batchsize)
valid_iter = chainer.iterators.SerialIterator(valid, batchsize, repeat=False, shuffle=False)
test_iter = chainer.iterators.SerialIterator(test, batchsize, repeat=False, shuffle=False)

# trainerとそのextensionsの設定
epoch = 30

In [292]:
train_iter.reset()
valid_iter.reset()

while train_iter.epoch < epoch: # 追加
  

  #　------------  学習の1イテレーション  ------------
  
  # データの取得
  train_batch = train_iter.next() # 追加
  x_train, t_train = concat_examples(train_batch)


  # 予測値の計算
  y_train = model(x_train)

  # ロスの計算
  loss_train = F.softmax_cross_entropy(y_train, t_train)

  # 勾配の計算
  model.cleargrads()
  loss_train.backward()

  # パラメータの更新
  optimizer.update()

  # 検証データで精度を計算
  accuracy_train = F.accuracy(y_train, t_train)

  
  print('epoch:{:02d} train_accuracy:{:.04f} '.format(train_iter.epoch, accuracy_train.data, end=''))
  
#   ----------------  ここまで  ----------------   


  if train_iter.is_new_epoch: # 新しいエポックに入った時のみ計算

    while True:
      # 検証データの取得   
      valid_batch = valid_iter.next() # 追加
      x_valid, t_valid = concat_examples(valid_batch)

     # 検証用データで順伝播の計算を実行
      with chainer.using_config('train', False), chainer.using_config('enable_backprop', False):
        y_valid = model(x_valid)


      # 検証データで損失関数を計算
      loss_valid = F.softmax_cross_entropy(y_valid, t_valid)

      # 検証データで精度を計算
      accuracy_valid = F.accuracy(y_valid, t_valid)

      if valid_iter.is_new_epoch: # 追加：1エポック計算し終わると、イテレーターをリセット
        valid_iter.reset()
        break

     # 結果を表示  
    print('valid_loss:{:.04f} valid_accuracy:{:.04f}'.format(loss_valid.data, accuracy_valid.data))
    print('---')

epoch:00 train_accuracy:0.0000 
epoch:00 train_accuracy:0.2000 
epoch:00 train_accuracy:0.0000 
epoch:00 train_accuracy:0.1000 
epoch:00 train_accuracy:0.3000 
epoch:00 train_accuracy:0.2000 
epoch:00 train_accuracy:0.2000 
epoch:00 train_accuracy:0.8000 
epoch:01 train_accuracy:0.0000 
valid_loss:0.7762 valid_accuracy:0.6250
---
epoch:01 train_accuracy:0.1000 
epoch:01 train_accuracy:0.1000 
epoch:01 train_accuracy:0.0000 
epoch:01 train_accuracy:0.5000 
epoch:01 train_accuracy:0.0000 
epoch:01 train_accuracy:0.2000 
epoch:01 train_accuracy:0.3000 
epoch:01 train_accuracy:0.3000 
epoch:02 train_accuracy:0.2000 
valid_loss:1.0437 valid_accuracy:0.8750
---
epoch:02 train_accuracy:0.5000 
epoch:02 train_accuracy:0.1000 
epoch:02 train_accuracy:0.4000 
epoch:02 train_accuracy:0.3000 
epoch:02 train_accuracy:0.0000 
epoch:02 train_accuracy:0.5000 
epoch:02 train_accuracy:0.6000 
epoch:03 train_accuracy:0.3000 
valid_loss:1.0700 valid_accuracy:0.5000
---
epoch:03 train_accuracy:0.1000 
epoc

検証データに対する正解率の値が上がっていればうまくバッチノーマリゼーションがうまく適応されています。  

このように、ディープラーニングでは、BatchNormalizationを含めた細かなポイントがあったりするため、調べながら進めてみてください。  

Chainerでは、ほとんどの機能がすでに実装されているため、上記のコードのように少し付け加えるだけでその効果を検証できるため、非常に便利です。

こちらでmodelsのフォルダ内に `wine.npz` というファイルができていれば学習済みモデルの保存が完了です。

## 学習済みモデルを使用した推論

## 学習済みモデルを保存

前章と同様に`chainer.serializers.save_npz('ファイル名.npz', model)`を使用して学習済みモデルを保存します。

In [0]:
chainer.serializers.save_npz('wine.npz', model)

In [294]:
!ls

drive  my_iris.model  sample_data  wine.npz


### 学習済みモデルのロード

学習済みモデルは単にファイルをロードするだけでなく、まずはモデルの構造を明示しておき、そのモデルに対して、パラメータの値を当てはめながらロードしていくことになります。

In [0]:
model = NN()

In [0]:
chainer.serializers.load_npz('wine.npz', model)

### 予測値の計算

今回はテストデータ一番最初のサンプルに対する予測値を計算します。

In [0]:
x_test, t_test = test[0]

In [303]:
# 予測値の計算
with chainer.using_config('train', False), chainer.using_config('enable_backprop', False):
  y = model(x_test)

InvalidType: ignored

推論で使用する際には、`(バッチサイズ, 入力変数の数)` という形式となっていないとエラーが起きます。
今回であれば、`(1, 10)`が望ましいデータの形といえます。

In [0]:
x_test = x_test[np.newaxis]

In [305]:
x_test.shape

(1, 10)

In [306]:
# 予測値の計算
with chainer.using_config('train', False), chainer.using_config('enable_backprop', False):
  y = model(x_test)
y

variable([[-0.01799808,  0.72122264, -0.16773805]])

In [307]:
y = F.softmax(y)
y

variable([[0.2528295 , 0.52950156, 0.21766897]])

In [308]:
y.array

array([[0.2528295 , 0.52950156, 0.21766897]], dtype=float32)

In [309]:
np.argmax(y.array)

1

In [310]:
t_test

1

このように学習済みモデルを使用した推論を実行できました。

次章では、回帰の実装方法についてお伝えします。分類とほとんど同じような実装方法となっております。