# Chainer の応用

前章で説明した Chainer を用いてネットワークを訓練するまでに必要なステップは、以下の 5 つでした。

- Step 1：データセットの準備
- Step 2：ネットワークの定義
- Step 3：目的関数を決める
- Step 4：最適化手法の選択
- Step 5：ネットワークの訓練

本章では、これらの各ステップに対して Chainer の機能を活用した工夫を加え、結果を改善する方法を解説します。

## Step 1 の改善: データセットの準備の工夫

前章で用いた iris データセットは、ndarray のままスライスを用いてミニバッチに分割し、ネットワークに入力したり、誤差の計算に用いたりしていました。
ここでは、Chainer が提供するいくつかのデータセットを扱うためのクラスを用いて同様のことを行ってみます。

まずはデータセットを scikit-learn を用いて取得しておきます。

In [1]:
from sklearn.datasets import load_iris

x, t = load_iris(return_X_y=True)

### TupleDataset

Chainer は `chainer.datasets` モジュール以下に色々なデータセットに対して用いられる便利なクラスが用意されています。
その一つが `TupleDataset` で、これは上で取得したような入力値を並べた配列と目標値を並べた配列を与えると、1 つ 1 つを取り出して対応するペアを作って返してくれるものです。

In [2]:
from chainer.datasets import TupleDataset

dataset = TupleDataset(x, t)

Chainer が提供する汎用のデータセットクラスは、ndarray をデータセットとして扱う場合と同様にして使えるよう、`[]` を使ったインデックスによる各データ（入力値と目標値のペタ）へのアクセスを可能としています。

それでは、1 つ目の入力値と目標値のペアを取り出してみます。

In [4]:
dataset[0]

(array([5.1, 3.5, 1.4, 0.2]), 0)

入力値と目標値を 1 つずつ持つタプルが返されました。
それでは、2 つのデータを取り出してみます。

In [5]:
dataset[:2]

[(array([5.1, 3.5, 1.4, 0.2]), 0), (array([4.9, 3. , 1.4, 0.2]), 0)]

`(入力値, 目標値)` というタプルを 2 つ持つリストが返されました。
このように、Python のリストで用いることができるスライスと同様の表記を Chainer のデータセットオブジェクトに対して用いることができます。

例えば、先頭から 1 つおきに 5 つのデータを取り出したい場合、

In [7]:
dataset[:10:2]

[(array([5.1, 3.5, 1.4, 0.2]), 0),
 (array([4.7, 3.2, 1.3, 0.2]), 0),
 (array([5. , 3.6, 1.4, 0.2]), 0),
 (array([4.6, 3.4, 1.4, 0.3]), 0),
 (array([4.4, 2.9, 1.4, 0.2]), 0)]

のような記述が可能です。

### SerialIterator

前章では、訓練データセットの順番を毎エポックシャッフルする方法として `np.random.permutation()` 関数が用いられていましたが、Chainer ではこのようなネットワークの訓練に際してよく行われるデータセットへの操作を抽象化した Iterator が提供されています。

Iteratorは、データセットオブジェクトを与えると、順番のシャッフルやバッチサイズ個だけデータをまとめて返すなどの操作を自動的に行なってくれるものです。
Python のイテレータと似たインターフェースを持ち、`next()` メソッドで順番にミニバッチを返してくれ、1 エポックが終了したら自動的にデータの順番をシャッフルしなおしてくれる便利なものです。

ここでは最もシンプルな Iterator である `SerialIterator` を紹介します。

In [13]:
from chainer.iterators import SerialIterator

iterator = SerialIterator(dataset, batch_size=4, repeat=True, shuffle=True)

iterator.next()

[(array([5.8, 2.8, 5.1, 2.4]), 2),
 (array([5.7, 2.6, 3.5, 1. ]), 1),
 (array([4.6, 3.1, 1.5, 0.2]), 0),
 (array([5.7, 3.8, 1.7, 0.3]), 0)]

## Step 2 の改善: ネットワーク構造の工夫

## Step 3 の改善: 目的関数の工夫

## Step 4 の改善: 最適化手法の工夫

## Step 5 の改善：ネットワークの訓練における工夫