# Introduction to Chainer

以下の内容を学習

https://docs.chainer.org/en/stable/tutorial/basic.html

In [16]:
import numpy as np
import chainer
from chainer import cuda, Function, gradient_check, report, training, utils, Variable
from chainer import datasets, iterators, optimizers, serializers
from chainer import Link, Chain, ChainList
import chainer.functions as F
import chainer.links as L
from chainer.training import extensions
#%matplotlib inline
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

### Trainer Example - MNIST Dataset Learning 

MNISTデータセットを使った多層パーセプトロンの学習でTrainerの使い方を学ぶ

今回使うデータセットは70000個の28 * 28サイズのグレイスケール画像と対応する数字ラベルからなる

また、デフォルトではそのうちの60000個が学習用・10000個がテスト用となっている

この画像を、28 * 28次元ベクトルとしたデータセットを以下のようにして取得できる

In [17]:
train, test = datasets.get_mnist()

このデータセットはTupleDataSetクラスのインスタンスがデータ数個含まれるArray

In [18]:
'グレイスケール画像部分  28*28次元ベクトルなので一部を表示'
train[0][0][150:200]
'数字ラベル'
train[0][1]

'グレイスケール画像部分  28*28次元ベクトルなので一部を表示'

array([ 0.        ,  0.        ,  0.01176471,  0.07058824,  0.07058824,
        0.07058824,  0.49411768,  0.53333336,  0.68627453,  0.10196079,
        0.65098041,  1.        ,  0.96862751,  0.49803925,  0.        ,
        0.        ,  0.        ,  0.        ,  0.        ,  0.        ,
        0.        ,  0.        ,  0.        ,  0.        ,  0.        ,
        0.        ,  0.11764707,  0.14117648,  0.36862746,  0.60392159,
        0.66666669,  0.99215692,  0.99215692,  0.99215692,  0.99215692,
        0.99215692,  0.88235301,  0.67450982,  0.99215692,  0.94901967,
        0.76470596,  0.25098041,  0.        ,  0.        ,  0.        ,
        0.        ,  0.        ,  0.        ,  0.        ,  0.        ], dtype=float32)

'数字ラベル'

5

これらデータセットに対してイテレータを定義する　データセットからデータを取り出す際のバッチサイズやシャッフルの有無を決められる

学習用データセットは毎epochごとにシャッフルされた状態で取り出したい　

テストデータはシャッフル不要　またデータセットを1周すれば問題ない

この場合、iterators.SerialIteratorが使える　以下のように書く

In [19]:
train_iter = iterators.SerialIterator(train, batch_size=100, shuffle=True)
test_iter = iterators.SerialIterator(train, batch_size=100, shuffle=False, repeat=False)

ここからNNの構造を作っていく

今回はシンプルな、1層100unit, 3層のrectifier networkを作る

In [20]:
class MLP(Chain):
    def __init__(self, n_units, n_out):
        super(MLP, self).__init__()
        with self.init_scope():
            self.l1 = L.Linear(None, n_units)
            self.l2 = L.Linear(None, n_units)
            self.l3 = L.Linear(None, n_out)
            
            
    def __call__(self, x):
        #層の結合結果に、活性化関数をかませる
        h1 = F.relu(self.l1(x))
        h2 = F.relu(self.l2(h1))
        y = self.l3(h2)
        return y

出力yが数字に対応する

さらに、loss値を求めたり、推定の正解率を算出するため、classifierチェインを定義する

In [21]:
class Classifier(Chain):
    def __init__(self, predictor):
        super(Classifier, self).__init__(self)
        with self.init_scope:
            self.predictor = predictor
            
    def __call__(self, x, t):
        y = self.predictor(x)
        loss = F.softmax_cross_entropy(y, t)
        accuracy = F.accuracy(y, t)
        report({'loss':loss, 'accuracy':accuracy})        
        return loss

このクラスは,コンストラクタで任意の分類機を設定することができる

その上で、テストデータ（今回はグレイスケール画像）と正解ラベルを与えて呼び出すと、学習機による推定結果と正解ラベルに対するloss値とaccuracyを計算し、loss値を返す

reportではloss値とaccuracyについて記録される　詳しくはReporterクラスへ

このClassifierクラスは、同様のものがchainer.links.Classifierに定義されている

以下ではこれを利用してすすめる


In [22]:
model = L.Classifier(MLP(100, 10))
optimizer = optimizers.SGD()
optimizer.setup(model)

#upodaterはイテレーションを回して勾配を更新する
updater = training.StandardUpdater(train_iter, optimizer)
#trainerはepochの設定、accuracy等の値のレポートを行う
trainer = training.Trainer(updater, (20, 'epoch'), out='result')
#updater = training.StandardUpdater(train_iter, optimizer)
#trainer = training.Trainer(updater, (20, 'epoch'), out='result')
trainer.extend(extensions.Evaluator(test_iter, model))
trainer.extend(extensions.LogReport())
#trainer.extend(extensions.PrintReport(['epoch', 'main/accuracy', 'validation/main/accuracy']))
trainer.extend(extensions.ProgressBar())
trainer.run()  



     total [..................................................]  0.83%
this epoch [########..........................................] 16.67%
       100 iter, 0 epoch / 20 epochs
       inf iters/sec. Estimated time to finish: 0:00:00.
     total [..................................................]  1.67%
this epoch [################..................................] 33.33%
       200 iter, 0 epoch / 20 epochs
    188.55 iters/sec. Estimated time to finish: 0:01:02.584363.
     total [#.................................................]  2.50%
this epoch [#########################.........................] 50.00%
       300 iter, 0 epoch / 20 epochs
    231.85 iters/sec. Estimated time to finish: 0:00:50.462803.
     total [#.................................................]  3.33%
this epoch [#################################.................] 66.67%
       400 iter, 0 epoch / 20 epochs
    247.96 iters/sec. Estimated time to finish: 0:00:46.781358.
     total [##.....................