# Chainerの基礎
- 習得が簡単なインターフェイスで作られている
- 論文レベルでカスタマイズする際にとても柔軟に対応できる
- ChainerFamilyが充実してきている（ChainerRL, ChainerCV, ChainerMN）

In [1]:
# Chainer, Cupyのインストール
!curl https://colab.chainer.org/install | sh -

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
  0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0100  1379  100  1379    0     0  10858      0 --:--:-- --:--:-- --:--:-- 10858
+ apt -y -q install cuda-libraries-dev-9-2
Reading package lists...
Building dependency tree...
Reading state information...
cuda-libraries-dev-9-2 is already the newest version (9.2.148-1).
0 upgraded, 0 newly installed, 0 to remove and 7 not upgraded.
+ pip install -q cupy-cuda92  chainer 
+ set +ex
Installation succeeded!


In [0]:
import chainer

## リンクの定義

In [0]:
import chainer.links as L

In [0]:
import numpy as np

In [0]:
#シードの固定
np.random.seed(3)
#全結合層（Fully-connercted）
fc = L.Linear(3,2)

In [6]:
fc

<chainer.links.connection.linear.Linear at 0x7f44531bf6d8>

In [7]:
fc.W

variable W([[ 1.0326651 ,  0.25201908,  0.05571284],
            [-1.075888  , -0.16015016, -0.20482019]])

In [8]:
fc.b

variable b([0., 0.])

## 線形変換

In [9]:
x = np.array([[1,2,3]])
x.dtype

dtype('int64')

In [10]:
u = fc(x)

InvalidType: ignored

- int:整数
- float:小数

In [11]:
x = np.array([[1,2,3]],'f')
x.dtype

dtype('float32')

In [12]:
u = fc(x)
u

variable([[ 1.7038419, -2.010649 ]])

## 非線形変換

In [0]:
import chainer.functions as F

In [14]:
z = F.relu(u)
z

variable([[1.7038419, 0.       ]])

### 実践問題

#### 問題設定
入力`[1,2,3]`に対する出力`y`の値を計算して下さい。

#### 構成
- 左側のリンク: fc1 →(3,2)
- 右側のリンク: fc2 →(2,1)
- fc1の線形変換 →u1
- fc1の非線形変換(Relu) →z1
- fc2の線形変換 →出力y

In [15]:
np.random.seed(3)
x = np.array([[1,2,3]],'f')
fc1 = L.Linear(3,2)
fc2 = L.Linear(2,1)
u1 = fc1(x)
z1 = F.relu(u1)
y = fc2(z1)
y

variable([[-0.09968679]])

In [16]:
# 解答
np.random.seed(3)

fc1 = L.Linear(3,2)
fc2 = L.Linear(2,1)

x = np.array([[1,2,3]],'f')

u1 = fc1(x)
z1 = F.relu(u1)

y = fc2(z1)
y

variable([[-0.09968679]])

## 損失関数の計算

In [17]:
#教師データ
t = np.array([[3]],'f')
t

array([[3.]], dtype=float32)

In [18]:
#平均二乗誤差の計算
loss = F.mean_squared_error(t,y)
loss

variable(9.608059)