# Sprint ディープラーニングフレームワーク2

In [1]:
# import warnings
# warnings.filterwarnings('ignore')

In [2]:
import tensorflow as tf
tf.__version__

'2.0.0'

## 1.このSprintについて

### Sprintの目的
- フレームワークのコードを読めるようにする
- フレームワークを習得し続けられるようになる
- 理論を知っている範囲をフレームワークで動かす

### どのように学ぶか
前半はTensorFlowのExampleを動かします。後半ではKerasのコードを書いていきます。

## 2.公式Example

深層学習フレームワークには公式に様々なモデルのExampleコードが公開されています。

### 【問題1】公式チュートリアルモデルを分担して実行
TensorFLowの公式チュートリアルモデルを分担して実行してください。

以下の中から1人ひとつ選び実行し、その結果を簡単に発表してください。

[models/tutorials at master · tensorflow/models](https://www.tensorflow.org/tutorials/)

- 実行したファイル
[image segmentation](https://colab.research.google.com/drive/1ko1JaJFFoO64dgwML3hWOWvWpveQnyPt#scrollTo=cZCM65CBt1CJ)

- ベースとなっているモデル　:  U-net [参考](https://qiita.com/hiro871_/items/871c76bf65b76ebe1dd0)

【問題2】（アドバンス課題）様々な手法を実行
TensorFLowやGoogle AI ResearchのGitHubリポジトリには、定番のモデルから最新のモデルまで多様なコードが公開されています。これらから興味あるものを選び実行してください。

なお、これらのコードは初学者向けではないため、巨大なデータセットのダウンロードが必要な場合など、実行が簡単ではないこともあります。そういった場合は、コードリーディングを行ってください。

[models/research at master · tensorflow/models](https://github.com/tensorflow/models/tree/master/research)

[google-research/google-research: Google AI Research](https://github.com/google-research/google-research)

更新日が古いものはPythonやTensorFlowのバージョンが古く、扱いずらい場合があります。新しいものから見ることを推奨します。

## 3.異なるフレームワークへの書き換え

「ディープラーニングフレームワーク1」で作成した4種類のデータセットを扱うTensorFLowのコードを異なるフレームワークに変更していきます。

- Iris（Iris-versicolorとIris-virginicaのみの2値分類）
- Iris（3種類全ての目的変数を使用して多値分類）
- House Prices
- MNIST

### Kerasへの書き換え
KerasはTensorFLowに含まれるtf.kerasモジュールを使用してください。

KerasにはSequentialモデルかFunctional APIかなど書き方に種類がありますが、これは指定しません。

### 【問題3】Iris（2値分類）をKerasで学習
TensorFlowによるIrisデータセットに対する2値分類をKerasに書き換えてください。

In [3]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
# データセットの読み込み
dataset_path ="/Users/ikeda/Desktop/dive/diveintocode-ml/Downlowd_data/datasets_19_420_Iris.csv"
df = pd.read_csv(dataset_path)
# データフレームから条件抽出
df = df[(df["Species"] == "Iris-versicolor")|(df["Species"] == "Iris-virginica")]
y = df["Species"]
X = df.loc[:, ["SepalLengthCm", "SepalWidthCm", "PetalLengthCm", "PetalWidthCm"]]
y = np.array(y)
X = np.array(X)
# ラベルを数値に変換
y[y=='Iris-versicolor'] = 0
y[y=='Iris-virginica'] = 1
y = y.astype(np.int)[:, np.newaxis]
# trainとtestに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# さらにtrainとvalに分割
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=0)

# ハイパーパラメータの設定
learning_rate = 0.01
batch_size = 10
num_epochs = 10
n_hidden1 = 50
n_hidden2 = 100
n_input = X_train.shape[1]
n_samples = X_train.shape[0]
n_classes = 1

In [4]:
model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(units=n_hidden1, activation='relu', input_shape=(n_input, )))
model.add(tf.keras.layers.Dense(units=n_hidden2, activation='relu'))
model.add(tf.keras.layers.Dense(units=n_classes, activation='sigmoid'))
model.compile(loss='binary_crossentropy', optimizer=tf.keras.optimizers.Adam(learning_rate=0.01), metrics=['accuracy'])

In [5]:
history = model.fit(X_train, y_train,
                    batch_size=batch_size,
                    epochs=num_epochs,
                    verbose=2,
                    validation_data=(X_val, y_val))

Train on 64 samples, validate on 16 samples
Epoch 1/10
64/64 - 1s - loss: 0.7791 - accuracy: 0.5312 - val_loss: 0.7333 - val_accuracy: 0.3750
Epoch 2/10
64/64 - 0s - loss: 0.6872 - accuracy: 0.5156 - val_loss: 0.6903 - val_accuracy: 0.3750
Epoch 3/10
64/64 - 0s - loss: 0.6396 - accuracy: 0.5625 - val_loss: 0.6053 - val_accuracy: 1.0000
Epoch 4/10
64/64 - 0s - loss: 0.5962 - accuracy: 0.8438 - val_loss: 0.6334 - val_accuracy: 0.4375
Epoch 5/10
64/64 - 0s - loss: 0.6566 - accuracy: 0.5781 - val_loss: 0.5056 - val_accuracy: 0.7500
Epoch 6/10
64/64 - 0s - loss: 0.7548 - accuracy: 0.5000 - val_loss: 0.5520 - val_accuracy: 0.8125
Epoch 7/10
64/64 - 0s - loss: 0.5387 - accuracy: 0.6406 - val_loss: 0.5712 - val_accuracy: 0.5625
Epoch 8/10
64/64 - 0s - loss: 0.4737 - accuracy: 0.8594 - val_loss: 0.4272 - val_accuracy: 0.9375
Epoch 9/10
64/64 - 0s - loss: 0.4164 - accuracy: 0.9062 - val_loss: 0.4566 - val_accuracy: 0.8125
Epoch 10/10
64/64 - 0s - loss: 0.3132 - accuracy: 0.9375 - val_loss: 0.266

### 【問題4】Iris（多値分類）をKerasで学習
TensorFlowによるIrisデータセットに対する3値分類をKerasに書き換えてください。

In [6]:
# データセットの読み込み
dataset_path ="/Users/ikeda/Desktop/dive/diveintocode-ml/Downlowd_data/datasets_19_420_Iris.csv"
df = pd.read_csv(dataset_path)
# データフレームから条件抽出
y = df["Species"]
X = df.loc[:, ["SepalLengthCm", "SepalWidthCm", "PetalLengthCm", "PetalWidthCm"]]
y = np.array(y)
X = np.array(X)
# ラベルを数値に変換
y[y=='Iris-setosa'] = 0
y[y=='Iris-versicolor'] = 1
y[y=='Iris-virginica'] = 2
# one_hotへ変換
y = y.astype(np.int)
y = np.identity(3)[y]

# trainとtestに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# さらにtrainとvalに分割
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=0)

# ハイパーパラメータの設定
learning_rate = 0.01
batch_size = 10
num_epochs = 10
n_hidden1 = 50
n_hidden2 = 100
n_input = X_train.shape[1]
n_samples = X_train.shape[0]
n_classes = 3

In [7]:
model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(units=n_hidden1, activation='relu', input_shape=(n_input, )))
model.add(tf.keras.layers.Dense(units=n_hidden2, activation='relu'))
model.add(tf.keras.layers.Dense(units=n_classes, activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer=tf.keras.optimizers.Adam(learning_rate=0.01), metrics=['categorical_accuracy'])

In [8]:
history = model.fit(X_train, y_train,
                    batch_size=batch_size,
                    epochs=num_epochs,
                    verbose=2,
                    validation_data=(X_val, y_val))

Train on 96 samples, validate on 24 samples
Epoch 1/10
96/96 - 1s - loss: 1.3029 - categorical_accuracy: 0.4062 - val_loss: 0.8320 - val_categorical_accuracy: 0.5000
Epoch 2/10
96/96 - 0s - loss: 0.7323 - categorical_accuracy: 0.6146 - val_loss: 0.5309 - val_categorical_accuracy: 0.7083
Epoch 3/10
96/96 - 0s - loss: 0.4969 - categorical_accuracy: 0.7083 - val_loss: 0.4656 - val_categorical_accuracy: 0.7083
Epoch 4/10
96/96 - 0s - loss: 0.4558 - categorical_accuracy: 0.7083 - val_loss: 0.4520 - val_categorical_accuracy: 0.7083
Epoch 5/10
96/96 - 0s - loss: 0.3514 - categorical_accuracy: 0.8542 - val_loss: 0.3457 - val_categorical_accuracy: 0.8750
Epoch 6/10
96/96 - 0s - loss: 0.2507 - categorical_accuracy: 0.9375 - val_loss: 0.2953 - val_categorical_accuracy: 0.9167
Epoch 7/10
96/96 - 0s - loss: 0.2029 - categorical_accuracy: 0.9479 - val_loss: 0.3144 - val_categorical_accuracy: 0.8333
Epoch 8/10
96/96 - 0s - loss: 0.1955 - categorical_accuracy: 0.9271 - val_loss: 0.2386 - val_categoric

### 【問題5】House PricesをKerasで学習
TensorFlowによるHouse Pricesデータセットに対する回帰をKerasに書き換えてください。

In [9]:
# データセットの読み込み
dataset_path ="/Users/ikeda/Desktop/dive/diveintocode-ml/Downlowd_data/train.csv"
df = pd.read_csv(dataset_path)
# データフレームから条件抽出
objective_variable = 'SalePrice'
features = ['GrLivArea', 'YearBuilt']

y = df[objective_variable]
X = df.loc[:, features]
y = np.array(y)
X = np.array(X)
y = y.astype(np.int)[:, np.newaxis]

# trainとtestに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# さらにtrainとvalに分割
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=0)

# Xを標準化
from sklearn.preprocessing import StandardScaler
std = StandardScaler()
X_train = std.fit_transform(X_train)
X_val = std.transform(X_val)
X_test = std.transform(X_test)

# ハイパーパラメータの設定
learning_rate = 0.01
batch_size = 10
num_epochs = 10
n_hidden1 = 50
n_hidden2 = 100
n_input = X_train.shape[1]
n_samples = X_train
n_classes = 1

In [10]:
# 決定係数
def det_coeff(y_true, y_pred):
    u = tf.reduce_sum(tf.square(y_true - y_pred))
    v = tf.reduce_sum(tf.square(y_true - tf.reduce_mean(y_true)))
    return tf.ones_like(v) - (u / v)

In [11]:
model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(units=n_hidden1, activation='relu', input_shape=(n_input, )))
model.add(tf.keras.layers.Dense(units=n_hidden2, activation='relu'))
model.add(tf.keras.layers.Dense(units=n_classes, activation=None))
model.compile(loss='mean_squared_error', optimizer=tf.keras.optimizers.Adam(learning_rate=0.01), metrics=[det_coeff])
# metrics=['root_mean_squared_error']

In [12]:
history = model.fit(X_train, y_train,
                    batch_size=batch_size,
                    epochs=num_epochs,
                    verbose=2,
                    validation_data=(X_val, y_val))

Train on 934 samples, validate on 234 samples
Epoch 1/10
934/934 - 1s - loss: 38721423605.5846 - det_coeff: -9.8510e+00 - val_loss: 34478913623.5214 - val_det_coeff: -1.3195e+01
Epoch 2/10
934/934 - 0s - loss: 27139086219.7859 - det_coeff: -6.4996e+00 - val_loss: 12068350704.6838 - val_det_coeff: -3.9466e+00
Epoch 3/10
934/934 - 0s - loss: 5580760591.5546 - det_coeff: -2.4556e-01 - val_loss: 1618795526.2906 - val_det_coeff: 0.0918
Epoch 4/10
934/934 - 0s - loss: 2135357513.2505 - det_coeff: 0.5495 - val_loss: 1509555307.7607 - val_det_coeff: 0.1375
Epoch 5/10
934/934 - 0s - loss: 2073594045.0535 - det_coeff: 0.5398 - val_loss: 1537164481.6410 - val_det_coeff: 0.1008
Epoch 6/10
934/934 - 0s - loss: 2062457132.2998 - det_coeff: 0.5299 - val_loss: 1493145544.2051 - val_det_coeff: 0.1582
Epoch 7/10
934/934 - 0s - loss: 2053844001.9529 - det_coeff: 0.5780 - val_loss: 1491126389.6068 - val_det_coeff: 0.1594
Epoch 8/10
934/934 - 0s - loss: 2026991208.9422 - det_coeff: 0.5461 - val_loss: 14729

### 【問題6】MNISTをKerasで学習
TensorFlowによるMNISTデータセットによる画像の多値分類をKerasに書き換えてください。

In [13]:
# データセットの読み込み
from tensorflow.keras.datasets import mnist
(X_train, y_train), (X_test, y_test) = mnist.load_data()
# 平滑化
X_train = X_train.reshape(-1, 784)
X_test = X_test.reshape(-1, 784)
# 前処理
X_train = X_train.astype(np.float)
X_test = X_test.astype(np.float)
X_train /= 255
X_test /= 255

# one_hotへ変換
y_test = np.identity(10)[y_test]
y_train = np.identity(10)[y_train]

# さらにtrainとvalに分割
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=0)

# ハイパーパラメータの設定
learning_rate = 0.01
batch_size = 20
num_epochs = 20
n_hidden1 = 400
n_hidden2 = 200
n_input = X_train.shape[1]
n_samples = X_train.shape[0]
n_classes = 10

In [14]:
model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(units=n_hidden1, activation='relu', input_shape=(n_input, )))
model.add(tf.keras.layers.Dense(units=n_hidden2, activation='relu'))
model.add(tf.keras.layers.Dense(units=n_classes, activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer=tf.keras.optimizers.Adam(learning_rate=0.01), metrics=['categorical_accuracy'])

In [15]:
history = model.fit(X_train, y_train,
                    batch_size=batch_size,
                    epochs=num_epochs,
                    verbose=2,
                    validation_data=(X_val, y_val))

Train on 48000 samples, validate on 12000 samples
Epoch 1/20
48000/48000 - 16s - loss: 0.3375 - categorical_accuracy: 0.9080 - val_loss: 0.2575 - val_categorical_accuracy: 0.9335
Epoch 2/20
48000/48000 - 15s - loss: 0.2241 - categorical_accuracy: 0.9415 - val_loss: 0.2034 - val_categorical_accuracy: 0.9496
Epoch 3/20
48000/48000 - 15s - loss: 0.1915 - categorical_accuracy: 0.9515 - val_loss: 0.2668 - val_categorical_accuracy: 0.9520
Epoch 4/20
48000/48000 - 15s - loss: 0.1805 - categorical_accuracy: 0.9561 - val_loss: 0.1835 - val_categorical_accuracy: 0.9567
Epoch 5/20
48000/48000 - 14s - loss: 0.1623 - categorical_accuracy: 0.9597 - val_loss: 0.1595 - val_categorical_accuracy: 0.9642
Epoch 6/20
48000/48000 - 14s - loss: 0.1518 - categorical_accuracy: 0.9640 - val_loss: 0.1804 - val_categorical_accuracy: 0.9609
Epoch 7/20
48000/48000 - 15s - loss: 0.1593 - categorical_accuracy: 0.9635 - val_loss: 0.1870 - val_categorical_accuracy: 0.9640
Epoch 8/20
48000/48000 - 14s - loss: 0.1511 - c

### 【問題7】（アドバンス課題）PyTorchへの書き換え
4種類の問題をPyTorchに書き換えてください。

In [360]:
import torch
torch.__version__

'1.6.0'

In [361]:
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import TensorDataset, DataLoader

#### Iris（2値分類）

In [376]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
# データセットの読み込み
dataset_path ="/Users/ikeda/Desktop/dive/diveintocode-ml/Downlowd_data/datasets_19_420_Iris.csv"
df = pd.read_csv(dataset_path)
# データフレームから条件抽出
df = df[(df["Species"] == "Iris-versicolor")|(df["Species"] == "Iris-virginica")]
y = df["Species"]
X = df.loc[:, ["SepalLengthCm", "SepalWidthCm", "PetalLengthCm", "PetalWidthCm"]]
y = np.array(y)
X = np.array(X)
# ラベルを数値に変換
y[y=='Iris-versicolor'] = 0
y[y=='Iris-virginica'] = 1
# y = y.astype(np.int)[:, np.newaxis]
y = y.astype(np.int)
# one_hotへ変換
# y = y.astype(np.int)
# y = np.identity(2)[y]

# trainとtestに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# さらにtrainとvalに分割
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=0)

# ハイパーパラメータの設定
learning_rate = 0.01
batch_size = 10
num_epochs = 10
n_hidden1 = 50
n_hidden2 = 100
n_input = X_train.shape[1]
n_samples = X_train.shape[0]
n_classes = 2

In [377]:
# 形を直してバッチ情報を取得
X_train = torch.from_numpy(X_train).float()
X_val = torch.from_numpy(X_val).float()
X_test = torch.from_numpy(X_test).float()
y_train = torch.from_numpy(y_train).long()
y_val = torch.from_numpy(y_val).long()
y_test = torch.from_numpy(y_test).long()
ds_train = TensorDataset(X_train, y_train)
loader_train = DataLoader(ds_train, batch_size=batch_size, shuffle=True)

In [378]:
# モデルを構築
model = nn.Sequential()
model.add_module('fc1', nn.Linear(n_input, n_hidden1))
model.add_module('relu1', nn.ReLU())
model.add_module('fc2', nn.Linear(n_hidden1, n_hidden2))
model.add_module('relu2', nn.ReLU())
model.add_module('fc3', nn.Linear(n_hidden2, n_classes))
# model.add_module('softmax', nn.Softmax(dim=1))
model

Sequential(
  (fc1): Linear(in_features=4, out_features=50, bias=True)
  (relu1): ReLU()
  (fc2): Linear(in_features=50, out_features=100, bias=True)
  (relu2): ReLU()
  (fc3): Linear(in_features=100, out_features=2, bias=True)
)

In [379]:
# 最適化手法のパラメータ設定
optimizer = optim.SGD(model.parameters(), lr=0.01)
# loss関数の定義
criterion = nn.CrossEntropyLoss()

In [380]:
# バッチ正規化等、学習時と推論時で振る舞いの違うモジュールの振る舞いを学習時の振る舞いに
# model.eval()で推論時の振る舞いに変更可能
model.train()
# 学習ループ
for epoch in range(1, num_epochs+1):
    total_acc = 0
    total_correct = 0
    total_loss = 0
    # ミニバッチ毎ににループ
    for mini_batch_x, mini_batch_y in loader_train:    
        # 勾配の初期化
        optimizer.zero_grad()
        # 順伝播
        out = model(mini_batch_x)
        # 推論する
        pred = out.data.max(1, keepdim=True)[1] # 出力ラベルを求める
        correct = pred.eq(mini_batch_y.data.view_as(pred)).sum()  # 正解と一緒だったらカウントアップ
        # print(pred, correct)
        total_correct += correct
        # print(total_correct)
        # ロスの計算
        loss = criterion(out, mini_batch_y)
        total_loss += loss
        # print(total_loss)
        # 勾配の計算
        loss.backward()
        # パラメータの更新
        optimizer.step()
    total_loss /= batch_size
    # print(total_loss)
    total_acc = total_correct.numpy() / n_samples
    # print(total_acc)
    val_out = model(X_val)
    val_pred = val_out.data.max(1, keepdim=True)[1] # 出力ラベルを求める
    val_correct = val_pred.eq(y_val.data.view_as(val_pred)).sum()  # 正解と一緒だったらカウントアップ
    val_acc = val_correct.numpy() / len(y_val.data)
    
    val_loss = criterion(val_out, y_val)
    print("Epoch {}, total_loss : {:.4f}, val_loss : {:.4f}, total_acc : {:.3f}, val_acc : {:.3f}".format(epoch, total_loss, val_loss, total_acc, val_acc))

Epoch 1, total_loss : 0.5664, val_loss : 0.8181, total_acc : 0.438, val_acc : 0.375
Epoch 2, total_loss : 0.4783, val_loss : 0.7012, total_acc : 0.531, val_acc : 0.375
Epoch 3, total_loss : 0.4781, val_loss : 0.7411, total_acc : 0.516, val_acc : 0.375
Epoch 4, total_loss : 0.4679, val_loss : 0.6536, total_acc : 0.531, val_acc : 0.625
Epoch 5, total_loss : 0.4617, val_loss : 0.6653, total_acc : 0.516, val_acc : 0.625
Epoch 6, total_loss : 0.4714, val_loss : 0.6419, total_acc : 0.484, val_acc : 0.625
Epoch 7, total_loss : 0.4733, val_loss : 0.7789, total_acc : 0.672, val_acc : 0.375
Epoch 8, total_loss : 0.4525, val_loss : 0.7574, total_acc : 0.625, val_acc : 0.375
Epoch 9, total_loss : 0.4520, val_loss : 0.6476, total_acc : 0.531, val_acc : 0.625
Epoch 10, total_loss : 0.4479, val_loss : 0.6579, total_acc : 0.625, val_acc : 0.375


#### Iris（多値分類）

In [381]:
# データセットの読み込み
dataset_path ="/Users/ikeda/Desktop/dive/diveintocode-ml/Downlowd_data/datasets_19_420_Iris.csv"
df = pd.read_csv(dataset_path)
# データフレームから条件抽出
y = df["Species"]
X = df.loc[:, ["SepalLengthCm", "SepalWidthCm", "PetalLengthCm", "PetalWidthCm"]]
y = np.array(y)
X = np.array(X)
# ラベルを数値に変換
y[y=='Iris-setosa'] = 0
y[y=='Iris-versicolor'] = 1
y[y=='Iris-virginica'] = 2
# one_hotへ変換
y = y.astype(np.int)
y = np.identity(3)[y]

# trainとtestに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# さらにtrainとvalに分割
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=0)

# ハイパーパラメータの設定
learning_rate = 0.01
batch_size = 10
num_epochs = 10
n_hidden1 = 50
n_hidden2 = 100
n_input = X_train.shape[1]
n_samples = X_train.shape[0]
n_classes = 3

In [382]:
# 形を直してバッチ情報を取得
X_train = torch.from_numpy(X_train).float()
X_val = torch.from_numpy(X_val).float()
X_test = torch.from_numpy(X_test).float()
y_train = torch.from_numpy(y_train).long()
y_val = torch.from_numpy(y_val).long()
y_test = torch.from_numpy(y_test).long()
ds_train = TensorDataset(X_train, y_train)
loader_train = DataLoader(ds_train, batch_size=batch_size, shuffle=True)

In [383]:
# モデルを構築
model = nn.Sequential()
model.add_module('fc1', nn.Linear(n_input, n_hidden1))
model.add_module('relu1', nn.ReLU())
model.add_module('fc2', nn.Linear(n_hidden1, n_hidden2))
model.add_module('relu2', nn.ReLU())
model.add_module('fc3', nn.Linear(n_hidden2, n_classes))
# model.add_module('softmax', nn.Softmax(dim=1))
model

Sequential(
  (fc1): Linear(in_features=4, out_features=50, bias=True)
  (relu1): ReLU()
  (fc2): Linear(in_features=50, out_features=100, bias=True)
  (relu2): ReLU()
  (fc3): Linear(in_features=100, out_features=3, bias=True)
)

In [384]:
# 最適化手法のパラメータ設定
optimizer = optim.SGD(model.parameters(), lr=0.01)
# loss関数の定義
criterion = nn.CrossEntropyLoss()

In [388]:
# バッチ正規化等、学習時と推論時で振る舞いの違うモジュールの振る舞いを学習時の振る舞いに
# model.eval()で推論時の振る舞いに変更可能
model.train()
# 学習ループ
for epoch in range(1, num_epochs+1):
    total_acc = 0
    total_correct = 0
    total_loss = 0
    # ミニバッチ毎ににループ
    for mini_batch_x, mini_batch_y in loader_train:    
        # 勾配の初期化
        optimizer.zero_grad()
        # 順伝播
        out = model(mini_batch_x)
        # 推論する
        pred = out.data.max(1, keepdim=True)[1] # 出力ラベルを求める
        correct = pred.eq(mini_batch_y.data.view_as(pred)).sum()  # 正解と一緒だったらカウントアップ
        # print(pred, correct)
        total_correct += correct
        # print(total_correct)
        # ロスの計算
        loss = criterion(out, mini_batch_y)
        total_loss += loss
        # print(total_loss)
        # 勾配の計算
        loss.backward()
        # パラメータの更新
        optimizer.step()
    total_loss /= batch_size
    # print(total_loss)
    total_acc = total_correct.numpy() / n_samples
    # print(total_acc)
    val_out = model(X_val)
    val_pred = val_out.data.max(1, keepdim=True)[1] # 出力ラベルを求める
    val_correct = val_pred.eq(y_val.data.view_as(val_pred)).sum()  # 正解と一緒だったらカウントアップ
    val_acc = val_correct.numpy() / len(y_val.data)
    
    val_loss = criterion(val_out, y_val)
    print("Epoch {}, total_loss : {:.4f}, val_loss : {:.4f}, total_acc : {:.3f}, val_acc : {:.3f}".format(epoch, total_loss, val_loss, total_acc, val_acc))

RuntimeError: shape '[10, 1]' is invalid for input of size 30

### 【問題8】（アドバンス課題）フレームワークの比較
それぞれのフレームワークにはどのような違いがあるかをまとめてください。

*《視点例》*

- 計算速度
- コードの行数・可読性
- 用意されている機能

- ThensorFlow
    - ハイレベルな機能を実装可能で、計算をデータフローやグラフで表すことができまるため、実践で、複雑な問題に対処できる
    - Googleの音声検索や言語翻訳、画像検索に使用
-　Keras
    - 比較的短いコードで実装可能、最新手法を素早く試すことができる
    - CPUとGPU上でシームレスな動作
- Chainer
    - 記法がシンプルで国産のフレームワークのため、学習が容易
    - 画像分類や物体検出などで利用されている
    - 2019年12月に開発を終了し、PyTorchへ移行
- PyTorch
    - Chainer, Numpyと似たような構文で操作可能
    - 計算速度も早く、ソースコードが扱いやすい
    - 計算グラフを動的で構築可能
- MXNet
    - 命令的プラグラムと宣言的プログラムを併用することができ、柔軟なフレームワーク
    - CNN、LSTM、RCNN、Deep Q Networkなど様々な深層学習モデルをサポートしており、画像認識、自然言語処理、レコメンデーションなど様々な場面で使われている
- Deeplearning4j（DL4j）
    - Javaで開発されているため、JVM上で動くという特徴があり、既存の情報システムと組み合わせ運用できます。そのため、商用に使われやすく、サポートが提供されているということが利点
    - Javaでディープラーニングを行う際に利用されており、例えば、金融分野の不正検知や異常検知、電子商取引や広告のレコメンドシステム、 製造業の不良品検知や画像認識などで使用されている
- Microsoft Cognitive Toolkit
    - 巨大データセット処理時のパフォーマンス低下を最小化するためのアルゴリズムが組み込まれているため、複数マシンで巨大データセットを扱う場合において、他のツールキットに対する優位性があるとされている
    - Skypeのリアルタイム翻訳、国内では三井住友銀行が自動応答システムで利用している
- PaddlePaddle
    - クラウドだけでなく、分散コンピューティングのクラスタで高速に稼働する
    - 中国で強い
- Caffe
    - C++で実装され、GPUに対応しているため、高速な計算処理が可能
    - 開発コミュニティーが活発にGitHubを更新していたり、サンプルコードも多く提供されているため、初心者にもおすすめ
    - 大規模画像認識のコンテスト「ILSVRC」で2012年に首位を獲得した「畳み込みニューラルネットワークの画像分類モデル」があり、直ぐに利用できるというのも利点