## 【問題2】（アドバンス課題）様々な手法を実行

TensorFLowやGoogle AI ResearchのGitHubリポジトリには、定番のモデルから最新のモデルまで多様なコードが公開されています。これらから興味あるものを選び実行してください。


なお、これらのコードは初学者向けではないため、巨大なデータセットのダウンロードが必要な場合など、実行が簡単ではないこともあります。そういった場合は、コードリーディングを行ってください。


[models/research at master · tensorflow/models](https://github.com/tensorflow/models/tree/master/research)


[google-research/google-research: Google AI Research](https://github.com/google-research/google-research)


更新日が古いものはPythonやTensorFlowのバージョンが古く、扱いずらい場合があります。新しいものから見ることを推奨します。

「ディープラーニングフレームワーク1」で作成した4種類のデータセットを扱うTensorFLowのコードを異なるフレームワークに変更していきます。


Iris（Iris-versicolorとIris-virginicaのみの2値分類）
Iris（3種類全ての目的変数を使用して多値分類）
House Prices
MNIST

Kerasへの書き換え
KerasはTensorFLowに含まれるtf.kerasモジュールを使用してください。


KerasにはSequentialモデルかFunctional APIかなど書き方に種類がありますが、これは指定しません。



## 【問題3】Iris（2値分類）をKerasで学習

TensorFlowによるIrisデータセットに対する2値分類をKerasに書き換えてください。

In [18]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
import tensorflow as tf
import matplotlib.pyplot as plt
import os

In [15]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [103]:
# データセットの読み込み
df = pd.read_csv('drive/My Drive/Iris.csv')

#データフレームから条件抽出
df = df[(df['Species'] == 'Iris-versicolor') | (df['Species'] == 'Iris-virginica')]
y = df['Species']
X = df.loc[:, ['SepalLengthCm', 'SepalWidthCm', 'PetalLengthCm', 'PetalWidthCm']]
y = np.array(y)
X = np.array(X)

# ラベルを数値に変換
y[y=='Iris-versicolor'] = 0
y[y=='Iris-virginica'] = 1
y = y.astype(np.int)[:, np.newaxis]

# trainとtestに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# さらにtrainとvalに分割
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=0)

In [104]:
# モデル構築
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense,Activation
from keras.optimizers import Adam
from keras import backend as K

K.clear_session()
# ハイパーパラメータの設定

batch_size = 10
n_epochs = 20
n_hidden1 = 50
n_hidden2 = 100
n_input = X_train.shape[1]
n_classes = y.shape[1]

# model構築
model = Sequential()
model.add(Dense(n_hidden1, input_dim=n_input))
model.add(Activation("relu"))
model.add(Dense(n_hidden2, input_dim=n_hidden1))
model.add(Activation("relu"))
model.add(Dense(n_classes, input_dim=n_hidden2))
model.add(Activation('sigmoid'))

# モデルのコンパイル
model.compile(optimizer='Adam', loss='binary_crossentropy', metrics=['accuracy'])

model.summary()



Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 50)                250       
_________________________________________________________________
activation (Activation)      (None, 50)                0         
_________________________________________________________________
dense_1 (Dense)              (None, 100)               5100      
_________________________________________________________________
activation_1 (Activation)    (None, 100)               0         
_________________________________________________________________
dense_2 (Dense)              (None, 1)                 101       
_________________________________________________________________
activation_2 (Activation)    (None, 1)                 0         
Total params: 5,451
Trainable params: 5,451
Non-trainable params: 0
______________________________________________________

In [105]:
# モデルの学習
model.fit(x=X_train, y=y_train, epochs=n_epochs, batch_size=batch_size )


Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<tensorflow.python.keras.callbacks.History at 0x7f0229262860>

In [106]:
y_pred = model.predict(X_test,  batch_size=batch_size)


# バッチごとにある入力データにおける損失値を計算
loss, acc = model.evaluate(X_test, y_test, batch_size=batch_size)
print("loss %.3f" % loss)
print("acc %.3f" % acc)

loss 0.427
acc 0.900


## 【問題4】Iris（多値分類）をKerasで学習

TensorFlowによるIrisデータセットに対する3値分類をKerasに書き換えてください。

[コンパイルのパレメーター参考](http://bcl.sci.yamaguchi-u.ac.jp/~jun/notebook/keras/loss/)

In [107]:
from sklearn.preprocessing import OneHotEncoder

# データセットの読み込み
df = pd.read_csv('drive/My Drive/Iris.csv')

#データフレームから条件抽出
y = df['Species']
X = df.loc[:, ['SepalLengthCm', 'SepalWidthCm', 'PetalLengthCm', 'PetalWidthCm']]
y = np.array(y)
X = np.array(X)

#ラベルを数値に変換
y[y == 'Iris-setosa'] = 0
y[y == 'Iris-versicolor'] = 1
y[y == 'Iris-virginica'] = 2
y = y.astype(np.int)[:, np.newaxis]

# OneHot
oe = OneHotEncoder(categories="auto",sparse=False)
y = oe.fit_transform(y)

# trainとtestに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# さらにtrainとvalに分割
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=0)

In [108]:
K.clear_session()
# ハイパーパラメータの設定

batch_size = 10
n_epochs = 20
n_hidden1 = 50
n_hidden2 = 100
n_input = X_train.shape[1]
n_classes = y.shape[1]

# model構築
model = Sequential()
model.add(Dense(n_hidden1, input_dim=n_input))
model.add(Activation("relu"))
model.add(Dense(n_hidden2, input_dim=n_hidden1))
model.add(Activation("relu"))
model.add(Dense(n_classes, input_dim=n_hidden2))
model.add(Activation('sigmoid'))

# モデルのコンパイル
model.compile(optimizer='Adam', loss='categorical_crossentropy', metrics=['accuracy'])

model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 50)                250       
_________________________________________________________________
activation (Activation)      (None, 50)                0         
_________________________________________________________________
dense_1 (Dense)              (None, 100)               5100      
_________________________________________________________________
activation_1 (Activation)    (None, 100)               0         
_________________________________________________________________
dense_2 (Dense)              (None, 3)                 303       
_________________________________________________________________
activation_2 (Activation)    (None, 3)                 0         
Total params: 5,653
Trainable params: 5,653
Non-trainable params: 0
______________________________________________________

In [109]:
# モデルの学習
model.fit(x=X_train, y=y_train, epochs=n_epochs, batch_size=batch_size )


Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<tensorflow.python.keras.callbacks.History at 0x7f02278caf98>

In [110]:
y_pred = model.predict(X_test,  batch_size=batch_size)

model.metrics_names
loss, acc = model.evaluate(X_test, y_test, batch_size=batch_size)
print("loss %.3f" % loss)
print("acc %.3f" % acc)

loss 0.135
acc 0.967


## 【問題5】House PricesをKerasで学習

TensorFlowによるHouse Pricesデータセットに対する回帰をKerasに書き換えてください。



In [68]:
df2 = pd.read_csv('drive/My Drive/train.csv')
y = df2["SalePrice"]
X = df2.loc[:, ["GrLivArea", "YearBuilt"]]
y = np.array(y)
X = np.array(X)
# 次元変換
y = y[:, np.newaxis]
# 対数変換
X = np.log(X)
y = np.log(y)
# trainとtestに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# さらにtrainとvalに分割
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=0)

In [82]:
K.clear_session()

# ハイパーパラメータの設定
batch_size = 10
n_epochs = 20

n_hidden1 = 50
n_hidden2 = 100
n_input = X_train.shape[1]
n_classes = y.shape[1]

# model構築
model = Sequential()
model.add(Dense(n_hidden1, input_dim=n_input))
model.add(Activation('sigmoid'))
model.add(Dense(n_hidden2, input_dim=n_hidden1))
model.add(Activation('sigmoid'))
model.add(Dense(n_classes, input_dim=n_hidden2))
model.add(Activation('sigmoid'))

# model コンパイル
model.compile(optimizer='Adam', loss='mse', metrics=['mse'])

model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 50)                150       
_________________________________________________________________
activation (Activation)      (None, 50)                0         
_________________________________________________________________
dense_1 (Dense)              (None, 100)               5100      
_________________________________________________________________
activation_1 (Activation)    (None, 100)               0         
_________________________________________________________________
dense_2 (Dense)              (None, 1)                 101       
_________________________________________________________________
activation_2 (Activation)    (None, 1)                 0         
Total params: 5,351
Trainable params: 5,351
Non-trainable params: 0
______________________________________________________

In [83]:
# モデルの学習
model.fit(x=X_train, y=y_train, epochs=n_epochs, batch_size=batch_size)

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<tensorflow.python.keras.callbacks.History at 0x7f0277ef0da0>

In [84]:
y_pred = model.predict(X_test,  batch_size=batch_size)

model.evaluate(X_test, y_test, batch_size=batch_size)



[121.74327087402344, 121.74327087402344]

## 【問題6】MNISTをKerasで学習

TensorFlowによるMNISTデータセットによる画像の多値分類をKerasに書き換えてください。

In [85]:
from keras.datasets import mnist

#データの読み込み
(X_train, y_train), (X_test, y_test) = mnist.load_data()

# 次元変換
y_train = y_train.astype(np.int)[:, np.newaxis]

y_test = y_test.astype(np.int)[:, np.newaxis]

#  OneHotEncoder
oe = OneHotEncoder(handle_unknown='ignore', sparse=False)
y_train = oe.fit_transform(y_train)

y_test = oe.fit_transform(y_test)

#データの変換
X_train = X_train.reshape(-1, 784)
X_test = X_test.reshape(-1, 784)
X_train = X_train.astype(np.float)
X_test = X_test.astype(np.float)
X_train /= 255
X_test /= 255

#分割
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2)
print(X_train.shape)
print(X_test.shape)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
(48000, 784)
(10000, 784)


In [89]:
K.clear_session()

# ハイパーパラメータの設定
batch_size = 500
n_epochs = 20
n_hidden1 = 50
n_hidden2 = 100
n_input = X_train.shape[1] #特徴量数
n_classes = y_train.shape[1] #クラス数

# model構築
model = Sequential()
model.add(Dense(n_hidden1, input_dim=n_input))
model.add(Activation('relu'))
model.add(Dense(n_hidden2, input_dim=n_hidden1))
model.add(Activation('relu'))
model.add(Dense(n_classes, input_dim=n_hidden2))
model.add(Activation('softmax'))

# modelコンパイル 交差エントロピー
model.compile(optimizer='Adam', loss='categorical_crossentropy', metrics=['accuracy'])

model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 50)                39250     
_________________________________________________________________
activation (Activation)      (None, 50)                0         
_________________________________________________________________
dense_1 (Dense)              (None, 100)               5100      
_________________________________________________________________
activation_1 (Activation)    (None, 100)               0         
_________________________________________________________________
dense_2 (Dense)              (None, 10)                1010      
_________________________________________________________________
activation_2 (Activation)    (None, 10)                0         
Total params: 45,360
Trainable params: 45,360
Non-trainable params: 0
____________________________________________________

In [90]:
# モデルの学習
model.fit(x=X_train, y=y_train, epochs=n_epochs, batch_size=batch_size,
          validation_data=(X_val, y_val))

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<tensorflow.python.keras.callbacks.History at 0x7f02747d77f0>

In [93]:
y_pred = model.predict(X_test,  batch_size=batch_size)
model.metrics_names
loss, acc = model.evaluate(X_test, y_test, batch_size=batch_size)
print("loss %.3f" % loss)
print("acc %.3f" % acc)

loss 0.102
acc 0.971


## 【問題7】（アドバンス課題）PyTorchへの書き換え

4種類の問題をPyTorchに書き換えてください。

In [95]:
import torch
import torchvision
import torchvision.transforms as transforms
import numpy as np

## Iris（2値分類）P

## 【問題8】（アドバンス課題）フレームワークの比較

それぞれのフレームワークにはどのような違いがあるかをまとめてください。


《視点例》


・計算速度
・コードの行数・可読性
・用意されている機能

 Keras　： 中身の処理がわからない、コードを書くのが楽(可読性が高い)
 
 
 TensorFLow : 細かい所まで設定できる


 Pytorch : 日本語での文献が少ない、Kerasならfit()で済むのが細かく書かなくてはいけない、Kerasより処理が早い(colab)