# Sprint ディープラーニングフレームワーク2
## 【問題1】公式チュートリアルモデルを分担して実行
TensorFLowの公式チュートリアルモデルを分担して実行してください。<br>
<br>
以下の中から1人ひとつ選び実行し、その結果を簡単に発表してください。<br>
<br>
[models/tutorials at master · tensorflow/models](https://www.tensorflow.org/tutorials)

>下記ノートブックにて実装<br>
>https://github.com/genkitamiya/diveintocode-ml/blob/master/sprint/sprint14_DCGAN_Tutorial.ipynb
>おまけ（有名人顔やポケモンを生成）<br>
>https://github.com/genkitamiya/diveintocode-ml/blob/master/sprint/sprint14_DCGAN_celeb.ipynb

## 【問題2】（アドバンス課題）様々な手法を実行
TensorFLowやGoogle AI ResearchのGitHubリポジトリには、定番のモデルから最新のモデルまで多様なコードが公開されています。これらから興味あるものを選び実行してください。<br>
<br>
なお、これらのコードは初学者向けではないため、巨大なデータセットのダウンロードが必要な場合など、実行が簡単ではないこともあります。そういった場合は、コードリーディングを行ってください。<br>
<br>
[models/research at master · tensorflow/models](https://github.com/tensorflow/models/tree/master/research)<br>
<br>
[google-research/google-research: Google AI Research](https://github.com/google-research/google-research)<br>
<br>
更新日が古いものはPythonやTensorFlowのバージョンが古く、扱いずらい場合があります。新しいものから見ることを推奨します。

>feelvosやmaskganが気になったが、卒業課題に時間を充てるため、後日実装したいと思う

## 異なるフレームワークへの書き換え
「ディープラーニングフレームワーク1」で作成した4種類のデータセットを扱うTensorFLowのコードを異なるフレームワークに変更していきます。<br>
<br>
- Iris（Iris-versicolorとIris-virginicaのみの2値分類）
- Iris（3種類全ての目的変数を使用して多値分類）
- House Prices
- MNIST

### Kerasへの書き換え
KerasはTensorFLowに含まれるtf.kerasモジュールを使用してください。<br>
KerasにはSequentialモデルかFunctional APIかなど書き方に種類がありますが、これは指定しません。

In [2]:
import time
import tensorflow as tf
from tensorflow.keras import backend as K
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

## 【問題3】Iris（2値分類）をKerasで学習
TensorFlowによるIrisデータセットに対する2値分類をKerasに書き換えてください。

In [26]:
from sklearn.model_selection import train_test_split

# データセットの読み込み
dataset_path ="Iris.csv"
df = pd.read_csv(dataset_path)
# データフレームから条件抽出
df = df[(df["Species"] == "Iris-versicolor")|(df["Species"] == "Iris-virginica")]
y = df["Species"]
X = df.loc[:, ["SepalLengthCm", "SepalWidthCm", "PetalLengthCm", "PetalWidthCm"]]
y = np.array(y)
X = np.array(X)
# ラベルを数値に変換
y[y=='Iris-versicolor'] = 0
y[y=='Iris-virginica'] = 1
y = y.astype(np.int)[:, np.newaxis]
# trainとtestに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# さらにtrainとvalに分割
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=0)

In [27]:
K.clear_session()

model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(8, activation = tf.nn.relu, input_shape=(4,)))
model.add(tf.keras.layers.Dense(1, activation = tf.nn.sigmoid))
model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 8)                 40        
_________________________________________________________________
dense_1 (Dense)              (None, 1)                 9         
Total params: 49
Trainable params: 49
Non-trainable params: 0
_________________________________________________________________


In [28]:
start = time.time()
model.compile(loss='binary_crossentropy',
              optimizer=tf.train.AdamOptimizer(learning_rate=0.01),
              metrics=['accuracy'])

history = model.fit(X_train, y_train,
                    batch_size=1,
                    epochs=50,
                    verbose=2,
                    validation_data=(X_val, y_val))
end = time.time()
print('wall time: {:.4f}sec'.format(end-start))

score = model.evaluate(X_test, y_test, verbose=0)
print('\nTest loss:', score[0])
print('Test accuracy:', score[1])

Train on 64 samples, validate on 16 samples
Epoch 1/50
 - 0s - loss: 0.6771 - acc: 0.6250 - val_loss: 0.6119 - val_acc: 0.6250
Epoch 2/50
 - 0s - loss: 0.5750 - acc: 0.7500 - val_loss: 0.5169 - val_acc: 0.8750
Epoch 3/50
 - 0s - loss: 0.5148 - acc: 0.7656 - val_loss: 0.4878 - val_acc: 0.9375
Epoch 4/50
 - 0s - loss: 0.5149 - acc: 0.7500 - val_loss: 0.4297 - val_acc: 0.8750
Epoch 5/50
 - 0s - loss: 0.4109 - acc: 0.8594 - val_loss: 0.3806 - val_acc: 1.0000
Epoch 6/50
 - 0s - loss: 0.4096 - acc: 0.8750 - val_loss: 0.3491 - val_acc: 1.0000
Epoch 7/50
 - 0s - loss: 0.3514 - acc: 0.8906 - val_loss: 0.3050 - val_acc: 0.8750
Epoch 8/50
 - 0s - loss: 0.3199 - acc: 0.9219 - val_loss: 0.3555 - val_acc: 0.8125
Epoch 9/50
 - 0s - loss: 0.2963 - acc: 0.9375 - val_loss: 0.2837 - val_acc: 0.9375
Epoch 10/50
 - 0s - loss: 0.2853 - acc: 0.9062 - val_loss: 0.2176 - val_acc: 1.0000
Epoch 11/50
 - 0s - loss: 0.2492 - acc: 0.9531 - val_loss: 0.1919 - val_acc: 1.0000
Epoch 12/50
 - 0s - loss: 0.2424 - acc: 0

## 【問題4】Iris（多値分類）をKerasで学習
TensorFlowによるIrisデータセットに対する3値分類をKerasに書き換えてください。

In [29]:
from sklearn.preprocessing import OneHotEncoder

# データセットの読み込み
dataset_path ="Iris.csv"
df = pd.read_csv(dataset_path)
# データフレームから条件抽出
y = df["Species"]
X = df.loc[:, ["SepalLengthCm", "SepalWidthCm", "PetalLengthCm", "PetalWidthCm"]]
y = np.array(y)
X = np.array(X)
# ラベルをone-hotに変換
enc = OneHotEncoder(handle_unknown='ignore', sparse=False)
y = enc.fit_transform(y[:, np.newaxis])
# trainとtestに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# さらにtrainとvalに分割
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=0)

In [30]:
K.clear_session()

model = tf.keras.Sequential()
model.add(tf.keras.layers.Dense(16, activation=tf.nn.relu, input_shape=(4,)))
model.add(tf.keras.layers.Dense(8, activation=tf.nn.relu))
model.add(tf.keras.layers.Dense(3, activation=tf.nn.softmax))

model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 16)                80        
_________________________________________________________________
dense_1 (Dense)              (None, 8)                 136       
_________________________________________________________________
dense_2 (Dense)              (None, 3)                 27        
Total params: 243
Trainable params: 243
Non-trainable params: 0
_________________________________________________________________


In [31]:
start = time.time()
model.compile(loss='categorical_crossentropy',
              optimizer=tf.train.AdamOptimizer(learning_rate=0.01),
              metrics=['accuracy'])

history = model.fit(X_train, y_train,
                    batch_size=10,
                    epochs=50,
                    verbose=2,
                    validation_data=(X_val, y_val))
end = time.time()
print('wall time: {:.4f}sec'.format(end-start))

score = model.evaluate(X_test, y_test, verbose=0)
print('\nTest loss:', score[0])
print('Test accuracy:', score[1])

Train on 96 samples, validate on 24 samples
Epoch 1/50
 - 0s - loss: 1.2364 - acc: 0.3646 - val_loss: 1.0464 - val_acc: 0.3750
Epoch 2/50
 - 0s - loss: 1.0360 - acc: 0.3750 - val_loss: 0.9854 - val_acc: 0.4583
Epoch 3/50
 - 0s - loss: 0.9494 - acc: 0.6562 - val_loss: 0.8966 - val_acc: 0.7083
Epoch 4/50
 - 0s - loss: 0.8507 - acc: 0.6875 - val_loss: 0.7753 - val_acc: 0.7083
Epoch 5/50
 - 0s - loss: 0.7120 - acc: 0.7188 - val_loss: 0.6662 - val_acc: 0.7500
Epoch 6/50
 - 0s - loss: 0.6110 - acc: 0.7917 - val_loss: 0.5617 - val_acc: 0.9167
Epoch 7/50
 - 0s - loss: 0.4938 - acc: 0.9167 - val_loss: 0.4646 - val_acc: 0.7083
Epoch 8/50
 - 0s - loss: 0.4014 - acc: 0.8854 - val_loss: 0.3923 - val_acc: 0.9167
Epoch 9/50
 - 0s - loss: 0.3286 - acc: 0.9167 - val_loss: 0.3066 - val_acc: 0.9167
Epoch 10/50
 - 0s - loss: 0.2819 - acc: 0.9167 - val_loss: 0.3184 - val_acc: 0.8750
Epoch 11/50
 - 0s - loss: 0.1926 - acc: 0.9583 - val_loss: 0.2647 - val_acc: 0.9167
Epoch 12/50
 - 0s - loss: 0.1618 - acc: 0

## 【問題5】House PricesをKerasで学習
TensorFlowによるHouse Pricesデータセットに対する回帰をKerasに書き換えてください。

In [32]:
from sklearn.preprocessing import StandardScaler

house_data = pd.read_csv('/Users/tamiyagt/Documents/machine learning/02_Kaggle/house prices/train.csv')

#GrLivArea、YearBuilt、SalePriceを抽出
train = house_data.loc[:, ['GrLivArea', 'YearBuilt', 'SalePrice']]

# DataFrameをndarrayに変換
X = np.array(train.iloc[:, :-1])
y = np.array(train.iloc[:, -1])[:,None]

# 特徴量を標準化
scaler = StandardScaler()
X = scaler.fit_transform(X)
# 目的変数を対数変換
y = np.log1p(y)

# trainとtestに分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
# さらにtrainとvalに分割
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=0)

In [33]:
K.clear_session()

input_data = tf.keras.layers.Input(shape=(2,))

l = tf.keras.layers.Dense(10, activation=tf.nn.relu)(input_data)
l = tf.keras.layers.Dense(10, activation=tf.nn.relu)(l)
output = tf.keras.layers.Dense(1, activation=tf.nn.relu)(l)

model = tf.keras.Model(input_data, output)

model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_1 (InputLayer)         (None, 2)                 0         
_________________________________________________________________
dense (Dense)                (None, 10)                30        
_________________________________________________________________
dense_1 (Dense)              (None, 10)                110       
_________________________________________________________________
dense_2 (Dense)              (None, 1)                 11        
Total params: 151
Trainable params: 151
Non-trainable params: 0
_________________________________________________________________


In [34]:
start = time.time()
model.compile(loss='mean_squared_error',
              optimizer=tf.train.AdamOptimizer(learning_rate=0.01),
              metrics=['mse'])

history = model.fit(X_train, y_train,
                    batch_size=10,
                    epochs=50,
                    verbose=2,
                    validation_data=(X_val, y_val))
end = time.time()
print('wall time: {:.4f}sec'.format(end-start))

score = model.evaluate(X_test, y_test, verbose=0)
print('\nTest loss:', score[0])

Train on 934 samples, validate on 234 samples
Epoch 1/50
 - 0s - loss: 37.5427 - mean_squared_error: 37.5427 - val_loss: 2.6651 - val_mean_squared_error: 2.6651
Epoch 2/50
 - 0s - loss: 1.4639 - mean_squared_error: 1.4639 - val_loss: 0.4946 - val_mean_squared_error: 0.4946
Epoch 3/50
 - 0s - loss: 0.3700 - mean_squared_error: 0.3700 - val_loss: 0.2051 - val_mean_squared_error: 0.2051
Epoch 4/50
 - 0s - loss: 0.1806 - mean_squared_error: 0.1806 - val_loss: 0.0964 - val_mean_squared_error: 0.0964
Epoch 5/50
 - 0s - loss: 0.1111 - mean_squared_error: 0.1111 - val_loss: 0.0720 - val_mean_squared_error: 0.0720
Epoch 6/50
 - 0s - loss: 0.0901 - mean_squared_error: 0.0901 - val_loss: 0.0565 - val_mean_squared_error: 0.0565
Epoch 7/50
 - 0s - loss: 0.0711 - mean_squared_error: 0.0711 - val_loss: 0.0545 - val_mean_squared_error: 0.0545
Epoch 8/50
 - 0s - loss: 0.0648 - mean_squared_error: 0.0648 - val_loss: 0.0513 - val_mean_squared_error: 0.0513
Epoch 9/50
 - 0s - loss: 0.0623 - mean_squared_e

## 【問題6】MNISTをKerasで学習
TensorFlowによるMNISTデータセットによる画像の多値分類をKerasに書き換えてください。

In [35]:
#《データセットをダウンロードするコード》
from keras.datasets import mnist
(X_train, y_train), (X_test, y_test) = mnist.load_data()
X_train = X_train.astype(np.float)
X_test = X_test.astype(np.float)
X_train /= 255
X_test /= 255

X_train = X_train[:,:,:,None]  # NHWC
X_test = X_test[:,:,:,None]  # NHWC

enc = OneHotEncoder(handle_unknown='ignore', sparse=False)
y_train = enc.fit_transform(y_train[:, np.newaxis])
y_test = enc.transform(y_test[:, np.newaxis])

# trainとvalに分割
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=0)

In [36]:
K.clear_session()

input_data = tf.keras.layers.Input(shape=(28,28,1))  # channels last

l = tf.keras.layers.Conv2D(8, (3,3), padding='valid', activation=tf.nn.relu)(input_data)
l = tf.keras.layers.MaxPool2D((3,3), padding='same')(l)
l = tf.keras.layers.Conv2D(16, (3,3), padding='valid', activation=tf.nn.relu)(l)
l = tf.keras.layers.MaxPool2D((3,3), padding='same')(l)
l = tf.keras.layers.Flatten()(l)
output = tf.keras.layers.Dense(10, activation=tf.nn.softmax)(l)

model = tf.keras.Model(input_data, output)

model.summary()

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_1 (InputLayer)         (None, 28, 28, 1)         0         
_________________________________________________________________
conv2d (Conv2D)              (None, 26, 26, 8)         80        
_________________________________________________________________
max_pooling2d (MaxPooling2D) (None, 9, 9, 8)           0         
_________________________________________________________________
conv2d_1 (Conv2D)            (None, 7, 7, 16)          1168      
_________________________________________________________________
max_pooling2d_1 (MaxPooling2 (None, 3, 3, 16)          0         
_________________________________________________________________
flatten (Flatten)            (None, 144)               0         
_________________________________________________________________
dense (Dense)                (None, 10)                1450      
Total para

In [40]:
start = time.time()
model.compile(loss='categorical_crossentropy',
              optimizer=tf.train.AdamOptimizer(learning_rate=0.01),
              metrics=['accuracy'])

history = model.fit(X_train, y_train,
                    batch_size=20,
                    epochs=20,
                    verbose=2,
                    validation_data=(X_val, y_val))
end = time.time()
print('wall time: {:.4f}sec'.format(end-start))

score = model.evaluate(X_test, y_test, verbose=0)
print('\nTest loss:', score[0])
print('Test accuracy:', score[1])

Train on 48000 samples, validate on 12000 samples
Epoch 1/20
 - 8s - loss: 0.0966 - acc: 0.9714 - val_loss: 0.0817 - val_acc: 0.9742
Epoch 2/20
 - 8s - loss: 0.0931 - acc: 0.9724 - val_loss: 0.0861 - val_acc: 0.9739
Epoch 3/20
 - 9s - loss: 0.0854 - acc: 0.9745 - val_loss: 0.0876 - val_acc: 0.9731
Epoch 4/20
 - 9s - loss: 0.0861 - acc: 0.9748 - val_loss: 0.1036 - val_acc: 0.9721
Epoch 5/20
 - 9s - loss: 0.0862 - acc: 0.9748 - val_loss: 0.1384 - val_acc: 0.9617
Epoch 6/20
 - 8s - loss: 0.0858 - acc: 0.9751 - val_loss: 0.1065 - val_acc: 0.9704
Epoch 7/20
 - 8s - loss: 0.0834 - acc: 0.9767 - val_loss: 0.0957 - val_acc: 0.9744
Epoch 8/20
 - 8s - loss: 0.0847 - acc: 0.9760 - val_loss: 0.0826 - val_acc: 0.9762
Epoch 9/20
 - 9s - loss: 0.0831 - acc: 0.9768 - val_loss: 0.1042 - val_acc: 0.9707
Epoch 10/20
 - 8s - loss: 0.0850 - acc: 0.9769 - val_loss: 0.1008 - val_acc: 0.9738
Epoch 11/20
 - 9s - loss: 0.0847 - acc: 0.9769 - val_loss: 0.1409 - val_acc: 0.9702
Epoch 12/20
 - 9s - loss: 0.0832 - 

## 【問題7】（アドバンス課題）PyTorchへの書き換え
4種類の問題をPyTorchに書き換えてください。

>下記ノートブックにて実装<br>
>https://github.com/genkitamiya/diveintocode-ml/blob/master/sprint/sprint14_pytorch.ipynb

## 【問題8】（アドバンス課題）フレームワークの比較
それぞれのフレームワークにはどのような違いがあるかをまとめてください。<br>
<br>
**《視点例》**
- 計算速度
- コードの行数・可読性
- 用意されている機能

>- 計算速度：各分類を同モデル・条件で実行したところ、MNIST以外においては、PyTorchの計算速度がKerasより早かった。より複雑なモデルの場合はKerasに軍配が上がるのだろうか？<br>
>- コードの行数・可読性：行数はKerasが圧倒的に少ない。また、可読性についてもKerasが見やすいと思われる。ただし、モデルの透過性はより細かなコードが必要な分、PyTorchが優れている。<br>
>- 用意されている機能：同フレームワーク共に機能が備わっていると思われるが、上記の通り、PyTorchの方が小回りが効いており、より複雑なモデルやカスタマイズに適している（例：並列層の実装など）<br>
>
>
>その他、下記の相違点を確認：<br>
>**Keras/Tensorflow**<br>
>- input NHWC
>- onehot encoding必須
>- Module/Functional型搭載<br>
>
>
>**PyTorch**<br>
>- input NCHW
>- onehot 不要
>- 各レイヤーのサイズ指定が必要
>- Module/Functional型搭載

