##### Sprintの目的
- フレームワークのコードを読めるようにする
- フレームワークを習得し続けられるようになる
- 理論を知っている範囲をフレームワークで動かす


In [3]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import tensorflow as tf

#### 公式Example

深層学習フレームワークには公式に様々なモデルのExampleコードが公開されています。

### 【問題1】公式チュートリアルモデルを分担して実行
TensorFLowの公式チュートリアルモデルを分担して実行してください。


以下の中から1人ひとつ選び実行し、その結果を簡単に発表してください。


[models/tutorials at master · tensorflow/models](https://www.tensorflow.org/tutorials/)



#### [Kerasチューナーの紹介](https://www.tensorflow.org/tutorials/keras/keras_tuner)

##### 概観
Keras Tunerは、TensorFlowプログラムに最適なハイパーパラメータのセットを選択するのに役立つライブラリです。機械学習（ML）アプリケーションに適したハイパーパラメーターのセットを選択するプロセスは、 ハイパーパラメーター チューニングまたはハイパーチューニングと呼ばれます。

ハイパーパラメータは、トレーニングプロセスとMLモデルのトポロジを管理する変数です。これらの変数はトレーニングプロセス全体で一定であり、MLプログラムのパフォーマンスに直接影響します。ハイパーパラメータには次の2つのタイプがあります。

- 非表示レイヤーの数や幅などのモデル選択に影響を与えるモデルハイパーパラメーター
- 確率的勾配降下法（SGD）の学習率やk最近傍（KNN）分類器の最近傍の数など、学習アルゴリズムの速度と品質に影響を与えるアルゴリズムハイパーパラメーター


このチュートリアルでは、Keras Tunerを使用して、画像分類アプリケーションのハイパーチューニングを実行します。

##### Setup

In [2]:
import tensorflow as tf
from tensorflow import keras

import IPython

In [3]:
#!pip install -U keras-tuner
import kerastuner as kt

In [4]:
tf.__version__

'1.14.0'

In [5]:
tf.keras.__version__

'2.2.4-tf'

##### データセットの用意
このチュートリアルでは、Keras Tunerを使用して、 Fashion MNISTデータセットから衣服の画像を分類する機械学習モデルに最適なハイパーパラメーターを見つけます。

データをロードします。

In [6]:
(img_train, label_train), (img_test, label_test) = keras.datasets.fashion_mnist.load_data()

In [7]:
# Normalize pixel values between 0 and 1
#正規化

img_train = img_train.astype('float32') / 255.0
img_test = img_test.astype('float32') / 255.0

In [8]:
display(img_train)
print(img_train.shape)
print("-------------------")
display(label_train)
print(label_train.shape)

array([[[0., 0., 0., ..., 0., 0., 0.],
        [0., 0., 0., ..., 0., 0., 0.],
        [0., 0., 0., ..., 0., 0., 0.],
        ...,
        [0., 0., 0., ..., 0., 0., 0.],
        [0., 0., 0., ..., 0., 0., 0.],
        [0., 0., 0., ..., 0., 0., 0.]],

       [[0., 0., 0., ..., 0., 0., 0.],
        [0., 0., 0., ..., 0., 0., 0.],
        [0., 0., 0., ..., 0., 0., 0.],
        ...,
        [0., 0., 0., ..., 0., 0., 0.],
        [0., 0., 0., ..., 0., 0., 0.],
        [0., 0., 0., ..., 0., 0., 0.]],

       [[0., 0., 0., ..., 0., 0., 0.],
        [0., 0., 0., ..., 0., 0., 0.],
        [0., 0., 0., ..., 0., 0., 0.],
        ...,
        [0., 0., 0., ..., 0., 0., 0.],
        [0., 0., 0., ..., 0., 0., 0.],
        [0., 0., 0., ..., 0., 0., 0.]],

       ...,

       [[0., 0., 0., ..., 0., 0., 0.],
        [0., 0., 0., ..., 0., 0., 0.],
        [0., 0., 0., ..., 0., 0., 0.],
        ...,
        [0., 0., 0., ..., 0., 0., 0.],
        [0., 0., 0., ..., 0., 0., 0.],
        [0., 0., 0., ..., 0., 0.

(60000, 28, 28)
-------------------


array([9, 0, 0, ..., 3, 0, 5], dtype=uint8)

(60000,)


In [9]:
np.unique(label_train)

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9], dtype=uint8)

ラベル数は10

##### モデルを定義する
ハイパーチューニング用のモデルを構築するときは、モデルアーキテクチャに加えて、ハイパーパラメーター検索スペースも定義します。あなたがhypertuning用に設定したモデルはhypermodelと呼ばれます。

次の2つの方法でハイパーモデルを定義できます。

- モデルビルダー機能を使用する
- HyperModel Tuner APIのHyperModelクラスをサブクラス化する

コンピュータビジョンアプリケーションには、 HyperXceptionとHyperResNetの 2つの定義済みHyperModelクラスを使用することもできます。

このチュートリアルでは、モデルビルダー関数を使用して画像分類モデルを定義します。モデルビルダー関数はコンパイルされたモデルを返し、インラインで定義したハイパーパラメーターを使用してモデルをハイパーチューニングします。

In [10]:
def model_builder(hp):
    model = keras.Sequential()
    model.add(keras.layers.Flatten(input_shape=(28, 28)))

    # Tune the number of units in the first Dense layer
    # Choose an optimal value between 32-512
    hp_units = hp.Int('units', min_value = 32, max_value = 512, step = 32) #15パターン
    model.add(keras.layers.Dense(units = hp_units, activation = 'relu')) #
    model.add(keras.layers.Dense(10))

    # Tune the learning rate for the optimizer 
    # Choose an optimal value from 0.01, 0.001, or 0.0001
    hp_learning_rate = hp.Choice('learning_rate', values = [1e-2, 1e-3, 1e-4])  #3パターン

    model.compile(optimizer = keras.optimizers.Adam(learning_rate = hp_learning_rate),
                loss = keras.losses.SparseCategoricalCrossentropy(from_logits = True), 
                metrics = ['accuracy'])

    return model

keras.losses.SparseCategoricalCrossentropy
>ラベルと予測の間のクロスエントロピー損失を計算します。

##### チューナーをインスタンス化してハイパーチューニングを実行する
チューナーをインスタンス化してハイパーチューニングを実行します。

Kerasチューナーには、RandomSearch、Hyperband、BayesianOptimization、およびSklearnの4つのチューナーがあります。 このチュートリアルでは、ハイパーバンドチューナーを使用します。

ハイパーバンドチューナーをインスタンス化するには、ハイパーモデル、最適化の目的 、トレーニングするエポックの最大数（ max_epochs ）を指定する必要があります。

In [11]:
tuner = kt.Hyperband(model_builder,
                     objective = "val_acc", 
                     max_epochs = 10,
                     factor = 3,
                     directory = 'my_dir',
                     project_name = 'intro_to_kt')

INFO:tensorflow:Reloading Oracle from existing project my_dir/intro_to_kt/oracle.json
Instructions for updating:
Call initializer instance with the dtype argument instead of passing it to the constructor
INFO:tensorflow:Reloading Tuner from my_dir/intro_to_kt/tuner0.json


factorはモデルの減らし方をコントロール??（1/3ずつ）

>実行時、下記エラーが発生したので、tensorflow1.14.0にアップグレード
>
>AttributeError: module 'tensorflow._api.v1.keras.metrics' has no attribute 'Metric'.

>2つ下のCodeセルで下記エラー発生したので、'val_accuracy'→'val_acc'
>
>ValueError: Objective value missing in metrics reported to the Oracle, expected: ['val_accuracy'], found: dict_keys(['loss', 'acc', 'val_loss', 'val_acc'])

ハイパーバンドチューニングアルゴリズムは、適応型リソース割り当てと早期停止を使用して、高性能モデルにすばやく収束します。これは、スポーツ選手権スタイルのブラケットを使用して行われます。  
アルゴリズムは、少数のエポックで多数のモデルをトレーニングし、モデルの上位の半分のみを次のラウンドに繰り越します。   
ハイパーバンドは、1 + log`factor`（max_epochs）を計算し、最も近い整数に切り上げることにより、ブラケットでトレーニングするモデルの数を決定します。

ハイパーパラメーター検索を実行する前に、すべてのトレーニングステップの最後にトレーニング出力をクリアするコールバックを定義します。

In [12]:
class ClearTrainingOutput(tf.keras.callbacks.Callback):
    def on_train_end(*args, **kwargs):
        IPython.display.clear_output(wait = True)

ハイパーパラメータ検索を実行します。検索メソッドの引数は、上記のコールバックに加えて、 tf.keras.model.fitに使用されるものと同じです。


In [13]:
%%time

tuner.search(img_train, label_train, epochs = 10, validation_data = (img_test, label_test), callbacks = [ClearTrainingOutput()])

# Get the optimal hyperparameters
best_hps = tuner.get_best_hyperparameters(num_trials = 1)[0]

print(f"""
The hyperparameter search is complete. The optimal number of units in the first densely-connected
layer is {best_hps.get('units')} and the optimal learning rate for the optimizer
is {best_hps.get('learning_rate')}.
""")

INFO:tensorflow:Oracle triggered exit

The hyperparameter search is complete. The optimal number of units in the first densely-connected
layer is 480 and the optimal learning rate for the optimizer
is 0.001.

CPU times: user 22min 16s, sys: 1min 15s, total: 23min 31s
Wall time: 4min 42s


In [14]:
tuner.search_space_summary()

In [15]:
tuner.results_summary()

このチュートリアルを完了するには、検索からの最適なハイパーパラメーターを使用してモデルを再トレーニングします。

In [16]:
# Build the model with the optimal hyperparameters and train it on the data
#最適なハイパーパラメーターを使用してモデルを作成し、データでトレーニングする

model = tuner.hypermodel.build(best_hps)
model.fit(img_train, label_train, epochs = 10, validation_data = (img_test, label_test))

Train on 60000 samples, validate on 10000 samples
Epoch 1/10
Epoch 2/10


Epoch 3/10


Epoch 4/10


Epoch 5/10


Epoch 6/10


Epoch 7/10


Epoch 8/10


Epoch 9/10


Epoch 10/10




<tensorflow.python.keras.callbacks.History at 0x7fe54207f4a8>

my_dir/intro_to_ktディレクトリには、 my_dir/intro_to_kt検索中に実行されたすべてのトライアル（モデル構成）の詳細なログとチェックポイントが含まれています。ハイパーパラメータ検索を再実行すると、Keras Tunerはこれらのログの既存の状態を使用して検索を再開します。この動作を無効にするには、チューナーをインスタンス化するときに追加のoverwrite = True引数を渡します。

In [17]:
tuner = kt.Hyperband(model_builder,
                     objective = "val_acc", 
                     max_epochs = 10,
                     factor = 3,
                     directory = 'my_dir',
                     project_name = 'intro_to_kt')

INFO:tensorflow:Reloading Oracle from existing project my_dir/intro_to_kt/oracle.json
INFO:tensorflow:Reloading Tuner from my_dir/intro_to_kt/tuner0.json


In [18]:
tuner.results_summary()

このチュートリアルでは、Keras Tunerを使用してモデルのハイパーパラメーターを調整する方法を学びました。 Keras Tunerの詳細については、次の追加リソースをご覧ください。

- [TensorFlowブログのKeras Tuner](https://blog.tensorflow.org/2020/01/hyperparameter-tuning-with-keras-tuner.html)
- [Keras TunerのWebサイト](https://keras-team.github.io/keras-tuner/)

また、 TensorBoardのHParams Dashboardをチェックして、モデルのハイパーパラメーターをインタラクティブに調整します。

----

#### 異なるフレームワークへの書き換え

「ディープラーニングフレームワーク1」で作成した4種類のデータセットを扱うTensorFLowのコードを異なるフレームワークに変更していきます。


- Iris（Iris-versicolorとIris-virginicaのみの2値分類）
- Iris（3種類全ての目的変数を使用して多値分類）
- House Prices
- MNIST

##### Kerasへの書き換え
KerasはTensorFLowに含まれるtf.kerasモジュールを使用してください。


KerasにはSequentialモデルかFunctional APIかなど書き方に種類がありますが、これは指定しません。

### 【問題3】Iris（2値分類）をKerasで学習
TensorFlowによるIrisデータセットに対する2値分類をKerasに書き換えてください。



In [51]:
df = pd.read_csv("Iris.csv")
display(df.head())
df.shape

Unnamed: 0,Id,SepalLengthCm,SepalWidthCm,PetalLengthCm,PetalWidthCm,Species
0,1,5.1,3.5,1.4,0.2,Iris-setosa
1,2,4.9,3.0,1.4,0.2,Iris-setosa
2,3,4.7,3.2,1.3,0.2,Iris-setosa
3,4,4.6,3.1,1.5,0.2,Iris-setosa
4,5,5.0,3.6,1.4,0.2,Iris-setosa


(150, 6)

In [20]:
# データフレームから条件抽出
df = df[(df["Species"] == "Iris-versicolor")|(df["Species"] == "Iris-virginica")]
y = df["Species"]
X = df.loc[:, ["SepalLengthCm", "SepalWidthCm", "PetalLengthCm", "PetalWidthCm"]]
y = np.array(y)
X = np.array(X)
# ラベルを数値に変換
y[y=='Iris-versicolor'] = 0
y[y=='Iris-virginica'] = 1
y = y.astype(np.int)[:, np.newaxis]

#データ分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=2)

In [21]:
from keras.models import Sequential
from keras.layers.core import Dense
from keras.utils import to_categorical
from keras.optimizers import Adam
from keras.callbacks import CSVLogger

#学習
model = Sequential()
model.add(Dense(input_dim=4, output_dim=50, bias=True, activation='relu'))
model.add(Dense(input_dim=50, output_dim=100, bias=True, activation='relu'))
model.add(Dense(input_dim=100, output_dim=1, bias=True, activation='sigmoid'))
model.compile(loss='binary_crossentropy', optimizer=Adam(), metrics=['accuracy'])
csv_logger = CSVLogger('log.csv', separator=',', append=False)
history = model.fit(X_train, y_train,
                    batch_size=32, epochs=100,
                    validation_data=(X_test, y_test)) #callbacks=[csv_logger]を追加でlogをcsvで保存可能

Using TensorFlow backend.
  if __name__ == '__main__':
  # Remove the CWD from sys.path while we load stuff.
  # This is added back by InteractiveShellApp.init_path()


Instructions for updating:
Use tf.where in 2.0, which has the same broadcast rule as np.where

Train on 80 samples, validate on 20 samples
Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100


Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78/100
Epoch 79/100
Epoch 80/100
Epoch 81/100
Epoch 82/100
Epoch 83/100
Epoch 84/100
Epoch 85/100


Epoch 86/100
Epoch 87/100
Epoch 88/100
Epoch 89/100
Epoch 90/100
Epoch 91/100
Epoch 92/100
Epoch 93/100
Epoch 94/100
Epoch 95/100
Epoch 96/100
Epoch 97/100
Epoch 98/100
Epoch 99/100
Epoch 100/100


In [22]:
#推定
pred_train = np.round(model.predict(X_train)) #0.5以上なら1に切り上げ、未満なら0に切り下げ
pred_test = np.round(model.predict(X_test))

print(pred_train.reshape(1, -1))
print((pred_train == y_train).reshape(1, -1))
print("---------------------")
print(pred_test.reshape(1, -1))
print((pred_test == y_test).reshape(1, -1))

[[0. 0. 1. 0. 1. 0. 0. 1. 1. 1. 1. 0. 1. 0. 0. 1. 0. 1. 1. 0. 0. 1. 1. 1.
  1. 0. 0. 0. 1. 1. 0. 1. 0. 1. 1. 0. 1. 0. 1. 0. 1. 1. 1. 1. 1. 1. 1. 1.
  1. 1. 1. 0. 1. 1. 1. 1. 1. 0. 1. 0. 0. 1. 0. 0. 1. 0. 1. 0. 1. 1. 0. 0.
  0. 1. 1. 0. 1. 1. 0. 0.]]
[[ True  True  True  True  True  True  True  True  True  True  True  True
  False  True  True  True  True  True  True  True  True  True  True  True
   True  True  True  True  True  True  True  True  True  True  True  True
   True  True  True  True  True  True  True  True  True  True  True  True
   True  True  True  True  True  True  True  True False  True  True  True
   True  True  True  True False  True  True  True  True  True  True  True
   True  True  True  True False  True  True  True]]
---------------------
[[1. 0. 1. 0. 0. 0. 0. 0. 0. 0. 1. 1. 1. 0. 0. 0. 0. 0. 1. 1.]]
[[ True  True  True  True  True  True  True  True  True  True  True  True
   True  True  True  True  True  True  True  True]]


### 【問題4】Iris（多値分類）をKerasで学習
TensorFlowによるIrisデータセットに対する3値分類をKerasに書き換えてください。

#### 単純パーセプトロン

[入門 Keras (4) 多クラス分類 – Iris データを学習する](https://www.infiniteloop.co.jp/blog/2018/01/learning-keras-04/)

In [52]:
# データフレームから条件抽出
y = df["Species"]
X = df.loc[:, ["SepalLengthCm", "SepalWidthCm", "PetalLengthCm", "PetalWidthCm"]]
y = np.array(y)
X = np.array(X)
# ラベルを数値に変換
y[y=='Iris-setosa'] = 0
y[y=='Iris-versicolor'] = 1
y[y=='Iris-virginica'] = 2

#kerasのto_categorical関数でone-hot-encodeing
from keras.utils import np_utils
y = np_utils.to_categorical(y)

#データ分割
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

#学習
from keras.models import Sequential
from keras.layers import Dense, Activation
from keras.optimizers import SGD
from keras.optimizers import Adam
model = Sequential()
model.add(Dense(input_dim=4, units=3)) # 入力が4種の特徴、3つに分離
model.add(Activation('softmax'))
#コンパイル時に損失関数と最適化手法、評価関数を指定
model.compile(loss='categorical_crossentropy', optimizer=SGD(lr=0.1), metrics=['accuracy'])
model.fit(X_train, y_train, epochs=50, batch_size=10) # エポック50, ミニバッチ 10

Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50


<keras.callbacks.callbacks.History at 0x7fe557b07630>

In [53]:
#推定
y_pred = model.predict_classes(X_test, batch_size=10) # ミニバッチは訓練時と同じく 10

#評価
_, y_test_label = np.where(y_test > 0) #onr-hot表現をラベルに
print(y_pred == y_test_label)
print("----------------------------")

train_score = model.evaluate(X_train, y_train, verbose=0)
print('Train loss:', train_score[0])
print('Train accuracy:', train_score[1])
print("----------------------------")

test_score = model.evaluate(X_test, y_test, verbose=0)
print('Test loss:', test_score[0])
print('Test accuracy:', test_score[1])

[ True  True  True  True  True  True  True False False  True  True  True
 False False False  True False False  True  True  True False  True  True
  True  True  True  True  True  True]
----------------------------
Train loss: 0.3027863085269928
Train accuracy: 0.8500000238418579
----------------------------
Test loss: 0.40847671031951904
Test accuracy: 0.7333333492279053


#### 3層ニューラルネットワーク

[KerasでIrisのデータセットを分類し、モデルを保存する](https://snova301.hatenablog.com/entry/2018/10/29/175028)

In [54]:
from keras.models import Sequential
from keras.layers.core import Dense
from keras.utils import to_categorical
from keras.optimizers import Adam
from keras.callbacks import CSVLogger

#学習
model = Sequential()
model.add(Dense(input_dim=4, output_dim=50, bias=True, activation='relu'))
model.add(Dense(input_dim=50, output_dim=100, bias=True, activation='relu'))
model.add(Dense(input_dim=100, output_dim=3, bias=True, activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer=Adam(), metrics=['accuracy'])
csv_logger = CSVLogger('log.csv', separator=',', append=False)
history = model.fit(X_train, y_train,
                    batch_size=32, epochs=100,
                    validation_data=(X_test, y_test)) #callbacks=[csv_logger]を追加でlogをcsvで保存可能

  if __name__ == '__main__':
  # Remove the CWD from sys.path while we load stuff.
  # This is added back by InteractiveShellApp.init_path()


Train on 120 samples, validate on 30 samples
Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100


Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78/100
Epoch 79/100
Epoch 80/100
Epoch 81/100
Epoch 82/100
Epoch 83/100
Epoch 84/100
Epoch 85/100
Epoch 86/100
Epoch 87/100


Epoch 88/100
Epoch 89/100
Epoch 90/100
Epoch 91/100
Epoch 92/100
Epoch 93/100
Epoch 94/100
Epoch 95/100
Epoch 96/100
Epoch 97/100
Epoch 98/100
Epoch 99/100
Epoch 100/100


In [55]:
#推定
pred_train = model.predict(X_train)
pred_test = model.predict(X_test)
pred_train = np.argmax(pred_train, axis=1) #一番大きな値のインデックスを出力
pred_test = np.argmax(pred_test, axis=1)


print(pred_train)
print(pred_train == np.argmax(y_train, axis=1))
print("---------------------")
print(pred_test)
print(pred_test == np.argmax(y_test, axis=1))

[2 1 0 2 2 1 0 2 1 1 2 0 2 0 0 1 2 2 2 2 1 2 1 1 2 2 2 2 1 2 1 0 2 1 1 1 1
 2 0 0 2 1 0 0 1 0 2 1 0 2 2 1 0 2 2 2 2 0 0 2 2 0 2 0 2 2 0 0 2 0 0 0 1 2
 2 0 0 0 1 1 0 0 1 0 2 1 2 1 0 2 0 2 0 0 2 0 2 1 1 1 2 2 2 1 0 1 2 2 0 1 1
 2 1 0 0 0 2 1 2 0]
[ True  True  True  True  True  True  True False  True  True  True  True
  True  True  True  True  True  True  True  True  True  True  True  True
  True  True  True  True  True  True  True  True  True  True  True  True
  True  True  True  True  True  True  True  True  True  True  True  True
  True False  True  True  True  True  True  True  True  True  True  True
  True  True  True  True  True  True  True  True  True  True  True  True
  True  True  True  True  True  True  True  True  True  True  True  True
  True  True  True  True  True  True  True  True  True  True  True  True
  True  True  True  True  True  True False  True  True  True  True  True
  True  True  True False  True  True  True  True  True  True  True  True]
---------------------
[2

In [63]:
#評価
train_score = model.evaluate(X_train, y_train)
test_score = model.evaluate(X_test, y_test)



In [64]:
print('Train loss:', train_score[0])
print('Train accuracy:', train_score[1])
print("----------------------------")
print('Test loss:', test_score[0])
print('Test accuracy:', test_score[1])

Train loss: 0.08267993330955506
Train accuracy: 0.9666666388511658
----------------------------
Test loss: 0.03807102516293526
Test accuracy: 1.0


### 【問題5】House PricesをKerasで学習
TensorFlowによるHouse Pricesデータセットに対する回帰をKerasに書き換えてください。

In [5]:
# データセットの読み込み
df = pd.read_csv("train.csv")

# データフレームから条件抽出
X = df.loc[:, ["GrLivArea", "YearBuilt"]].values
y = df.loc[:, "SalePrice"].values

#標準化、対数変換
scaler = StandardScaler()
scaler.fit(X)
X_scaled = scaler.transform(X)
y_scaled = np.log(y)
y_scaled = y_scaled[:, np.newaxis]

#分割
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y_scaled, test_size=0.2, random_state=0)
# さらにtrainとvalに分割
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=0)



In [10]:
from keras.models import Sequential
from keras.layers import Dense, Activation
from keras.optimizers import SGD
from keras.optimizers import Adam
from keras.callbacks import CSVLogger

#学習
model = Sequential()
model.add(Dense(input_dim=2, output_dim=50, bias=True, activation='relu'))
model.add(Dense(input_dim=50, output_dim=100, bias=True, activation='relu'))
model.add(Dense(input_dim=100, output_dim=1, bias=True))
model.compile(loss='mse', optimizer=Adam(), metrics=['mse'])
csv_logger = CSVLogger('log.csv', separator=',', append=False)
history = model.fit(X_train, y_train,
                    batch_size=32, epochs=100,
                    validation_data=(X_test, y_test)) 

  if __name__ == '__main__':
  # Remove the CWD from sys.path while we load stuff.
  # This is added back by InteractiveShellApp.init_path()



Train on 934 samples, validate on 292 samples
Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100


Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78/100
Epoch 79/100
Epoch 80/100
Epoch 81/100
Epoch 82/100
Epoch 83/100
Epoch 84/100
Epoch 85/100
Epoch 86/100
Epoch 87/100
Epoch 88/100
Epoch 89/100
Epoch 90/100
Epoch 91/100
Epoch 92/100
Epoch 93/100
Epoch 94/100
Epoch 95/100
Epoch 96/100
Epoch 97/100
Epoch 98/100
Epoch 99/100
Epoch 100/100


In [14]:
#評価
test_mse = model.evaluate(X_test, y_test, verbose=0)
print("test_mse : ", test_mse[0])

test_mse :  0.05575376228518682


### 【問題6】MNISTをKerasで学習
TensorFlowによるMNISTデータセットによる画像の多値分類をKerasに書き換えてください。

In [4]:
#MNISTデータ
from keras.datasets import mnist
(X_train_, y_train), (X_test, y_test) = mnist.load_data()

In [5]:
#平滑化
X_train_ = X_train_.reshape(-1, 784)
X_test = X_test.reshape(-1, 784)

#正規化
X_train_ = X_train_.astype(np.float)
X_test = X_test.astype(np.float)
X_train_ /= 255
X_test /= 255

#ワンホットエンコーディング
from sklearn.preprocessing import OneHotEncoder
enc = OneHotEncoder(handle_unknown='ignore', sparse=False)
y_train_one_hot = enc.fit_transform(y_train[:, np.newaxis])
y_test_one_hot = enc.transform(y_test[:, np.newaxis])

# trainとtestに分割
X_train, X_test, y_train, y_test = train_test_split(X_train_, y_train_one_hot, test_size=0.2, random_state=0)
# さらにtrainとvalに分割
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, random_state=0)

In [6]:
from keras.models import Sequential
from keras.layers.core import Dense
from keras.utils import to_categorical
from keras.optimizers import Adam
from keras.callbacks import CSVLogger

#学習
model = Sequential()
model.add(Dense(input_dim=784, output_dim=50, bias=True, activation='relu'))
model.add(Dense(input_dim=50, output_dim=100, bias=True, activation='relu'))
model.add(Dense(input_dim=100, output_dim=10, bias=True, activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer=Adam(), metrics=['accuracy'])
csv_logger = CSVLogger('log.csv', separator=',', append=False)
history = model.fit(X_train, y_train,
                    batch_size=32, epochs=30,
                    validation_data=(X_test, y_test))

  if __name__ == '__main__':
  # Remove the CWD from sys.path while we load stuff.
  # This is added back by InteractiveShellApp.init_path()



Train on 38400 samples, validate on 12000 samples
Epoch 1/30
Epoch 2/30
Epoch 3/30
Epoch 4/30
Epoch 5/30
Epoch 6/30
Epoch 7/30
Epoch 8/30
Epoch 9/30
Epoch 10/30
Epoch 11/30
Epoch 12/30
Epoch 13/30
Epoch 14/30
Epoch 15/30
Epoch 16/30
Epoch 17/30
Epoch 18/30
Epoch 19/30
Epoch 20/30
Epoch 21/30
Epoch 22/30
Epoch 23/30
Epoch 24/30
Epoch 25/30
Epoch 26/30
Epoch 27/30
Epoch 28/30
Epoch 29/30
Epoch 30/30


In [7]:
#推定
pred_train = model.predict(X_train)
pred_test = model.predict(X_test)
pred_train = np.argmax(pred_train, axis=1) #一番大きな値のインデックスを出力
pred_test = np.argmax(pred_test, axis=1)

np.set_printoptions(threshold=0)
print(pred_train)
print(pred_train == np.argmax(y_train, axis=1))
print("---------------------")
print(pred_test)
print(pred_test == np.argmax(y_test, axis=1))

[9 0 7 ... 1 7 5]
[ True  True  True ...  True  True  True]
---------------------
[3 6 6 ... 5 1 6]
[ True  True  True ...  True  True  True]


In [8]:
#評価
train_score = model.evaluate(X_train, y_train)
test_score = model.evaluate(X_test, y_test)



In [10]:
print('Train loss:', train_score[0])
print('Train accuracy:', train_score[1])
print("----------------------------")
print('Test loss:', test_score[0])
print('Test accuracy:', test_score[1])

Train loss: 0.006110339705029695
Train accuracy: 0.9982812404632568
----------------------------
Test loss: 0.19634726526020313
Test accuracy: 0.9715833067893982
