### 【問題1】公式Exampleを分担して実行

In [15]:
#
# 公式チュートリアル
#

import tensorflow as tf

mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0 # feature scalingのために255で割る
model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(input_shape=(28, 28)),
  tf.keras.layers.Dense(128, activation='relu'),
  tf.keras.layers.Dropout(0.2),
  tf.keras.layers.Dense(10)
])
predictions = model(x_train[:1]).numpy()
predictions
tf.nn.softmax(predictions).numpy()
loss_fn = tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True)
loss_fn(y_train[:1], predictions).numpy()
model.compile(optimizer='adam',
              loss=loss_fn,
              metrics=['accuracy'])
# 学習
model.fit(x_train, y_train, epochs=5)
model.evaluate(x_test,  y_test, verbose=2)
probability_model = tf.keras.Sequential([
  model,
  tf.keras.layers.Softmax()
])
probability_model(x_test[:5])

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
313/313 - 0s - loss: 0.0719 - accuracy: 0.9787


### 【問題2】Iris（2値分類）をKerasで学習

In [58]:
import tensorflow as tf
import keras
from sklearn import datasets
from sklearn import preprocessing
from keras.utils import np_utils
from sklearn.model_selection import train_test_split
from keras.models import Sequential
from keras.layers.core import Dense, Activation
import pandas as pd

# データ準備
iris_dataset = datasets.load_iris()
x = pd.DataFrame(iris_dataset.data, columns=["sepal_length", "sepal_width", "petal_length", "petal_width"])
y = pd.Series(iris_dataset.target, name="y")
df_train = x.join(y).query('y in (1,2)') # yを2値に変換
x = df_train.drop(["y"],  axis=1)
y = df_train["y"]

# 正規化 (精度向上のため)
x = preprocessing.scale(x)

# ワンホットエンコーディング
y = np_utils.to_categorical(y)

# 分割 
x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=0)

# モデルの初期化
model = Sequential()
# Denseの第一引数は隠れ層のニューロン数を、
# 第二引数は入力層（がくの長さ、幅、花弁の長さ、幅）をタプル形式で指定
model.add(Dense(16, input_shape=(4,)))
model.add(Activation('relu'))
# ３種の分類をしたいので出力層は3を指定
model.add(Dense(3))
model.add(Activation('softmax')) # Activationは活性化関数
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# 学習
# epochs: 整数でモデルを訓練するエポック数（x・y全データの反復）
# batch_size: 設定したサンプル数ごとに勾配の更新
model.fit(x_train, y_train, epochs=10, batch_size=1, verbose=1)

# 推定/評価
loss, accuracy = model.evaluate(x_test, y_test, verbose=0)
print('アヤメ 2値分類 Accuracy', '{:.2f}'.format(accuracy))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
アヤメ 2値分類 Accuracy 0.92


### 【問題3】Iris（多値分類）をKerasで学習

In [57]:
# 参考: https://chusotsu-program.com/tensorflow-keras-iris/

import tensorflow as tf
import keras
from sklearn import datasets
from sklearn import preprocessing
from keras.utils import np_utils
from sklearn.model_selection import train_test_split
from keras.models import Sequential
from keras.layers.core import Dense, Activation
 
iris = datasets.load_iris()
x = iris.data
y = iris.target

# 正規化 (精度向上のため)
x = preprocessing.scale(x)

# ワンホットエンコーディング
y = np_utils.to_categorical(y)

# 分割 
x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=0)

# モデルの初期化
model = Sequential()
# Denseの第一引数は隠れ層のニューロン数を、
# 第二引数は入力層（がくの長さ、幅、花弁の長さ、幅）をタプル形式で指定
model.add(Dense(16, input_shape=(4,)))
model.add(Activation('relu'))
# ３種の分類をしたいので出力層は3を指定
model.add(Dense(3))
model.add(Activation('softmax')) # Activationは活性化関数


model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
# epochs: 整数でモデルを訓練するエポック数（x・y全データの反復）
# batch_size: 設定したサンプル数ごとに勾配の更新
model.fit(x_train, y_train, epochs=30, batch_size=1, verbose=1)

loss, accuracy = model.evaluate(x_test, y_test, verbose=0)
print('Accuracy', '{:.2f}'.format(accuracy))

Epoch 1/30
Epoch 2/30
Epoch 3/30
Epoch 4/30
Epoch 5/30
Epoch 6/30
Epoch 7/30
Epoch 8/30
Epoch 9/30
Epoch 10/30
Epoch 11/30
Epoch 12/30
Epoch 13/30
Epoch 14/30
Epoch 15/30
Epoch 16/30
Epoch 17/30
Epoch 18/30
Epoch 19/30
Epoch 20/30
Epoch 21/30
Epoch 22/30
Epoch 23/30
Epoch 24/30
Epoch 25/30
Epoch 26/30
Epoch 27/30
Epoch 28/30
Epoch 29/30
Epoch 30/30
Accuracy 0.97


### 【問題4】House PricesをKerasで学習

In [28]:
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_boston
import pandas as pd
import matplotlib.pyplot as plt
from tensorflow.python import keras as K
import pandas as pd
pd.set_option('display.expand_frame_repr', False)
pd.set_option('display.max_columns', 6)
pd.set_option('display.max_info_rows', 6)

# データセット準備
df_base = pd.read_csv("../data/house-prices-advanced-regression-techniques/train.csv")
feature_names = ["GrLivArea", "YearBuilt"]
y_name = "SalePrice"
x = df_base.loc[:, feature_names].values
y = df_base[y_name].values

# 前処理
# 訓練データとテストデータに分ける
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, shuffle=True, random_state=0)

# モデル準備
model = K.Sequential([
    # データの正規化（入力は１３の特徴量）
    K.layers.BatchNormalization(input_shape=(2,)),
    # １層目のニューラルネットワーク
    #   活性化関数はsoftplus
    #   kernel_regularizer正則化=>重みに制限をかける=>過学習防止
    K.layers.Dense(units=2, activation="softplus", kernel_regularizer="l1"),
    # ２層目のニューラルネットワーク
    K.layers.Dense(units=1)
])
# loss=最小二乗法  optimizer=最適化に確率的勾配降下法
model.compile(loss="mean_absolute_error", optimizer="adam")

# 学習
model.fit(x_train, y_train, epochs=10)

# 予測を行う
predicts = model.predict(x_test)

# 評価
display(model.evaluate(x_test, y_test, verbose=1))

# 結果をグラフ表示する。
# result = pd.DataFrame({
#     "predict": np.reshape(predicts, (-1,)),   # 2次元データを1次元データに変換
#     "actual": y_test
# })
# result.plot.scatter(x="actual", y="predict")
# plt.show()

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


181369.546875

### 【問題5】MNISTをKerasで学習

In [32]:
import numpy as np
import tensorflow as tf
import tensorflow_datasets as tfds

# PrefetchDataset
mnist_dataset, mnist_info = tfds.load(name="mnist", with_info=True, as_supervised=True)
# PrefetchDataset
mnist_train, mnist_test = mnist_dataset["train"], mnist_dataset['test']

# EagerTensor
# なぜtf.castを通しているのかは現段階では不明、おそらくtf内で計算しやすいオブジェクトにしているのではなかろうか
num_valid_samples = tf.cast(0.1 * mnist_info.splits['train'].num_examples, tf.int64)
num_test_samples = tf.cast(mnist_info.splits['test'].num_examples, tf.int64)


# Feature Scaling 0~255 => 0~1 にスケーリングする
def scale(image, label):
    image = tf.cast(image, tf.float32)
    image /= 255.
    return image, label


# MapDataset
scaled_train_and_valid_data = mnist_train.map(scale)
test_data = mnist_test.map(scale)

# train/validにsplit
BUFFER_SIZE = 10000 # メモリ対策
shuffled_train_and_valid_data = scaled_train_and_valid_data.shuffle(BUFFER_SIZE)
valid_data = shuffled_train_and_valid_data.take(num_valid_samples)
train_data = shuffled_train_and_valid_data.skip(num_valid_samples)

# 負荷対策
BATCH_SIZE = 100
train_data = train_data.batch(BATCH_SIZE)
valid_data = valid_data.batch(num_valid_samples)
test_data = test_data.batch(num_test_samples)

valid_inputs, valid_targets = next(iter(valid_data))

#
# モデルの作成
# 隠れ層: 2層
# 合計: 4層
#
input_size = 784 # 28 * 28 * 1
output_size = 10
hidden_layer_size = 50
model = tf.keras.Sequential([
    tf.keras.layers.Flatten(input_shape=(28,28,1)), # 1列に変換
    tf.keras.layers.Dense(hidden_layer_size, activation='relu'),
    tf.keras.layers.Dense(hidden_layer_size, activation='relu'),
    tf.keras.layers.Dense(output_size, activation='softmax'),
])
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

# 学習
model.fit(train_data, epochs=5, validation_data=(validation_inputs, validation_targets), verbose =2)

# 評価
test_loss, test_accuracy = model.evaluate(test_data)
print('Test loss: {0:.2f}. Test accuracy: {1:.2f}%'.format(test_loss, test_accuracy*100.))

Epoch 1/5
540/540 - 3s - loss: 0.4242 - accuracy: 0.8815 - val_loss: 0.2284 - val_accuracy: 0.9332
Epoch 2/5
540/540 - 2s - loss: 0.1926 - accuracy: 0.9443 - val_loss: 0.1588 - val_accuracy: 0.9543
Epoch 3/5
540/540 - 2s - loss: 0.1432 - accuracy: 0.9577 - val_loss: 0.1308 - val_accuracy: 0.9620
Epoch 4/5
540/540 - 1s - loss: 0.1142 - accuracy: 0.9660 - val_loss: 0.1134 - val_accuracy: 0.9675
Epoch 5/5
540/540 - 2s - loss: 0.1000 - accuracy: 0.9699 - val_loss: 0.0952 - val_accuracy: 0.9712
Test loss: 0.11. Test accuracy: 96.61%
