# ニューラルネットワークによる手書き数字画像の分類
MNISTの0から9までの手書き数字の画像を分類する

## 画像データの読み込み


In [None]:
%matplotlib inline
!pip install japanize-matplotlib

import numpy as np
import tensorflow as tf
from tensorflow.keras import datasets
import matplotlib.pyplot as plt
import japanize_matplotlib


(x_train, y_train), (x_test, y_test) = datasets.mnist.load_data()


画像の枚数と画素数を確認する

In [None]:
print("訓練用画像の枚数と画素数")
print(x_train.shape)

print()

print("テスト用画像の枚数と画素数")
print(x_test.shape)


テスト用画像の1枚目の多次元配列を表示してみる

In [None]:
# 途中で改行されないように、一行に表示できる文字数を200文字に変更
np.set_printoptions(linewidth=200)


print(x_train[0])

## 訓練用画像の表示

In [None]:
fig = plt.figure()


for i in range(0,15):

  ax = fig.add_subplot(3, 5, i+1)

  ax.set_title("正解ラベル" + str(y_train[i]))

  ax.imshow(x_train[i], cmap='Greys')

fig.tight_layout()

plt.show()

## 画像の正規化
画素値が0から1の範囲に収まるように前処理を行う

In [None]:
x_train = x_train / 255
x_test = x_test / 255

カテゴリ変数をone-hotエンコーディングする

In [None]:
from tensorflow.keras.utils import to_categorical

print("エンコーディング前のラベルの一部を表示")
print(y_train[0:4])

y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)

print()
print("エンコーディング後のラベルの一部を表示")
print(y_train[0:4])

## モデルの作成

In [None]:
from tensorflow.keras.models import Sequential

# 講義資料を参考にし、抜けている部分を自分で書き足しなさい
model =

## モデルへニューロンの層を追加

In [None]:
# 追加する層をインポートしておく
from tensorflow.keras.layers import Dense, Dropout, Flatten


# Flatten層の追加
# 28画素×28画素の画像を1次元配列に変換する
# 講義資料を参考にし、抜けている部分を自分で書き足しなさい
model.add(Flatten(     ))

# 中間層(隠れ層)の追加
# 講義資料を参考にし、抜けている部分を自分で書き足しなさい
model.add(Dense(       ))

# 出力層の追加
# 講義資料を参考にし、抜けている部分を自分で書き足しなさい
model.add(Dense(       ))



## モデルのコンパイル

In [None]:
# 講義資料を参考にし、抜けている部分を自分で書き足しなさい
model.compile(optimizer =     ,
              loss =        ,
              metrics = [        ])

model.summary()

## 学習の実行

In [None]:
epochs = 10

# 講義資料を参考にし、抜けている部分を自分で書き足しなさい
results = model.fit(      ,      , epochs =    , \
                    validation_data = (        ))

## 学習履歴の可視化

In [None]:

# 学習のエポック数のリストを生成
epo = range(1, epochs+1)


#------------------------------
# 損失関数のグラフを表示
#------------------------------

fig = plt.figure()
ax = fig.add_subplot(111)

ax.set_xlabel("エポック")
ax.set_ylabel("loss")


ax.set_xlim(0,epochs + 1)
ax.set_ylim(0,0.4)



# 訓練用データでの損失関数のグラフ
ax.plot(epo, results.history["loss"], label="訓練用データ")
# テスト用データでの損失関数のグラフ
ax.plot(epo, results.history["val_loss"], label="テスト用データ")

ax.legend()

plt.show()


#------------------------------
# 正解率のグラフを表示
#------------------------------


fig = plt.figure()
ax = fig.add_subplot(111)

ax.set_xlabel("エポック")
ax.set_ylabel("accuracy")

ax.set_xlim(0,epochs + 1)
ax.set_ylim(0,1)


# 訓練用データでの正解率のグラフ
ax.plot(epo, results.history["accuracy"], label="訓練用データ")
# テスト用データでの正解率のグラフ
ax.plot(epo, results.history["val_accuracy"], label="テスト用データ")

ax.legend()

plt.show()




## 学習済みモデルを用いた予測

In [None]:
# テストデータに対する予測
y_pred = model.predict(x_test)

# 予測値の最初のいくつかを表示
print("予測結果の一部を表示")
print(y_pred[0:4])

print()

# 最も確率が高いラベルを選ぶ
predicted_label = np.argmax(y_pred, axis=1)
print("予測したラベルの一部を表示")
print(predicted_label[0:4])

## 混同行列の表示

In [None]:
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay



# テストデータの正解ラベル
y_test_label = np.argmax(y_test, axis=1)



# 混同行列の計算
cm = confusion_matrix(y_test_label, predicted_label)

# 混同行列のヒートマップを作成
disp = ConfusionMatrixDisplay(confusion_matrix=cm)


disp.plot()

plt.show()