### 必要なライブラリと、データのインポート

In [3]:
import numpy as np
import tensorflow as tf

# tensorflow-datasetsモジュールを使ってMNISTデータセットをインポートしていきます。まだインストールしていない場合は以下のコマンドでインストールしましょう。
# pip install tensorflow-datasets 
# conda install tensorflow-datasets

import tensorflow_datasets as tfds

# このデータセットは、C:\Users\*USERNAME*\tensorflow_datasets\...に保存されます。

### データセットを読み込む

In [5]:
# tfds.loadを使ってデータセットを読み込んでいきます 
mnist_dataset, mnist_info = tfds.load(name='mnist',with_info=True,as_supervised=True)
# with_info=True をすることによって、データに関する情報を得ることができるようになります。

# as_supervised=Trueをすることによって、データを入力とターゲットの二つののタプル形式で作成することができま
print(mnist_info)



tfds.core.DatasetInfo(
    name='mnist',
    version=1.0.0,
    description='The MNIST database of handwritten digits.',
    urls=['https://storage.googleapis.com/cvdf-datasets/mnist/'],
    features=FeaturesDict({
        'image': Image(shape=(28, 28, 1), dtype=tf.uint8),
        'label': ClassLabel(shape=(), dtype=tf.int64, num_classes=10),
    }),
    total_num_examples=70000,
    splits={
        'test': 10000,
        'train': 60000,
    },
    supervised_keys=('image', 'label'),
    citation="""@article{lecun2010mnist,
      title={MNIST handwritten digit database},
      author={LeCun, Yann and Cortes, Corinna and Burges, CJ},
      journal={ATT Labs [Online]. Available: http://yann. lecun. com/exdb/mnist},
      volume={2},
      year={2010}
    }""",
    redistribution_info=,
)



In [11]:
print(mnist_dataset['train'])
print(mnist_info.splits['train'])

<_OptionsDataset shapes: ((28, 28, 1), ()), types: (tf.uint8, tf.int64)>
<tfds.core.SplitInfo num_examples=60000>


### 訓練用、検証用、テスト用の個数を定義し、変数に代入する

In [69]:
# 訓練用データとテスト用データをそれぞれの変数に代入します
mnist_train, mnist_test =mnist_dataset['train'],mnist_dataset['test']

# ここから検証用データセットを作っていきます。まずは、検証用データに割り当てる割合を決めます。
num_validation_samples = 0.1*mnist_info.splits['train'].num_examples
# 数字を整数に変換していきます（既に整数になっている場合も念のため行います）
num_validation_samples = tf.cast(num_validation_samples,tf.int64)
# テストデータの数も変数に入れていきます
num_test_samples =mnist_info.splits['test'].num_examples
# 数字を整数に変換していきます
num_test_samples =tf.cast(num_test_samples,tf.int64 )


### データを0,1の形に変換し、それを訓練、検証、テスト用データに適応させる

In [70]:

# 元の入力データの範囲である0から255を0と1に変えていきます
# 今回は、変換するための関数を作成していきます
def scale(image, label):
    # 数字が小数であることを確認します
    image =tf.cast(image,tf.float32)
    # 0と1の範囲におさめるため、255で割っていきます 
    image /=255

    return image, label

# メソッドを使ってデータの変換を行っていきます
scaled_train_and_validation_data = mnist_train.map(scale)


# テストデータに関しても同様の変換を行っていきます
test_data = mnist_test.map(scale)



### データをシャッフルし、バッチごとに分けていく

In [71]:
#データをシャッフルするためのバッファのサイズを決めていきます
BUFFER_SIZE = 10000

# シャッフルメソッドを使ってデータをシャッフルしていきます
shuffled_train_and_validation_data = scaled_train_and_validation_data.shuffle(BUFFER_SIZE)

# メソッドを使ってシャッフルした検証用データを変数に代入していきます
validation_data = shuffled_train_and_validation_data.take(num_validation_samples)

# メソッドを使って訓練用データセットを変数に代入します
train_data =  shuffled_train_and_validation_data.skip(num_validation_samples)

# batchの大きさを定義します
BATCH_SIZE = 100

# 訓練、検証データをバッチの数毎に分けていきます
#それぞれどのようなバッチ数毎に分けていくのかを注意する
train_data = train_data.batch(BATCH_SIZE)

validation_data =validation_data.batch(num_validation_samples)
# テストデータに関してもバッチ毎に分けていきます
test_data = test_data.batch(num_test_samples )


# バリデーションデータセットに関し、入力とターゲットそれぞれの変数を作成していきます
validation_inputs, validation_targets = next(iter(validation_data))

### TensorFlowを用いて入力、出力のデータ数等を定義しモデルを作成し、フィットさせる

In [72]:
input_size = 756
output_size = 10
# 隠れ層のユニットの数を定義します
hidden_layer_size = 50
    
# モデルの定義を進めていきます
model = tf.keras.Sequential([
    
    # 入力層の定義をしていきます
    # ①もとの行列のデータをベクトルに変換します
    tf.keras.layers.Flatten(input_shape=(28,28,1)),# 入力層
    
    # tf.keras.layers.Dense は線形結合をするための計算を行います。つまり、入力と重みの積にバイアスを追加する形です
    # 引数として、ここでは隠れ層の数と活性化関数を指定します
    tf.keras.layers.Dense(hidden_layer_size, activation='relu'), # 1番目の隠れ層
    tf.keras.layers.Dense(hidden_layer_size, activation='relu'),# 2番目の隠れ層
    
    # 最後の層の活性関数はソフトマックスとします
    tf.keras.layers.Dense(hidden_layer_size, activation='softmax')# 出力層
                            ])

### モデルをもとに、最適化アルゴリズムと、損失関数を決めてコンパイルさせる

In [73]:
# 最適化アルゴリズムはadamを、損失関数はクロスエントロピーを使っていきます
model.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics=['accuracy'])

In [74]:
# 繰り返しの回数を決めます
NUM_EPOCHS = 5
#アーリーストッピングを設定
early_stoppings=tf.keras.callbacks.EarlyStopping(patience=2)

# モデルに対してデータを入れて演算を行っていきます
model.fit(train_data,epochs=NUM_EPOCHS,verbose=1,validation_data=(validation_inputs, validation_targets ),callbacks=[early_stoppings])


Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x1e3c3bed0d0>

In [75]:
test_loss, test_accuracy=model.evaluate(test_data)



In [76]:
# 出力結果の見た目を整えます
print('Test loss: {0:.2f}. Test accuracy: {1:.2f}%'.format(test_loss, test_accuracy*100.))

Test loss: 0.12. Test accuracy: 96.24%
