In [None]:
#!pip3 install tensorflow
#!pip install protobuf

# MNISTによるAIモデルの構築

In [None]:
# ライブラリの読み込み

import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten, Dropout

## MNISTデータの読み込み

In [None]:
# MNISTデータの読み込み
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

# データの正規化
train_images = train_images / 255.0
test_images = test_images / 255.0

# データの形状確認
print("Training data shape:", train_images.shape)
print("Testing data shape:", test_images.shape)

# いくつか表示
print("===================train data===============================")
num_rows, num_cols = 3, 5  # 行数と列数
fig, axes = plt.subplots(num_rows, num_cols, figsize=(1.5 * num_cols, 2 * num_rows))
for i in range(num_rows * num_cols):
    ax = axes[i // num_cols, i % num_cols]
    ax.imshow(train_images[i], cmap='gray')
    ax.set_title('Label: {}'.format(train_labels[i]))
plt.tight_layout()
plt.show()

print("===================test data===============================")
num_rows, num_cols = 3, 5  # 行数と列数
fig, axes = plt.subplots(num_rows, num_cols, figsize=(1.5 * num_cols, 2 * num_rows))
for i in range(num_rows * num_cols):
    ax = axes[i // num_cols, i % num_cols]
    ax.imshow(test_images[i], cmap='gray')
    ax.set_title('Label: {}'.format(train_labels[i]))
plt.tight_layout()
plt.show()

## モデルの定義

In [None]:
# モデルの定義(TensorFlow & Keras)
model = Sequential([
    Flatten(input_shape=(28, 28)), # 入力層: 入力画像を28x28ピクセルから784ピクセルの1次元配列に変換
    Dense(128, activation='relu'), # 第1の中間層: 128個のニューロンを持つ全結合層。活性化関数としてReLU（Rectified Linear Unit）を使用
    Dropout(0.2),                  # ドロップアウト層: 過学習を防ぐために層の出力の20%をランダムにリセットする
    Dense(128, activation='relu'), # 第2の中間層: 別の128ニューロンを持つ全結合層。活性化関数はReLU
    Dense(10, activation='softmax') # 出力層: 10個のニューロンを持ち、10クラス（0から9の数字）の分類を行うためのsoftmax活性化関数(ベクトルの長さを1に規格化して比較可能に)
])

# コンパイル設定
model.compile(optimizer='adam', # 最適化手法: adam: 効率的な勾配降下法の一種
              loss='sparse_categorical_crossentropy', # 最適化計算における損失関数(コスト関数): sparse_categorical_crossentropyは整数形式のラベルを持つ多クラス分類問題に適しているらしい
              metrics=['accuracy']) # 学習過程で評価したい指標。ここではとりあえず精度(accuracy)を評価

# モデルのサマリを表示
model.summary()

## 学習の実施

ここでは、全訓練データによる学習を1セットとして、それを5回繰り返すことにした。

In [None]:
# TensorFlow/Kerasを使用してニューラルネットワークモデルをトレーニング
history = model.fit(train_images, train_labels, epochs=5, validation_data=(test_images, test_labels))

In [None]:
# 訓練の精度と損失の可視化
plt.figure(figsize=(12, 4))

plt.subplot(1, 2, 1)
plt.plot(history.history['accuracy'], label='Training Accuracy')
plt.plot(history.history['val_accuracy'], label='Validation Accuracy')
plt.legend()
plt.title('Training and Validation Accuracy')

plt.subplot(1, 2, 2)
plt.plot(history.history['loss'], label='Training Loss')
plt.plot(history.history['val_loss'], label='Validation Loss')
plt.legend()
plt.title('Training and Validation Loss')

plt.tight_layout()
plt.show()

## モデルの保存

In [None]:
# モデルの保存
model.save('model.saved')

## どのような文字の間違いが多いかを確認

In [None]:
import numpy as np
from collections import Counter

def display_predictions(model, input_data, true_labels):
    # Model predictions
    predictions = model.predict(input_data)
    
    # Get the indices of the predicted classes
    predicted_labels = np.argmax(predictions, axis=1)
    
    # Initialize a dictionary to count mismatches
    mismatches = Counter()
    
    # Display results
    for i in range(len(true_labels)):
        if true_labels[i] != predicted_labels[i]:
            # Increment the count of the mismatched pair in the dictionary
            mismatches[(true_labels[i], predicted_labels[i])] += 1
    
    # Display mismatched information in a sorted manner
    for (actual, predicted), count in mismatches.most_common():
        print(f"Mismatched Pair: Actual Label {actual} | Predicted Label {predicted} | Count: {count}")

# Since this is a hypothetical code snippet, we need to mock the model's predict function and the data
# to be able to run this function without errors.

# Use the first 10 samples from the teacher data to display the prediction results
sample_data = test_images
sample_labels = test_labels

# Now we can call the modified function
display_predictions(model, sample_data, sample_labels)