# **データ・AI利活用のための情報リテラシー入門**
## **第6章 AIプログラミング演習**
このノートブックは「データ・AI利活用のための情報リテラシー入門」（培風館刊, ISBN978-4-563-01624-1）第6章に対応したものです。

### **6.3 AIプログラミング演習ー深層学習**

#### **6.3.3 演習（深層学習）**

##### **a. ライブラリのインポート**

**ソースコード6.34** 必要なライブラリのインポート

In [None]:
# 必要なライブラリのインポート
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import fetch_openml
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import confusion_matrix, classification_report

##### **b．MNISTデータセットの読み込みとサイズの確認**

**ソースコード6.35** MNISTデータセットの読み込み

⚠️ 教科書では紙面の都合上、改行コード（``\``）を入れていますが、以下のサンプルコードでは含めていません。

In [None]:
# MNISTデータセットの読み込み
X, y = fetch_openml('mnist_784', return_X_y=True, as_frame=False, parser='pandas')

# データセットサイズを決める
train_samples = 60000
test_size = 10000

# 訓練データとテストデータにわける
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0, train_size=train_samples, test_size=test_size, shuffle=False)

# データセットのサイズを表示
print("学習データのサイズ:", X_train.shape)
print("テストデータのサイズ", X_test.shape)

##### **c．一部のデータを可視化**

**ソースコード6.36** データセットを画像として表示

In [None]:
fig, axes = plt.subplots(1, 5, figsize=(15, 3))
for i, ax in enumerate(axes):
    ax.imshow(X_train[i].reshape(28, 28), cmap='gray')
    ax.set_title("Label: " + y_train[i])
    ax.axis('off')

plt.show()

#### **d．データの前処理とその影響の確認**

**ソースコード6.37** データの前処理前の中身

In [None]:
# データの正規化前のサンプルを表示
plt.imshow(X_train[0].reshape(28, 28), cmap=plt.cm.binary)
plt.title("Sample Before Normalization (Label: " + y_train[0] + " )")
plt.show()

# 正規化前の最初の画像の全ピクセル値を表示
print("Sample pixel values before normalization:")
print(X_train[0])  # 最初の画像の全ピクセル値を表示

**ソースコード6.38** データの正規化

In [None]:
# データの正規化
X_train = X_train / 255.0
X_test = X_test / 255.0

# 正規化後のサンプルを表示
plt.imshow(X_train[0].reshape(28, 28), cmap=plt.cm.binary)
plt.title("Sample After Normalization (Label:" + y_train[0] + " )")
plt.show()

# 正規化後の最初の画像の全ピクセル値を表示
print("Sample pixel values after normalization:")
print(X_train[0])  # 最初の画像の全ピクセル値を表示

##### **f．深層学習モデルの構築**

**ソースコード6.39** 深層学習モデルの構築

In [None]:
# 深層学習モデルの構築
model = MLPClassifier(hidden_layer_sizes=(128,),  # 中間層
                      activation='relu',          # 活性化関数
                      solver='adam',              # 最適化アルゴリズム
                      max_iter=5,                 # エポック数
                      verbose=True)               # 学習の進行状況を表示

##### **g．モデルの学習**

**ソースコード6.40** モデルの学習

⚠️ ConvergenceWarningという警告が出ますが、無視してください。

In [None]:
# モデルの学習
model.fit(X_train, y_train)

##### **h．モデルの評価**

**ソースコード6.41** テストデータに対する予測

続いて，テストデータ``X_test``（100個のデータ）に対する予測結果を一括で``y_pred``に保存しましょう。

In [None]:
# テストデータに対する予測
y_pred = model.predict(X_test)

# 単一のサンプルに対する予測結果の表示
img = X_test[0].reshape(28, 28)
prediction = model.predict([X_test[0]])
print("予測結果:", prediction[0])

##### **i．混同行列**

**ソースコード6.42** 混同行列の計算

In [None]:
# 混同行列の計算
conf_matrix = confusion_matrix(y_test, y_pred)

# 混同行列の可視化
plt.figure(figsize=(10, 7))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted Label')
plt.ylabel('True Label')
plt.title('Confusion Matrix')
plt.show()

**ソースコード6.43** 分類レポートの表示

In [None]:
# 分類レポートの表示
print("Classification Report:")
print(classification_report(y_test, y_pred))

### **本演習で利用したコード**

**ソースコード6.44** 深層学習演習のコード全体

In [None]:
# 必要なライブラリのインポート
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import fetch_openml
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import confusion_matrix, classification_report

# MNISTデータセットの読み込み
X, y = fetch_openml('mnist_784', return_X_y=True, as_frame=False, parser='pandas')

# データセットサイズを決める
train_samples = 60000
test_size = 10000

# 訓練データとテストデータにわける
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0, train_size=train_samples, test_size=test_size, shuffle=False)

# データセットのサイズを表示
print("学習データのサイズ:", X_train.shape)
print("テストデータのサイズ", X_test.shape)

# データの正規化
X_train = X_train / 255.0
X_test = X_test / 255.0

# 正規化後のサンプルを表示
plt.imshow(X_train[0].reshape(28, 28), cmap=plt.cm.binary)
plt.title("Sample After Normalization (Label:" + y_train[0] + " )")
plt.show()

# 正規化後の最初の画像の全ピクセル値を表示
print("Sample pixel values after normalization:")
print(X_train[0])  # 最初の画像の全ピクセル値を表示

# 深層学習モデルの構築
model = MLPClassifier(hidden_layer_sizes=(128,),  # 中間層
                      activation='relu',          # 活性化関数
                      solver='adam',              # 最適化アルゴリズム
                      max_iter=5,                 # エポック数
                      verbose=True)               # 学習の進行状況を表示

# モデルの学習
model.fit(X_train, y_train)

# テストデータに対する予測
y_pred = model.predict(X_test)

# 単一のサンプルに対する予測結果の表示
img = X_test[0].reshape(28, 28)
prediction = model.predict([X_test[0]])
print("予測結果:", prediction[0])

# 混同行列の計算
conf_matrix = confusion_matrix(y_test, y_pred)

# 混同行列の可視化
plt.figure(figsize=(10, 7))
sns.heatmap(conf_matrix, annot=True, fmt='d', cmap='Blues')
plt.xlabel('Predicted Label')
plt.ylabel('True Label')
plt.title('Confusion Matrix')
plt.show()

# 分類レポートの表示
print("Classification Report:")
print(classification_report(y_test, y_pred))
