# **第2回 演習Ⅱ 課題1**

コードを実行してください。

※上部にある「ドライブにコピー」で自分のドライブにコピーしてから編集・実行してください。

In [None]:
# ライブラリのインポート
import os
import time
import random
import numpy as np
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from torchvision import datasets, transforms
import matplotlib.pyplot as plt

import warnings
warnings.simplefilter('ignore', UserWarning)

# Google DriveをマウントしてDrive内のファイルにアクセスできるようにする
from google.colab import drive
drive.mount('/content/drive')

In [None]:
# 各種設定
BATCH_SIZE = 128 # ミニバッチのサイズ
MAX_EPOCH = 10   # エポック数（訓練データ全体を何回繰り返して学習させるか）

# シード値の固定
# シードを固定すると毎回同じ結果が得られる（再現性の確保）
random.seed(0)
np.random.seed(0)
torch.manual_seed(0)

In [None]:
# データの前処理の方法を定義
transform = transforms.Compose([
	transforms.ToTensor() # データをテンソルに変換
])

In [None]:
# 訓練データ、検証データ、テストデータの準備
# 手書き数字画像データセットMNISTを使用

# 訓練データの取得
train_dataset = datasets.MNIST(
	"./data",            # データの保存先
	train=True,          # 訓練データとして取得
	download=True,       # データが存在しない場合はダウンロード
	transform=transform, # データに前処理を適用
)

# 訓練データの一部を検証データとして分割
train_dataset, valid_dataset = torch.utils.data.random_split(
	  train_dataset,
	  [48000, 12000] # 48000枚を訓練データ、12000枚を検証データに分割
)

# テストデータの取得
test_dataset = datasets.MNIST(
	"./data",            # データの保存先
	train=False,         # テストデータとして取得
	download=True,       # データが存在しない場合はダウンロード
	transform=transform, # データに前処理を適用
)

In [None]:
# データローダーの作成
# データセットからバッチを作成してモデルに供給する役割

# 訓練データ用のデータローダー
train_loader = torch.utils.data.DataLoader(
	train_dataset,
	batch_size=BATCH_SIZE, # バッチサイズごとにデータを供給
	shuffle=True,          # 学習時はデータをシャッフル
)
# 検証データ用のデータローダー
valid_loader = torch.utils.data.DataLoader(
	valid_dataset,
	batch_size=BATCH_SIZE, # バッチサイズごとにデータを供給
	shuffle=False,         # 検証時はシャッフルしない
)
# テストデータ用のデータローダー
test_loader = torch.utils.data.DataLoader(
	test_dataset,
	batch_size=BATCH_SIZE, # バッチサイズごとにデータを供給
	shuffle=False,         # テスト時もシャッフルしない
)

In [None]:
# 畳み込みニューラルネットワークの定義
class CNN(nn.Module):
  def __init__(self):
    '''
    畳み込みニューラルネットワークの構造を定義
    '''
    super(CNN, self).__init__()

    # 畳み込み層1
    self.conv1 = nn.Conv2d(1, 8, 3)  # 28x28x1 -> 26x26x8
    # 畳み込み層2
    self.conv2 = nn.Conv2d(8, 16, 3) # 26x26x8 -> 24x24x16
    # 最大プーリング層
    self.pool = nn.MaxPool2d(2, 2)   # 24x24x16 -> 12x12x16
    # 全結合層
    self.fc1 = nn.Linear(12 * 12 * 16, 128) # 12x12x16 -> 128
    self.fc2 = nn.Linear(128, 64)           # 128 -> 64
    self.fc3 = nn.Linear(64, 10)            # 64 -> 10

  def forward(self, x):
    '''
    入力から出力までの流れを定義
    '''
    x = F.relu(self.conv1(x))    # 畳み込み層1の計算 + 活性化関数ReLUの適用
    x = F.relu(self.conv2(x))    # 畳み込み層2の計算 + 活性化関数ReLUの適用
    x = self.pool(x)             # 最大プーリング

    x = x.view(-1, 12 * 12 * 16) # 特徴マップを1次元のベクトルに変換

    x = F.relu(self.fc1(x))      # 全結合層1の計算 + 活性化関数ReLUの適用
    x = F.relu(self.fc2(x))      # 全結合層2の計算 + 活性化関数ReLUの適用
    x = self.fc3(x)              # 出力層の計算
    return x

In [None]:
# 定義した畳み込みニューラルネットワークのインスタンス化
model = CNN()
# 損失関数の定義
loss_function = nn.CrossEntropyLoss()
# 最適化手法と学習率の定義
optimizer = optim.SGD(model.parameters(), lr=0.1)

In [None]:
# 学習を通しての損失を記録するためのリスト（学習曲線のプロット用）
train_losses = []
valid_losses = []

# 学習にかかった時間の計測開始
start_time = time.time()

print("\n【学習開始】\n")
print("train_loss: 学習データにおける損失")
print("valid_loss: 検証データにおける損失\n")

# エポックごとの訓練損失と検証損失を出力
print("epoch\ttrain_loss\tvalid_loss")

for epoch in range(MAX_EPOCH):
	model.train()        # モデルを訓練モードに設定
	train_loss_list = [] # 訓練損失を保存するリスト

	# 訓練データでモデルを学習
	for x, label in train_loader:
		optimizer.zero_grad()               # 勾配をリセット
		output = model(x)                   # モデルの出力を計算
		loss = loss_function(output, label) # 損失を計算
		loss.backward()                     # 勾配を計算
		optimizer.step()                    # 勾配に基づいてパラメータを更新
		train_loss_list.append(loss.item()) # バッチごとの損失を記録

	train_loss_mean = np.mean(train_loss_list) # エポックごとの平均訓練損失
	train_losses.append(train_loss_mean)       # 訓練損失をリストに追加

	model.eval()         # モデルを評価モードに設定
	valid_loss_list = [] # 検証損失を保存するリスト

	# 検証データで損失を計算
	for x, label in valid_loader:
		output = model(x)                      # モデルの出力を計算
		loss = loss_function(output, label)    # 損失を計算
		valid_loss_list.append(loss.item())    # バッチごとの損失を記録

	valid_loss_mean = np.mean(valid_loss_list) # エポックごとの平均検証損失
	valid_losses.append(valid_loss_mean)       # 検証損失をリストに追加

	print("{}\t{:.8}\t{:.8}".format(epoch, train_loss_mean, valid_loss_mean))

# 学習にかかった時間の計測終了
end_time = time.time()
print("\n学習にかかった時間 : {} [sec]".format(end_time - start_time))

print("\n【学習終了】\n")

In [None]:
# 学習曲線のプロット
plt.plot(range(MAX_EPOCH), train_losses, label='Training Loss')
plt.plot(range(MAX_EPOCH), valid_losses, label='Validation Loss', color="green")
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.title('Learning Curve')
plt.legend()
plt.show()

In [None]:
# テストデータを使ってモデルを評価
model.eval() # モデルを評価モードに設定
test_loss = 0
test_correct = 0
test_total = 0

# テストデータでの損失と正解率を計算
for x, label in test_loader:
	output = model(x)                            # モデルの出力を計算
	loss = loss_function(output, label)          # 損失を計算
	_, pred = torch.max(output.data, dim=1)      # 出力の最大値を持つクラスを予測
	test_correct += (pred == label).sum().item() # 正解の数をカウント
	test_total += label.size()[0]                # テストデータの総数をカウント

# テストデータにおける正解率を計算して表示
test_accuracy = test_correct / test_total
print("テストデータにおける正解率 : {:.4f}".format(test_accuracy))

In [None]:
# モデルの保存
model_dir = "/content/drive/MyDrive/jts2024_2/model/"
os.makedirs(model_dir, exist_ok=True)
save_path = model_dir + "cnn.pt"
torch.save(model.state_dict(), save_path)