In [1]:
#  jojo_trainer.ipynb
#  3.モデルの学習を行う

In [2]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
import numpy as np
import pandas as pd
import random
import sys
sys.path.append("/content/drive/MyDrive/jojo_poser/src")

import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.init as init
!pip install torchinfo
from torchinfo import summary

from image_loader import *
from models import *

torch.manual_seed(1)
np.random.seed(1)
random.seed(1)

In [None]:
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print("使用されるデバイス: ",device)

使用されるデバイス:  cuda


In [None]:
LABELS = ["Buccellati", "Dio", "Giorno", "Highway-Star", "Jo-suke", "Jo-taro",
            "Kakyoin", "Kira", "Kishibe", "Polnareff", "Trish"]

In [None]:
#  画像の読み込み
im_rows = 256
im_cols = 256

#  Dataを取得
root_path = "/content/drive/MyDrive/jojo_poser"
train_img_path_list, train_labels = data_loder(root_path, "train")
valid_img_path_list, valid_labels = data_loder(root_path, "valid")

#  Datasetを作成
tr_data = PreprocessJOJO(train_img_path_list, train_labels, "train", im_rows, im_cols)
val_data = PreprocessJOJO(valid_img_path_list, valid_labels, "valid", im_rows, im_cols)
print('訓練データのサイズ: ', tr_data.__len__())
print('検証データのサイズ: ', val_data.__len__())

#  DataLorderを作成
batch_size = 12
tr_batch = data.DataLoader(
    tr_data,                #  訓練用data
    batch_size = batch_size,#  ミニバッチのサイズ
    shuffle = True,         #  シャッフルして抽出
    )
val_batch = data.DataLoader(
    val_data,               #  検証用data
    batch_size = batch_size,#  ミニバッチのサイズ
    shuffle = False,        #  シャッフルはせずに抽出
    )
print('訓練データのミニバッチの個数: ', tr_batch.__len__())
print('検証データのミニバッチの個数: ', val_batch.__len__())

#  DataLoaderをdictにまとめる
dataloaders_dict = {"train":tr_batch, "valid":val_batch}

訓練データのサイズ:  559
検証データのサイズ:  110
訓練データのミニバッチの個数:  47
検証データのミニバッチの個数:  10


In [None]:
#  訓練用のDataLorderをイテレーターに変換
batch_iterator = iter(dataloaders_dict["valid"])
#  最初のミニバッチを取り出す
images, labels = next(batch_iterator)
print('ミニバッチのイメージの形状: ',images.size())
print('ミニバッチのラベルの形状: ',len(labels))
print('labels[0]の形状: ',labels[0])

ミニバッチのイメージの形状:  torch.Size([12, 3, 256, 256])
ミニバッチのラベルの形状:  12
labels[0]の形状:  tensor(0)


In [None]:
#   モデルのインスタンス作成
net = JOJO_classifier('train', len(LABELS))
#  vggモデルの学習済みの重みを適用
vgg_weights = torch.load(root_path+'/weights/vgg16_reducedfc.pth')
net.vgg.load_state_dict(vgg_weights)
print("[model vgg] weights is applied.")
#  denseモデルの重みを初期化
if isinstance(net.dense, nn.Linear):
    init.kaiming_normal_(net.dense.weight.data)
    if net.dense.bias is not None:
        init.constant_(net.dense.bias, 0.0)

print(net)

[model vgg] weights is applied.
JOJO_classifier(
  (vgg): ModuleList(
    (0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU(inplace=True)
    (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU(inplace=True)
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (6): ReLU(inplace=True)
    (7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (8): ReLU(inplace=True)
    (9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(inplace=True)
    (12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (13): ReLU(inplace=True)
    (14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (15): ReLU(inplace=True)
    (16): MaxPool2d(kernel_

In [None]:
summary(
    net,
    input_size = (batch_size, 3, im_rows, im_cols),
    col_names=["input_size","output_size","num_params"])

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
0
1


  return torch.max_pool2d(input, kernel_size, stride, padding, dilation, ceil_mode)


2
3
4
5
6
7
8


Layer (type:depth-idx)                   Input Shape               Output Shape              Param #
JOJO_classifier                          --                        --                        --
├─ModuleList: 1-1                        --                        --                        --
├─ModuleList: 1-2                        --                        --                        --
├─ModuleList: 1-1                        --                        --                        --
│    └─Conv2d: 2-1                       [12, 3, 256, 256]         [12, 64, 256, 256]        1,792
│    └─ReLU: 2-2                         [12, 64, 256, 256]        [12, 64, 256, 256]        --
│    └─Conv2d: 2-3                       [12, 64, 256, 256]        [12, 64, 256, 256]        36,928
│    └─ReLU: 2-4                         [12, 64, 256, 256]        [12, 64, 256, 256]        --
│    └─MaxPool2d: 2-5                    [12, 64, 256, 256]        [12, 64, 128, 128]        --
│    └─Conv2d: 2-6          

In [None]:
#  損失関数及びオプティマイザーの作成
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(net.dense.parameters(),
                lr = 0.05)

In [None]:

def train(net, dataloaders_dict, criterion, optimizer, num_epochs):
    '''
    Parameters:
        net(object): VGG+Dense モデル
        datalorders_dict(dict(object)): DataLorder
        criterion(object): 損失関数
        optimizer(object): オプティマイザー
        num_epochs(int): 学習回数
    '''
    
    net.to(device)
    torch.backends.cudnn.benchmark = True
    
    iteration = 1 #  イテレーション(ステップ)カウンター
    epoch_train_loss = 0.0 #  訓練1エポックごとの損失和
    epoch_val_loss = 0.0 #  検証1エポックごとの損失和
    logs = [] #  損失のログを記録するリスト
    
    for epoch in range(num_epochs):
        print('----------------------------------------------------')
        print('Epoch {}/{}'.format(epoch+1, num_epochs))
        print('----------------------------------------------------')

        for phase in ["train","valid"]:

            if phase=="train":
                #  モデルを訓練モードに
                net.train()
            else:
                if((epoch+1)%10 == 0):
                    net.eval()#  モデルを検証モードに
                    print("----------------------------------------------------")
                    print("----- validation mode -----")
                else:
                    continue
                    
            #  1ステップにおけるミニバッチを使用した学習または検証
            #  データローダーをイテレートしてミニバッチを抽出
            for images, labels in dataloaders_dict[phase]:
                print("labels",labels)#  ================================== test!!!!
                #  画像データにデバイスを割り当てる
                images = images.to(device)
                #  教師データをデバイスを割り当てる
                labels = labels.to(device)

                #  optimizerが保持する勾配を0で初期化
                optimizer.zero_grad()

                #  順伝搬(forward)とバックプロパゲーション(訓練時)
                with torch.set_grad_enabled(phase == 'train'):
                    #  順伝播(forward)
                    outputs = net(images)
                    print("outputs: ",outputs.data)#  ================================== test!!!!
                    print("outputs: ",outputs.data.max(1)[1])#  ================================== test!!!!
                    #  labelの損失平均
                    loss = criterion(outputs, labels)
                    print("loss: ",loss.item())#  ================================== test!!!!
                    
                    #  訓練時はバックプロパゲーションによるパラメーター更新を行う
                    if phase == 'train':
                        loss.backward()  #  バックプロパゲーション

                        # 勾配降下法の更新式を適用してバイアス、重みを更新
                        optimizer.step()

                        # ミニバッチを10個処理(10ステップ)ごとに損失を出力
                        if (iteration % 10 == 0):
                            #  ステップ, 損失を出力
                            print('step( {} )  loss: {:.4f}'.format(iteration, loss.item()))

                        # エポックの損失をepoch_train_lossに加算する
                        epoch_train_loss += loss.item()
                        # ステップ数を1増やす
                        iteration += 1

                    # 検証モードでは順伝播後の損失の記録のみを行う
                    else:
                        epoch_val_loss += loss.item()
                        
        # epochのphaseごとのlossと正解率
        print('---------------------------------------')
        # 訓練データの損失と検証データの損失を出力
        print('train_loss: {:.4f} - val_loss(Every 10 epochs): {:.4f}'.format(epoch_train_loss, epoch_val_loss))

        # エポックごとに損失をdictオブジェクトに保存
        log_epoch = {'epoch': epoch+1,
                     'train_loss': epoch_train_loss,
                     'val_loss': epoch_val_loss}
        # ログのリストに追加
        logs.append(log_epoch)

        # 訓練時の損失和を0で初期化
        epoch_train_loss = 0.0
        # 検証時の損失和を0で初期化
        epoch_val_loss = 0.0
        
        # 1エポック終了ごとにモデルのパラメーター値を保存
        if ((epoch+1) % 10 == 0):
            torch.save(
                net.state_dict(),
                root_path + '/weights/jojo_weights' + str(epoch+1) + '.pth')
            print('--saved weights--')
    # ログのリストをデータフレームに変換
    df = pd.DataFrame(logs)
    # ログファイルに保存
    df.to_csv(root_path + '/outputs/epoch_loss.csv')

In [None]:
#  学習
num_epochs = 10#  最終は50
train(net,
      dataloaders_dict,
      criterion,
      optimizer,
      num_epochs=num_epochs)

----------------------------------------------------
Epoch 1/10
----------------------------------------------------
labels tensor([ 4,  2,  6,  1,  3,  0,  8,  0, 10,  3,  8,  0])
outputs:  tensor([6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6, 6], device='cuda:0')
loss:  2.459707498550415


KeyboardInterrupt: ignored

In [None]:
#  画像の読み込み
im_rows = 256
im_cols = 256

#  Dataを取得
root_path = "/content/drive/MyDrive/jojo_poser"
valid_imgs, valid_labels = data_loder(root_path,"valid", im_rows, im_cols)
val_data = PreprocessJOJO(valid_imgs, valid_labels, "valid")
#  DataLorderを作成
batch_size = 1
val_batch = data.DataLoader(
    val_data,               #  検証用data
    batch_size = batch_size,#  ミニバッチのサイズ
    shuffle = False,        #  シャッフルはせずに抽出
    )

In [None]:
#   モデルのインスタンス作成
net = JOJO_classifier('train', len(LABELS))
#  vggモデルの学習済みの重みを適用
net_weights = torch.load(root_path+'/weights/jojo_weights10.pth')
net.load_state_dict(net_weights)
print("[model net] weights is applied.")

[model net] weights is applied.


In [None]:
soft = nn.Softmax(dim=1)
def accuracy(net, val_batch):

  all_outputs = []
  all_labels = []
  for images, labels in val_batch:
    print(images)
    outputs = soft(net(images))
    print(outputs)
    all_outputs.append(outputs.data.max(1)[1].item())
    all_labels.append(labels.item())
    print("answer: ",labels.item())
    print("predict: ", outputs.data.max(1)[1].item())
    del images, labels
  all_outputs = np.array(all_outputs)
  all_labels = np.array(all_labels)
  print("total accuracy score: ",sum(all_outputs==all_labels)/len(all_labels))

In [None]:
accuracy(net, val_batch)