In [11]:
import glob
import os.path as osp
import random
import numpy as np
import json
from PIL import Image
from tqdm import tqdm
import matplotlib.pyplot as plt
%matplotlib inline

import torch
import torch.nn as nn
import torch.optim as optim
import torch.utils.data as data
import torchvision
from torchvision import models, transforms

#乱数シードを設定
torch.manual_seed(1234)
np.random.seed(1234)
random.seed(1234)

In [3]:
#1.3節で作成したクラスをフォルダutilsにあるdataloader_image_classification.pyに記載して使用
from utils.dataloader_image_classification import ImageTransform, make_datapath_list, HymenopteraDataset

#アリとハチの画像へのファイルパスのリストを作成
train_list = make_datapath_list(phase='train')
val_list = make_datapath_list(phase='val')

#Datasetを作成
size=224
mean=(0.485, 0.456, 0.406)
std=(0.229, 0.224, 0.225)
train_dataset=HymenopteraDataset(file_list=train_list, transform=ImageTransform(size,mean,std), phase='train')
val_dataset=HymenopteraDataset(file_list=val_list, transform=ImageTransform(size,mean,std),phase='val')

#DataLoaderを作成
batch_size = 32

train_dataloader=torch.utils.data.DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
val_dataloader=torch.utils.data.DataLoader(val_dataset, batch_size=batch_size, shuffle=False)

#辞書オブジェクトにまとめる
dataloaders_dict={'train':train_dataloader, 'val':val_dataloader}

./data/hymenoptera_data/train/**/*.jpg
./data/hymenoptera_data/val/**/*.jpg


In [5]:
#学習済みのVGG-16モデルをロード

#VGG-16モデルのインスタンスを生成
use_pretrained = True
net = models.vgg16(pretrained=use_pretrained)

#VGG16の最後の出力層の出力ユニットをアリとハチの2つに付け替える
net.classifier[6]=nn.Linear(in_features=4096, out_features=2)

#訓練モードに設定
net.train()

print('ネットワーク設定完了：学習済みの重みをロードし訓練モードに移行')

#損失関数を定義
criterion = nn.CrossEntropyLoss()

ネットワーク設定完了：学習済みの重みをロードし訓練モードに移行


In [10]:
#fine-tuningの肝
#ファインチューニングで学習させるパラメタを、変数params_to_updateの1~3に格納する

params_to_update_1 = []
params_to_update_2 = []
params_to_update_3 = []

#学習させる層のパラメタ名を指定
update_param_names_1 = ["features"]
update_param_names_2 = ["classifier.0.weight", "classifier.0.bias", "classifier.3.weight", "classifier.3.bias"]
update_param_names_3 = ["classifier.6.weight", "classifier.6.bias"]

#パラメタごとに各リストに格納
for name, param in net.named_parameters():
    if update_param_names_1[0] in name:
        param.requires_grad = True
        params_to_update_1.append(param)
        print("params_to_update_1に格納：", name)
        
    elif name in update_param_names_2:
        param.requires_grad = True
        params_to_update_2.append(param)
        print("params_to_update_2に格納：", name)
        
    elif name in update_param_names_3:
        param.requires_grad = True
        params_to_update_3.append(param)
        print("params_to_update_3に格納：", name)
        
    else:
        param.requires_grad = False
        print("勾配計算なし。学習しない：", name)
        
#最適化手法の設定
optimizer = optim.SGD([
    {'params':params_to_update_1, 'lr':1e-4},{'params':params_to_update_2, 'lr':5e-4},{'params':params_to_update_3, 'lr':1e-3}
], momentum=0.9)

params_to_update_1に格納： features.0.weight
params_to_update_1に格納： features.0.bias
params_to_update_1に格納： features.2.weight
params_to_update_1に格納： features.2.bias
params_to_update_1に格納： features.5.weight
params_to_update_1に格納： features.5.bias
params_to_update_1に格納： features.7.weight
params_to_update_1に格納： features.7.bias
params_to_update_1に格納： features.10.weight
params_to_update_1に格納： features.10.bias
params_to_update_1に格納： features.12.weight
params_to_update_1に格納： features.12.bias
params_to_update_1に格納： features.14.weight
params_to_update_1に格納： features.14.bias
params_to_update_1に格納： features.17.weight
params_to_update_1に格納： features.17.bias
params_to_update_1に格納： features.19.weight
params_to_update_1に格納： features.19.bias
params_to_update_1に格納： features.21.weight
params_to_update_1に格納： features.21.bias
params_to_update_1に格納： features.24.weight
params_to_update_1に格納： features.24.bias
params_to_update_1に格納： features.26.weight
params_to_update_1に格納： features.26.bias
params_to_update_1に格納： f

In [14]:
#モデルを学習させる関数を作成

def train_model(net, dataloaders_dict, criterion, optimizer, num_epochs):
    
    #初期設定
    #GPUが使えるか確認
    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
    print("使用デバイス：", device)
    
    #ネットワークをGPUへ
    net.to(device)
    
    #ネットワークがある程度固定であれば、高速化させる
    torch.backends.cudnn.benchmark = True
    
    #epochのループ
    for epoch in range(num_epochs):
        print('Epoch {}/{}'.format(epoch+1,num_epochs))
        print('------------')
        
        #epochごとの訓練と検証
        for phase in ['train', 'val']:
            if phase == 'train':
                net.train() #訓練モード
            else:
                net.eval() #検証モード
                
            epoch_loss = 0.0 #epochの損失和
            epoch_corrects = 0 #epochの正解数
            
            #未学習時の検証性能を確かめるため、epoch=0の訓練は省略
            if (epoch==0) and (phase=='train'):
                continue
            
            #データローダーからミニバッチを取り出すループ
            for inputs, labels in tqdm(dataloaders_dict[phase]):
                
                #GPUが使えるならGPUにデータを送る
                inputs = inputs.to(device)
                labels = labels.to(device)
                
                #optimizerを初期化
                optimizer.zero_grad()
                
                #順伝搬(forward)を計算
                with torch.set_grad_enabled(phase=='train'): #学習時のみ勾配を計算させる
                    outputs = net(inputs)
                    loss = criterion(outputs,labels) #損失計算
                    _, preds = torch.max(outputs, 1) #ラベルを予測
                    
                    #訓練時はバックプロパゲーション
                    if phase == 'train':
                        loss.backward()
                        optimizer.step()
                        
                    #結果の計算
                    epoch_loss += loss.item()*inputs.size(0) #lossの合計を計算
                    #正解数の合計を計算
                    epoch_corrects += torch.sum(preds == labels.data)
                    
            #epochごとのlossと正解率を表示
            epoch_loss = epoch_loss / len(dataloaders_dict[phase].dataset)
            epoch_acc = epoch_corrects.double() / len(dataloaders_dict[phase].dataset)
            
            print('{} Loss: {:.4f} Acc: {:.4f}'.format(phase, epoch_loss, epoch_acc))    

In [15]:
#学習・検証を実行する
num_epochs = 2
train_model(net, dataloaders_dict, criterion, optimizer, num_epochs=num_epochs)


  0%|          | 0/5 [00:00<?, ?it/s][A

使用デバイス： cpu
Epoch 1/2
------------



 20%|██        | 1/5 [00:15<01:02, 15.67s/it][A
 40%|████      | 2/5 [00:30<00:46, 15.37s/it][A
 60%|██████    | 3/5 [00:44<00:30, 15.14s/it][A
 80%|████████  | 4/5 [01:00<00:15, 15.29s/it][A
100%|██████████| 5/5 [01:12<00:00, 14.50s/it][A

  0%|          | 0/8 [00:00<?, ?it/s][A

val Loss: 0.6491 Acc: 0.6471
Epoch 2/2
------------



 12%|█▎        | 1/8 [00:52<06:09, 52.74s/it][A
 25%|██▌       | 2/8 [01:46<05:17, 52.90s/it][A
 38%|███▊      | 3/8 [02:40<04:27, 53.52s/it][A
 50%|█████     | 4/8 [03:32<03:31, 52.95s/it][A
 62%|██████▎   | 5/8 [04:23<02:37, 52.39s/it][A
 75%|███████▌  | 6/8 [05:15<01:44, 52.33s/it][A
 88%|████████▊ | 7/8 [06:06<00:51, 51.84s/it][A
100%|██████████| 8/8 [06:36<00:00, 49.50s/it][A

  0%|          | 0/5 [00:00<?, ?it/s][A

train Loss: 0.4136 Acc: 0.7942



 20%|██        | 1/5 [00:16<01:04, 16.13s/it][A
 40%|████      | 2/5 [00:30<00:47, 15.73s/it][A
 60%|██████    | 3/5 [00:45<00:30, 15.43s/it][A
 80%|████████  | 4/5 [01:00<00:15, 15.25s/it][A
100%|██████████| 5/5 [01:14<00:00, 14.94s/it][A

val Loss: 0.1950 Acc: 0.9673





#PyTorchのネットワークパラメタの保存  
save_path = './weights_fine_tuning.pth'
torch.save(net.state_dice(),save_path)

#PyTorchのネットワークパラメータのロード  
load_path = './weights_fine_tuning.pth'
load_weights = torch.load(load_path)
net.load_state_dict(load_weights)

#GPU上で保存された重みをCPU上でロードする場合  
load_weights = torch.load(load_path, map_location={'cuda:0': 'cpu'})
net.load_state_dict(load_weights)