#  ファインチューニング

## ライブラリーのインポート

In [1]:
import numpy as np
import random

import torch
import torch.nn  as nn
import torch.optim as optim 

from torchvision import models

from tqdm import tqdm

In [2]:
# 乱数のシードを固定
torch.manual_seed(1234)
np.random.seed(1234)
random.seed(1234)

## DatasetとDataLoaderを作成

In [27]:
# 1.3節で作成したクラスを同じフォルダにあるmake_dataset_dataloader.pyに記載して使用
from utils.dataloader_image_classification import ImageTransform, make_datapath_list, HymenopteraDataset

# アリとハチの画像へのファイルパスのリストを作成する
train_list = make_datapath_list(phase="train")
val_list = make_datapath_list(phase="val")

# Datasetを作成する
size = 224
mean = (0.485, 0.456, 0.406)
std = (0.229, 0.224, 0.225)
train_dataset = HymenopteraDataset(
    file_list=train_list, transform=ImageTransform(size, mean, std), phase='train')

val_dataset = HymenopteraDataset(
    file_list=val_list, transform=ImageTransform(size, mean, std), phase='val')

#DataLoaderを作成する
batch_size = 32

train_dataloader = torch.utils.data.DataLoader(
    train_dataset , batch_size=batch_size , shuffle=True)

val_dataloader = torch.utils.data.DataLoader(
    val_dataset, batch_size=batch_size, shuffle=False)

# 辞書オブジェクトにまとめる
dataloaders_dict = {"train": train_dataloader , "val" : val_dataloader}

./data/hymenoptera_data/train/**/*.jpg
./data/hymenoptera_data/val/**/*.jpg


## ネットワークモデルの作成

In [6]:
# 学習済のVGG-16モデルをロード

# VGG-16モデルのインスタンスを生成
use_pretrained =True #学習済のパラメータを使用
net = models.vgg16(pretrained = use_pretrained)

# VGG16の最後の出力層の出力ユニットをアリとハチの2つに付け替える
net.classifier[6]=nn.Linear(in_features=4096,out_features=2)

# 訓練モードに設定
net.train()

print('ネットワーク設定完了：学習済の重みをロードし、訓練モードに設定しました')


ネットワーク設定完了：学習済の重みをロードし、訓練モードに設定しました


## 損失関数を定義

In [7]:
# 損失関数の設定
criterion = nn.CrossEntropyLoss()

## 最適化手法を設定

In [10]:
#  ファインチューニングで学習させるパラメータを、変数params_to_updateの1〜3に格納する

params_to_update_1 = []
params_to_update_2 = []
params_to_update_3 = []

# 学習させる層のパラメータ名を指定
update_param_names_1 = ["features"]
update_param_names_2 = ["classifier.0.weight" , 
                                                  "classifier.0.bias" , "classifier.3.weight" , "classifier.3.bias"]
update_param_names_3 = ["classifier.6.weight" , "classifier.6.biass"]

#  パラメータごとに各リストに格納する
for name , param in net.named_parameters():
    if update_param_names_1[0] in name:
        param.requiers_grad = True
        params_to_update_1.append(param)
        print("params_to_updata_1に格納：" , name)
        
    elif name in update_param_names_2:
        param.requiers_grad = True
        params_to_update_2.append(param)
        print("params_to_updata_2に格納：" , name)
    
    elif name in update_param_names_3:
        param.requiers_grad = True
        params_to_update_3.append(param)
        print("params_to_updata_3に格納：" , name)
        
    else:
        param.requires_grad = False
        print("勾配計算なし。学習しない：" , name)
    



params_to_updata_1に格納： features.0.weight
params_to_updata_1に格納： features.0.bias
params_to_updata_1に格納： features.2.weight
params_to_updata_1に格納： features.2.bias
params_to_updata_1に格納： features.5.weight
params_to_updata_1に格納： features.5.bias
params_to_updata_1に格納： features.7.weight
params_to_updata_1に格納： features.7.bias
params_to_updata_1に格納： features.10.weight
params_to_updata_1に格納： features.10.bias
params_to_updata_1に格納： features.12.weight
params_to_updata_1に格納： features.12.bias
params_to_updata_1に格納： features.14.weight
params_to_updata_1に格納： features.14.bias
params_to_updata_1に格納： features.17.weight
params_to_updata_1に格納： features.17.bias
params_to_updata_1に格納： features.19.weight
params_to_updata_1に格納： features.19.bias
params_to_updata_1に格納： features.21.weight
params_to_updata_1に格納： features.21.bias
params_to_updata_1に格納： features.24.weight
params_to_updata_1に格納： features.24.bias
params_to_updata_1に格納： features.26.weight
params_to_updata_1に格納： features.26.bias
params_to_updata_1に格納： f

In [12]:
#  最適化手法の設定
optimizer = optim.SGD([
    {'params': params_to_update_1 , 'lr' : 1e-4},
    {'params': params_to_update_2 , 'lr' : 5e-4},
    {'params': params_to_update_3 , 'lr' : 1e-3}  
] , momentum=0.9)

## 学習・検証の実施

In [30]:
# モデルを学習させる関数を作成

def train_model(net , dataloaders_dict , criterion , optimizer , num_epochs):
    
    #初期設定
    #GPUが使えるか確認
    device = torch.device("cuda : 0"  if torch.cuda.is_available() else "cpu")
    print("使用デバイス：", device)
    
    #ネットワークをGPUへ
    net.to(device)
    
    #ネットワークがある程度固定であれば、高速化させる
    torch.backends.cudnn.benchmark  = True
    
    #epochのループ
    for epoch in range(num_epochs):
        print('Epoch {}/{}'.format(epoch+1 ,num_epochs))
        print('----------------')
        
        #epochごとの訓練と検証のループ
        for phase in ['train' , 'val']:
            if phase =='train':
                net.train()  #モデルを訓練モードに
            else:
                net.eval()   #モデルを検証モードに
                
            epoch_loss = 0.0  #epochの損失和
            epoch_corrects = 0 #epochの正解数
            
            
            # 未検証時の検証性能を確かめるため、epoch=0の訓練は省略
            if (epoch == 0) and (phase == 'train'):
                continue
                
            #データローダーからミニバッチを取り出すループ
            for inputs , labels in tqdm(dataloaders_dict[phase]):
                
                
                #GPUが使えるならGPUへデータを送る
                inputs = inputs.to(device)
                labels = labels.to(device)
                
                # optimizerを初期化
                optimizer.zero_grad()
                
                #順伝搬(forward)計算
                with torch.set_grad_enabled(phase == 'train'):
                    outputs = net(inputs)
                    loss = criterion(outputs, labels) #損失を計算
                    _, preds = torch.max(outputs ,1)  #ラベルを予測
                    
                    #訓練時はバックププロパゲーション
                    if phase == 'train':
                        loss.backward()
                        optimizer.step()
                        
                    #結果の計算
                    epoch_loss += loss.item() * inputs.size(0) #lossの合計を更新
                    #正解の合計を更新
                    epoch_corrects  += torch.sum(preds == labels.data)
                    
            #epochごとのlossと正解率を表示
            epoch_loss = epoch_loss / len(dataloaders_dict[phase].dataset)
            epoch_acc = epoch_corrects.double() / len(dataloaders_dict[phase].dataset)
            
            print('{} Loss  {:.4f}  Acc:{:.4f}'.format(phase , epoch_loss ,epoch_acc))
                
                
                

In [31]:
# 学習・検証を実行する
num_epochs = 2
train_model(net ,dataloaders_dict , criterion , optimizer , num_epochs=num_epochs)

  0%|          | 0/5 [00:00<?, ?it/s]

使用デバイス： cpu
Epoch 1/2
----------------


100%|██████████| 5/5 [00:15<00:00,  3.07s/it]
  0%|          | 0/8 [00:00<?, ?it/s]

val Loss  0.7704  Acc:0.4444
Epoch 2/2
----------------


100%|██████████| 8/8 [02:15<00:00, 16.94s/it]
  0%|          | 0/5 [00:00<?, ?it/s]

train Loss  0.4824  Acc:0.7202


100%|██████████| 5/5 [00:14<00:00,  2.97s/it]

val Loss  0.1693  Acc:0.9542





## 学習したネットワークを保存・ロード

In [32]:
# PyTorchのネットワークパラメータをの保存
save_path = './weights_fine_tuning.pth'
torch.save(net.state_dict() , save_path)

In [33]:
# PyTorchのネットワークパラメータのロード
load_path = './weights_fine_tuning.pth'
load_weights = torch.load(load_path)
net.load_state_dict(load_weights)

#GPU上で保存された重みをCPU上でロードする場合
load_weights = torch.load(load_path ,map_location={'cuda:0' : 'cpu'})
net.load_state_dict(load_weights)

<All keys matched successfully>