# 1-5 ファインチューニングの実装
## ファインチューニング
ファインチューニング（fine tuning）は，学習済みモデルをベースに出力層などを変更したモデルを構築し，自前のデータでニューラルネットワーク・モデルの結合パラメータを学習させる手法．
転移学習とは異なり前奏のパラメータを再学習するが，入力層に近い部分の学習率は小さくまたは0に設定し，出力層付近の学習率は大きく設定する．

## フォルダの準備と事前準備
GPU 環境でも make_folders_and_data_downloads.ipynb を実行して 1-3 と同様な環境を構築する．

## Dataset と DataLoader を作成
1−3 で作成した ImageTransform，make_datapath_list，HymenopteraDataset を utils フォルダ内の dataloader_image_classification.py から読み込む．

In [1]:
%matplotlib inline

import glob
import json
import random
import numpy as np
import os.path as osp
from PIL import Image
from tqdm import tqdm
from matplotlib import pyplot as plt

import torch
import torchvision
import torch.nn as nn
import torch.optim as optim
import torch.utils.data as data
from torchvision import models, transforms

torch.manual_seed(1234)
np.random.seed(1234)
random.seed(1234)

torch.backends.cudnn.deterministic = True
torch.backends.cudnn.benchmark = False

In [2]:
from utils.dataloader_image_classification import ImageTransform, HymenopteraDataset, make_datapath_list

# アリとハチの画像へのファイルパスのリストを作成する
train_list = make_datapath_list(phase="train")
val_list = make_datapath_list(phase="val")

# Dataset の作成
size = 224
mean = (0.485, 0.456, 0.406)
std = (0.229, 0.224, 0.225)
train_dataset = HymenopteraDataset(file_list=train_list, transform=ImageTransform(size, mean, std), phase="train")
val_dataset = HymenopteraDataset(file_list=val_list, transform=ImageTransform(size, mean, std), phase="val")

# DataLoader の作成
batch_size = 32
train_dataloader = torch.utils.data.DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
val_dataloader = torch.utils.data.DataLoader(val_dataset, batch_size=batch_size, shuffle=False)

# 辞書にまとめる
dataloaders_dict = {"train": train_dataloader, "val": val_dataloader}

./data/hymenoptera_data/train/**/*.jpg
./data/hymenoptera_data/val/**/*.jpg


## ネットワークモデルを作成
1-3節と同じように出力層を変更する．

In [3]:
use_pretrained = True
net = models.vgg16(pretrained=use_pretrained)

net.classifier[6] = nn.Linear(in_features=4096, out_features=2)
net.train()

print("ネットワーク設定完了：学習済みの重みをロードし，訓練モードにセットしました")

ネットワーク設定完了：学習済みの重みをロードし，訓練モードにセットしました


## 損失関数を定義
これも1-3節と同様にクロスエントロピー誤差関数を用いる．

In [4]:
criterion = nn.CrossEntropyLoss()

## 最適化手法を設定
転移学習とは異なり全層のパラメータを学習できるように optimizer を設定する．
各層ごとに学習率を変えられるようにパラメータを設定し，それぞれについて異なる学習率を適用する．

In [16]:
# ファインチューニングで学習させるパラメータを3つのグループに分ける
params_to_update_1 = []
params_to_update_2 = []
params_to_update_3 = []

# 学習させる層のパラメータ名を指定
update_param_names_1 = ["features"]
update_param_names_2 = ["classifier.0.weight", "classifier.0.bias", "classifier.3.weight", "classifier.3.bias"]
update_param_names_3 = ["classifier.6.weight", "classifier.6.bias"]

# パラメータごとに各リストに格納する
for name, param in net.named_parameters():
    if update_param_names_1[0] in name:
        param.requires_grad = True
        params_to_update_1.append(param)
        print("params_to_update_1 に格納：", name)
        
    elif name in update_param_names_2:
        param.requires_grad = True
        params_to_update_2.append(param)
        print("params_to_update_2 に格納：", name)
        
    elif name in update_param_names_3:
        param.requires_grad = True
        params_to_update_3.append(param)
        print("params_to_update_3 に格納：", name)
        
    else:
        param.requires_grad = False
        print("勾配計算なし，学習しない ：", name)

params_to_update_1 に格納： features.0.weight
params_to_update_1 に格納： features.0.bias
params_to_update_1 に格納： features.2.weight
params_to_update_1 に格納： features.2.bias
params_to_update_1 に格納： features.5.weight
params_to_update_1 に格納： features.5.bias
params_to_update_1 に格納： features.7.weight
params_to_update_1 に格納： features.7.bias
params_to_update_1 に格納： features.10.weight
params_to_update_1 に格納： features.10.bias
params_to_update_1 に格納： features.12.weight
params_to_update_1 に格納： features.12.bias
params_to_update_1 に格納： features.14.weight
params_to_update_1 に格納： features.14.bias
params_to_update_1 に格納： features.17.weight
params_to_update_1 に格納： features.17.bias
params_to_update_1 に格納： features.19.weight
params_to_update_1 に格納： features.19.bias
params_to_update_1 に格納： features.21.weight
params_to_update_1 に格納： features.21.bias
params_to_update_1 に格納： features.24.weight
params_to_update_1 に格納： features.24.bias
params_to_update_1 に格納： features.26.weight
params_to_update_1 に格納： features.26.bias


上で作成した各層のグループに対して次のように異なる学習率を設定する．ここでも Momentum SGD を用いる．

In [17]:
# 最適化手法の設定
optimizer = optim.SGD([
    {"params": params_to_update_1, "lr": 1e-4},
    {"params": params_to_update_2, "lr": 1e-4},
    {"params": params_to_update_3, "lr": 1e-3}
], momentum=0.9)

## 学習・検証を実施
基本的には1-3節と同じコードを用いる．ここから先は GPU を用いて学習するため，その設定を行うコードを挿入する．  
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu") とすることで GPU が使用可能であれば GPU を，それ以外は CPU を使うようにデバイスを設定する．こうしてデバイスを指定したのち， to(device) とすることで GPU でも CPU でもコードを実行できるようになる．
また，イテレーションごとのニューラルネットワークの順伝播および誤差関数の計算手法がある程度一定であれば，torch.backends.cudnn.benchmark = True とすることで GPU の計算を高速化できる．

In [None]:
def trein_model(net, dataloaders_dict, criterion, optimizer, num_epochs):
    # GPU が使えるか確認
    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
    print("使用デバイス：", device)
    
    # ネットワークを GPU 上へ移動する
    net.to(device)
    
    # ネットワークがある程度固定であれば高速化できる
    torch.backends.cudnn.benchmark = True
    
    # epoch 数だけループ
    for epoch in range(num_epochs):
        print("Epoch {}/{}".format(epoch + 1, num_epochs))
        print("-----------")
        
        # 学習と検証のループ
        for phase in ["train", "val"]:
            if phase == "train":
                net.train()
            if phase == "val":
                net.eval()
                
            epoch_loss = 0.0      # epoch の損失和
            epoch_cerrects = 0  # epoch の正解数
            
            # 未学習時の検証性能を確かめるため epoch = 0 の訓練は行わない
            if (epoch == 0) and (phase == "train"):
                continue
            
            # データローダからミニバッチを取り出す
            for inputs, labels in tqdm(dataloaders_dict[phase]):
                # GPU が使えるなら GPU にデータを送る
                inputs = inputs.to(device)
                labels = labels.to(device)
                
                # optimizer の初期化
                optimizer.zero_grad()
            
                # 順伝播の計算
                with torch.set_grad_enabled(phase == "train"):
                    outputs = net(inputs)
                    loss = criterion(outputs, labels)  # 損失の計算
                    _, preds = torch.max(outputs, 1)   # ラベルの予測
                
                    # 訓練時は逆伝播も計算
                    if phase == "train":
                        loss.backward()
                        optimizer.step()
                    
                    # イテレーション結果の計算
                    epoch_loss += loss.item() * inputs.size(0)
                    epoch_cerrects += torch.sum(preds == labels.data)
            
            # epoch ごとの loss と正解率を表示
            epoch_loss = epoch_loss / len(dataloaders_dict[phase].dataset)
            epoch_acc = epoch_cerrects.double() / len(dataloaders_dict[phase].dataset)
            print("{} Loss: {:.4f} Acc: {:.4f}".format(phase, epoch_loss, epoch_acc))
            

# 1回だけ学習と検証を行う
num_epochs = 2
trein_model(net, dataloaders_dict, criterion, optimizer, num_epochs)

使用デバイス： cuda:0


ファインチューニングによってうまく分類できるようになっていることが確認できる．
また，GPU を使用しているため計算もかなり高速化されている．

## 学習したネットワークを保存・ロード
学習したモデルを格納した変数 net に対して .state_dict() でパラメータを辞書型変数に書き出し，torch.save() で保存先のファイルパスを指定して保存する．

In [None]:
save_path = "./weights_fine_tuning.pth"
torch.save(net.state_dict(), save_path)

ロードする際は torch.load() で辞書型のオブジェクトとしてロードし，ネットワークに load_state_dict() で格納する．GPU で保存したファイルを CPU 上に展開するには map_location を使う必要がある．

In [None]:
load_path = "./weights_fine_tuning.pth"
load_weights = torch.load(load_path)
net.load_state_dict(load_weights)

# GPU 上で保存したモデルを CPU　上に展開する場合
load_weights = torch.load(load_path, map_location={"cuda:0", "cpu"})
net.load_state_dict(load_weights)