In [20]:
!python --version

Python 3.6.9


### 変更点
- Google Driveをマウントする

In [21]:
from google.colab import drive
drive.mount('/content/gdrive')

Drive already mounted at /content/gdrive; to attempt to forcibly remount, call drive.mount("/content/gdrive", force_remount=True).


In [0]:
import glob
import os.path as osp
import random
import numpy as np
import json
from PIL import Image
from tqdm import tqdm
import matplotlib.pyplot as plt
%matplotlib inline

import torch
import torch.nn as nn
import torch.optim as optim
import torch.utils.data as data
import torchvision
from torchvision import models, transforms

In [0]:
torch.manual_seed(1234)
np.random.seed(1234)
random.seed(1234)

In [0]:
class ImageTransform():
    def __init__(self, resize, mean, std):
        self.data_transform = {
            'train': transforms.Compose([
                transforms.RandomResizedCrop(
                    resize, scale=(0.5, 1.0)),  # データオーギュメンテーション
                transforms.RandomHorizontalFlip(),  # データオーギュメンテーション
                transforms.ToTensor(),  # テンソルに変換
                transforms.Normalize(mean, std)  # 標準化
            ]),
            'val': transforms.Compose([
                transforms.Resize(resize),  # リサイズ
                transforms.CenterCrop(resize),  # 画像中央をresize×resizeで切り取り
                transforms.ToTensor(),  # テンソルに変換
                transforms.Normalize(mean, std)  # 標準化
            ])
        }

    def __call__(self, img, phase='train'):
        return self.data_transform[phase](img)

### 変更点
- rootpathをGoogle Driveに変更

In [0]:
def make_datapath_list(phase="train"):

    rootpath = "./gdrive/My Drive/pytorch_advanced/data/hymenoptera_data/"
    target_path = osp.join(rootpath+phase+'/**/*.jpg')
    print(target_path)

    path_list = []  # ここに格納する

    # globを利用してサブディレクトリまでファイルパスを取得する
    for path in glob.glob(target_path):
        path_list.append(path)

    return path_list

### 変更点
- ラベルをファイル名から抜き出す際に、パスから抜き出すため、文字数を変更する

In [0]:
class HymenopteraDataset(data.Dataset):

    def __init__(self, file_list, transform=None, phase='train'):
        self.file_list = file_list  # ファイルパスのリスト
        self.transform = transform  # 前処理クラスのインスタンス
        self.phase = phase  # train or valの指定

    def __len__(self):
        '''画像の枚数を返す'''
        return len(self.file_list)

    def __getitem__(self, index):
        '''
        前処理をした画像のTensor形式のデータとラベルを取得
        '''

        # index番目の画像をロード
        img_path = self.file_list[index]
        img = Image.open(img_path)  # [高さ][幅][色RGB]

        # 画像の前処理を実施
        img_transformed = self.transform(
            img, self.phase)  # torch.Size([3, 224, 224])

        # 画像のラベルをファイル名から抜き出す
        if self.phase == "train":
            label = img_path[63:67]
        elif self.phase == "val":
            label = img_path[61:65]

        # ラベルを数値に変更する
        if label == "ants":
            label = 0
        elif label == "bees":
            label = 1

        return img_transformed, label

In [27]:
train_list = make_datapath_list(phase='train')
val_list = make_datapath_list(phase='val')

size = 224
mean = (0.485, 0.456, 0.406)
std = (0.229, 0.224, 0.225)
train_dataset = HymenopteraDataset(
    file_list=train_list, transform=ImageTransform(size, mean, std), phase='train')

val_dataset = HymenopteraDataset(
    file_list=val_list, transform=ImageTransform(size, mean, std), phase='val')

batch_size = 32

train_dataloader = torch.utils.data.DataLoader(
    train_dataset, batch_size=batch_size, shuffle=True)

val_dataloader = torch.utils.data.DataLoader(
    val_dataset, batch_size=batch_size, shuffle=False)

dataloaders_dict = {'train': train_dataloader, 'val': val_dataloader}

./gdrive/My Drive/pytorch_advanced/data/hymenoptera_data/train/**/*.jpg
./gdrive/My Drive/pytorch_advanced/data/hymenoptera_data/val/**/*.jpg


In [28]:
use_pretrained = True  # 学習済みのパラメータを使用
net = models.vgg16(pretrained=use_pretrained)

# VGG16の最後の出力層の出力ユニットをアリとハチの2つに付け替える
net.classifier[6] = nn.Linear(in_features=4096, out_features=2)

# 訓練モードに設定
net.train()

print('ネットワーク設定完了：学習済みの重みをロードし、訓練モードに設定しました')

ネットワーク設定完了：学習済みの重みをロードし、訓練モードに設定しました


In [0]:
# 損失関数の設定
criterion = nn.CrossEntropyLoss()

In [30]:
# ファインチューニングで学習させるパラメータを、変数params_to_updateの1～3に格納する

params_to_update_1 = []
params_to_update_2 = []
params_to_update_3 = []

# 学習させる層のパラメータ名を指定
update_param_names_1 = ["features"]
update_param_names_2 = ["classifier.0.weight",
                        "classifier.0.bias", "classifier.3.weight", "classifier.3.bias"]
update_param_names_3 = ["classifier.6.weight", "classifier.6.bias"]

# パラメータごとに各リストに格納する
for name, param in net.named_parameters():
    if update_param_names_1[0] in name:
        param.requires_grad = True
        params_to_update_1.append(param)
        print("params_to_update_1に格納：", name)

    elif name in update_param_names_2:
        param.requires_grad = True
        params_to_update_2.append(param)
        print("params_to_update_2に格納：", name)

    elif name in update_param_names_3:
        param.requires_grad = True
        params_to_update_3.append(param)
        print("params_to_update_3に格納：", name)

    else:
        param.requires_grad = False
        print("勾配計算なし。学習しない：", name)


params_to_update_1に格納： features.0.weight
params_to_update_1に格納： features.0.bias
params_to_update_1に格納： features.2.weight
params_to_update_1に格納： features.2.bias
params_to_update_1に格納： features.5.weight
params_to_update_1に格納： features.5.bias
params_to_update_1に格納： features.7.weight
params_to_update_1に格納： features.7.bias
params_to_update_1に格納： features.10.weight
params_to_update_1に格納： features.10.bias
params_to_update_1に格納： features.12.weight
params_to_update_1に格納： features.12.bias
params_to_update_1に格納： features.14.weight
params_to_update_1に格納： features.14.bias
params_to_update_1に格納： features.17.weight
params_to_update_1に格納： features.17.bias
params_to_update_1に格納： features.19.weight
params_to_update_1に格納： features.19.bias
params_to_update_1に格納： features.21.weight
params_to_update_1に格納： features.21.bias
params_to_update_1に格納： features.24.weight
params_to_update_1に格納： features.24.bias
params_to_update_1に格納： features.26.weight
params_to_update_1に格納： features.26.bias
params_to_update_1に格納： f

In [0]:
# 最適化手法の設定
optimizer = optim.SGD([
    {'params': params_to_update_1, 'lr': 1e-4},
    {'params': params_to_update_2, 'lr': 5e-4},
    {'params': params_to_update_3, 'lr': 1e-3}
], momentum=0.9)

In [0]:
def train_model(net, dataloaders_dict, criterion, optimizer, num_epochs):

    # 初期設定
    # GPUが使えるかを確認
    device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
    print("使用デバイス：", device)

    # ネットワークをGPUへ
    net.to(device)

    # ネットワークがある程度固定であれば、高速化させる
    torch.backends.cudnn.benchmark = True

    # epochのループ
    for epoch in range(num_epochs):
        print('Epoch {}/{}'.format(epoch+1, num_epochs))
        print('-------------')

        # epochごとの訓練と検証のループ
        for phase in ['train', 'val']:
            if phase == 'train':
                net.train()  # モデルを訓練モードに
            else:
                net.eval()   # モデルを検証モードに

            epoch_loss = 0.0  # epochの損失和
            epoch_corrects = 0  # epochの正解数

            # 未学習時の検証性能を確かめるため、epoch=0の訓練は省略
            if (epoch == 0) and (phase == 'train'):
                continue

            # データローダーからミニバッチを取り出すループ
            for inputs, labels in tqdm(dataloaders_dict[phase]):

                # GPUが使えるならGPUにデータを送る
                inputs = inputs.to(device)
                labels = labels.to(device)

                # optimizerを初期化
                optimizer.zero_grad()

                # 順伝搬（forward）計算
                with torch.set_grad_enabled(phase == 'train'):
                    outputs = net(inputs)
                    loss = criterion(outputs, labels)  # 損失を計算
                    _, preds = torch.max(outputs, 1)  # ラベルを予測

                    # 訓練時はバックプロパゲーション
                    if phase == 'train':
                        loss.backward()
                        optimizer.step()

                    # 結果の計算
                    epoch_loss += loss.item() * inputs.size(0)  # lossの合計を更新
                    # 正解数の合計を更新
                    epoch_corrects += torch.sum(preds == labels.data)

            # epochごとのlossと正解率を表示
            epoch_loss = epoch_loss / len(dataloaders_dict[phase].dataset)
            epoch_acc = epoch_corrects.double() / len(dataloaders_dict[phase].dataset)

            print('{} Loss: {:.4f} Acc: {:.4f}'.format(
                phase, epoch_loss, epoch_acc))

In [33]:
num_epochs=5
train_model(net, dataloaders_dict, criterion, optimizer, num_epochs=num_epochs)

使用デバイス： cuda:0



  0%|          | 0/5 [00:00<?, ?it/s][A

Epoch 1/5
-------------



 20%|██        | 1/5 [00:02<00:09,  2.44s/it][A
 40%|████      | 2/5 [00:22<00:22,  7.66s/it][A
 60%|██████    | 3/5 [00:42<00:22, 11.41s/it][A
 80%|████████  | 4/5 [01:03<00:14, 14.33s/it][A
100%|██████████| 5/5 [01:19<00:00, 14.71s/it][A
[A
  0%|          | 0/8 [00:00<?, ?it/s][A

val Loss: 0.7704 Acc: 0.4444
Epoch 2/5
-------------



 12%|█▎        | 1/8 [00:21<02:30, 21.52s/it][A
 25%|██▌       | 2/8 [00:39<02:02, 20.42s/it][A
 38%|███▊      | 3/8 [00:54<01:34, 18.94s/it][A
 50%|█████     | 4/8 [01:13<01:15, 18.78s/it][A
 62%|██████▎   | 5/8 [01:30<00:55, 18.36s/it][A
 75%|███████▌  | 6/8 [01:46<00:35, 17.50s/it][A
 88%|████████▊ | 7/8 [02:02<00:17, 17.07s/it][A
100%|██████████| 8/8 [02:16<00:00, 16.35s/it][A
[A
  0%|          | 0/5 [00:00<?, ?it/s][A

train Loss: 0.5061 Acc: 0.7449



 20%|██        | 1/5 [00:00<00:01,  2.25it/s][A
 40%|████      | 2/5 [00:00<00:01,  2.25it/s][A
 60%|██████    | 3/5 [00:01<00:00,  2.24it/s][A
 80%|████████  | 4/5 [00:01<00:00,  2.10it/s][A
100%|██████████| 5/5 [00:02<00:00,  2.27it/s][A
[A
  0%|          | 0/8 [00:00<?, ?it/s][A

val Loss: 0.1751 Acc: 0.9608
Epoch 3/5
-------------



 12%|█▎        | 1/8 [00:00<00:05,  1.24it/s][A
 25%|██▌       | 2/8 [00:01<00:04,  1.25it/s][A
 38%|███▊      | 3/8 [00:02<00:03,  1.26it/s][A
 50%|█████     | 4/8 [00:03<00:03,  1.25it/s][A
 62%|██████▎   | 5/8 [00:03<00:02,  1.26it/s][A
 75%|███████▌  | 6/8 [00:04<00:01,  1.27it/s][A
 88%|████████▊ | 7/8 [00:05<00:00,  1.24it/s][A
100%|██████████| 8/8 [00:06<00:00,  1.37it/s][A
[A
  0%|          | 0/5 [00:00<?, ?it/s][A

train Loss: 0.1310 Acc: 0.9547



 20%|██        | 1/5 [00:00<00:01,  2.22it/s][A
 40%|████      | 2/5 [00:00<00:01,  2.21it/s][A
 60%|██████    | 3/5 [00:01<00:00,  2.18it/s][A
 80%|████████  | 4/5 [00:01<00:00,  2.04it/s][A
100%|██████████| 5/5 [00:02<00:00,  2.22it/s][A
[A
  0%|          | 0/8 [00:00<?, ?it/s][A

val Loss: 0.1224 Acc: 0.9412
Epoch 4/5
-------------



 12%|█▎        | 1/8 [00:00<00:05,  1.26it/s][A
 25%|██▌       | 2/8 [00:01<00:04,  1.25it/s][A
 38%|███▊      | 3/8 [00:02<00:04,  1.23it/s][A
 50%|█████     | 4/8 [00:03<00:03,  1.24it/s][A
 62%|██████▎   | 5/8 [00:04<00:02,  1.24it/s][A
 75%|███████▌  | 6/8 [00:04<00:01,  1.25it/s][A
 88%|████████▊ | 7/8 [00:05<00:00,  1.26it/s][A
100%|██████████| 8/8 [00:06<00:00,  1.39it/s][A
[A
  0%|          | 0/5 [00:00<?, ?it/s][A

train Loss: 0.0887 Acc: 0.9753



 20%|██        | 1/5 [00:00<00:01,  2.22it/s][A
 40%|████      | 2/5 [00:00<00:01,  2.21it/s][A
 60%|██████    | 3/5 [00:01<00:00,  2.19it/s][A
 80%|████████  | 4/5 [00:01<00:00,  2.01it/s][A
100%|██████████| 5/5 [00:02<00:00,  2.20it/s][A
[A
  0%|          | 0/8 [00:00<?, ?it/s][A

val Loss: 0.1170 Acc: 0.9477
Epoch 5/5
-------------



 12%|█▎        | 1/8 [00:00<00:05,  1.17it/s][A
 25%|██▌       | 2/8 [00:01<00:05,  1.19it/s][A
 38%|███▊      | 3/8 [00:02<00:04,  1.21it/s][A
 50%|█████     | 4/8 [00:03<00:03,  1.22it/s][A
 62%|██████▎   | 5/8 [00:04<00:02,  1.22it/s][A
 75%|███████▌  | 6/8 [00:04<00:01,  1.23it/s][A
 88%|████████▊ | 7/8 [00:05<00:00,  1.24it/s][A
100%|██████████| 8/8 [00:06<00:00,  1.36it/s][A
[A
  0%|          | 0/5 [00:00<?, ?it/s][A

train Loss: 0.0581 Acc: 0.9712



 20%|██        | 1/5 [00:00<00:01,  2.10it/s][A
 40%|████      | 2/5 [00:00<00:01,  2.12it/s][A
 60%|██████    | 3/5 [00:01<00:00,  2.13it/s][A
 80%|████████  | 4/5 [00:01<00:00,  2.01it/s][A
100%|██████████| 5/5 [00:02<00:00,  2.19it/s][A
[A

val Loss: 0.1135 Acc: 0.9542


In [0]:
save_path = './gdrive/My Drive/pytorch_advanced/weights_fine_tuning.pth'
torch.save(net.state_dict(), save_path)