In [19]:
#パッケージのインポート
import glob
import os.path as osp
import random
import numpy as np
import json
from PIL import Image
from tqdm import tqdm
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

import torch
import torch.nn as nn
import torch.optim as optim
import torch.utils.data as data
import torchvision
from torchvision import models,transforms
import cv2 
import time

## DataLoaderの作成

In [6]:
from utils.ssd_model import make_datapath_list,VOCDataset,DataTransform,Anno_xml2list,od_collate_fn

In [9]:
#ファイルパスのリストを取得
rootpath="../2_objectdetection/data/VOCdevkit/VOC2012/"
train_img_list, train_anno_list,val_img_list,val_anno_list=make_datapath_list(rootpath)

In [10]:
#Datasetを作成
voc_classes=["aeroplane","bicycle","bird","boat","bottle","bus","car","cat","chair",
"cow","dinigtable","dog","horse","motorbike","person","pottedplant","sheep","sofa","train","tvmonitor"]

color_mean=(104,117,123) #(BGR)の色の平均値

input_size=300 #画像のinputサイズを300*300にする

In [12]:
train_dataset=VOCDataset(train_img_list,train_anno_list,phase="train",
transform=DataTransform(input_size,color_mean), transform_anno=Anno_xml2list(voc_classes))

val_dataset=VOCDataset(val_img_list,val_anno_list,phase="val",
transform=DataTransform(input_size,color_mean),transform_anno=Anno_xml2list(voc_classes))

In [13]:
#DataLoaderを作成する
batch_size=32

train_dataloader=data.DataLoader(train_dataset,batch_size=batch_size,shuffle=True,collate_fn=od_collate_fn)
val_dataloader=data.DataLoader(val_dataset,batch_size=batch_size,shuffle=True,collate_fn=od_collate_fn)

#辞書オブジェクトにまとめる
dataloaders_dict={"train":train_dataloader,"val":val_dataloader}

In [14]:
train_dataloader

<torch.utils.data.dataloader.DataLoader at 0x7feed9b48080>

## ネットワークモデルの作成

In [15]:
from utils.ssd_model import SSD

In [17]:
#SSD300の設定
ssd_cfg={
    "num_classes":21, #背景クラスを含めた合計クラス数
    "input_size":300, #画像入力クラス
    "bbox_aspect_num":[4,6,6,6,4,4], #出力するDBoxのアスペクト比の種類
    "feature_maps":[38,19,10,5,3,1], #各sourceの画像サイズ
    "steps":[8,16,32,64,100,300], #DBoxの大きさを決める
    "min_sizes":[30,60,111,162,213,264], #DBoxの大きさを決める
    "max_sizes":[60,111,162,213,264,315], #DBoxの大きさを決める
    "aspect_ratios":[[2],[2,3],[2,3],[2,3],[2],[2]],
}

#SSDネットワークモデル
net=SSD(phase="train",cfg=ssd_cfg)

In [None]:
#SSDの初期の重みに設定
#ssdのvgg部分に重みをロードする
vgg_weights=torch.load("../2_objectdetection/weights/vgg16_reducedfc.pth")
net.vgg.load_state_dict(vgg_weights)

#ssdの他のネットワークの重みはHeの初期値で初期化
def weights_init(m):
    if isinstance(m,nn.Conv2d):
        init.kaiming_normal_(m.weight.data)
        if m.bias is not None:
            nn.init.constant_(m.bias,0.0)

#Heの初期値を適用
net.extras.apply(weights_init)
net.loc.apply(weights_init)
net.conf.apply(weights_init)

In [None]:
#GPUが使えるか確認
device=torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
print("使用デバイス：",device)

print("ネットワーク設定完了：学習済みの重みをロードしました")

## 損失関数と最適化手法の設定

In [None]:
from utils.ssd_model import MultiBoxLoss

#損失関数の設定
criterion=MultiBoxLoss(jaccard_thresh=0.5,neg_pos=0.3,device=device)

#最適化手法の設定
optimizer=optim.SGD(net.parameters(),lr=1e-3,momentum=0.9,weight_decay=5e-4)

## 学習と検証の実施

In [None]:
#モデルを学習させる関数を作成
def train_model(net,dataloaders_dict,criterion,optimizer,num_epochs):
    #GPUが使えるか確認
    device=torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
    print("使用デバイス：",device)

    #ネットワークをGPUへ
    net.to(device)

    #ネットワークがある程度固定であれば、高速化させる
    torch.backends.cudnn.benchmark=True


    #イテレーションカウンタをセット
    iteration=1
    epoch_train_loss=0.0 #epochの損失和
    epoch_val_loss=0.0 #epochの損失和
    logs=[]

    #epochのループ
    for epoch in range(num_epochs+1):

        #開始時刻を保存
        t_epoch_strat=time.time()
        t_iter_start=time.time()

        print("------------------")
        print("Epoch {}/{}".format(epoch+1, num_epochs))
        print("------------------")

        #epochごとに訓練と検証のループ
        for phase in ["train","val"]:
            if phase=="train":
                net.train() #モデルを訓練モードに
                print("(train)")
            else:
                if ((epoch+1)%10 ==0):
                    net.eval() #モデルを検証モードに
                    print("------------------")
                    print("(val)")
                else:
                    #検証は10回に1回だけ行う
                    continue

            #データローダーからminibatchずつ取り出すループ
            for images,targets in dataloaders_dict[phase]:

                #GPUが使えるならGPUにデータを送る
                images=images.to(device)
                targets=[ann.to(device) for ann in targets] #リストの各要素をテンソルへ

                #optimizerを初期化
                optimizer.zero_grad()

                #順伝搬(forward)計算
                with torch.set_grad_enabled(phase=="train"):
                    outputs=net(images)

                    #損失の計算
                    loss_l,loss_c=criterion(outputs,targets)
                    loss=loss_l+loss_c

                    #訓練時はバックプロパゲーション
                    if phase=="train":
                        loss.backward() #勾配の計算

                        #勾配が大きくなりすぎると計算が不安定になるので、clipで最大でも勾配2.0に留める
                        nn.utils.clip_grad_value_(net.parameters(),clip_value=2)

                        optimizer.step() #パラメータ更新

                        if (iteration%10==0): #10iterに1度、lossを表示
                            t_iter_finish=time.time()
                            duration=t_iter_finish-t_iter_start
                            print("イテレーション{} || Loss: {:.4f} || 10 iter: {:.4f} sec.".format(
                                iteration.loss.item(),duration))
                            t_iter_start=time.time()

                        epoch_train_loss+=loss.item()
                        iteration+=1
                    
                    #検証時
                    else:
                        epoch_val_loss+=loss.item()

        #epochのphaseごとのloss
        t_epoch_finish=time.time()
        print("------------------")
        print("epoch{} || Epoch_TRAIN_Loss:{:.4f} || Epoch_VAL_Loss:{:.4f}".format(
            epoch+1,epoch_train_loss,epoch_val_loss))
        print("timer:{:.4f}sec. ".format(t_epoch_finish-t_epoch_strat))
        t_epoch_strat=time.time()

        #ログを保存
        log_epoch={"epoch":epoch+1,"train_loss":epoch_train_loss,"val_loss":epoch_val_loss}
        logs.append(log_epoch)
        df=pd.DataFrame(logs)
        df.to_csv("log_output.csv")

        epoch_train_loss=0.0 #epochの損失和
        epoch_val_loss=0.0 #epochの損失和

        #ネットワークを保存する
        if ((epoch+1)%10==0):
            torch.save(net.state_dict(),"weights/ssd300_"+str(epoch+1)+".pth")
        

In [None]:
#学習・検査をする
num_epochs=50
train_model(net,dataloaders_dict,criterion,optimizer,num_epochs=num_epochs)