# 学習済みVGGモデルを用いた転移学習

## Introduction

### Goal
- 目的:
    - ImageNetデータセットで学習済みのVGG-16モデルで未知の画像の分類を行う
    - VGG-16モデルの実力を知る
- 詳細:
    - 以下のハリネズミの写真をハリネズミと認識するか確認する

![gahag-0059907781-1](./data/gahag-0059907781-1.jpg)

### Key words
- **ImageNetデータセット**
    - スタンフォード大学がインターネット上から画像を収集して分類したデータセット
- **VGG-16モデル**
    - 2014年のILSVR(ImageNet Large Scale Visual Recognition Challenge)コンテストで準優勝した畳み込みニューラルネットワーク
    - オックスフォード大学のVGG(Visual Geometry Group)チームが開発した16層構成のモデルであるため VGG-16モデルと呼ばれる

In [2]:
# 必要パッケージのimport
import numpy as np
import json, torch, torchvision
from torchvision import models, transforms
from PIL import Image
import matplotlib.pyplot as plt
%matplotlib inline

In [3]:
# PyTorch バージョン確認
torch.__version__

'1.1.0'

In [4]:
# TorchVision バージョン確認
torchvision.__version__

'0.3.0'

In [5]:
# 学習済みVGG-16モデルロード
## 初回実行時はダウンロードの時間がかかる
net = models.vgg16(pretrained=True)

# モデルのネットワーク構成を確認
net

Downloading: "https://download.pytorch.org/models/vgg16-397923af.pth" to /home/user/.cache/torch/checkpoints/vgg16-397923af.pth
100%|██████████| 553433881/553433881 [00:27<00:00, 20147751.17it/s]


VGG(
  (features): Sequential(
    (0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU(inplace)
    (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU(inplace)
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (6): ReLU(inplace)
    (7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (8): ReLU(inplace)
    (9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(inplace)
    (12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (13): ReLU(inplace)
    (14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (15): ReLU(inplace)
    (16): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (17): Conv2d