In [1]:
# Copyright 2023, Acadential, All rights reserved.

# 14-13. PyTorch로 구현된 VGGNet 뜯어보기
이번 시간에는 VGGNet을 뜯어보도록 하겠습니다. \
간단하게 VGGNet의 특징을 정리하면 다음과 같습니다.
- VGGNet은 2014년 ILSVRC에서 2위를 차지한 모델로, 1위를 차지한 GoogLeNet과는 다르게 굉장히 간단한 구조를 가지고 있습니다.
- VGGNet은 3x3의 작은 필터를 사용하여 깊이를 늘려가는 방식을 사용하였습니다.
- 이는 11x11이나 7x7의 큰 필터를 사용하는 것보다 깊이가 깊어지는 것이 더 좋은 성능을 보여주었기 때문입니다. VGGNet은 3x3의 작은 필터를 사용하면서도 GoogLeNet보다 더 깊은 구조를 가지고 있습니다.
- 이는 VGGNet이 GoogLeNet보다 더 많은 파라미터를 가지고 있기 때문입니다.
- VGGNet은 16개의 레이어를 가지고 있으며, 이는 13개의 컨볼루션 레이어와 3개의 Fully Connected 레이어로 구성되어 있습니다.

Torchvision에서 제공되는 VGGNet 모델은 다음과 같습니다:
- "vgg11"
- "vgg11_bn"
- "vgg13"
- "vgg13_bn"
- "vgg16"
- "vgg16_bn"
- "vgg19"
- "vgg19_bn"

뒤에 붙은 숫자는 Layer개수이고, bn은 Batch Normalization을 사용한 것을 의미합니다.



In [2]:
from torchvision.models import (vgg11,
                                vgg11_bn,
                                vgg13)
from torchsummary import summary 

## VGG11

In [3]:
from torchvision.models import vgg11,

# 예를 들어서 vgg11 모델을 불러오는 코드는 다음과 같습니다.
model = vgg11()

In [4]:
summary(model, (3, 64, 64))

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
            Conv2d-1           [-1, 64, 64, 64]           1,792
              ReLU-2           [-1, 64, 64, 64]               0
         MaxPool2d-3           [-1, 64, 32, 32]               0
            Conv2d-4          [-1, 128, 32, 32]          73,856
              ReLU-5          [-1, 128, 32, 32]               0
         MaxPool2d-6          [-1, 128, 16, 16]               0
            Conv2d-7          [-1, 256, 16, 16]         295,168
              ReLU-8          [-1, 256, 16, 16]               0
            Conv2d-9          [-1, 256, 16, 16]         590,080
             ReLU-10          [-1, 256, 16, 16]               0
        MaxPool2d-11            [-1, 256, 8, 8]               0
           Conv2d-12            [-1, 512, 8, 8]       1,180,160
             ReLU-13            [-1, 512, 8, 8]               0
           Conv2d-14            [-1, 51

## VGG11_BN

In [5]:
# 예를 들어서 vgg11_bn 모델을 불러오는 코드는 다음과 같습니다.
model = vgg11_bn()

In [6]:
summary(model, (3, 64, 64))

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
            Conv2d-1           [-1, 64, 64, 64]           1,792
       BatchNorm2d-2           [-1, 64, 64, 64]             128
              ReLU-3           [-1, 64, 64, 64]               0
         MaxPool2d-4           [-1, 64, 32, 32]               0
            Conv2d-5          [-1, 128, 32, 32]          73,856
       BatchNorm2d-6          [-1, 128, 32, 32]             256
              ReLU-7          [-1, 128, 32, 32]               0
         MaxPool2d-8          [-1, 128, 16, 16]               0
            Conv2d-9          [-1, 256, 16, 16]         295,168
      BatchNorm2d-10          [-1, 256, 16, 16]             512
             ReLU-11          [-1, 256, 16, 16]               0
           Conv2d-12          [-1, 256, 16, 16]         590,080
      BatchNorm2d-13          [-1, 256, 16, 16]             512
             ReLU-14          [-1, 256,

## VGG13

In [7]:
# 예를 들어서 vgg11_bn 모델을 불러오는 코드는 다음과 같습니다.
model = vgg13()

In [8]:
summary(model, (3, 64, 64))

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
            Conv2d-1           [-1, 64, 64, 64]           1,792
              ReLU-2           [-1, 64, 64, 64]               0
            Conv2d-3           [-1, 64, 64, 64]          36,928
              ReLU-4           [-1, 64, 64, 64]               0
         MaxPool2d-5           [-1, 64, 32, 32]               0
            Conv2d-6          [-1, 128, 32, 32]          73,856
              ReLU-7          [-1, 128, 32, 32]               0
            Conv2d-8          [-1, 128, 32, 32]         147,584
              ReLU-9          [-1, 128, 32, 32]               0
        MaxPool2d-10          [-1, 128, 16, 16]               0
           Conv2d-11          [-1, 256, 16, 16]         295,168
             ReLU-12          [-1, 256, 16, 16]               0
           Conv2d-13          [-1, 256, 16, 16]         590,080
             ReLU-14          [-1, 256,

# Section 14 Slide의 Appendix 참고!

Appendix에 한 눈에 차이점을 파악할 수 있도록 정리해두었습니다!

그리고 각 vgg 모델이 pytorch로 구현하는 코드는 src/vgg.py에 있습니다. 이 코드는 torchvision.model.vgg를 참고하여 작성하였습니다.