<a href="https://colab.research.google.com/github/seonae0223/Deep_Learning/blob/main/06_ResNet.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import torch
from torch import nn


# Basic Block 구현

In [None]:
class BasicBlock(nn.Module):

  # 나가는 채널을 몇 배 늘려서 나가게 할지 결정
  #  사실 18, 34 레이어는 필요 없으나, 구현을 일치성을 위해 놔둠
  expansion = 1

  def __init__(self, in_channels, inner_channels, stride=1, projection=None):
    super().__init__()

    # 3x3을 두 번 통과 --> F(x)의 역할
    self.residyal = nn.Sequential (
        nn.Conv2d(in_channels, inner_channels, 3, stride=stride, bias=False),
        nn.BatchNorm2d(inner_channels),
        nn.ReLU(inplace=True),

        nn.Conv2d(inner_channels, inner_channels * self.expension, 3, padding=1, bias=False),
        nn.BatchNorm2d(inner_channels)
    )

    # projection은 1x1 conv 진행
    self.projention = projection
    self.relu = nn.ReLU(inplace=True)


  def forward(self, x):

    # F(x) 부터 계산
    residual = self.residual(x)

    # skip connection
    if self.projection is not None:
      # 점선 연결 부분 구현. 이전 스테이지의 마지막 블록의 출력의 채널의 두배로, 세로가로는 절반으로
      shortcut = self.projection(x)
    else:
      shortcut = x

    out = self.relu(residual + x)

    return out

# BootleNeck 구현
- 50, 101, 152 레이어를 위한 블록

In [None]:
class BottleNeck(nn.Module):

  # 내보낼 때 채널이 입력된 데이터의 채널의 4배로 늘어난다. 64 -> 256, 128 -> 512, 512 -> 2048
  expansion = 4

  def __init__(self, in_channels, inner_channels, stride=1, projection=None):
    super().__init__()

    # 1x1 -> 3x3 -> 1x1
    self.residual = nn.Sequential(
        # 1x1
        nn.Conv2d(in_channels, inner_channels, 1, bias=False),
        nn.BatchNorm2d(inner_channels),
        nn.ReLU(inplace=True),

        # 3x3
        nn.Conv2d(inner_channels, inner_channels, 3, stride=stride, padding=1, bias=False),
        nn.BatchNorm2d(inner_channels),
        nn.ReLU(inplace=True),

        # 1x1
        nn.Conv2d(inner_channels, inner_channels * self.expansion, 1, bias=False),
        nn.BatchNorm2d(inner_channels * self.expansion)
    )

    self.projection = projection
    self.relu = nn.ReLU(inplace=True)

  def forward(self, x):
    residual = self.residual(x)

    if self.projection is not None:
      shortcut = self.projection(x)
    else:
      shortcut = x

    out = self.relu(residual + shortcut)
    return out

# ResNet 모듈 구현


In [None]:
class ResNet(nn.Module):

  def __init__(self, block, num_block_list, num_classes=1000, zero_init_residual=True):
    super().__init__()

    self.in_channels = 64

    self.conv1 = nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3, bias=False)
    self.bn1 = nn.BatchNorm2d(64)
    self.relu = nn.ReLU(inplace=True)
    self.maxpool = nn.MaxPool2d(kernel_size=3, stride=2, padding=1)

    self.stage1 = self.make_stage(block, 64, num_block_list[0], stride=1)
    self.stage2 = self.make_stage(block, 128, num_block_list[1], stride=2)
    self.stage3 = self.make_stage(block, 256, num_block_list[2], stride=2)
    self.stage4 = self.make_stage(block, 512, num_block_list[3], stride=2)

    if zero_init_residual:
      # 전체 모듈 가져오기
      for m in self.modules():

        # 모듈이 block이라면(BottleNeck이거나 BasicBlock 이라면)
        if isinstance(m, block):
          # residual 모듈의 제일 마지막 레이어의 가중치를 0으로 만들어 준다.
          #  residual 모듈의 제일 마지막 레이어는 Batch Normalization
            # 각 모듈의 마지막 층은 BatchNorm2d입니다. 이 BatchNorm2d의 weight 파라미터(γ 또는 alpha라고도 부릅니다)를 0으로 초기화합니다.
            # γ를 0으로 설정하면 해당 BatchNorm 층의 출력이 0이 되어 residual branch의 전체 출력이 0이 됩니다.
            # 따라서 이 residual branch는 초기에는 출력을 하지 않고, 블록 전체는 입력을 그대로 출력하는 identity mapping처럼 동작합니다.
            # 이는 초기 학습 시 네트워크의 안정적인 수렴을 도와주며, 모델의 성능을 향상시킵니다.
            # 이러한 방법은 논문 https://arxiv.org/abs/1706.02677 에서 제안되었으며, 약 0.2~0.3%의 성능 향상이 있다고 합니다.
          nn.init.constant_(m.residual[-1].weight, 0) # BN의 가중치를 0으로 만들어 준다.

    self.avgpool = nn.AdaptiveAvgPool2d((1, 1))
    self.fc = nn.Linear(512 * block.expansion, num_classes)

  def forward(self, x):

    # 입력된 이미지에 대한 기본 처리
    x = self.conv1(x)
    x = self.bn1(x)
    x = self.relu(x)
    x = self.maxpool(x)

    # 잔차 학습(스테이지 통과)
    x = self.stage1(x)
    x = self.stage2(x)
    x = self.stage3(x)
    x = self.stage4(x)

    # FCL
    x = self.avgpool(x)
    x = torch.flatten(x, 1)
    y = self.fc(x)

    return y

  def make_stage(self, block, inner_channels, num_blocks, stride=1):

    if stride != 1 or self.in_channels != inner_channels * block.expansion:
      projection = nn.Sequential(
          nn.Conv2d(self.in_channels, inner_channels * block.expansion, 1, stride=stride, bias=False),
          nn.BatchNorm2d(inner_channels * block.expansion)
      )
    else:
      projection = None

    layers = []

    # 각 스테이지 별 첫 번째 레이어는 projection을 수행한다. 아닌 경우에는 그냥 None으로 들어간다.
    layers += [ block(self.in_channels, inner_channels, stride, projection) ]

    self.in_channels = inner_channels * block.expansion

    for _ in range(1, num_blocks):
      layers += [block(self.in_channels, inner_channels)] # 첫 번째 레이어 이후는 stride, projection 없음

    return nn.Sequential(*layers)

In [None]:
def resnet18(**kwargs):
    return ResNet(BasicBlock, [2, 2, 2, 2], **kwargs)

def resnet34(**kwargs):
    return ResNet(BasicBlock, [3, 4, 6, 3], **kwargs)

########

def resnet50(**kwargs):
    return ResNet(BottleNeck, [3, 4, 6, 3], **kwargs)

def resnet101(**kwargs):
    return ResNet(BottleNeck, [3, 4, 23, 3], **kwargs)

def resnet152(**kwargs):
    return ResNet(BottleNeck, [3, 8, 36, 3], **kwargs)

In [None]:
model = resnet101()

In [None]:
!pip install torchinfo

Collecting torchinfo
  Downloading torchinfo-1.8.0-py3-none-any.whl.metadata (21 kB)
Downloading torchinfo-1.8.0-py3-none-any.whl (23 kB)
Installing collected packages: torchinfo
Successfully installed torchinfo-1.8.0


In [None]:
from torchinfo import summary
summary(model, input_size=(64, 3, 224, 224), device='cpu')

Layer (type:depth-idx)                   Output Shape              Param #
ResNet                                   [64, 1000]                --
├─Conv2d: 1-1                            [64, 64, 112, 112]        9,408
├─BatchNorm2d: 1-2                       [64, 64, 112, 112]        128
├─ReLU: 1-3                              [64, 64, 112, 112]        --
├─MaxPool2d: 1-4                         [64, 64, 56, 56]          --
├─Sequential: 1-5                        [64, 256, 56, 56]         --
│    └─BottleNeck: 2-1                   [64, 256, 56, 56]         --
│    │    └─Sequential: 3-1              [64, 256, 56, 56]         58,112
│    │    └─Sequential: 3-2              [64, 256, 56, 56]         16,896
│    │    └─ReLU: 3-3                    [64, 256, 56, 56]         --
│    └─BottleNeck: 2-2                   [64, 256, 56, 56]         --
│    │    └─Sequential: 3-4              [64, 256, 56, 56]         70,400
│    │    └─ReLU: 3-5                    [64, 256, 56, 56]         --