## AlexNet
---
$AlexNet$은 5개의 컨볼루션층(convolution layer)와 분류를 위한 3개의 완전연결층(fully connected layer)로 이루어져 있습니다. 입력으로는 $ImageNet$의 데이터(3\*244\*244의 RGB 채널 이미지)를 사용했고, 첫 번째 컨볼루션층에서 3\*11\*11 필터 96개를 사용했습니다.

In [None]:
class AlexNet(nn.Module):
    def __init__(self, n_classes=2):
        super(AlexNet, self).__init__()
        self.conv1 = nn.Sequential(nn.Conv2d(1, 96, kernel_size=11, stride=4, padding=1), 
                                    nn.BatchNorm2d(96), 
                                    nn.ReLU(), 
                                    nn.MaxPool2d(3, stride=2)
                                  )
        self.conv2 = nn.Sequential(nn.Conv2d(96, 256, kernel_size=5, stride=1, padding=1), 
                                    nn.BatchNorm2d(256), 
                                    nn.ReLU(), 
                                    nn.MaxPool2d(3, stride=2)
                                  )
        self.conv3 = nn.Sequential(nn.Conv2d(256, 384, kernel_size=3, stride=1, padding=1), 
                                    nn.ReLU()
                                  )
        self.conv4 = nn.Sequential(nn.Conv2d(384, 384, kernel_size=3, stride=1, padding=1), 
                                   nn.ReLU()
                                  )
        self.conv5 = nn.Sequential(nn.Conv2d(384, 256, kernel_size=3, stride=1, padding=1), 
                                   nn.ReLU()
                                  )
        self.fc1 = nn.Sequential(nn.Linear(4096, 4096), nn.ReLU())
        self.fc2 = nn.Sequential(nn.Linear(4096, 4096), nn.ReLU())
        self.fc3 = nn.Sequential(nn.Linear(4096, n_classes), nn.Softmax())
    
    def forward(self, x):
        out = self.conv1(x)
        out = self.conv2(out)
        out = self.conv3(out)
        out = self.conv4(out)
        out = self.conv5(out)
        out = out.reshape(out.size(0), -1)
        out = self.fc1(out)
        out = self.fc2(out)
        out = self.fc3(out)
        
        return out

##  VGGNet
---
$VGGNet$을 한 마디로 요약하면 '더 작은 필터, 더 깊은 층'이 되겠습니다. 3\*3 필터를 사용해 더 깊은 신경망을 구성했고, 13개의 컨볼루션층과 3개의 완전연결층을 사용했습니다($VGG-16$의 경우).

In [None]:
class VGG16(nn.Module):
    def __init__(self, n_classes=2):
        super(VGG16, self).__init__()
        self.conv1 = nn.Sequential(nn.Conv2d(1, 64, kernel_size=3, stride=1, padding=1), 
                                   nn.ReLU(), 
                                   nn.Conv2d(64, 128, kernel_size=3, stride=1, padding=1), 
                                   nn.ReLU(), 
                                   nn.MaxPool2d(2, stride=2)
                                  )
        self.conv2 = nn.Sequential(nn.Conv2d(128, 128, kernel_size=3, stride=1, padding=1), 
                                   nn.ReLU(), 
                                   nn.Conv2d(128, 256, kernel_size=3, stride=1, padding=1), 
                                   nn.ReLU(), 
                                   nn.MaxPool2d(2, stride=2)
                                  )
        self.conv3 = nn.Sequential(nn.Conv2d(256, 256, kernel_size=3, stride=1, padding=1), 
                                   nn.ReLU(), 
                                   nn.Conv2d(256, 256, kernel_size=3, stride=1, padding=1), 
                                   nn.ReLU(), 
                                   nn.Conv2d(256, 512, kernel_size=3, stride=1, padding=1), 
                                   nn.MaxPool2d(2, stride=2)
                                  )
        self.conv4 = nn.Sequential(nn.Conv2d(512, 512, kernel_size=3, stride=1, padding=1), 
                                   nn.ReLU(), 
                                   nn.Conv2d(512, 512, kernel_size=3, stride=1, padding=1), 
                                   nn.ReLU(), 
                                   nn.Conv2d(512, 512, kernel_size=3, stride=1, padding=1), 
                                   nn.ReLU(), 
                                   nn.MaxPool2d(2, stride=2)
                                  )
        self.conv5 = nn.Sequential(nn.Conv2d(512, 512, kernel_size=3, stride=1, padding=1), 
                                   nn.ReLU(), 
                                   nn.Conv2d(512, 512, kernel_size=3, stride=1, padding=1), 
                                   nn.ReLU(), 
                                   nn.Conv2d(512, 512, kernel_size=3, stride=1, padding=1), 
                                   nn.ReLU(), 
                                   nn.MaxPool2d(2, stride=2)
                                  )
        self.fc = nn.Sequential(nn.Linear(4096, 4096), 
                                nn.ReLU(), 
                                nn.Linear(4096, 4096), 
                                nn.ReLU(), 
                                nn.Linear(4096, n_classes), 
                                nn.Softmax())
        
    def forward(self, x):
        out = self.conv1(x)
        out = self.conv2(out)
        out = self.conv3(out)
        out = self.conv4(out)
        out = self.conv5(out)
        out = out.reshape(out.size(0), -1)
        out = self.fc(out)
        
        return out

## GoogLeNet
---
$Network In Network$($NIN$)에서 영감을 얻은 $Inception module$을 사용했습니다. 기존 컨볼루션 연산이 필터와 입력값의 선형조합으로 이루어진 반면 $NIN$에서는 MLP가 들어갑니다.

In [None]:
class GoogLeNet(nn.Module):
    def __init__(self, n_classes=2):
        super(GoogLeNet, self).__init__()