## 과적합

과적합은 학습 데이터에 치중하여 모델이 학습하는 현상으로 새로운 데이터에 대해서 대응을 못하는 문제다. 따라서 딥러닝에서 가장 쉽게 접할 수 있는 유형이지만 개선하기 힘든 문제다.

### 1. Dropout & Batch Normalization

In [None]:
class CNN(nn.Module):
  def __init__(self):
    super(CNN,self).__init__()

    self.feature_extraction = nn.Sequential(nn.Conv2d(3,6,5),
                                            nn.BatchNorm2d(6),
                                            nn.ReLU(),
                                            nn.MaxPool2d(2,2),
                                            nn.Conv2d(6,16,5),
                                            nn.BatchNorm2d(16),
                                            nn.ReLU(),
                                            nn.MaxPool2d(2,2)
                                            )
    self.classifier = nn.Sequential(nn.Linear(512,120),
                                    nn.ReLU(),
                                    nn.Dropout(0.5), #비활성화 시킬 노드의 비율
                                    nn.Linear(120,64),
                                    nn.ReLU(),
                                    nn.Linear(64,10)

    )
  def forward(self,x):
    x = self.feature_extraction(x)
    x = x.view(-1,512)
    x = self.classifier(x)

    return x

net = CNN().to(device) #모델 선언

### 2. L2 Regularization

In [None]:
import torch.optim as optim

optimizer = optim.Adam(model.parameters(), lr=1e-4, weight_decay =1e-2)

### 3. Data Augmentation

In [None]:
import torchvision.transforms as tr
import PIL

transf = tr.Compose([
    tr.ToPILImage(), tr.RandomCrop(60), tr.ColorJitter(brightness=0.1, contrast=0.1, saturation=0.2,hue=0.2),
    tr.RandomHorizontalFlip(),
    tr.RandomRotation(10),
    tr.ToTensor()
])

### 4. Label Smoothing

In [1]:
import torch.nn as nn

class LabelSmoothingLoss(nn.Module):
  def __init__(self, classes, smoothing=0.0, dim=-1):
    super(LabelSmoothingLoss, self).__init__()
    self.confidence = 1.0 - smoothing
    self.smoothing = smoothing
    self.cls = classes
    self.dim = dim

  def forward(self, pred, target):
    pred = pred.log_softmax(dim=self.dim) #Cross Entropy 부분의 log softmax 미리 계산하기
    with torch.no_grad():
      true_dist = torch.zeros_like(pred) #예측값과 동일한 크기의 영텐서 만들기
      true_dist.fill_(self.smoothing/(self.cls-1)) #alpha/(K-1)을 만들어 줌(alpha/K로 할 수도 있음)
      true_dist.scatter_(1,target.data.unsqueeze(1),self.confidence) #(1-alpha)y + alpha/(K-1)
    return torch.mean(torch.sum(-true_dist*pred,dim=self.dim)) #Cross Entropy Loss 계산

In [2]:
ls = LabelSmoothingLoss(10, smoothing=0.2)