## Focal Loss

- one-stage detector가 two-stage detector에 비해서 정확도가 낮은 이유 중 하나는, negative sample의 비율이 positive sample보다 월등하게 많다는 것.
- 객체가 아닌 배경에 친 박스가 훨씬 많다. (클래스 불균형 문제)
- 이러한 easy negative sample의 학습 반영률을 낮추고, hard positive sample의 학습 반영률은 높이기 위해서 고안된 Loss.

![image.png](attachment:aa0eff92-fd39-4b02-896f-8201c61a0f3b.png)

- CE에 (1-p_t)^gamma 항을 추가하면 focal loss다. 

In [10]:
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch. autograd import Variable

class FocalLoss(nn.Module) : 
    def __init__(self, gamma = 0 , alpha = None, size_average = None ) :
        super(FocalLoss, self).__init__()
        self.gamma = gamma
        self.alpha = alpha 
        if isinstance(alpha, (float, int, long)) : 
            self.alpha = torch.Tensor([alpha, 1- alpha]) # foreground에 대해서 alpha, background에 대해서는 1 - alpha
        if instance(alpha, list) : 
            self.alpha = torch.Tensor(alpha)
        self.size_average = size_average
        
    def forward(self, input, target) :
        if input.dim() > 2 :
            input = input.view(input.size(0), input.size(1), -1) # B,C,H,W => B,C, H*W
            input = input.permute(0,2,1) # N,C, H*W => N, H*W, C
            input = input.contiguous().view(-1, input.size(2)) # contiguous를 쓰는 이유 : https://f-future.tistory.com/entry/Pytorch-Contiguous  / tensor 객체의 주소값 연속성이 불변인 것을 contiguous()함수를 통해 새로운 메모리 공간에 데이터 복사하여 주소값 연속성이 가변적이게 만들 수 있음
        target = target.view(-1,1)
        
        logpt = F.log_softmax(input)
        logpt = logpt.gather(1, target)
        logpt = logpt.view(-1)
        pt = Variable(logpt.data.exp())
        
        if self.alpha is not None :
            if self.alpha.type()!=input.data.type() :
                self.alpha = self.alpha.type_as(input.data)
                at = self.alpha.gather(0, target.data.view(-1)) # alpha 내 target 값이 가리키는 index들을 추출
                logpt = logpt * Variable(at)
        
        loss = -1 * (1-pt) ** self.gamma * logpt
        if self.size_average :
            return loss.mean()
        else : 
            return loss.sum()