# F.softmax() + torch.log() = F.log_softmax()

In [4]:
import torch
import torch.nn.functional as F
torch.manual_seed(1)


z = torch.rand(3, 5, requires_grad=True)
hypothesis = F.softmax(z, dim=1)

y = torch.randint(5, (3,)).long()

# 모든 원소가 0의 값을 가진 3 × 5 텐서 생성
y_one_hot = torch.zeros_like(hypothesis) 

# unsqueeze 는 차원을 늘림. 즉 아래의 경우 dim=1 에 차원을 하나 늘려라는 의미임
# 그러면 y는 아래와 같이 변할 것임
# [[3],[1],[2]]

#scatter 는 dim,index,src를 인자를 받음
# 아래의 의미는 dim=1에 각각 해당하는 숫자의 열에 1을 집어넣으라는 의미 unsqueeze를 해야됨 그이유는 알아서 생각
y_one_hot.scatter_(1, y.unsqueeze(1), 1)

tensor([[1., 0., 0., 0., 0.],
        [0., 0., 1., 0., 0.],
        [0., 1., 0., 0., 0.]])

# F.log_softmax() + F.nll_loss() = F.cross_entropy()

### Low level
### 첫번째 수식
(y_one_hot * -torch.log(F.softmax(z, dim=1))).sum(dim=1).mean()

In [5]:
# 두번째 수식
(y_one_hot * - F.log_softmax(z, dim=1)).sum(dim=1).mean()

tensor(1.4689, grad_fn=<MeanBackward0>)

이를 더 간단하게 하면 다음과 같습니다. F.nll_loss()를 사용할 때는 원-핫 벡터를 넣을 필요없이 바로 실제값을 인자로 사용합니다.

In [6]:
# High level
# 세번째 수식
F.nll_loss(F.log_softmax(z, dim=1), y)

tensor(1.4689, grad_fn=<NllLossBackward>)