[toc]

# Pytorch Loss

## torch.nn.CrossEntropyLoss

主要记得下面几点：
1. 第一个参数是 logits，也就是不需要过 softmax 函数。
2. 第二个参数是不是one_hot形式的，而且其类型应该为 `torch.long`
3. 默认是求 mean 的结果，不像 tensorflow，需要手动求 mean

使用

>The input is expected to contain raw, unnormalized scores for each class.

In [10]:
import torch
import torch.nn as nn

loss = nn.CrossEntropyLoss()
input = torch.randn(3, 5, requires_grad=True)
target = torch.empty(3, dtype=torch.long).random_(5)
output = loss(input, target)
output.backward()

### ignore_index

有时，我们希望忽略我们预测出来的标签。比如，我们在使用 rnn 的时候会进行 pad，我们不希望在计算 loss 的时候将 pad_token 也计算进去，因此我们可以使用 ignore_index 来指定那个 index 不希望被计算。

In [16]:
import torch

logits = torch.tensor([[0.1, 0.2, 0.3, 0.4]])
target = torch.tensor([0,])
xentropy = torch.nn.CrossEntropyLoss()
xentropy(logits, target)

tensor(1.5425)

如果使用 ignore_index 将 0 忽略掉，那么结果是 0

In [15]:
import torch

logits = torch.tensor([[0.1, 0.2, 0.3, 0.4]])
target = torch.tensor([0,])
xentropy = torch.nn.CrossEntropyLoss(ignore_index=0)
xentropy(logits, target)

tensor(0.)

## torch.nn.NLLLoss()


该函数的全程是**negative log likelihood loss**，函数表达式为

$$
f(x, class) = - x[class]
$$

例如假设 $x=[0.1,0.2,0.3]$ , $class=2$ ,那么 $f(x,class)=-0.3$

In [14]:
import torch

x = torch.tensor([[0.1, 0.2, 0.3]])
y = torch.tensor([2,])
loss = torch.nn.NLLLoss()
print(loss(x, y))

tensor(-0.3000)


### 和 nn.LogSoftmax() 连用

这个函数和 `nn.LogSoftmax()` 结合起来实现 `nn.CrossEntropyLoss()` 的功能

In [21]:
m = nn.LogSoftmax(dim=1)
loss = nn.NLLLoss()
# input is of size N x C = 3 x 5
input = torch.randn(3, 5, requires_grad=True)
# each element in target has to have 0 <= value < C
target = torch.tensor([1, 0, 4])
output = loss(m(input), target)
output.backward()

使用 `nn.CrossEntropyLoss()` 实现相同的功能

In [20]:
xentropy = nn.CrossEntropyLoss()
output2 = xentropy(input, target)
print(output == output2)

tensor(True)



# References
1. [torch.nn — PyTorch master documentation](https://pytorch.org/docs/stable/nn.html#crossentropyloss)
2. [Pytorch里的CrossEntropyLoss详解 - marsggbo - 博客园](https://www.cnblogs.com/marsggbo/p/10401215.html)