In [11]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

In [2]:
x_train = [[1, 2, 1, 1],
           [2, 1, 3, 2],
           [3, 1, 3, 4],
           [4, 1, 5, 5],
           [1, 7, 5, 5],
           [1, 2, 5, 6],
           [1, 6, 6, 6],
           [1, 7, 7, 7]]
y_train = [2, 2, 2, 1, 1, 1, 0, 0]
x_train = torch.FloatTensor(x_train)
y_train = torch.LongTensor(y_train)

소프트맥스 회귀에서 y는 정수 라벨링이 된 벡터일 것이다. 

여기서는 세 개의 클래스가 각각 0, 1, 2 정수 인덱스가 부여되었다고 가정한다.

In [4]:
print(x_train.shape)

torch.Size([8, 4])


In [5]:
print(y_train.shape)

torch.Size([8])


In [9]:
y_one_hot = torch.zeros(8,3)
y_one_hot.scatter_(1, y_train.unsqueeze(1), 1)

tensor([[0., 0., 1.],
        [0., 0., 1.],
        [0., 0., 1.],
        [0., 1., 0.],
        [0., 1., 0.],
        [0., 1., 0.],
        [1., 0., 0.],
        [1., 0., 0.]])

소프트맥스에서 target은 원-핫벡터이다. 왜냐하면 모델의 마지막 출력은 각 클래스에 속할 확률이기 때문이다. 따라서 정답은 해당 클래스일 확률이 1인 경우이므로 정답 클래스만 1이고 나머지는 0인 원-핫 벡터를 만들어줘야 한다.

unsqueeze는 크기가 1인 차원을 생성해주는 것이다.

unsqueeze함수에 인자로 들어가는 값은 차원이 생성될 위치이다. 

위의 예시에서 현재 y_train은 torch.Size([8])의 1차원 텐서이다. 이를 이차원 텐서로 만들어주는데 1의 위치, 즉 열의 위치에 차원을 추가하겠다는 뜻이다. 따라서 unsqueeze를 하면 [8,1] 크기가 될 것이다.

scatter_는 말 그대로 특정 값을 텐서에 흩뿌려준다. 첫 번째 매개변수는 dim즉, 어느 차원을 기준으로 할 것인가, 두 번째는 index로 어느 위치에 값을 지정할지, 세 번째는 src로 어떤 값을 넣을지를 의미한다.

In [13]:
class SoftmaxClassifier(nn.Module):
  def __init__(self):
    super().__init__()
    self.linear = nn.Linear(4, 3)

  def forward(self, x):
    return self.linear(x)

In [14]:
model = SoftmaxClassifier()

In [15]:
optimizer = optim.SGD(model.parameters(), lr=0.1)

nb_epochs = 1000

for epoch in range(nb_epochs + 1):

  prediction = model(x_train)

  cost = F.cross_entropy(prediction, y_train)

  optimizer.zero_grad()
  cost.backward()
  optimizer.step()

  if epoch % 100 == 0:
    print('Epoch {:4d}/{} Cost: {:.6f}'.format(
        epoch, nb_epochs, cost.item()
    ))

Epoch    0/1000 Cost: 2.022202
Epoch  100/1000 Cost: 0.672347
Epoch  200/1000 Cost: 0.579019
Epoch  300/1000 Cost: 0.521621
Epoch  400/1000 Cost: 0.475899
Epoch  500/1000 Cost: 0.435727
Epoch  600/1000 Cost: 0.398518
Epoch  700/1000 Cost: 0.362696
Epoch  800/1000 Cost: 0.327053
Epoch  900/1000 Cost: 0.290750
Epoch 1000/1000 Cost: 0.255535
