## Softmax regression 구현

In [1]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

In [2]:
torch.manual_seed(1)

<torch._C.Generator at 0x14fa39f6730>

In [3]:
x_train = [[1,2,1,1],
          [2,1,3,2],
          [3,1,3,4],
          [4,1,5,5],
          [1,7,5,5],
          [1,2,5,6],
          [1,6,6,6],
          [1,7,7,7]]
y_train = [2, 2, 2, 1, 1, 1, 0, 0]

x_train = torch.FloatTensor(x_train)
y_train = torch.LongTensor(y_train)

x_train의 각 샘플은 4개의 특성을 가지고 있고, 총 8개의 샘플이 존재한다.   
y_train은 각 샘플에 대한 레이블로, 여기서는 0,1,2 총 3개의 클래스가 존재한다.


x_train의 size는 8x4, y_train의 size는 8x1이다. 하지만 최종 사용할 레이블은 y_train에서 one-hot encoding을 한 결과여야 한다.   
즉 클래스의 갯수는 3개이므로 y_train에 one-hot encoding한 결과는 8x3의 갯수를 가져야 한다.   
(2 -> 0 0 1)

In [4]:
y_one_hot = torch.zeros(8,3)
y_one_hot.scatter_(1, y_train.unsqueeze(1), 1)
print(y_one_hot.shape)

torch.Size([8, 3])


이제 W의 size는 각각 4x3이 되어야 한다.

In [5]:
W = torch.zeros((4,3), requires_grad=True)
b = torch.zeros(1, requires_grad=True)

In [6]:
optimizer = optim.SGD([W,b], lr=0.1)

In [7]:
EPOCH = 1000

for epoch in range(EPOCH + 1):
    
    hypothesis = x_train.matmul(W) + b
    
    cost = F.cross_entropy(hypothesis, y_train)
    
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()
    
    if epoch % 100 == 0:
        print('Epoch {:4d}/{} Cost : {:.6f}'.format(epoch, EPOCH, cost.item()))

Epoch    0/1000 Cost : 1.098612
Epoch  100/1000 Cost : 0.761050
Epoch  200/1000 Cost : 0.689991
Epoch  300/1000 Cost : 0.643229
Epoch  400/1000 Cost : 0.604117
Epoch  500/1000 Cost : 0.568255
Epoch  600/1000 Cost : 0.533922
Epoch  700/1000 Cost : 0.500291
Epoch  800/1000 Cost : 0.466908
Epoch  900/1000 Cost : 0.433507
Epoch 1000/1000 Cost : 0.399962


### 2. nn.Module로 구현

In [8]:
model = nn.Linear(4,3)

In [9]:
optimizer = optim.SGD(model.parameters(), lr=0.1)

EPOCH = 1000
for epoch in range(EPOCH + 1):
    
    prediction = model(x_train)
    
    cost = F.cross_entropy(prediction, y_train)
    
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()
    
    if epoch % 100 == 0:
        print('Epoch {:4d}/{}, Cost : {:.6f}'.format(epoch, EPOCH, cost.item()))

Epoch    0/1000, Cost : 1.616785
Epoch  100/1000, Cost : 0.658891
Epoch  200/1000, Cost : 0.573444
Epoch  300/1000, Cost : 0.518151
Epoch  400/1000, Cost : 0.473266
Epoch  500/1000, Cost : 0.433516
Epoch  600/1000, Cost : 0.396563
Epoch  700/1000, Cost : 0.360914
Epoch  800/1000, Cost : 0.325392
Epoch  900/1000, Cost : 0.289179
Epoch 1000/1000, Cost : 0.254148


### 3. Class로 구현

In [10]:
class SoftmaxClassifierModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = nn.Linear(4,3)
        
    def forward(self, x):
        return self.linear(x)

In [11]:
model = SoftmaxClassifierModel()

In [12]:
optimizer = optim.SGD(model.parameters(), lr=0.1)

EPOCH = 1000

for epoch in range(EPOCH + 1):
    
    prediction = model(x_train)
    
    cost = F.cross_entropy(prediction, y_train)
    
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()
    
    if epoch % 100 == 0:
        print('Epoch {:4d}/{} Cost : {:.6f}'.format(epoch, EPOCH, cost.item()))

Epoch    0/1000 Cost : 2.637636
Epoch  100/1000 Cost : 0.647903
Epoch  200/1000 Cost : 0.564643
Epoch  300/1000 Cost : 0.511043
Epoch  400/1000 Cost : 0.467249
Epoch  500/1000 Cost : 0.428280
Epoch  600/1000 Cost : 0.391924
Epoch  700/1000 Cost : 0.356742
Epoch  800/1000 Cost : 0.321577
Epoch  900/1000 Cost : 0.285617
Epoch 1000/1000 Cost : 0.250818
