## 1. 초기 설정

In [2]:
import torch
from torch.autograd import Variable
import numpy as np

torch.manual_seed(777)

<torch._C.Generator at 0x107b7f8f0>

## 2. training set과 Variable 만들기

In [9]:
x_data = np.array([[1, 2],
                   [2, 3],
                   [3, 1],
                   [4, 3],
                   [5, 3],
                   [6, 2]], dtype=np.float32)
y_data = np.array([[0],
                   [0],
                   [0],
                   [1],
                   [1],
                   [1]], dtype=np.float32)

X = Variable(torch.from_numpy(x_data))
Y = Variable(torch.from_numpy(y_data))

## 3. model 만들기

In [10]:
hypothesis = torch.nn.Linear(2, 1, bias=True)
sigmoid = torch.nn.Sigmoid()

# torch.nn.Sequential은 위에 선언한 두 node를 합쳐준다. parameter 순서가 중요하다.
model = torch.nn.Sequential(hypothesis, sigmoid)

## 4. cost function과 optimizer 만들기

In [17]:
# logistic regression을 훈련시키기 위해서는 gradient descent algorithm을 사용한다.
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

## 5. model 훈련시키기

In [19]:
for step in range(10001):
    # optimizer를 초기화한다.
    optimizer.zero_grad()
    
    Y_hat = model(X)
    # Variable은 계산해도 Variable이다. 그래서 cost도 Variable.
    cost = -(Y * torch.log(Y_hat) +
             (1 - Y) * torch.log(1 - Y_hat)).mean()
    cost.backward()
    optimizer.step()
    
    if step % 200 == 0:
        print(step, cost.data.numpy())

0 [ 0.15161428]
200 [ 0.14933652]
400 [ 0.14712647]
600 [ 0.14498121]
800 [ 0.14289799]
1000 [ 0.14087436]
1200 [ 0.13890769]
1400 [ 0.13699572]
1600 [ 0.13513622]
1800 [ 0.13332713]
2000 [ 0.13156645]
2200 [ 0.12985234]
2400 [ 0.12818281]
2600 [ 0.12655646]
2800 [ 0.12497142]
3000 [ 0.12342627]
3200 [ 0.12191948]
3400 [ 0.12044972]
3600 [ 0.11901561]
3800 [ 0.11761583]
4000 [ 0.11624929]
4200 [ 0.11491473]
4400 [ 0.11361104]
4600 [ 0.1123373]
4800 [ 0.11109231]
5000 [ 0.1098752]
5200 [ 0.10868512]
5400 [ 0.10752102]
5600 [ 0.10638225]
5800 [ 0.10526781]
6000 [ 0.10417704]
6200 [ 0.10310917]
6400 [ 0.10206345]
6600 [ 0.10103922]
6800 [ 0.10003587]
7000 [ 0.09905271]
7200 [ 0.09808911]
7400 [ 0.09714466]
7600 [ 0.09621859]
7800 [ 0.09531043]
8000 [ 0.09441967]
8200 [ 0.09354585]
8400 [ 0.09268847]
8600 [ 0.09184704]
8800 [ 0.09102113]
9000 [ 0.0902104]
9200 [ 0.0894143]
9400 [ 0.08863241]
9600 [ 0.08786456]
9800 [ 0.08711011]
10000 [ 0.08636896]


## 6. model 확인하기

In [16]:
predicted = (model(X).data > 0.5).float()
accuracy = (predicted == Y.data).float().mean()
print("\nCorrect (Y):", predicted.numpy(), "\nAccuracy:", accuracy)


Correct (Y): [[ 0.]
 [ 0.]
 [ 0.]
 [ 1.]
 [ 1.]
 [ 1.]] 
Accuracy: 1.0


In [20]:
# Variable의 required_grad는 기본값이 False인데,
# 이 의미는 이 Variable은 Backpropagation시에 변화량을 안 받겠다는 것이다