## 1. 초기 설정

In [2]:
import torch
from torch.autograd import Variable
import numpy as np

torch.manual_seed(777)

<torch._C.Generator at 0x1040739f0>

## 2. training set과 Variable 만들기

In [3]:
x_data = np.array([[1, 2],
                   [2, 3],
                   [3, 1],
                   [4, 3],
                   [5, 3],
                   [6, 2]], dtype=np.float32)
y_data = np.array([[0],
                   [0],
                   [0],
                   [1],
                   [1],
                   [1]], dtype=np.float32)

X = Variable(torch.from_numpy(x_data))
Y = Variable(torch.from_numpy(y_data))

## 3. model 만들기

In [4]:
# 코드를 짜면서 느끼는 거지만 이 단계에서 사용하는 함수들은 tensorflow의 node 같은 느낌이다. 
# 5단계에서 Variable을 넣어줘야만 움직이고 그냥 아래처럼 대입만해서는 동작하지 않기 때문이다.
# 따라서 밑에서 cost function은 선언하지 않는데,
# logistic regression의 cost는 특정 선언해야 할 함수 없이 실제 훈련 시에 직접 계산하기 때문이다.

hypothesis = torch.nn.Linear(2, 1, bias=True)
sigmoid = torch.nn.Sigmoid()

# torch.nn.Sequential은 위에 선언한 두 node를 합쳐준다. parameter 순서가 중요하다.
model = torch.nn.Sequential(hypothesis, sigmoid)

## 4. cost function과 optimizer 만들기

In [5]:
# logistic regression을 훈련시키기 위해서는 gradient descent algorithm을 사용한다.
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

## 5. model 훈련시키기

In [6]:
for step in range(10001):
    # optimizer를 초기화한다.
    optimizer.zero_grad()
    
    Y_hat = model(X)
    # Variable은 계산해도 Variable이다. 그래서 cost도 Variable.
    cost = -(Y * torch.log(Y_hat) +
             (1 - Y) * torch.log(1 - Y_hat)).mean()
    cost.backward()
    optimizer.step()
    
    if step % 200 == 0:
        print(step, cost.data.numpy())

0 [ 1.71229613]
200 [ 0.55874169]
400 [ 0.48905891]
600 [ 0.45216355]
800 [ 0.42799503]
1000 [ 0.40953714]
1200 [ 0.39402437]
1400 [ 0.38024762]
1600 [ 0.36763126]
1800 [ 0.35588053]
2000 [ 0.34483218]
2200 [ 0.33438912]
2400 [ 0.32448757]
2600 [ 0.31508172]
2800 [ 0.30613571]
3000 [ 0.29761967]
3200 [ 0.28950715]
3400 [ 0.28177419]
3600 [ 0.27439904]
3800 [ 0.2673611]
4000 [ 0.2606411]
4200 [ 0.25422108]
4400 [ 0.24808392]
4600 [ 0.24221388]
4800 [ 0.23659591]
5000 [ 0.23121582]
5200 [ 0.2260606]
5400 [ 0.22111771]
5600 [ 0.21637559]
5800 [ 0.21182325]
6000 [ 0.2074506]
6200 [ 0.20324801]
6400 [ 0.1992064]
6600 [ 0.1953174]
6800 [ 0.19157311]
7000 [ 0.18796612]
7200 [ 0.18448943]
7400 [ 0.18113652]
7600 [ 0.17790125]
7800 [ 0.17477784]
8000 [ 0.17176092]
8200 [ 0.16884524]
8400 [ 0.16602618]
8600 [ 0.16329901]
8800 [ 0.16065963]
9000 [ 0.15810403]
9200 [ 0.1556284]
9400 [ 0.15322906]
9600 [ 0.15090273]
9800 [ 0.14864622]
10000 [ 0.14645647]


## 6. model 확인하기

In [7]:
predicted = (model(X).data > 0.5).float()
accuracy = (predicted == Y.data).float().mean()
print("\nCorrect (Y):", predicted.numpy(), "\nAccuracy:", accuracy)


Correct (Y): [[ 0.]
 [ 0.]
 [ 0.]
 [ 1.]
 [ 1.]
 [ 1.]] 
Accuracy: 1.0


In [8]:
# Variable의 required_grad는 기본값이 False인데,
# 이 의미는 이 Variable은 Backpropagation시에 변화량을 안 받겠다는 것이다