In [1]:
# 파이토치로 로지스틱 회귀 구현하기 
import torch 
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

# seed 고정 
torch.manual_seed(1)

# x_train , y_train
x_data = [[1,2] , [2,3] ,[3,1] ,[4,3] ,[5,3] , [6,2]]
y_data = [[0],[0],[0],[1],[1],[1]]

x_train = torch.FloatTensor(x_data)
y_train = torch.FloatTensor(y_data)

# 여기서도 마찬가지로 행렬 연산을 사용하여 가설식을 세울겁니다. x_train과 y_train의 크기를 확인해봅시다.

# print(x_train)
# print(y_train)

print(x_train.shape)
print(y_train.shape)

torch.Size([6, 2])
torch.Size([6, 1])


In [2]:
# 현재 x_train은 6 × 2의 크기(shape)를 가지는 행렬이며, y_train은 6 × 1의 크기를 가지는 벡터입니다. 
# x_train을 X라고 하고, 이와 곱해지는 가중치 벡터를 W라고 하였을 때, 
# XW가 성립되기 위해서는 W 벡터의 크기는 2 × 1이어야 합니다. 이제 W와 b를 선언합니다.

w = torch.zeros((2,1) , requires_grad=True)
b = torch.zeros(1, requires_grad=True)

# 가설식을 세워보겠습니다. 파이토치에서는 ex를 구현하기 위해서 torch.exp(x)를 사용합니다.
hypothesis = 1 / (1 + torch.exp(-(x_train.matmul(w) + b)))

# 앞서 w 와 b는 torch.zeros를 통해 전부 0으로 초기화 된 상태 입니다. 이 상태에서 예측값 출력 
print(hypothesis)

tensor([[0.5000],
        [0.5000],
        [0.5000],
        [0.5000],
        [0.5000],
        [0.5000]], grad_fn=<MulBackward0>)


In [3]:
# 실제값 y_train 과 크기가 동일한 6x1의 크기를 가지는 예측값 백터가 나오는데 모든값은 0.5입니다.

# 가설식을 이용한 방법이 아닌 torch에서 제공되는 sigmoid 을 이용하여 예측값 구하기
hypothesis = torch.sigmoid(x_train.matmul(w) + b)

print(hypothesis)
print(y_train)

tensor([[0.5000],
        [0.5000],
        [0.5000],
        [0.5000],
        [0.5000],
        [0.5000]], grad_fn=<SigmoidBackward>)
tensor([[0.],
        [0.],
        [0.],
        [1.],
        [1.],
        [1.]])


In [4]:
# 현재 총 6개의 원소가 존재하지만 하나의 샘플. 즉, 하나의 원소에 대해서만 오차를 구하는 식을 작성해보겠습니다.
loss = -(y_train[0] *torch.log(hypothesis[0]) + (1 - y_train[0]) * torch.log(1 - hypothesis[0]))
print(loss)

tensor([0.6931], grad_fn=<NegBackward>)


In [5]:
# 모든 원소에 대해서 오차를 구해보자 
losses = -(y_train * torch.log(hypothesis) + (1 - y_train) * torch.log(1-hypothesis))

print(losses)

tensor([[0.6931],
        [0.6931],
        [0.6931],
        [0.6931],
        [0.6931],
        [0.6931]], grad_fn=<NegBackward>)


In [6]:
# 전체 오차 평균 구하기 
loss_avg = losses.mean()
print("전체 오차 평균 : " , loss_avg)

전체 오차 평균 :  tensor(0.6931, grad_fn=<MeanBackward0>)


In [21]:
# 모델 훈련 
x_data = [[1, 2], [2, 3], [3, 1], [4, 3], [5, 3], [6, 2]]
y_data = [[0], [0], [0], [1], [1], [1]]
x_train = torch.FloatTensor(x_data)
y_train = torch.FloatTensor(y_data)

# 모델 초기화
w = torch.zeros((2, 1), requires_grad=True)
b = torch.zeros(1, requires_grad=True)
# optimizer 설정
optimizer = optim.SGD([w, b], lr=1)

nb_epochs = 1000
for epoch in range(nb_epochs + 1):

    # loss 계산
    hypothesis = torch.sigmoid(x_train.matmul(w) + b)
    loss = -(y_train * torch.log(hypothesis) + 
             (1 - y_train) * torch.log(1 - hypothesis)).mean()

    # cost로 H(x) 개선
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    # 100번마다 로그 출력
    if epoch % 100 == 0:
        print('Epoch {:4d}/{} loss: {:.6f}'.format(
            epoch, nb_epochs, loss.item()
        ))

Epoch    0/1000 loss: 0.693147
Epoch  100/1000 loss: 0.134722
Epoch  200/1000 loss: 0.080643
Epoch  300/1000 loss: 0.057900
Epoch  400/1000 loss: 0.045300
Epoch  500/1000 loss: 0.037261
Epoch  600/1000 loss: 0.031673
Epoch  700/1000 loss: 0.027556
Epoch  800/1000 loss: 0.024394
Epoch  900/1000 loss: 0.021888
Epoch 1000/1000 loss: 0.019852


In [22]:
# 학습이 끝났습니다. 이제 훈련했던 훈련 데이터를 그대로 입력으로 사용했을 때, 제대로 예측하는지 확인해보겠습니다.
# 현재 W와 b는 훈련 후의 값을 가지고 있습니다. 현재 W와 b를 가지고 예측값을 출력해보겠습니다.
hypothesis = torch.sigmoid(x_train.matmul(w) + b)
print(hypothesis)

tensor([[2.7648e-04],
        [3.1608e-02],
        [3.8977e-02],
        [9.5622e-01],
        [9.9823e-01],
        [9.9969e-01]], grad_fn=<SigmoidBackward>)


In [23]:
# 현재 위 값들은 0과 1 사이의 값을 가지고 있습니다. 이제 0.5를 넘으면 True, 넘지 않으면 False로 값을 정하여 출력해보겠습니다.
prediction = hypothesis >= torch.FloatTensor([0.5])
print(prediction)

tensor([[False],
        [False],
        [False],
        [ True],
        [ True],
        [ True]])


In [24]:
# 실제값은 [[0], [0], [0], [1], [1], [1]]이므로, 이는 결과적으로 False, False, False, True, True, True와 동일합니다. 
# 즉, 기존의 실제값과 동일하게 예측한 것을 볼 수 있습니다. 
# 훈련이 된 후의 W와 b의 값을 출력해보겠습니다.
print(w)
print(b)


tensor([[3.2530],
        [1.5179]], requires_grad=True)
tensor([-14.4819], requires_grad=True)
