<a href="https://colab.research.google.com/github/kmongsil1105/colab_ipynb/blob/main/AI_PyTorch(%EC%8B%9C%EA%B7%B8%EB%AA%A8%EC%9D%B4%EB%93%9C%ED%95%A8%EC%88%98%EC%9D%B4%EC%9A%A9_%EB%A1%9C%EC%A7%80%EC%8A%A4%ED%8B%B1%ED%9A%8C%EA%B7%80%EA%B5%AC%ED%98%84).ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

In [None]:
torch.manual_seed(1)

<torch._C.Generator at 0x7f36451b2b50>

In [None]:
x_data = [[1, 2], [2, 3], [3, 1], [4, 3], [5, 3], [6, 2]]
y_data = [[0], [0], [0], [1], [1], [1]]
x_train = torch.FloatTensor(x_data)
y_train = torch.FloatTensor(y_data)

In [None]:
print(x_train.shape)
print(y_train.shape)

torch.Size([6, 2])
torch.Size([6, 1])


 * 현재 x_train은 6 × 2의 크기(shape)를 가지는 행렬이며, y_train은 6 × 1의 크기를 가지는 벡터입니다. 
 
 x_train을 X라고 하고, 이와 곱해지는 가중치 벡터를 W라고 하였을 때, 
 
 X * W가 성립되기 위해서는  W벡터의 크기는 2 × 1이어야 합니다. 
 
 이제 W와 b를 선언합니다.

In [None]:
W = torch.zeros((2, 1), requires_grad=True) # 크기는 2 x 1
b = torch.zeros(1, requires_grad=True)

 * 가설식을 세워보겠습니다. 
 
   

In [None]:
# 파이토치에서는 를 구현하기 위해서 torch.exp(x)를 사용합니다.
#  이에 따라 행렬 연산을 사용한 가설식은 다음과 같습니다.
###################################################
# hypothesis = 1 / (1 + torch.exp(-(x_train.matmul(W) + b)))
###################################################     아래쪽 가설식과 위쪽 가설식 중에서 하나를 사용하면 됨!!!
# 가설식을 좀 더 간단하게도 구현할 수 있습니다. 
# 파이토치에서는 "시그모이드 함수"를 이미 구현하여 제공하고 있기 때문. 
# 다음은 torch.sigmoid를 사용하여 좀 더 간단히 구현한 가설식입니다.
hypothesis = torch.sigmoid(x_train.matmul(W) + b)

 * 앞서 W와 b는 torch.zeros를 통해 전부 0으로 초기화 된 상태입니다. 이 상태에서 예측값을 출력해봅시다.

In [None]:
print(hypothesis) # 예측값인 H(x) 출력

tensor([[0.5000],
        [0.5000],
        [0.5000],
        [0.5000],
        [0.5000],
        [0.5000]], grad_fn=<MulBackward0>)


 * 실제값 y_train과 크기가 동일한 6 × 1의 크기를 가지는 "예측값 벡터"가 나오는데 모든 값이 0.5입니다.

 *  torch.sigmoid(시그모이드 함수) 사용시 결과값
 
 tensor([[0.5000],
        [0.5000],
        [0.5000],
        [0.5000],
        [0.5000],
        [0.5000]], grad_fn=<SigmoidBackward>)

-----------------------------------------------
 * 비용 함수값. 즉, 현재 예측값과 실제값 사이의 cost를 구해보겠습니다.

 * 우선, 현재 예측값과 실제값을 출력해보겠습니다.

In [None]:
print(hypothesis)
print(y_train)

tensor([[0.5000],
        [0.5000],
        [0.5000],
        [0.5000],
        [0.5000],
        [0.5000]], grad_fn=<SigmoidBackward>)
tensor([[0.],
        [0.],
        [0.],
        [1.],
        [1.],
        [1.]])


 * 현재 총 6개의 원소가 존재하지만 하나의 샘플. 
 
   즉, 하나의 원소에 대해서만 오차를 구하는 식을 작성해보겠습니다.

In [None]:
-(y_train[0] * torch.log(hypothesis[0]) + 
  (1 - y_train[0]) * torch.log(1 - hypothesis[0]))


tensor([0.6931], grad_fn=<NegBackward>)

 * 이제 모든 원소에 대해서 오차를 구해보겠습니다.

In [None]:
losses = -(y_train * torch.log(hypothesis) + 
           (1 - y_train) * torch.log(1 - hypothesis))
print(losses)

tensor([[0.6931],
        [0.6931],
        [0.6931],
        [0.6931],
        [0.6931],
        [0.6931]], grad_fn=<NegBackward>)


 * 그리고 이 전체 오차에 대한 평균을 구합니다.

In [None]:
cost = losses.mean()
print(cost)

tensor(0.6931, grad_fn=<MeanBackward0>)


----------------------------

 * 지금까지 비용 함수의 값을 직접 구현하였는데, 
 
   사실 파이토치에서는 로지스틱 회귀의 비용 함수를 이미 구현해서 제공하고 있습니다.

   사용 방법은 torch.nn.functional as F와 같이 임포트 한 후에 F.binary_cross_entropy(예측값, 실제값)과 같이 사용하면 됩니다.

In [None]:
F.binary_cross_entropy(hypothesis, y_train)

tensor(0.6931, grad_fn=<BinaryCrossEntropyBackward>)

In [None]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
torch.manual_seed(1)

x_data = [[1, 2], [2, 3], [3, 1], [4, 3], [5, 3], [6, 2]]
y_data = [[0], [0], [0], [1], [1], [1]]
x_train = torch.FloatTensor(x_data)
y_train = torch.FloatTensor(y_data)

# 모델 초기화
W = torch.zeros((2, 1), requires_grad=True)
b = torch.zeros(1, requires_grad=True)
# optimizer 설정
optimizer = optim.SGD([W, b], lr=1)

nb_epochs = 1000
for epoch in range(nb_epochs + 1):

    # Cost 계산
    hypothesis = torch.sigmoid(x_train.matmul(W) + b)
    #cost = -(y_train * torch.log(hypothesis) + 
    #         (1 - y_train) * torch.log(1 - hypothesis)).mean()
    #############################   위쪽과 아래쪽 중 한가지의 비용함수 계산식을 사용 가능!!
    cost = F.binary_cross_entropy(hypothesis, y_train)
    # cost로 H(x) 개선
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()

    # 100번마다 로그 출력
    if epoch % 100 == 0:
        print('Epoch {:4d}/{} Cost: {:.6f}'.format(
            epoch, nb_epochs, cost.item()
        ))

Epoch    0/1000 Cost: 0.693147
Epoch  100/1000 Cost: 0.134722
Epoch  200/1000 Cost: 0.080643
Epoch  300/1000 Cost: 0.057900
Epoch  400/1000 Cost: 0.045300
Epoch  500/1000 Cost: 0.037261
Epoch  600/1000 Cost: 0.031672
Epoch  700/1000 Cost: 0.027556
Epoch  800/1000 Cost: 0.024394
Epoch  900/1000 Cost: 0.021888
Epoch 1000/1000 Cost: 0.019852


 * 학습이 끝났습니다. 이제 훈련했던 훈련 데이터를 그대로 입력으로 사용했을 때, 제대로 예측하는지 확인해보겠습니다.

  현재 W와 b는 훈련 후의 값을 가지고 있습니다. 
  
  현재 W와 b를 가지고 예측값을 출력해보겠습니다.

In [None]:
hypothesis = torch.sigmoid(x_train.matmul(W) + b)
print(hypothesis)

tensor([[2.7648e-04],
        [3.1608e-02],
        [3.8977e-02],
        [9.5622e-01],
        [9.9823e-01],
        [9.9969e-01]], grad_fn=<SigmoidBackward>)


 * 현재 위 값들은 0과 1 사이의 값을 가지고 있습니다. 
 
   이제 0.5를 넘으면 True, 넘지 않으면 False로 값을 정하여 출력해보겠습니다.

In [None]:
prediction = hypothesis >= torch.FloatTensor([0.5])
print(prediction)

tensor([[False],
        [False],
        [False],
        [ True],
        [ True],
        [ True]])


 * 실제값은 [[0], [0], [0], [1], [1], [1]]이므로, 이는 결과적으로 False, False, False, True, True, True와 동일합니다. 
 
   즉, 기존의 실제값과 동일하게 예측한 것을 볼 수 있습니다. 훈련이 된 후의 W와 b의 값을 출력해보겠습니다.

In [None]:
print(W)
print(b)

tensor([[3.2530],
        [1.5179]], requires_grad=True)
tensor([-14.4819], requires_grad=True)
