###  Logistic Regression
---
- 둘 중 하나를 결정하는 문제를 이진 분류(Binary Classification)
- Regression이지만 분류
    * => 선형 가설(y=wx+b)에 기반하여 분류하기때문에 Regression이라함
- 이진 분류(Binary Classification)
    * 0과 1로 결과가 나오는 분류
    * 기존 LinearRegression의 선형함수만으로는 해당 S곡선 불가
    * 0과 1 두 가지로 분류해주는 특별한 함수 필요 ==> 활성화함수(Activation Function)
        - $ y=Wx+b $ ===> $ y=f(Wx+b)
        - Sigmoid Function  
        
    * 비용 함수(Cost Function)
        - 최적의 와 를 찾을 수 있는 비용 함수(cost function) 정의
        - torch.nn.functional의 binary_cross_entropy(예측값, 실제값)

In [1]:
# 모듈 로딩 ------------------------------------------
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

In [2]:
# 랜덤 시드 설정 ------------------------------
torch.manual_seed(1)

<torch._C.Generator at 0x1e4ec8829f0>

In [3]:
# 훈련 데이터 ---------------------------------
x_data = [[1, 2], [2, 3], [3, 1], [4, 3], [5, 3], [6, 2]]
y_data = [[0], [0], [0], [1], [1], [1]]
x_train = torch.FloatTensor(x_data)
y_train = torch.FloatTensor(y_data)

In [4]:
# 모델 설계 ------------------------------------
# Sequential : 순서대로 진행되는
model = nn.Sequential(
   nn.Linear(2, 1), # input_dim = 2, output_dim = 1
   nn.Sigmoid()     # 출력은 시그모이드 함수 거침
)

# optimizer 설정 -------------------------------
# 경사하강법으로 업데이트 해야 하는 W와 b는 모델 인스턴스에서 가지고 있다.
# => 가지고 오는 메서드 : model.parameters()
optimizer = optim.SGD(model.parameters(), lr=1)

In [5]:
# 학습 -----------------------------------------
    
def training():
    nb_epochs = 1000
    for epoch in range(nb_epochs + 1):

        # H(x) 계산 => 예측값 계산
        hypothesis = model(x_train)

        # cost 계산 => 이진 분류 손실함수  binary_cross_entropy()
        # y = 0일 때 오차, y = 1일때 오차를 계산해준다.
        cost = F.binary_cross_entropy(hypothesis, y_train)

        # cost로 W,b값 업데이트
        optimizer.zero_grad()
        cost.backward()
        optimizer.step()

        # 20번마다 로그 출력
        if epoch % 20 == 0:
            prediction = hypothesis >= torch.FloatTensor([0.5])     # 예측값이 0.5를 넘으면 True로 간주
            correct_prediction = prediction.float() == y_train      # 실제값과 일치하는 경우만 True로 간주
            accuracy = correct_prediction.sum().item() / len(correct_prediction) # 정확도를 계산
 
            print(f'Epoch {epoch:4d}/{nb_epochs} Cost: {cost.item():.6f} Accuracy {accuracy * 100:2.2f}%')
    

In [6]:
training()

Epoch    0/1000 Cost: 0.539713 Accuracy 83.33%
Epoch   20/1000 Cost: 0.441875 Accuracy 66.67%
Epoch   40/1000 Cost: 0.316358 Accuracy 83.33%
Epoch   60/1000 Cost: 0.220498 Accuracy 100.00%
Epoch   80/1000 Cost: 0.157299 Accuracy 100.00%
Epoch  100/1000 Cost: 0.134272 Accuracy 100.00%
Epoch  120/1000 Cost: 0.118297 Accuracy 100.00%
Epoch  140/1000 Cost: 0.105779 Accuracy 100.00%
Epoch  160/1000 Cost: 0.095704 Accuracy 100.00%
Epoch  180/1000 Cost: 0.087420 Accuracy 100.00%
Epoch  200/1000 Cost: 0.080486 Accuracy 100.00%
Epoch  220/1000 Cost: 0.074595 Accuracy 100.00%
Epoch  240/1000 Cost: 0.069526 Accuracy 100.00%
Epoch  260/1000 Cost: 0.065118 Accuracy 100.00%
Epoch  280/1000 Cost: 0.061247 Accuracy 100.00%
Epoch  300/1000 Cost: 0.057820 Accuracy 100.00%
Epoch  320/1000 Cost: 0.054764 Accuracy 100.00%
Epoch  340/1000 Cost: 0.052022 Accuracy 100.00%
Epoch  360/1000 Cost: 0.049546 Accuracy 100.00%
Epoch  380/1000 Cost: 0.047299 Accuracy 100.00%
Epoch  400/1000 Cost: 0.045251 Accuracy 100

In [7]:
# 학습 후 W, b 확인
print(list(model.parameters()))

[Parameter containing:
tensor([[3.2534, 1.5181]], requires_grad=True), Parameter containing:
tensor([-14.4839], requires_grad=True)]
