# Logistic Regression / Classification

![](./image/2022-01-13-10-57-10.png)

Linear Regression은 위에 있는 항목만 준비되면 실행 가능하다.

하지만 분류 문제의 경우 조금 다르다.

## Binary Classification

참 거짓 중 둘 중 하나만 고르는 문제

이를 위해 0, 1 encoding을 거친다.

![](./image/2022-01-13-10-59-57.png)



## Classification에서 만나는 문제

1. outlier를 만났을 때, 그 출력이 0과 1 뿐이라서 linear regression 표현식이 크게 변한다.

![](./image/2022-01-13-11-32-46.png)

2. $H(x) = Wx + b$가 0과 1사이가 안나오는 문제가 있다.

![](./image/2022-01-13-11-33-49.png)


이 문제를 해결하기 위해 sigmoid function (혹은 logistic function)을 도입한다. 강제로 output을 0과 1 사이에 두는 것이다.

아래 그림은 sigmoid function의 graph이다.

![](./image/2022-01-13-11-42-54.png)

즉 수식을 다음과 같이 고려한다.

$Z = WX + b, \space H(X) = g(Z), \space g = sigmoid$

이를 이용해서 binary classification에서의 새로운 hypothesis를 정의한다.

![](./image/2022-01-13-11-40-27.png)


## Cost Function

위의 새로운 hypothesis와 기존의 cost function을 이용해서 그래프를 그리면 다음과 같이 local minimum이 많이 나온다. 즉 global minimum으로 가기가 어려워진다.

![](./image/2022-01-13-11-47-42.png)

이를 해결하기 위해 새로운 cost function을 설정해야한다.

----

![](./image/2022-01-13-12-10-30.png)

이렇게 새로운 Cost Function을 정의한다. y = 0, y = 1인 경우에 따라서 함수가 달라진다.

위 식은 Cost의 평균을 Cost Function이라고 보는 의미이고, 그 아랜 그 Cost의 정의


![](./image/2022-01-13-12-11-05.png)

기본적으로 $\log$를 사용하는 이유는 자연상수 $e$의 효과를 절충하여 선형성을 주기 위해서이다.

그리고 위 사진에서 Cost Function의 정의를 보면 $H(x)$가 $y$와 일치할 때 cost가 0이 되는 것을 볼 수 있다.

----

이제 if 절을 없애자. 즉, y = 1이냐 0이냐에 따라서 각 term을 없애는 방식으로 정의하면 될 것이다. 

![](./image/2022-01-13-12-16-43.png)


----

# 이제는 다른 자료 정리...

In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
import torch.functional as F

torch.manual_seed(1)

x_data = [[1, 2], [2, 3], [3, 1], [4, 3], [5, 3], [6, 2]]
y_data = [[0], [0], [0], [1], [1], [1]]

x_train = torch.FloatTensor(x_data)
y_train = torch.FloatTensor(y_data)

W = torch.zeros((2,1), requires_grad=True)
b = torch.zeros(1, requires_grad=True)


optimizer = optim.SGD([W,b], lr = 0.001)
epochs = 10000
for epoch in range(epochs + 1):
    hypothesis = 1/(1 + torch.exp(-(x_train.matmul(W) + b)))
    # hypothesis = torch.sigmoid(x_train.matmul(W) + b) # 이렇게 해도 된다.

    loss = -(y_train * torch.log(hypothesis) + (1 - y_train) * torch.log(1 - hypothesis))
    cost = loss.mean() # 하나의 스칼라로 저장
    # cost = F.binary_cross_entropy(hypothesis, y_train) # 이렇게 해도 된다.
    
    optimizer.zero_grad()
    cost.backward()
    optimizer.step()
    
    if epoch % 100 == 0:
        print('Epoch {:4d}/{} Cost: {:.6f}'.format(
            epoch, epochs, cost.item()
            ))

Epoch    0/10000 Cost: 0.693147
Epoch  100/10000 Cost: 0.653620
Epoch  200/10000 Cost: 0.634803
Epoch  300/10000 Cost: 0.623416
Epoch  400/10000 Cost: 0.614912
Epoch  500/10000 Cost: 0.607670
Epoch  600/10000 Cost: 0.601084
Epoch  700/10000 Cost: 0.594916
Epoch  800/10000 Cost: 0.589064
Epoch  900/10000 Cost: 0.583481
Epoch 1000/10000 Cost: 0.578142
Epoch 1100/10000 Cost: 0.573028
Epoch 1200/10000 Cost: 0.568125
Epoch 1300/10000 Cost: 0.563422
Epoch 1400/10000 Cost: 0.558909
Epoch 1500/10000 Cost: 0.554574
Epoch 1600/10000 Cost: 0.550408
Epoch 1700/10000 Cost: 0.546404
Epoch 1800/10000 Cost: 0.542551
Epoch 1900/10000 Cost: 0.538843
Epoch 2000/10000 Cost: 0.535272
Epoch 2100/10000 Cost: 0.531830
Epoch 2200/10000 Cost: 0.528511
Epoch 2300/10000 Cost: 0.525310
Epoch 2400/10000 Cost: 0.522219
Epoch 2500/10000 Cost: 0.519233
Epoch 2600/10000 Cost: 0.516347
Epoch 2700/10000 Cost: 0.513556
Epoch 2800/10000 Cost: 0.510855
Epoch 2900/10000 Cost: 0.508240
Epoch 3000/10000 Cost: 0.505706
Epoch 31