# 학습 과정

데이터를 정수형으로 반환했으면 이진분류를 통해 학습하여 보자.

---
## (1)class Model

모델 클래스에서는 필요한 가중치와 계산에 필요한 함수들로 구성된다.

이진 분류의 핵심 계산함수(activate_function)는 sigmoid 함수이다.

In [None]:
import numpy as np
class Model:
    def __init__(self):
        self.weight = np.zeros((3, 1))
        pass

    def predict(self, x):
        feature_matrix = x
        z = feature_matrix @ self.weight
        pred = self.activate(z)
        return pred
    
    def activate(self, x):
        y = 1/ (1+np.exp(-x))
        return y
    
    def update(self, weight):
        self.weight = weight


## (2)class MyOptim

myoptim 클래스에서는 학습률과 정규화 상수를 추가한다.

학습률을 가중치의 변화량에 영향을 준다.

또한 손실값과 잔차를 계산하여 최대 손실의 방향으로 (gradient)로 이동하여 학습한다.

이때 학습이 잘 되는지 확인하기 위해 손실값을 반환하자.

In [None]:
class MyOptim:
    def __init__(self, model):
        self.model  = model
        self.eps    = 1e-8
        self.lr = 0.1
    def compute_loss(self, label, prediction):
        # ===========================
        eps = self.eps
        loss = (1 / (len(label))) * ((((-1) * label.T) @ np.log(prediction + eps)) - ((np.ones_like(label) - label).T @ np.log(np.ones_like(label) - prediction + eps)))
        # ===========================
        return loss
     
    def compute_residual(self, label, prediction):
        # ===========================
        res = label - prediction
        # ===========================
        return res
   
    def compute_gradient(self, x, label, pred):
        # ===========================
        A = x
        grad = (1 / (len(label))) * (A.T @ (pred - label))
        # ===========================
        return grad
        
    def step(self, grad):
        # ===========================
        weight = self.model.weight
        next_weight = weight - (self.lr * grad)
        self.model.update(next_weight)
        pass 
        # ===========================

## (3) test accuracy

이진 분류는 기준점 (여기에선 0.5)을 기준으로 그 이상과 이하로 분류하는 모델이다.

시그모이드 (activate function)을 통과한 결과값을 토대로 해당 샘플에 대해 값을 부여한다.

따라서 학습을 통해 업데이트한 가중치를 이용하여, 테스트 데이터를 예측 모델에 대입한다.

후에 0.5 이상인 데이터의 합 갯수를 구하여 전체 크기로 나누어준다.

In [None]:
x_test.shape, y_test.shape

test_pred = model.predict(x_test)
test_pred_class = (test_pred >= 0.5).astype(int)

correct = (test_pred_class.to_numpy().flatten() == y_test.flatten()).sum()
total = len(y_test)

accuracy = correct / total
print(f"Test Accuracy: {accuracy:.4f}")