In [1]:
import pandas as pd
import numpy as np

In [2]:
    # 가중치를 기록하는 변수와 학습률 파라미터 추가

    class SingleLayer:
        def __init__(self, learning_rate=0.1, l1=0, l2=0):
            self.w = None
            self.b = None
            self.losses = []
            self.val_losses = []
            self.w_history = []
            self.lr = learning_rate
            self.l1 = l1
            self.l2 = l2

        def forpass(self, x):
            z = np.sum(x * self.w) + self.b # 직선 방정식을 계산
            return z 

        def backprop(self, x, err):
            w_grad = x * err # 가중치에 대한 그래디언트 계산
            b_grad = 1 * err  # 절편에 대한 그래디언트 계산
            return w_grad, b_grad

        def activation(self, z):
            z = np.clip(z, -100, None) # 안전한 np.exp() 계산을 위해 
            a = 1 / (1 + np.exp(-z)) # 시그모이드 계산 

            return a 
        def fit(self, x, y, epochs=100):
            self.w = np.ones(x.shape[1])
            self.b = 0
            self.w_history.append(self.w.copy()) # 가중치 기록
            np.random.seed(42)

            for i in range(epochs):
                loss = 0
                # 인덱스를 섞는다 (확률적 경사 하강법): 1개의 샘플을 중복되지 않도록 무작위로 선택
                indexes = np.random.permutation(np.arange(len(x)))

                for i in indexes:
                    z = self.forpass(x[i])
                    a = self.activation(z)

                    err = -(y[i] - a)

                    w_grad, b_grad = self.backprop(x[i], err) # 역방향 계산

                    # 그래디언트에서 패널티 항의 미분 값을 더한다. 
                    w_grad += self.l1 * np.sign(self.w) + self.l2 * self.w
                    self.w -= self.lr * w_grad
                    self.b -= self.lr * b_grad

                    # 가중치 기록
                    self.w_history.append(self.w.copy())

                    # 안전한 로그 계산을 위해 클리핑한 후 손실을 누적 
                    a = np.clip(a, 1e-10, 1-1e-10)

                    loss += -(y[i]*np.log(a) + (1-y[i])*np.log(1-a))

                # 에포크마다 평균 손실을 저장 
                self.losses.append(loss/len(y))

                # 검증 세트에 대한 손실 계산

        def predict(self, x):
            z = [self.forpass(x_i) for x_i in x]
            return np.array(z) > 0 # 스텝 함수 적용

        def score(self, x, y):
            return np.mean(self.predict(x)==y)


        def reg_loss(self):
            return self.l1 * np.sum(np.abs(self.w)) + self.l2 / 2 * np.sum(self.w**2)

        def update_val_loss(self, x_val, y_val):
            # 검증 세트 손실 기록 로지스틱 손실
            if x_val is None:
                return 
            val_loss = 0
            for i in range(len(x_val)):
                z = self.forpass(x_val[i])
                a = self.activation(z)
                a = np.clip(a, 1e-10, 1-1e-10)
                val_loss += -(y_val[i]*np.log(a)+(1-y_val[i])*np.log(1-a))
            self.val_losses.append(val_loss/len(y_val) + self.reg_loss())


In [None]:
layer3 = SingleLayer()
layer3.fit(x_train_scaled, y_train, x_val=X_va)