# 신경망 알고리즘을 벡터화해 한 번에 전체 샘플 사용하기


## SingleLayer 클래스에 배치 경사 하강법 적용하기

In [2]:
# 1. 넘파이 맷플롯립 임포트
import numpy as np
import matplotlib.pyplot as plt


In [9]:
# 2. 위스콘신 유방암 데이터 세트를 훈련, 검증 , 테스트 세트로 나누고 데이터 살펴보기
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split

cancer = load_breast_cancer()
x = cancer.data
y = cancer.target
x_train_all, x_test, y_train_all, y_test = train_test_split(x, y, stratify=y, test_size=0.2, random_state=42)

x_train, x_val, y_train, y_val = train_test_split(x_train_all, y_train_all, stratify=y_train_all, test_size = 0.2, random_state=42)




In [10]:
# 3. cancer 데이터 세트 특성 개수 30개  
# shape으로 크기 확인

print(x_train.shape, x_val.shape)

(364, 30) (91, 30)


In [11]:
# 4. 정방향 계싼을 행렬 곱셈으로 표현
# 스칼라(scalar)는 하나의 실숫값을 의미한다. 여러 개가 모이면 벡터가 만들어진다.


In [12]:
# 5. 그레이디언트 계산 이해

In [13]:
# 6. forpass(), backprop() 메서드에 배치 경사 하강법 적용하기

def forpass(self, x):
    z = np.dot(x, self.w) + self.b # 선형 출력 계산
    return z

def backprop(slef, x, err):
    m = len(x)
    w_grad = np.dot(x.T, err) / m # 가중치에 대한 평균 그레이디언트를 계산한다.
    b_grad = np.sum(err) / m # 절편에 대한 평균 그레이디언트를 계산한다.
    
    return w_grad, b_grad

# 파이썬의 len() 함수는 넘파이 배열의 행 크기를 반환하므로 이 값을 이용해 그레이디언트의 평균을 계산한다.
# 절편의 그레이디언트는 오차이므로 오차 행렬의 평균값을 구한다.



In [None]:
# 7. fit() 메서드 수정하기
# 배치 경사 하강법에서는 forpass() 메서드와 backprop() 메서드에서 전체 샘플을 한꺼번에 계산하므로 두 번째 for문이 삭제된다.

def fit(self, x, y, eprochs=100, x_val=None, y_val=None):
    y = y.reshape(-1,1) # 타깃을 열 벡터로 바꾼다.
    y_val = y_val.reshape(-1, 1)  #검증용 타깃을 열 벡터로 바꾼다.
    m = len(x) # 샘플 개수 저장
    self.w = np.ones((x.shape[1], 1)) # 가중치 초기화
    self.b = 0
    self.w_history.append(self.w.copy()) # 가중치를 기록한다.
    
    for i in range(epochs):
        z = self.forpass(x) # 정방향 계산을 수행한다.
        a = slef. activation(z) # 활성화 함수를 적용한다.
        err = -(y -a) # 오차 계산
        w_grad, b_grad = self.backprop(x, err) # 오차를 역전파해 그레이디언트를 계산한다.
        w_grad += (self.l1 * np.sign(self.w) + self.l2* self.w) / m # 그레이디언트에서 패널티 항의 미분값 더하기
        self.w -= self.lr * w_grad # 가중치 절편 업데이트
        self.b -= self.lr * b_grad
        
        self.w_history.append(self.w.copy()) # 가중치 기록하기
        a = np.clip(a, 1e-10, 1-1e-10) # 안전한 로그 계산을 위해 클리핑하기
        loss = np.sum(-(y*np.log(a) + (1-y) * np.log(1-a))) # 로그 손실 규제 손실 더해 리스트에 추가
        self.losses.append((loss + self.reg_loss())/m)
        self.update_val_loss(x_val, y_val) # 검증 세트에 대한 손실 계산
        
        
# 전체 구조는 확률적 경사 하강법과 비슷하지만 for문이 한 단계 삭제되어 코드가 훨씬 간단해짐
# 활성화 출력 a가 열 벡터이므로 이에 맞추어 타깃값을(m,1)크기의 열 벡터로 변환하고 평균 손실 구하기 위해 np.sum()함수로 각 샘플의 손실을 더한 후 전체 샘플의 개수로 나눈다.



        