로지스틱 회귀 = 단일층 신경망

#일반적인 신경망의 모습
입력층 : 가장 왼쪽
은닉층 : 가운데(+활성화 함수)
출력층 : 가장 오른쪽(+활성화 함수)

단일 신경망이란?
은닉층이 없고, 입력층 출력층만으로 이루어져있는 신경망 로지스틱 회귀가 이와 같다.


# 경사하강법의 종류

확률적 경사 하강법 : 샘플 데이터 1개에 대한 그레이디언트를 매번 구해주었음
배치 경사 하강법 : 전체 훈련 세트를 사용하여 한 번에 그레디언트를 계산 하는 방식
미니 배치 경사 하강법 : 배치의 크기를 작게하여 각각 한 번에 그레디언트를 계산 하는 방식

확률적 경사 하강법은 랜덤으로 여러 데이터를 뽑아서 하므로, 계산 비용은 적은 대신 최적값에 수렴하기 불안정
배치 경사 하강법은 세트를 한 번에 처리하므로, 계산 비용은 많은 대신 최적값에 수렴하기 안정
-->  그 중간인 미니 배치 경사 하강법!

경사하강법을 이용할 시에 한 에포크당 데이터 샘플의 순서를 섞어 가중치를 구한다. 

<샘플의 순서를 섞는 가장 좋은방법>
np.random.permutation()함수 이용 : 넘파이에서 제공하는 함수로 배열의 인덱스를 섞은 후 인덱스 순서대로 나열한다.


# 단일층 신경망 구현 


In [1]:
class SingleLayer:
    def __init__(self):
        self.w = None
        self.b = None
        self.losses=[] #손실함수의 결과값 저장할 배열
    def forpass(self,x):
        z = np.sum(x * self.w)+self.b #선형 함수
        return z
    def backprop(self, x, err):
        w_grad = x * err
        b_grad = 1 * err 
        return w_grad, b_grad #그레디언트 계산
    def activation(self, z):
        a = 1/ (1+np.exp(-z))
        return a #시그모이드 계산
    def fit(self, x, y, epochs = 100):
        self.w = np.ones(x.shape[1]) #가중치는 1로 초기화
        self.b = 0 #절편은 0으로 초기화
        for i in range(epochs): #에포크 만큼 돌린다.
            loss = 0
            indexes = np.random.permutation(np.arange(len(x))) #배열 전체의 인덱스를 섞어줌
            for i in indexes:
                z = self.forpass(x[i]) # 정방향 계산
                a = self.activation(z) # 시그모이드 계산
                err = -(y[i]-a) #오차값 
                w_grad, b_grad = self.backprop(x[i], err) # 역방향 계산 (그레디언트 계산)
                self.w -= w_grad # 가중치 절편 업데이트
                self.b -= b_grad
                a = np.clip(a, 1e-10, 1-1e-10) #손실 값이 무한대가 되지 않도록 조정해주는 clip사용
                
                loss += -(y[i]*np.log(a)+(1-y[i])*np.log(1-a)) #평균 손실을 계산하여 저장(누적)
            self.losses.append(loss/len(y))
    def predict(self, x):
        z = [self.forpass(x_i) for x_i in x] # 정방향 계산
        return np.array(z)>0 #임계함수 대용
    
    def score(self, x, y):
        return np.mean(self.predict(x) ==y) #정확도 계산 
    
from sklearn.model_selection import train_test_split#train_test_split함수를 사용하겠다. 
import numpy as np
from sklearn.datasets import load_breast_cancer #사이킷런에서 제공하는 datasets의 모듈에서 유방암 데이터를 불러온다. 
cancer = load_breast_cancer() #데이터를 불러온다
np.unique(cancer.target, return_counts = True)
x = cancer.data #x에는 데이터
y = cancer.target #y에는 타겟데이터
x_train, x_test, y_train, y_test = train_test_split(x,y,stratify=y, test_size=0.2, random_state=42)

# 단일층 신경망 훈련하기 
layer= SingleLayer()
layer.fit(x_train, y_train)
print(layer.score(x_test, y_test))

                
                
                
                
    

  


0.9210526315789473