## 퍼셉트론 1개를 이용한 오차역전파

In [4]:
import numpy as np

# (특성데이터, 라벨데이터, 반복수, 학습률)
def fit_user(X, y, epoch, lr):
    #(1) w,b를 랜덤으로 초기화
    w = np.random.rand(1)
    b = np.random.rand(1)
    
    # epoch 수만큼 반복
    for i in range(epoch) : 
        # (2) 특성 데이터를 입력해서 라벨 데이터를 예측
        pred_y = w * X + b
        
        #(3) 오차 계산 (실제값 - 예측값)
        e = y - pred_y
        
        #(4) 미분을 해서 기울기를 계산 (w,b가 e에 얼마나 영향을 주고 있는지 분석)
        dw = e / w
        db = e / b
        
        # (5) 경사를 이용해서 w,b를 갱신 
        # 학습률을 적용 - w,b가 너무 크게 변하는 것을 방지하기 위한 것
        w = w + dw * lr
        b = b + db * lr
        
        # 중간결과 출력
        print("반복수 : {}, 예측값 : {}, 오차:{}".format(i, pred_y, e))
        print("현재 파라미터 : -> w : {}, b : {}".format(w,b))
    

In [5]:
fit_user(1,3,100,0.01)

반복수 : 0, 예측값 : [1.04806136], 오차:[1.95193864]
현재 파라미터 : -> w : [0.31852766], b : [0.83636969]
반복수 : 1, 예측값 : [1.15489735], 오차:[1.84510265]
현재 파라미터 : -> w : [0.37645364], b : [0.85843054]
반복수 : 2, 예측값 : [1.23488418], 오차:[1.76511582]
현재 파라미터 : -> w : [0.42334164], b : [0.87899267]
반복수 : 3, 예측값 : [1.30233431], 오차:[1.69766569]
현재 파라미터 : -> w : [0.46344319], b : [0.89830643]
반복수 : 4, 예측값 : [1.36174962], 오차:[1.63825038]
현재 파라미터 : -> w : [0.49879273], b : [0.91654353]
반복수 : 5, 예측값 : [1.41533626], 오차:[1.58466374]
현재 파라미터 : -> w : [0.53056272], b : [0.93383309]
반복수 : 6, 예측값 : [1.46439581], 오차:[1.53560419]
현재 파라미터 : -> w : [0.55950565], b : [0.95027719]
반복수 : 7, 예측값 : [1.50978284], 오차:[1.49021716]
현재 파라미터 : -> w : [0.58614018], b : [0.96595911]
반복수 : 8, 예측값 : [1.5520993], 오차:[1.4479007]
현재 파라미터 : -> w : [0.61084248], b : [0.98094837]
반복수 : 9, 예측값 : [1.59179084], 오차:[1.40820916]
현재 파라미터 : -> w : [0.63389603], b : [0.99530396]
반복수 : 10, 예측값 : [1.62919999], 오차:[1.37080001]
현재 파라미터 : -> w : [0.655521

## 퍼셉트론 2개를 이용한 오차역전파

In [13]:
import numpy as np

# (특성 데이터, 라벨 데이터, 반복수, 학습률)
def fit_user2(X, y, epoch, lr):
    # (1) w, b를 랜덤으로 초기화
    w1=np.random.randn(1)
    b1=np.random.randn(1)
    w2=np.random.randn(1)
    b2=np.random.randn(1)
    
    # epoch 수만큼 반복
    for i in range(epoch) :
        # (2) 특성 데이터를 입력해서 라벨데이터를 예측
        # 1층 중간 결과
        pred_y1 = w1*X+b1
        # 2층의 결과
        pred_y2 = w2*pred_y1+b2
        
        # 2층부터 오차 역전파
        # (3) 오차 계산 (실체값 - 예측값)
        e = y-pred_y2
        
        # (4) 미분을 해서 기울기를 계산 (w, b가 e(= 오차)에 얼마나 영향을 주고 있는 지 분석)
        dw2 = e/w2
        db2 = e/b2
        
        # (5) 경사를 이용해서 w, b를 갱신
        # 락습률을 적용 - w,b가 너무 크게 변하는 것을 방지하기 위한 것
        w2 = w2+dw2 * lr
        b2 = b2+db2 * lr
        
        # 1층 오차역전파
        dw1 = pred_y1* dw2 /w1
        db1 = pred_y1* db2 /b1
        
        # 1층 파라미터 업데이트
        w1= w1+dw1*lr
        b1= b1+db1*lr
        
        # 중간 결과 출력
        print("반복수 : {}, 예측값 : {} ,오차 : {}".format(i, pred_y2, e))

In [14]:
fit_user2(1,3,100,0.01)

반복수 : 0, 예측값 : [-0.4506296] ,오차 : [3.4506296]
반복수 : 1, 예측값 : [0.10718212] ,오차 : [2.89281788]
반복수 : 2, 예측값 : [0.22392488] ,오차 : [2.77607512]
반복수 : 3, 예측값 : [0.31288996] ,오차 : [2.68711004]
반복수 : 4, 예측값 : [0.38619745] ,오차 : [2.61380255]
반복수 : 5, 예측값 : [0.44918855] ,오차 : [2.55081145]
반복수 : 6, 예측값 : [0.50476627] ,오차 : [2.49523373]
반복수 : 7, 예측값 : [0.55470988] ,오차 : [2.44529012]
반복수 : 8, 예측값 : [0.60019973] ,오차 : [2.39980027]
반복수 : 9, 예측값 : [0.64206436] ,오차 : [2.35793564]
반복수 : 10, 예측값 : [0.68091057] ,오차 : [2.31908943]
반복수 : 11, 예측값 : [0.71719779] ,오차 : [2.28280221]
반복수 : 12, 예측값 : [0.75128323] ,오차 : [2.24871677]
반복수 : 13, 예측값 : [0.78345081] ,오차 : [2.21654919]
반복수 : 14, 예측값 : [0.81393035] ,오차 : [2.18606965]
반복수 : 15, 예측값 : [0.84291081] ,오차 : [2.15708919]
반복수 : 16, 예측값 : [0.87054963] ,오차 : [2.12945037]
반복수 : 17, 예측값 : [0.89697957] ,오차 : [2.10302043]
반복수 : 18, 예측값 : [0.92231368] ,오차 : [2.07768632]
반복수 : 19, 예측값 : [0.94664913] ,오차 : [2.05335087]
반복수 : 20, 예측값 : [0.97007011] ,오차 : [2.02992989]
반복수