# 作業目標:

    通過建立多層的神經網路, 了解權值矩陣更新

# 作業重點: 

3  層神經網路

通過增加更多的中間層，以對更多關係的組合進行建模

syn1 權值矩陣將隱層的組合輸出映射到最終結果，

而在更新 syn1 的同時，還需要更新 syn0 權值矩陣，

以從輸入資料中更好地產生這些組合

- 輸入層 有四個值
- 隱藏層 有四個神經元
- 輸出層 有一個神經元

In [1]:
import numpy as np
 
# Sigmoid 函數可以將任何值都映射到一個位於 0 到  1 範圍內的值。通過它，我們可以將實數轉化為概率值
def nonlin(x,deriv=False):
    if(deriv==True):
        return x*(1-x)
    return 1/(1+np.exp(-x))

# 參數定義
# X 輸入資料集，形式為矩陣，每 1 行代表 1 個訓練樣本。
# y 輸出資料集，形式為矩陣，每 1 行代表 1 個訓練樣本。

#共3個樣本
X = np.array([  [0,0,1],
                [0,1,1],
                [1,0,1],
                [1,1,1] ])  
        
# define y for output dataset            
y=np.array([[0,0,1,1]]).T


In [2]:
X #4*3矩陣

array([[0, 0, 1],
       [0, 1, 1],
       [1, 0, 1],
       [1, 1, 1]])

In [3]:
y #4*1矩陣

array([[0],
       [0],
       [1],
       [1]])

In [4]:
# seed random numbers to make calculation
# deterministic (just a good practice)
np.random.seed(1)
#亂數設定產生種子得到的權重初始化集仍是隨機分佈的，
#但每次開始訓練時，得到的權重初始集分佈都是完全一致的。
 
# initialize weights randomly with mean 0
syn0 = 2*np.random.random((3,4))-1

# define syn1
syn1 = 2*np.random.random((4,1))-1


iter = 0
#該神經網路權重矩陣的初始化操作。
#用 “syn0” 來代指 (即“輸入層-第一層隱層”間權重矩陣）
#用 “syn1” 來代指 (即“輸入層-第二層隱層”間權重矩陣）



神經網路訓練
for 迴圈反覆運算式地多次執行訓練代碼，使得我們的網路能更好地擬合訓練集

In [5]:
#訓練前權重
l0 = X
l1 = nonlin(np.dot(l0,syn0))
l2 = nonlin(np.dot(l1,syn1))
'''
# Feed forward through layers 0, 1, and 2
# l0 網路第 1 層，即網路輸入層。
# l1 網路第 2 層，常稱作隱藏層。
# l2 假定為網路最後一層，隨著訓練進行，其輸出應該逐漸接近正確結果
'''
print("Output before Training:")
print(l1)
print("\n\n")
print(l2)

Output before Training:
[[0.44856632 0.51939863 0.45968497 0.59156505]
 [0.28639589 0.32350963 0.31236398 0.51538526]
 [0.40795614 0.62674606 0.23841622 0.49377636]
 [0.25371248 0.42628115 0.14321233 0.41732254]]



[[0.47372957]
 [0.48895696]
 [0.54384086]
 [0.54470837]]


In [6]:
syn1_history=[]
syn0_history=[]
for iter in range(60000):
    # forward propagation
    l0 = X
    l1 = nonlin(np.dot(l0,syn0))
    l2 = nonlin(np.dot(l1,syn1))
    '''
    # how much did we miss the target value?
    # l2_error 該值說明了神經網路預測時“丟失”的數目。
    # l2_delta 該值為經確信度加權後的神經網路的誤差，除了確信誤差很小時，它近似等於預測誤差。
    # l1_error 該值為 l2_delta 經 syn1 加權後的結果，從而能夠計算得到中間層/隱層的誤差。
    # l1_delta 該值為經確信度加權後的神經網路 l1 層的誤差，除了確信誤差很小時，它近似等於 l1_error 。
    '''
    
    # how much did we miss?
    l2_error=  y - l2
    
    # multiply how much we missed by the 
    # slope of the sigmoid at the values in l1
    l2_delta = l2_error * nonlin(l2,True)
    l1_error = l2_delta * nonlin(l1,True)
    
    l1_delta = l1_error * nonlin(l1,deriv=True)
    
    # update weights
    
    syn1 += l1.T.dot(l2_delta)
    syn0 += l0.T.dot(l1_delta)
    
    syn1_history.append(syn1)
    syn0_history.append(syn0)
    if (iter% 10000) == 0:
        print(f"{iter}")
    
    if (iter% 10000) == 0:
        print("L2_Error:" + str(np.mean(np.abs(l2_error))))
        
    if (iter% 10000) == 0:
        print("L1_Error:" + str(np.mean(np.abs(l2_error))))

print('60000')
print("L2_Error:" + str(np.mean(np.abs(l2_error))))
print("L1_Error:" + str(np.mean(np.abs(l2_error)))) 

0
L2_Error:0.4685343254580603
L1_Error:0.4685343254580603
10000
L2_Error:0.1598838126736579
L1_Error:0.1598838126736579
20000
L2_Error:0.15179138107920168
L1_Error:0.15179138107920168
30000
L2_Error:0.1479281445309289
L1_Error:0.1479281445309289
40000
L2_Error:0.14550248128640852
L1_Error:0.14550248128640852
50000
L2_Error:0.14377788842085396
L1_Error:0.14377788842085396
60000
L2_Error:0.1424603661688671
L1_Error:0.1424603661688671


In [7]:
#訓練後權重
print("Output After Training:")
print(l1)
print("\n\n")
print(l2)

Output After Training:
[[0.03421756 0.03379603 0.02572573 0.03457432]
 [0.00773208 0.00770741 0.00432394 0.00772982]
 [0.91477842 0.91581813 0.03857198 0.91412815]
 [0.7024541  0.70724358 0.00655503 0.69839431]]



[[0.10921785]
 [0.41649408]
 [0.96480434]
 [0.99106612]]
