# 神经网络学习规则

In [1]:
import numpy as np
np.set_printoptions(precision=3)
from nn_tool.activation import *
from nn_tool import activation as ac

In [2]:
# linear 函数
def linear(x,w):
    # x,w 行向量
    return np.dot(w,x.T)    

##  Hebb 学习规则

&nbsp;学习信号: &nbsp; $r = f(net) = f(W X^T)$

In [3]:
# Hebb学习规则
def hebb(x,w,act='sgn'):
    # x,w 行向量
    # hebb规则：r(x)    
    net = linear(x,w)
    print('净输入: net = w * x.T = %.3f'%net)    
    if act == 'sgn':
        out = np.sign(net)
    elif act == 'sigmoid_d':
        out = Sigmoid_d().value(net)
    elif act == 'tanh':
        out = np.tanh(net)
    print('实际输出: o = f(net) = %.3f'% out)
    return out

##  Perceptron (感知器) 学习规则

&nbsp;学习信号: &nbsp; $r = d - o = d - f(net) = d - \mathrm{sgn}(W X^T)$

In [4]:
# Perceptron 学习规则
def perceptron(x,y,w):
    # x,w 行向量
    # perceptron 学习规则：r(x)
    net = linear(x,w)
    print('净输入: net = w * x.T =%.3f'% net)
    out = np.sign(net)
    print('实际输出: o = f(net) = %.3f'% out)
    return y -out

##  $\delta$ 学习规则

&nbsp;学习信号: &nbsp; $r = [d - f(net)]f'(net) = [d - f(W X^T)]f'(W X^T)$

In [5]:
# Delta学习规则
def delta(x,y,w,act='logistic'):
    # x,w 行向量
    # Delta学习规则：r(x)    
    net = linear(x,w)
    print('净输入: net = w * x.T = %.3f'%net)  
    # 激活函数
    func = eval(f'{ac.func_name[act]}()')
    out = func.value(net)
    df = func.gradient_value(net)
    print('实际输出: o = f(net) = %.3f'% out)
    print("导数：f'(net) = %.3f"% df)
    return (y-out)*df

##  Widrow-Hoff (最小均方)学习规则

&nbsp;学习信号: &nbsp; $r = d - net = d - W X^T$

In [6]:
# Widrow-hoff (LMS)学习规则
def LMS(x,y,w):
    # x,w 行向量
    # Widrow-hoff (LMS)学习规则：r(x)    
    out = linear(x,w)
    print('净输入: net = w * x.T = %.3f'%out)
    print('实际输出: o = net = %.3f'% out)
    return y-out

##  Correlation (相关)学习规则

&nbsp;学习信号: &nbsp; $r = d$

In [7]:
# correlation学习规则
def corre(x,y,w):
    # x,w 行向量
    # Correlation学习规则：r = y 
    return y

##  Winner-Take-All (胜者为王)学习规则

&nbsp; &nbsp; 权值更新

In [8]:
# 权值更新
def update(epoch,X,y,w,rule,act,lr): 
    i = epoch % X.shape[0]
    print("\nEpoch: %d"% epoch)
    print('当前输入的训练数据: ',X[i],y[i])
    # print('Current input training data: ',X[i])
    
    #func = eval(f'{rule}') # 学习规则
    #rs = func(X[i],y[i],w,act)   # 学习信号(实际输出)    
    if rule == 'hebb':  
        rs = hebb(X[i],w,act)    # 学习信号
    elif rule == 'perceptron':
        rs = perceptron(X[i],y[i],w)    # 学习信号
    elif rule == 'delta':
        rs = delta(X[i],y[i],w,act)
    elif rule == 'LMS':
        rs = LMS(X[i],y[i],w)
    print('学习信号：r(w,x,d) = %.3f'% rs)
    dw = lr * rs * X[i]   # 权值调整量
    w = w+dw  
    print('更新的权值向量: ',w)
    #print('Updated weight vector: ',w)
    return w

&nbsp; &nbsp; 运行权值学习

In [9]:
# 运行 权值学习
def runner(X,y=None,rule='hebb',act='sgn',lr=0.1,epochs=10,init_w=None,init_T=None):
    # 样本
    if y is None:
        y = X.shape[0]*[None]
    # 初始化权向量
    if init_w is None:
        w_ = np.zeros(X_.shape[1])  
    else:   
        w_ = np.array(init_w)        
    print('初始权值向量: ',w_)
    #print('Initial weight vector: ',w_)
    
    # 更新权值向量 （训练）
    for epoch in range(epochs):   
        w = update(epoch,X,y,w_,rule,act,lr)        
        if (w == w_).all():
            print('\n学习结束')
            print(f'算法迭代次数: {epoch}')
            break
        else:
            w_ = w        
    return w_

&nbsp; $\cdot $ &nbsp; Hebbian学习规则的应用

In [10]:
print('可选择的激活函数：',list(ac.func_name.keys()))
# Hebbian学习规则

# P33 例2.1 样本
X = np.array([[1,-2,1.5,0],[1,-0.5,-2,-1.5],[0,1,-1,1.5]])
lr = 1    # 学习率
rule =  'hebb' # 学习规则
act =  'sgn' # 'sigmoid_d' #   # 激活函数
epochs = 3    # 训练次数
init_w = np.array([1,-1,0,0.5])  # 初始化权向量  

print(f'\n学习规则：{rule}')
print('激活函数：{}'.format(ac.func_name[act]))
print(f'学习率：{lr}')

final_w = runner(X,y=None,rule=rule,act=act,lr=lr,epochs=epochs,init_w=init_w)

可选择的激活函数： ['unit', 'sgn', 'logistic', 'tanh', 'sigmoid_d', 'piecewise_s', 'piecewise_d', 'hard_logistic', 'hard_tanh', 'relu', 'leakyRelu', 'elu', 'softplus', 'swish', 'gelu', 'softmax']

学习规则：hebb
激活函数：SGN
学习率：1
初始权值向量:  [ 1.  -1.   0.   0.5]

Epoch: 0
当前输入的训练数据:  [ 1.  -2.   1.5  0. ] None
净输入: net = w * x.T = 3.000
实际输出: o = f(net) = 1.000
学习信号：r(w,x,d) = 1.000
更新的权值向量:  [ 2.  -3.   1.5  0.5]

Epoch: 1
当前输入的训练数据:  [ 1.  -0.5 -2.  -1.5] None
净输入: net = w * x.T = -0.250
实际输出: o = f(net) = -1.000
学习信号：r(w,x,d) = -1.000
更新的权值向量:  [ 1.  -2.5  3.5  2. ]

Epoch: 2
当前输入的训练数据:  [ 0.   1.  -1.   1.5] None
净输入: net = w * x.T = -3.000
实际输出: o = f(net) = -1.000
学习信号：r(w,x,d) = -1.000
更新的权值向量:  [ 1.  -3.5  4.5  0.5]


In [11]:
# Hebbian学习规则
# 作业： P40 习题2.4
# (1) act = 'sgn'; (2) act = 'sigmoid_d'
X = np.array([[1,-2],[0,1],[2,3],[1,1]])
print(X.shape)
lr = 1    # 学习率
rule =  'hebb' # 学习规则
act = 'sigmoid_d' #   'sgn' #  # 激活函数
epochs = 4    # 训练次数
init_w = np.array([1,-1])  # 初始化权向量  

print(f'学习规则：{rule}')
print('激活函数：{}'.format(ac.func_name[act]))
print(f'学习率：{lr}')

final_w = runner(X,y=None,rule=rule,act=act,lr=lr,epochs=epochs,init_w=init_w)

(4, 2)
学习规则：hebb
激活函数：Sigmoid_d
学习率：1
初始权值向量:  [ 1 -1]

Epoch: 0
当前输入的训练数据:  [ 1 -2] None
净输入: net = w * x.T = 3.000
实际输出: o = f(net) = 0.905
学习信号：r(w,x,d) = 0.905
更新的权值向量:  [ 1.905 -2.81 ]

Epoch: 1
当前输入的训练数据:  [0 1] None
净输入: net = w * x.T = -2.810
实际输出: o = f(net) = -0.886
学习信号：r(w,x,d) = -0.886
更新的权值向量:  [ 1.905 -3.697]

Epoch: 2
当前输入的训练数据:  [2 3] None
净输入: net = w * x.T = -7.280
实际输出: o = f(net) = -0.999
学习信号：r(w,x,d) = -0.999
更新的权值向量:  [-0.092 -6.693]

Epoch: 3
当前输入的训练数据:  [1 1] None
净输入: net = w * x.T = -6.785
实际输出: o = f(net) = -0.998
学习信号：r(w,x,d) = -0.998
更新的权值向量:  [-1.09 -7.69]


&nbsp; $\cdot $ &nbsp; 感知器学习规则的应用

In [12]:
# Perceptron 学习规则
# 作业： P40 习题2.5
# 反复训练，直到网络输出误差为零
X = np.array([[2,1,-1],[0,-1,-1]])
y = np.array([-1,1])
lr = 1    # 学习率
rule =  'perceptron' # 学习规则
act = 'sgn' #  # 激活函数
epochs = 100    # 训练次数
init_w = np.array([0,1,0])  # 初始化权向量  

print(f'学习规则：{rule}')
print('激活函数：{}'.format(ac.func_name[act]))
print(f'学习率：{lr}')

final_w = runner(X,y=y,rule=rule,act=act,lr=lr,epochs=epochs,init_w=init_w)

学习规则：perceptron
激活函数：SGN
学习率：1
初始权值向量:  [0 1 0]

Epoch: 0
当前输入的训练数据:  [ 2  1 -1] -1
净输入: net = w * x.T =1.000
实际输出: o = f(net) = 1.000
学习信号：r(w,x,d) = -2.000
更新的权值向量:  [-4 -1  2]

Epoch: 1
当前输入的训练数据:  [ 0 -1 -1] 1
净输入: net = w * x.T =-1.000
实际输出: o = f(net) = -1.000
学习信号：r(w,x,d) = 2.000
更新的权值向量:  [-4 -3  0]

Epoch: 2
当前输入的训练数据:  [ 2  1 -1] -1
净输入: net = w * x.T =-11.000
实际输出: o = f(net) = -1.000
学习信号：r(w,x,d) = 0.000
更新的权值向量:  [-4 -3  0]

学习结束
算法迭代次数: 2


&nbsp; $\cdot $ &nbsp;$\delta$ 学习规则的应用

In [13]:
# Delta 学习规则
# P37 例2.2  Delta学习规则
# 样本
X = np.array([[-1,1,-2,0],[-1,0,1.5,-0.5],[-1,-1,1,0.5]])
# 期望输出 d = y
y = np.array([-1,-1,1]) 
lr = 0.1    # 学习率
rule =  'delta' # 学习规则
act = 'sigmoid_d' #    激活函数
epochs = 3    # 训练次数
init_w = np.array([0.5,1,-1,0]) # 初始化权向量  

print(f'\n学习规则：{rule}')
print('激活函数：{}'.format(ac.func_name[act]))
print(f'学习率：{lr}')

final_w = runner(X,y=y,rule=rule,act=act,lr=lr,epochs=epochs,init_w=init_w)


学习规则：delta
激活函数：Sigmoid_d
学习率：0.1
初始权值向量:  [ 0.5  1.  -1.   0. ]

Epoch: 0
当前输入的训练数据:  [-1.  1. -2.  0.] -1
净输入: net = w * x.T = 2.500
实际输出: o = f(net) = 0.848
导数：f'(net) = 0.140
学习信号：r(w,x,d) = -0.259
更新的权值向量:  [ 0.526  0.974 -0.948  0.   ]

Epoch: 1
当前输入的训练数据:  [-1.   0.   1.5 -0.5] -1
净输入: net = w * x.T = -1.948
实际输出: o = f(net) = -0.750
导数：f'(net) = 0.218
学习信号：r(w,x,d) = -0.054
更新的权值向量:  [ 0.531  0.974 -0.956  0.003]

Epoch: 2
当前输入的训练数据:  [-1.  -1.   1.   0.5] 1
净输入: net = w * x.T = -2.460
实际输出: o = f(net) = -0.843
导数：f'(net) = 0.145
学习信号：r(w,x,d) = 0.267
更新的权值向量:  [ 0.505  0.947 -0.93   0.016]


In [14]:
# Delta 学习规则
# 作业： P41 习题2.6
# 样本
X = np.array([[2,0,-1],[1,-2,-1]])
# 期望输出 d = y
y = np.array([-1,1]) 
lr = 0.25    # 学习率
rule =  'delta' # 学习规则
act = 'sigmoid_d' #    激活函数
epochs = 3    # 训练次数
init_w = np.array([1,0,1]) # 初始化权向量  

print(f'\n学习规则：{rule}')
print('激活函数：{}'.format(ac.func_name[act]))
print(f'学习率：{lr}')

final_w = runner(X,y=y,rule=rule,act=act,lr=lr,epochs=epochs,init_w=init_w)


学习规则：delta
激活函数：Sigmoid_d
学习率：0.25
初始权值向量:  [1 0 1]

Epoch: 0
当前输入的训练数据:  [ 2  0 -1] -1
净输入: net = w * x.T = 1.000
实际输出: o = f(net) = 0.462
导数：f'(net) = 0.393
学习信号：r(w,x,d) = -0.575
更新的权值向量:  [0.713 0.    1.144]

Epoch: 1
当前输入的训练数据:  [ 1 -2 -1] 1
净输入: net = w * x.T = -0.431
实际输出: o = f(net) = -0.212
导数：f'(net) = 0.477
学习信号：r(w,x,d) = 0.579
更新的权值向量:  [ 0.857 -0.289  0.999]

Epoch: 2
当前输入的训练数据:  [ 2  0 -1] -1
净输入: net = w * x.T = 0.715
实际输出: o = f(net) = 0.343
导数：f'(net) = 0.441
学习信号：r(w,x,d) = -0.592
更新的权值向量:  [ 0.561 -0.289  1.147]


&nbsp; $\cdot $ &nbsp;Widrow-Hoff (最小均方LMS) 学习规则的应用

In [15]:
# Widrow-Hoff 学习规则
# 作业： P41 习题2.7
# 样本
X = np.array([[2,0,-1],[1,-2,-1]])
# 期望输出 d = y
y = np.array([-1,1]) 
lr = 0.25    # 学习率
rule =  'LMS' # 学习规则
act = None #    激活函数
epochs = 3    # 训练次数
init_w = np.array([1,0,1]) # 初始化权向量  

print(f'\n学习规则：{rule}')
print('激活函数：None')
print(f'学习率：{lr}')

final_w = runner(X,y=y,rule=rule,act=act,lr=lr,epochs=epochs,init_w=init_w)


学习规则：LMS
激活函数：None
学习率：0.25
初始权值向量:  [1 0 1]

Epoch: 0
当前输入的训练数据:  [ 2  0 -1] -1
净输入: net = w * x.T = 1.000
实际输出: o = net = 1.000
学习信号：r(w,x,d) = -2.000
更新的权值向量:  [0.  0.  1.5]

Epoch: 1
当前输入的训练数据:  [ 1 -2 -1] 1
净输入: net = w * x.T = -1.500
实际输出: o = net = -1.500
学习信号：r(w,x,d) = 2.500
更新的权值向量:  [ 0.625 -1.25   0.875]

Epoch: 2
当前输入的训练数据:  [ 2  0 -1] -1
净输入: net = w * x.T = 0.375
实际输出: o = net = 0.375
学习信号：r(w,x,d) = -1.375
更新的权值向量:  [-0.062 -1.25   1.219]


In [16]:
a = 0.5
func = 'leakyRelu'
print(ac.func_name[func])
#afunc = eval(f'ac.{ac.func_name[fname]}({a})')
afunc = eval(f'ac.{ac.func_name[func]}({a})')
print(afunc)
print(afunc.formula())

LeakyReLU
<nn_tool.activation.LeakyReLU object at 0x000001313059A750>


NameError: name 'a' is not defined