# 神经网络


## 多维数组运算

### 使用unmpy处理数组

In [None]:
import numpy as np
A = np.array([1,2,3,4])
# 打印数组
print(A) 

In [None]:
# 输出数组维度
print(np.ndim(A))

In [None]:
# 数组形状
print(A.shape)
# 数组第一个维度形状
print(A.shape[0])

### 矩阵的乘法
使用np.dot(A,B)计算数组乘法

In [None]:
B = np.array([[1,2],
              [3,4]])

C = np.array([[5,6],
              [7,8]])

print(np.dot(B,C))

In [None]:
X = np.array([1,2])
W = np.array([[1,3,5],
              [2,4,6]])
print(np.dot(X,W))

### 三层神经网络实现

输入层到第一层

输入X, 第一层 $ A^{(1)} $, 权重 $ W^{(1)} $, 偏置 $ B^{(1)} $

$ A^{(1)}= XW^{(1)} + B^{(1)}  $

In [None]:
# sigmod函数
def sigmod(x):
    return 1 / (1 + np.exp(-x))

In [None]:

X = np.array([1.0, 0.5])
W1 = np.array([[0.1, 0.3, 0.5],
               [0.2, 0.4, 0.6]])
B1 = np.array([0.1, 0.2, 0.3])

A1 = np.dot(X, W1) + B1
print(A1)
Z1 = sigmod(A1)
print(Z1)

第一层到第二层

In [None]:
W2 = np.array([[0.1, 0.4],
               [0.2, 0.5],
               [0.3, 0.6]])
B2 = np.array([0.1, 0.2])

A2 = np.dot(Z1,W2) + B2
print(A2)
Z2 = sigmod(A2)
print(Z2)

第二层到输出层

In [None]:
def identity_func(x):
    return x;

W3 = np.array([[0.1, 0.3],
               [0.2, 0.4]])
B3 = np.array([0.1, 0.2])
A3 = np.dot(Z2,W3) + B3
print(A3)

Y = identity_func(A3)

代码实现小结

In [None]:
def init_network():
    network = {}
    network['W1'] = np.array([[0.1, 0.3, 0.5],
                              [0.2, 0.4, 0.6]])
    network['b1'] = np.array([0.1, 0.2, 0.3])
    network['W2'] = np.array([[0.1, 0.4],
                              [0.2, 0.5],
                              [0.3, 0.6]])
    network['b2'] = np.array([0.1, 0.2])
    network['W3'] = np.array([[0.1, 0.3],
                              [0.2, 0.4]])
    network['b3'] = np.array([0.1, 0.2])

    return network

def forward(network, x):
    W1, W2, W3 = network['W1'], network['W2'], network['W3']
    b1, b2, b3 = network['b1'], network['b2'], network['b3']

    a1 = np.dot(x,W1) + b1
    z1 = sigmod(a1)

    a2 = np.dot(z1,W2) + b2
    z2 = sigmod(a2)

    a3 = np.dot(z2,W3) + b3
    y = identity_func(a3)

    return y

network = init_network()
x = np.array([1.0, 0.5])
y = forward(network, x)
print(y)

## 输出层设计

神经网络可以用在分类问题和回归问题上，不过要根据情况改变输出层的激活函数。一般回归问题用恒等函数，分类问题用softmax函数。

### 恒等函数

恒等函数会将输入原样输出

### softmax函数

$ y_k = \frac{exp(a_k)}{\sum_{i=1}^n {exp(a_i)}}$

其中 $ exp(x) $ 表示 $ e^x $

In [None]:
a = np.array([0.3, 2.9, 4.0])
exp_a = np.exp(a)
print(exp_a)

sum_exp_a = np.sum(exp_a)
print(sum_exp_a)

y = exp_a / sum_exp_a
print(y)

实现softmax函数

In [None]:
#会出现溢出问题,a比较大时，e的a次幂就会变得相当大
def softmax_1(a):
    exp_a = np.exp(a)
    sym_exp_a = np.sum(exp_a)
    y = exp_a / sum_exp_a
    return y

print(softmax_1(100))
print(softmax_1(np.array([1010,1000,900])))

softmax函数改进

$ y_k 
= \frac{e^{a_k}}{\sum_{i=1}^n {e^{a_i}}} 
= \frac{C e^{a_k}}{C \sum_{i=1}^n {e^{a_i}}} 
= \frac{e^{a_k + logC}}{\sum_{i=1}^n {e^{a_i + logC}}} 
= \frac{e^{a_k + C'}}{\sum_{i=1}^n {e^{a_i + C'}}}
= \frac{exp(a_k + C')}{\sum_{i=1}^n {exp(a_i + C')}} $ 

通过上式，发现在进行softmax指数函数运算时，加上或减去某个常数并不会改变计算结果

softmax函数输出是0.0道1.0之间的实数，并且softmax函数的输出值总和是1。正是应为这个性质，我们才可以把softmax函数解释成概率

In [None]:
def softmax(a):
    c = np.max(a)
    exp_a = np.exp(a - c) #溢出对策
    sum_exp_a = np.sum(exp_a)
    y = exp_a/sum_exp_a
    return y

a = np.array([1010,1000,900])
y = softmax(a)
print(y)
print(np.sum(y))

## 手写数字识别