## 输出层的设计

### 神经网络两个具体问题

&emsp;上面一小节上我们在最后的输出层使用的是恒等函数，也就是直接将最后一层的信号量通过加权计算后的数据直接在输出层输出来。这里我们就要重点来看看输出层到底需要怎么来输出。  
&emsp;一般神经网络输出层有两种分类，这个分类是根据实际网络需要解决的具体问题而定：
- 分类问题：一般选用softmax函数
    - 判断输入的数据是属于哪个类别，比如是猫还是狗
- 回归问题：一般选用恒等函数
    - 用来预测具体数值问题，比如预测温度，体重等具体数值
    
### 恒等函数和 softmax 函数

#### 恒等函数
&emsp;上面一小节上我们在最后的输出层使用的是恒等函数，也就是直接将最后一层的信号量通过加权计算后的数据直接在输出层输出来。所以这里就可以直接表示如下图：

![恒等函数](imgs/16.jpg)

#### softmax 函数

&emsp;softmax函数其实没有那么神秘，其实就是对最后的值计算一个指数，然后将所有的输出层求和，在计算各个输出所占的比例。计算公式如下：  
$y_k =\frac{exp(a_k)}{\sum^n_{i=1}{exp(a_i)}} $

- $a_k$:表示第k个输出的输入信号
- 分子:表示$a_k$的指数函数
- 分母:表示所有信号的指数函数的和

这里通过一个例子来理解,


In [3]:
import numpy as np

# 倒数第二层的输入加权信号为
a = np.array([0.1,-0.2,0.3])
# 对输入信号进行指数函数计算
z = np.exp(a)
print(z)
# 计算总和
z_sum = np.sum(z)
print(z_sum)
#计算softmax值
#其实就是计算对于输出所占的比例
y = z/z_sum
print(y)
# y_sum这个值是1
y_sum = np.sum(y)
print(y_sum)

[1.10517092 0.81873075 1.34985881]
3.2737604787296326
[0.33758454 0.25008878 0.41232669]
1.0


In [4]:
# softmax函数可以归纳如下
def softmax(a):
    exp_a = np.exp(a)
    sum_exp_a = np.sum(exp_a)
    y = exp_a/sum_exp_a
    return y

### softmax函数需要注意的点

&ensp;&ensp;上面我使用softmax来分类,里面有一个最大的特点就是使用指数函数.指数函数这里在数学计算中可能没有什么特别的地方,但是到了计算机就有不同了,因为计算机对于数据的大小表示是由范围限制的.比如:$e^10$与$e^1000$,计算机的表示是不同的.后者可能表示为无穷大.

&ensp;&ensp;为了让数据的输入在一个正常的范围,让计算能够能够正常显示,下面我们对这个公式做一个变换.