# 神经网络的学习
- 从训练数据集中获得最优参数的过程，记神经网络的反向传播过程
- 深度学习是一种新的编程方法，摆脱了以往以人为中心的思想，所有的东西都让数据发声
## 传统算法&机器学习&深度学习
- 传统算法：人能想到的算法,然后编写算法规则，即把假设空间写死
- 机器学习：人能想到的特征，提取特征向量，机器学习（SVM/KNN）
- 深度学习：数据->答案
- 所以也称机器学习是一种端到端的学习方式
## 以识别手写数字为例说明三种算法的思路
### 传统算法
- 把(28*28)**256所有的情况都枚举出来
- 然后写分支判断语句，判断每种情况是哪种分类
- 但这种情况是不行的，因为(28*28)**256是一个天文数字，写不出来这样的代码
### 机器学习
- 提取特征：比如说边缘、角点、纹理、统计特征等
- 然后使用机器学习算法，比如SVM/KNN
- 最后就能比较好的将图片分类
### 深度学习
- 将图片数据直接喂给深度学习算法，比如神经网络
- 通过反向传播机制，让算法自己找到最好的假设空间
- 最后能比较好的进行图片分类

## 均方误差
- 使用公式表达均方误差：$ E = 1/2 \sum_k (yk - tk)^2$

In [2]:
import numpy as np
def mean_squared_error(y, t):
    return 0.5 * np.sum((y-t)**2)
# 使用softmax预测出来的一组数字的概率
y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]
# 使用one-hot编码的标签，这个样本的真实标签是2
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]
# 计算示例中的均方误差
# 也就说这个样本所产生的均方误差大概是0.1
print(mean_squared_error(np.array(y), np.array(t)))

# 再来计算一个样本的均方误差
y = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]
# 假设真实标签还是2
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]
# 由于预测出来是7的概率最大，所以这个样本的损失还是比较大的
print(mean_squared_error(np.array(y), np.array(t)))

0.09750000000000003


## 交叉熵误差
- 使用公式表达交叉熵误差：$ E = - \sum_k tk \log(yk) $
- 相对于均方误差，这个误差只考虑真实标签那个预测情况，预测概率越接近于1，误差越小，反之越大

In [7]:
# 以上面mnist的结果，计算一下交叉熵的损失
def cross_entropy_error(y, t):
    # 为了防止log(0)对结果溢出，加上一个比较小的量，根据softmax的例子
    # 即使加了这delta也不影响最终的概率分布
    delta = 1e-7
    return -np.sum(t * np.log(y+delta))
y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]
print(cross_entropy_error(np.array(y), np.array(t)))

# 预测比较失败的那个交叉熵损失是多少
y = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]
print(cross_entropy_error(np.array(y), np.array(t)))

0.510825457099338
2.302584092994546
