## 深度学习基本问题

### 1 什么是深度学习

深度学习允许**由多个处理层组成的计算模型**来学**习具有多个抽象级别的数据表**示，这些方法极大地改善了语音识别，视觉对象识别，物体检测以及药物发现和基因组学等许多其他领域的最新技术。深度学习通过使用反向传播算法来指示机器应如何更改其内部参数(用于从前一层中的表示)计算每个层中的表示来发现大数据集中的复杂结构。

**深度学习出发点：数据+任务**。确定任务后获取相应的数据集，数据集形成的过程中往往伴随着噪声数据，噪声是相对于每一个任务来说，因为可能不同的任务对同一份数据集的需求是不一样的。**因此数据基于任务的目标可以分成两部分，即有价值的数据和噪声**。深度学习的每一个Layer就是用来放大前者，抑制后者的，经过一系列的Layer之后，数据中最有用的部分被提取出来，之后再进行相应目标的任务会特别简单，这就是深度学习。


### 2 深度学习计算的本质

在计算机，或者说在TensorFlow中，深度学习计算的本质是张量(Tensor)的计算，每一层Layer都是数据的一系列几何变换，这是使得复杂问题简单化的过程(放大数据中的价值，抑制噪声)，深度学习的训练过程就是一系列的几何变换的搜索过程。所谓的搜索过程，就是一开始几何变换的方法是未知的(或者说模型的权重参数是未知的),但是可以通过数据来反推应该如何进行变换，使得经过变换后的数据更加有用。

### 3 分类问题与回归问题

**分类问题预测的是目标的类别，模型的输出是每个类别的概率分布**，比如对于三分类的问题，模型的输出可能是 [0.1,0.1,0.8]，不同的索引对应不同的类别，它的类别就是值最大的那个索引，在前面的例子中，模型给出的结果类别就是索引 [2] 位置对应的类别。

**回归问题预测的是一个值，例如房价等连续变量**。

### 4 神经网络的基本要素

* 输入数据(InputData)：InputData真正决定了任务实现的上限，学术界都是在数据规定好的上限内通过一定的算法逼近上限，工业界由于各家数据不同，上限也各不相等。
* 网络层(Layer)：Layer是神经网络的基本数据结构，它是一个数据处理的模块，数据(一个或者多个Tensor）经过一个Layer转换成一个或者多个Tensor。大部分Layer是有状态的，其状态的表示就是层的权重(weights)，如卷积层，全连接层。少部分层是没有状态的，如池化层。每一层的权重就是通过Loss和Optimizer学习到的"知识"。
* 模型(Model)：Model是一系列Layer连接而成的有向无环图，模型的拓扑结构决定了搜索空间，搜索空间过大会导致很难找到合适的数据表示，搜索空间太小容易导致数据表示的表达效果上限很低。

* 损失函数(Loss):深度学习中的参数是逐步调整的，让预测值逐步逼近真实值，Loss可以帮助衡量模型的好坏，它决定了训练的反馈信号。对于分类问题来说，Loss需要衡量出目标类别与当前预测的差距，例如对于一个三分类问题来说，假设模型输出为 [0.1,0.1,0.8]，真实分类是 2，则需要将 2 通过独热编码(one-hot)变成一个分布 [0,0,1]，这时候就可以计算 [0.1,0.1,0.8]，[0,0,1] 这两个向量的距离。对于回归问题来说，因为预测结果直接就是一个值，因此只需衡量出两个值之间的差距。
* 优化器(Optimizer):Optimizer决定了如何利用反馈信号，即Loss去调整模型。

### 5.明白深度学习擅长的领域

* 什么场景下适合用深度学习？
* 什么场景下适合用机器学习？
* 任务的性质？
* 数据的形态？