# 深度学习框架入门

作者：杨岱川

时间：2019年12月

github：https://github.com/DrDavidS/basic_Machine_Learning

开源协议：[MIT](https://github.com/DrDavidS/basic_Machine_Learning/blob/master/LICENSE)

## 承上启下

在之前的机器学习章节里，我们较为详细地讲述了常用的机器学习算法原理和应用，以及利用 Pandas 和 Scikit-Learn 库，也就是 SKLearn ，直接调用一些封装好的机器学习算法类（class），比如：

- $k$近邻算法：`sklearn.neighbors.KNeighborsClassifier`
- 决策树算法：`sklearn.tree.DecisionTreeClassifier`
- 朴素贝叶斯算法：`sklearn.naive_bayes.GaussianNB`
- 随机森林算法：`sklearn.ensemble.RandomForestClassifier`

等等。

可以说 SKlearn 是一个很优秀、很常用的 Python 机器学习库，其中不仅有各种封装好的机器学习算法，还有很多特征工程处理算法。

在[2.04 特征的统计学检查](https://github.com/DrDavidS/basic_Machine_Learning/blob/master/机器学习基础/2.04%20特征的统计学检查.ipynb)中介绍了相关性系数和数据分布的统计方法，在[2.07 蘑菇分类实践](https://github.com/DrDavidS/basic_Machine_Learning/blob/master/机器学习基础/2.07%20蘑菇分类实践.ipynb)中介绍了**数据探索性分析（Exploratory Data Analysis, EDA）**方法以及数据可视化方法。

此外，针对**特征工程（Feature Engineering）**，我们也在[2.09 数据的编码方法](https://github.com/DrDavidS/basic_Machine_Learning/blob/master/机器学习基础/2.09%20数据的编码方法.ipynb)中简要介绍了特征数据的常见编码方法，比如：

- Label Encoding
- One-Hot Encoding
- 周期特征编码

等。

此外，我们也讨论了部分其他非深度学习的机器学习框架，比如 LightGBM、XGBoost、CatBoost 等，并且详细解读了 XGBoost 算法过程。这些框架在比赛领域和工业界受到了广泛的欢迎，其效果非常优秀且性能也很好，所以应用广泛。

在深度学习领域，当我们需要运用深度学习相关知识和各种神经元，比如各位可能听过的 CNN、RNN 之类的东西，搭建一个自己的神经网络结构的时候，SKLearn 可能就不太够用了（虽然 SKLearn 还是提供了一个很简单的[神经网络模型](https://scikit-learn.org/stable/modules/neural_networks_supervised.html)）。

## 神经网络



下载并安装 TensorFlow 2.0 。将 TensorFlow 载入你的程序：

In [1]:
from __future__ import absolute_import, division, print_function, unicode_literals
import tensorflow as tf

ModuleNotFoundError: No module named 'tensorflow'

载入并准备好 MNIST 数据集。将样本从整数转换为浮点数：

In [2]:
mnist = tf.keras.datasets.mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz


将模型的各层堆叠起来，以搭建 `tf.keras.Sequential` 模型。为训练选择优化器和损失函数：

In [3]:
model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(input_shape=(28, 28)),
  tf.keras.layers.Dense(128, activation='relu'),
  tf.keras.layers.Dropout(0.2),
  tf.keras.layers.Dense(10, activation='softmax')
])

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

训练并验证模型：

In [4]:
model.fit(x_train, y_train, epochs=5)

model.evaluate(x_test,  y_test, verbose=2)

Train on 60000 samples
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
10000/1 - 0s - loss: 0.0354 - accuracy: 0.9773


[0.06881703766956926, 0.9773]