# 使用 CNN 提高 Fashion 分类器的性能

在前面的课程中，你已经在 Fashion 数据集上使用了三层（输入层、隐藏层、输出层）的深度神经网络（DNN）。你也探究了不同大小的隐藏层、epoch 次数等对准确率的影响。

我们先来复习一下代码。

In [1]:
import tensorflow as tf

tf.config.list_physical_devices(device_type = None)

[PhysicalDevice(name='/physical_device:CPU:0', device_type='CPU')]

你的训练准确率可能是89%，测试准确率可能是87%。这成绩不错了，但是它还有优化空间，你如何把它变得更好？

我们接下来将使用 卷积神经网络（CNN） 来提高分类器的性能。

运行以下 cell 的代码，这比之前的神经网络多了卷积层。程序运行将需要更长的时间，我们来看看准确率如何？

## 构建卷积

- 原始图片和卷积核(filter)

![](https://miro.medium.com/max/661/1*4yv0yIH0nVhSOv3AkLUIiw.png)

- 使用矩阵乘法后，得到卷积特征(convolved feature)

![](https://miro.medium.com/max/429/1*MrGSULUtkXc0Ou07QouV8A.gif)

- 使用很多个卷积核进行卷积

![](https://miro.medium.com/max/558/1*uJpkfkm2Lr72mJtRaqoKZg.png)

- padding

![](https://miro.medium.com/max/963/1*SmiydxM5lbTjoKWYPiuzWQ.png)

### 步骤1--构建数据
这里的代码和你之前的学过的不太一样，多了一步 reshape，用来调整训练数据的形状。这是因为第一个卷积需要一个包含所有内容的张量。因此这个张量的shape是（60000，28，28，1）。测试图像也是同理。如果不这样做，在训练时会出现 Shape mismatch 的错误。

### 步骤2--搭建模型

你需要了解卷积层的几个参数：
1. 第一层卷积的输入的形状。在这个例子中，输入形状是（28，28，1）
2. 生成的卷积数。这个由你决定，但最好从32开始
3. 过滤器（卷积核）的大小。在这个例子中，过滤器是3x3
4. 激活函数。在这个例子中，激活函数使用的是 relu

**为什么要进行池化呢？**

卷积和池化层的代码为：

另一个卷积池化:

接下来，将上层输出的结构 flatten, 成为全连接层的输入:

全连接层：

编译、训练、计算损失:

根据上个 cell 的输出结果，模型在训练集和测试集的准确率分别上升到 93%和90%。这说明加入卷积层是有效果的！\
我们可以修改 epoch 次数，来看一下运行结果。

根据上个 cell 的运行结果可以看到，虽然训练集的准确率非常高，但是测试集的准确率却下降了。这也是“过度拟合”的原因，“过度拟合”将在后面章节讨论。

## 可视化卷积和池化

打印 (test_labels[:100]) 。输出是测试集中的前 100 个标签，你可以看到索引0、索引23和索引28处的标签都是相同的值 (9)。

### 练习

1. 尝试修改卷积层。 将输出的卷积数更改为16或128。这会对准确性和/或训练时间产生什么影响？

2. 删除最后的卷积层和池化层，这会对准确性和/或训练时间产生什么影响？

3. 添加更多卷积怎么样？您认为这会产生什么影响？