首先我们导入一些必要的库
- cifar10: Keras库中包含的一个方便我们加载CIFAR-10数据集的类
- VGG16: Keras中可以直接加载的VGG16模型
- preprocess_input: VGG16的输入预处理函数
- Model: Keras的模型类
- numpy: Python中用于处理各种数值计算的库

In [1]:
# 如果没有安装 keras 和 tensorflow 库
# 请使用 pip install keras tensorflow 安装
import keras
from keras.datasets import cifar10
from keras.applications.vgg16 import VGG16, preprocess_input
from keras.models import Model
import numpy as np

Using TensorFlow backend.


载入CIFAR-10数据集并进行预处理，Keras为每个预定义的模型提供了一个preprocess_input方法，用于对输入进行预处理，可以理解为替代了我们之前的将每个数字除以255的操作。

In [2]:
(x_train, y_train), (x_test, y_test) = cifar10.load_data()
x_train = preprocess_input(x_train)
x_test = preprocess_input(x_test)
y_train = keras.utils.to_categorical(y_train)
y_test = keras.utils.to_categorical(y_test)

Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz


加载VGG16模型，并指定一些参数。
- weights=None：使用随机初始化的权重
- input_shape=(32, 32, 3)：指定输入数据的大小为32\*32\*3
- classes=10：指定类别的数量，CIFAR-10中一共有10类物体

In [3]:
model = VGG16(weights=None, input_shape=(32, 32, 3), classes=10)

我们使用随机梯度下降sgd优化器，定义损失函数为交叉熵，并使用准确度作为度量。

In [4]:
model.compile(optimizer="sgd", loss="categorical_crossentropy", metrics=["accuracy"])

使用fit函数，训练模型。由于VGG16模型比较大，参数较多，训练会花较多时间。

In [5]:
model.fit(x_train, y_train, batch_size=256, epochs=50, validation_data=(x_test, y_test))

Train on 50000 samples, validate on 10000 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
...
Epoch 50/50


<keras.callbacks.History at 0x7fcdf84d9c18>

50轮训练完成！可以看到我们使用预定义的VGG16架构，使用非常少的代码在CIFAR-10数据集上获得了72%的准确率。这个准确率并没有发挥出VGG16架构的全部实力，原因是VGG16架构是为更复杂的Imagenet数据集设计的，相比CIFAR-10数据集，Imagenet的种类更多，图片分辨率也更大。可以说使用VGG16对CIFAR-10分类有种杀鸡用牛刀的味道。另外，如果我们使用更多先进的技巧，比如之前提到的图像增强，准确率会进一步提升。