# 深度学习-6 如何使用训练好的模型

## 前言

原作者：养薛定谔的猫
链接：https://www.jianshu.com/p/77e89a1652b8
著作权归原作者所有

本人只用于自己学习，侵删

在使用Keras编程的时候，我们往往会将更多的精力放在如何解决实际的问题上面。由于Keras高层封装的好处，大部分低级的错误都被避免了，对学习来说减少了大量调试找错的时间。
那么在前面几篇文章里面，我们讲了如何使用Keras实现一个卷积网络的模型，并且通过TensorBoard来可视化模型训练过程，从而进行对模型的优化工作。那么现在则是时候将我们训练好的模型投入使用了。

## 保存模型

在Keras中，训练好的模型可以通过```model.save```来将这个模型保存下来。
在程序的最后加入如下代码来将模型保存下来：

再次运行程序，在程序文件所在的文件夹下可以发现出现了一个新的名为64x3-CNN.model的文件。这个文件也就是我们训练的模型的文件，该文件内保存着模型的结构和所有参数的具体数据。如果模型越复杂，那么文件的大小也会越大。

In [5]:
import time
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout, Activation, Flatten, Conv2D, MaxPooling2D
import pickle
from tensorflow.keras.callbacks import TensorBoard

X = pickle.load(open("X.pickle","rb"))
y = pickle.load(open("y.pickle","rb"))

# normalize data image in grayscale is from 0-255
X = X/255.0

# train multiple models
dense_layer = 0
layer_size = 32
conv_layers = 3


model_name = "{}-conv-{}-nodes-{}-dense-{}".format(conv_layers, layer_size, dense_layer, int(time.time()))
tensorboard = TensorBoard(log_dir='logs/{}'.format(model_name))
print(model_name)
model = Sequential()

model.add(Conv2D(layer_size, (3, 3), input_shape = X.shape[1:]))
model.add(Activation("relu"))
model.add(MaxPooling2D(pool_size=(2,2)))

for l in range(conv_layers-1):
    model.add(Conv2D(layer_size, (3, 3)))
    model.add(Activation("relu"))
    model.add(MaxPooling2D(pool_size=(2,2)))

model.add(Flatten()) #Conv Layer是2D， DenseLayer是1D的 所以需要将ConvLayer压平

model.add(Dense(1))
model.add(Activation("sigmoid"))

model.compile(loss="binary_crossentropy", optimizer="adam", metrics=["accuracy"]) # 可以使用categorical_crossentropy作为损失函数

model.fit(X, y, batch_size =32, epochs=20, validation_split=0.1, callbacks=[tensorboard])
model.save('64x3-CNN.model')


3-conv-32-nodes-0-dense-1554815979
Instructions for updating:
Colocations handled automatically by placer.
Train on 22451 samples, validate on 2495 samples
Instructions for updating:
Use tf.cast instead.
Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


## 使用保存下来的模型进行分类

我们编写的模型是用来对猫和狗进行分类的CNN模型，且保存在了64x3-CNN.model文件内。
为了使用这个模型来实现分类，则需要再新建一个Python文件(或者是Jupyter Notebook)。为了实现分类功能，模型的新的输入的图片应该是在数据集内没有存在过的。
这里选择了网络上搜集到的猫和狗的照片,选用的分辨率比较低。

![image.png](attachment:image.png)

![image.png](attachment:image.png)

使用已有的模型预测的思路如下：首先是加载现有的待预测的图片，为了能让我们的卷积网络将已有的图片作为输入，需要将图片大小转换为前面定义的大小。然后通过keras.models.load_model将训练好且保存下来的模型加载，最后通过model.predict来进行预测。
因此，根据上面思路所编写的代码如下：

In [6]:
import cv2
import tensorflow as tf

categories = ['Dog', 'Cat']


def prepare(path):
    img_size = 50
    img_array = cv2.imread(path, cv2.IMREAD_GRAYSCALE)
    new_array = cv2.resize(img_array, (img_size, img_size))
    return new_array.reshape(-1, img_size, img_size, 1)


model = tf.keras.models.load_model('64x3-CNN.model')

prediction = model.predict([prepare('dog.png')])

print(prediction)

[[0.]]


通过运行之后，得到的输出为：
[[0.]]

也就是说，预测的结果是0，狗。同理，加载了猫的图片后，预测的结果是1，也就是猫。

In [8]:
prediction = model.predict([prepare('cat.png')])

print(prediction)

[[1.]]


将输出转换为字符串形式的分类。

In [9]:
prediction = model.predict([prepare('cat.png')])
print(categories[int(prediction[0][0])])

Cat


## 后记

至此，使用Keras编写CNN网络的教程已经结束了。
按照上一讲中模型训练的结果，准确率大概为80%，大家可以试着实现其他的卷积网络，来提高准确性。并且在更大的，类别更多的数据集上实现分类。