# 转成 tflite 格式

模型训练好了之后要实际应用。对于模型部署有很多成熟的方案，服务器端有 Nvidia 的 TensorRT， Intel 的 OpenVINO 等。移动端也有各种不同的选择，这里仅仅使用 TensorFlow官方的 TfLite做演示。


In [1]:
import os

import tensorflow as tf

import numpy as np

首先还是模型的定义，因为我们要使用模型，那么首先要知道模型是什么样子的。这里直接将训练中使用的模型代码拿来即可。

In [2]:
class MyModel(tf.keras.Model):
    def __init__(self):
        super(MyModel, self).__init__()
        # 模型有两个主要部分，特征提取层和分类器

        # 这里是特征提取层
        self.feature = tf.keras.models.Sequential()
        self.feature.add(self.conv(64))
        self.feature.add(self.conv(64, add_pooling=True))

        self.feature.add(self.conv(128))
        self.feature.add(self.conv(128, add_pooling=True))

        self.feature.add(self.conv(256))
        self.feature.add(self.conv(256))
        self.feature.add(self.conv(256, add_pooling=True))

        self.feature.add(self.conv(512))
        self.feature.add(self.conv(512))
        self.feature.add(self.conv(512, add_pooling=True))

        self.feature.add(self.conv(512))
        self.feature.add(self.conv(512))
        self.feature.add(self.conv(512, add_pooling=True))

        self.feature.add(tf.keras.layers.GlobalAveragePooling2D())

        self.feature.add(tf.keras.layers.Dense(4096, activation="relu"))
        self.feature.add(tf.keras.layers.BatchNormalization())
        self.feature.add(tf.keras.layers.Dense(4096, activation="relu"))
        self.feature.add(tf.keras.layers.BatchNormalization())

        self.feature.add(tf.keras.layers.Dropout(0.5))

        # 这个简单的机构是分类器
        self.pred = tf.keras.layers.Dense(100)

    def conv(self, filters, add_pooling=False):
        # 模型大量使用重复模块构建，
        # 这里将重复模块提取出来，简化模型构建过程
        model = tf.keras.models.Sequential(
            [
                tf.keras.layers.Conv2D(filters, 3, padding="same", activation="relu"),
                tf.keras.layers.BatchNormalization(),
            ]
        )
        if add_pooling:
            model.add(
                tf.keras.layers.MaxPool2D(
                    pool_size=(2, 2), strides=None, padding="same"
                )
            )
        return model

    def call(self, x):
        # call 用来定义模型各个结构之间的运算关系

        x = self.feature(x)
        return tf.nn.softmax(self.pred(x))

需要注意上面模型定义里面， call 的最后，输出 pred 之前，多加了一个 softmax 。这是因为原始模型输出的是未经 softmax 激活的 logits，虽然大小可以判断，但不具备可读性。在服务器端可以很方便的使用 python 或其他语言的 api 转换为 概率模式，但是这里在 tflite 中，我们需要提前做一步转换。

不用担心这里的一个操作会导致什么错误，因为 softmax 本质只是一个操作，没有新引入的变量，所以模型结构虽然有了变化，但是之前训练用的 ckpt 这里还是可以成功加载。

有了模型的定义之后，我们可以加载训练好的模型，跟模型训练的时候类似，我们可以直接加载模型训练中的 checkpoint。

In [3]:
model = MyModel()
ckpt = tf.train.get_checkpoint_state(".")
if ckpt:
    model.load_weights(ckpt.model_checkpoint_path)
    print("model lodaded")

model lodaded


另外 tflite converter 转换模型的时候，需要提前知道模型的输入输出尺寸，而我们这里只是加载了模型，还没有做过运算，模型输入输出尺寸无从得知，因此下面要进行一步运算，使用一个随手生成的数据。

In [4]:
model(np.ones([1,128,128,3]))



To change all layers to have dtype float64 by default, call `tf.keras.backend.set_floatx('float64')`. To change just this layer, pass dtype='float64' to the layer constructor. If you are the author of this layer, you can disable autocasting by passing autocast=False to the base Layer constructor.



<tf.Tensor: shape=(1, 100), dtype=float32, numpy=
array([[6.97592739e-03, 3.50881674e-05, 2.99538297e-05, 9.69473086e-03,
        3.26752067e-02, 3.38254467e-05, 4.28270176e-03, 7.65197736e-04,
        1.38145303e-02, 4.08006570e-04, 9.17119253e-03, 2.54529703e-04,
        8.80055968e-03, 2.19247136e-02, 1.69239156e-02, 5.20564441e-04,
        3.75563162e-04, 6.06878370e-04, 6.36276382e-04, 2.92343990e-04,
        1.59879904e-02, 1.20332901e-04, 2.19296475e-04, 6.52071601e-03,
        7.25438772e-03, 3.08928802e-03, 6.33171108e-03, 7.33097717e-02,
        2.71364674e-03, 1.47544459e-04, 2.18871821e-04, 1.30667789e-02,
        8.32068981e-05, 1.33725349e-02, 3.60220962e-04, 6.36282144e-04,
        1.49801731e-01, 4.53493092e-03, 6.90849358e-03, 2.50804285e-03,
        2.28558830e-03, 2.93506833e-04, 2.17173016e-04, 6.17122687e-02,
        4.72656591e-03, 8.37453044e-05, 5.78573830e-02, 9.84658371e-04,
        2.13809806e-04, 4.66867127e-02, 1.56987342e-03, 4.50606551e-03,
        8.1136

根据官方文档，tflite converter可以接受 3 种不同形式的输入，这里使用其中一种。

In [5]:
tf.saved_model.save(model, "vgg")

Instructions for updating:
If using Keras pass *_constraint arguments to layers.
INFO:tensorflow:Assets written to: vgg/assets


之后直接调用 tflite converter 进行转换就可以了，当然转换过程中也可以做一些优化操作，包括量化等等，具体参考官方文档即可。

In [2]:
converter = tf.lite.TFLiteConverter.from_saved_model("vgg")
tflite_model = converter.convert()

with open("converted_model.tflite", "wb") as of:
    of.write(tflite_model)

生成的模型就可以拿到官方的 tflite demo apk 里面使用了。

> 不过还有些地方需要注意，官方的 apk 对于输入的图像做了 90 度旋转，但是旋转的方向错了，导致我们这里的模型需要把手机倒立才能正确识别。
> 另外，这里的模型训练的时候，输入数据做了处理，所以 apk 里面 输入后