## 模型的保存
使用SaveModel即可导出tensorflow程序的完整信息。  
相比与checkpoint只导出对应的参数举证， SaveModel在保留参数矩阵的同时，还保留了了计算图  
当模型导出为SaveModel文件时，无需模型的源代码即可再次运行模型   
这种特性使SaveModel尤其适用于模型的分享和部署。

Keras模型均可方便的导出为SaveModel格式。  
需要注意的是，因为SaveModel基于计算图，所以对于使用继承tf.keras.Model类建立的模型，其需要导出到SavedModel格式的方法（如call）都需要使用@tf.function来进行修饰.

```python
    tf.saved_model.save(model,"目录")
    tf.saved_model.load("目录")
```

对于使用继承tf.keras.Model类建立的Keras模型model, 使用SavedModel载入后无法使用model()进行推断，需要使用model.call()

## 服务端模型部署 Tensorflow Serving
模型训练完成后，需要将模型在生产环境中部署  
在不考虑高并发和性能，使用Flask等Python下的web框架即可轻松实现服务器API  
生产环境下，Tensorflow提供了Tensorflow Serving 来灵活且高性能的部署机器学习模型  

使用以下命令即可部署  
tensorflow_model_server \  
    -- reset_api_port=端口号 \  
    -- model_name=模型名 \  
    -- model_base_path="SavedModel格式模型的文件夹绝对地址（不含版本号）"

tensorflow serving 支持 gRPC和RESTful API 调用

## 移动端模型部署 Tensorflow Lite
tensorflow Lite是tensorflow在移动和IOT等边缘设备端的解决方案，提供了Java、Python和C++ API库  
目前TF lite 只提供了推理功能，在服务端进行训练后，经过简单处理即可部署到边缘设备上   

- 模型转换 
- 边缘设备部署  

### 模型转换
转换工具有两种： 命令行工具、 Python API    
TF2.0 推荐使用python API ， 命令行工具只提供了基本的转化功能  
转换后的原模型为FlatBuffers 格式。     
FlatBuffers 原来是 google 为了高性能场景创建的序列化库，相比 protocol Buffer 有更高的性能和更小的大小  

转换方式有两种： Float格式 和 Quantized 格式

命令行  
    tflite_convert(终端执行)  
    -- saved_model_dir=『原模型目录』 \  
    -- output_file="输出模型目录"

## Tensorflow in JavaScript(tensorflow的JS版本) 
在浏览器中使用tensorflow.js  
使用本地资源来进行机器学习运算  

相比与服务器端来讲的优点：  
- 不用安装软件或驱动
- 通过浏览器进行更加方便的人机交互
- 通过手机浏览器调用手机硬件的各种传感器 
- 用户数据无需上传服务器，在本地即可完成所需操作  

浏览器引入：  
```html
<script src="http://unpkg.com/@tensorflow/tfjs/dist/tf.min.js"></script>
```

tf.js不仅支持模型的推理，还支持模型的训练