## 持久化代码实现
TensorFlow提供了tf.train.Saver()类用于保存和还原神经网络模型。
保存神经网络模型代码如下：

In [5]:
import tensorflow as tf

v1 = tf.Variable(tf.constant(1.0, shape=[1]), name='v1')
v2 = tf.Variable(tf.constant(2.0, shape=[1]), name='v2')

result = v1 + v2

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    # 使用Saver().save函数将模型保存到'../Model/model.ckpt'文件中
    tf.train.Saver().save(sess, '../Model/model.ckpt')

TensorFlow模型一般会保存在后缀为`.ckpt`文件中，在指定目录生成四个文件。这是因为TensorFlow将计算图的结构和参数取值分开保存。<br/>
生成的文件名和作用：<br/>
- `model.ckpt.meta`：保存TensorFlow计算图的结构；<br/>
- `model.ckpt.index`和`model.ckpt.data-***-of-***`：保存TensorFlow中变量的取值；<br/>
- `checkpoint`:保存了一个目录下所有文件列表；<br/>

加载已保存的TensorFlow模型：<br/>

In [9]:
import tensorflow as tf

# 前面已经定义过同名变量，必须清空默认的graph，否则程序报错
tf.reset_default_graph() 
v1 = tf.Variable(tf.constant(1.0, shape=[1]), name='v1')
v2 = tf.Variable(tf.constant(2.0, shape=[1]), name='v2')
result = v1 + v2

with tf.Session() as sess:
    tf.train.Saver().restore(sess, '../Model/model.ckpt')
    print(sess.run(result))

INFO:tensorflow:Restoring parameters from ../Model/model.ckpt
[3.]


加载模型的程序也是先定义TensorFlow的计算图上的所有运算，两段代码唯一不同的是，加载模型的时候不需要重新初始化变量，而是将变量的值通过已保存的模型加载进来。如果不希望重复定义计算图上的运算，那么也可以直接加载已经持久化的图。<br/>

In [17]:
import tensorflow as tf

tf.reset_default_graph()
# 直接加载计算图
saver = tf.train.import_meta_graph('../Model/model.ckpt.meta')
with tf.Session() as sess:
    saver.restore(sess, '../Model/model.ckpt')
    # 通过张量名字获取tensor
    print(sess.run(tf.get_default_graph().get_tensor_by_name('add:0')))

INFO:tensorflow:Restoring parameters from ../Model/model.ckpt
[3.]


上面的程序默认保存和加载了TensorFlow计算图上定义的变量。但有时可能只需要保存或加载部分变量。为了保存和加载部分变量，在声明tf.train.Saver类时可以提供一个列表来指定需要保存或加载的变量。<br/>
除了可以选取需要被加载的变量，tf.train.Saver类支持在保存或加载时给变量重命名。

In [None]:
# 声明的变量的名称与已保存的变量名称不一致
v1 = tf.Variable(tf.constant(1.0, [1]), name='other-v1')
v2 = tf.Variable(tf.constant(2.0, [1]), name='other-v2')
# 如果直接使用Saver函数的话,程序会报错;
# 使用一个字典来重命名变量就可以加载原来模型
# 通过字典将模型保存时的变量名和需要加载的变量关联起来
saver = tf.train.Saver({'v1':v1, 'v2':v2})

TensorFlow通过字典将模型保存时的变量名和需要加载的变量联系起来，目的之一就是方便使用变量的滑动平均值。在TensorFlow中，每个变量的滑动平均值时通过影子变量来维护的，所以要获取变量的滑动平均值实际上就是获取变量的影子变量的取值。如果在加载模型时直接将影子变量映射到变量自身，那么在使用训练好的模型时就不需要再调用函数来获取变量的滑动平均值。这样大大方便滑动平均值的使用。<br/>
保存滑动平均值模型的代码如下：

In [1]:
import tensorflow as tf

tf.reset_default_graph()
v = tf.Variable(0, dtype=tf.float32, name="v")
for variables in tf.global_variables():
    print(variables.name)
    
ema = tf.train.ExponentialMovingAverage(0.99)
maintain_averages_op = ema.apply(tf.global_variables())
for variables in tf.global_variables():
    print(variables.name)

saver = tf.train.Saver()
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    sess.run(tf.assign(v, 10))
    sess.run(maintain_averages_op)
    saver.save(sess, '../Model/EmaModel.ckpt')
    print(sess.run([v, ema.average(v)]))

v:0
v:0
v/ExponentialMovingAverage:0
[10.0, 0.099999905]


通过变量重命名直接读取变量的滑动平均值：

In [2]:
v = tf.Variable(0, dtype=tf.float32, name="v")
# 通过变量重命名将原来变量v的滑动平均值赋值给变量v
saver = tf.train.Saver({"v/ExponentialMovingAverage": v})
with tf.Session() as sess:
    saver.restore(sess, '../Model/EmaModel.ckpt')
    print(sess.run(v))

INFO:tensorflow:Restoring parameters from ../Model/EmaModel.ckpt
0.099999905


为了方便加载时重命名滑动平均变量，tf.train.ExponentialMovingAverage类提供了`variable_to_restore`函数来生成`tf.train.Saver`类所需要的变量重命名字典。<br/>
函数variable_to_restore使用示例：

In [6]:
import tensorflow as tf

tf.reset_default_graph()
v = tf.Variable(0, dtype=tf.float32, name="v")
ema = tf.train.ExponentialMovingAverage(0.99)
# 使用variables_to_restore函数直接生成字典
print(ema.variables_to_restore())
saver = tf.train.Saver(ema.variables_to_restore())
with tf.Session() as sess:
    saver.restore(sess, '../Model/EmaModel.ckpt')
    print(sess.run(v))

{'v/ExponentialMovingAverage': <tf.Variable 'v:0' shape=() dtype=float32_ref>}
INFO:tensorflow:Restoring parameters from ../Model/EmaModel.ckpt
0.099999905


使用tf.train.Saver()会保存TensorFlow程序所需要的全部信息，而且将变量取值和计算图结构分不同的文件存储有时候也不方便。因此，TensorFlow提供了convert_variables_to_constant函数，通过这个函数可以将计算图中的变量及取值通过常量的方式保存，这样整个TensorFlow计算图可以统一存放在一个文件中。<br/>
示例代码<br/>

In [8]:
import tensorflow as tf
from tensorflow.python.framework import graph_util

v1 = tf.Variable(tf.constant(1.0, shape=[1]), name="v1")
v2 = tf.Variable(tf.constant(2.0, shape=[1]), name="v2")
result = v1 + v2

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    # 导出当前计算图GraphDef部分，只需要这部分就可以完成从输入层到输出层的计算过程
    graph_def = tf.get_default_graph().as_graph_def()
    # 将图中的变量及其取值转化为常量，同时将图中不必要节点去掉
    # 最后参数给出了需要保存节点的名称，add节点是上面定义的两个变量相加操作
    output_graph_def = graph_util.convert_variables_to_constants(
        sess, graph_def, ['add'])
    with tf.gfile.GFile('../Model/combined_model.pb', "wb") as f:
        f.write(output_graph_def.SerializeToString())

INFO:tensorflow:Froze 2 variables.
INFO:tensorflow:Converted 2 variables to const ops.


通过以下程序可以直接计算定义的加法运算的结果，当只需要取得计算图中某个节点的取值时，这提供了一个更加方便的方法。

In [9]:
import tensorflow as tf
from tensorflow.python.platform import gfile

with tf.Session() as sess:
    model_filename = "../Model/combined_model.pb"
    # 读取保存的模型文件，并将文件解析成对应的GraphDef Protocol Buffer
    with gfile.FastGFile(model_filename, 'rb') as f:
        graph_def = tf.GraphDef()
        graph_def.ParseFromString(f.read())
    # 将graph_def中保存的图加载到当前图中，在加载时候给出张量的名称
    result = tf.import_graph_def(graph_def, return_elements=["add:0"])
    print(sess.run(result))

[array([3.], dtype=float32)]


## 持久化原理和数据格式
TensorFlow是一个通过图的形式来表达计算的编程系统,TensorFlow程序中的所有计算都会被表达为计算图上的节点。TensorFlow通过元图(MetaGraph)来记录计算图中节点的信息以及计算图中节点所需要的元数据。TensorFlow中元图是由MetaGraphDef Procotol Buffer定义。<br/>
![image.png](attachment:image.png)

`model.ckpt.index`和`model.ckpt.data-**-of-**`文件保存了所有变量的取值。其中`model.ckpt.data`通过SSTable格式存储，简单理解就是一个(key, value)列表。<br/>
TensorFlow提供了`tf.train.NewCheckpointReader`类来查看保存的变量信息。<br/>

In [18]:
import tensorflow as tf

# tf.train.NewCheckpointReader可以读取checkpoint文件中保存的所有变量
reader = tf.train.NewCheckpointReader('../Model/model.ckpt')
# 获取所有变量列表
global_variables = reader.get_variable_to_shape_map()
for variable_name in global_variables:
    # 变量名称
    print(variable_name)
    # 变量维度
    print(global_variables[variable_name])
# 获取名称v1的变量的取值
print('value for variable v1 is ', reader.get_tensor("v1"))

v2_2
[1]
v2_1
[1]
v1
[1]
v1_1
[1]
v1_3
[1]
v1_2
[1]
v2_3
[1]
v2
[1]
value for variable v1 is  [1.]


`checkpoint`这个文件是`tf.save.Saver`自动生成且维护。在checkpoint文件中维护了由一个`tf.save.Saver`持久化的所有TensorFlow模型文件的文件名。当某个保存的TensorFlow模型文件被删除时，这个模型对应的文件名也会从checkpoint文件中删除。checkpoint中内容格式为`CheckpointState Protocol Buffer`：
```
message CheckpointState {
    # 保存最新的TensorFlow模型文件的文件名
    string model_checkpoint_path = 1;
    # 列出当前还没被删除的所有TensorFlow模型文件的文件名
    repeated string all_model_checkpoint_paths = 2;
}
```