## Tensorflow怎样保存与加载模型

#### 背景：模型训练和预估服务
* 训练模型一般不是目标，在线预估服务才是
* 一般会有一个程序训练模型，训练好之后把模型保存，在线预估加载模型实现服务
* 模型一般包括模型结构、训练好的模型参数两部分组成

#### 保存模型的方法
* 模型结构+参数打包保存和加载
* 模型结构存储到json文件，模型参数保存到h5文件
* 模型结构存储到yaml文件，模型参数保存到h5文件

其实，模型参数甚至也会存储到redis、mysql等，各个web服务可以随意更新加载

In [1]:
import pandas as pd
import tensorflow as tf

### 1. 准备和训练一个模型

#### 读取数据

In [2]:
df = pd.read_csv("./datas/heart/heart.csv")

# 把thal列变成数字编码
df['thal'] = pd.Categorical(df['thal'])
df['thal'] = df['thal'].cat.codes

# 要预测的目标，这是个二分类问题
target = df.pop('target')

#### 构建dataset

In [3]:
# 构建dataset，其实是把pandas数据转换成numpy数组进行转换的
dataset = tf.data.Dataset.from_tensor_slices((df.values, target.values))
# Shuffle and batch the dataset.
train_dataset = dataset.shuffle(len(df)).batch(4)

In [4]:
# 用于一会的测试
for x, y in train_dataset.take(1):
    input_data = x.numpy()
    print(input_data)

[[ 58.    1.    4.  128.  259.    0.    2.  130.    1.    3.    2.    2.
    4. ]
 [ 67.    1.    4.  120.  229.    0.    2.  129.    1.    2.6   2.    2.
    4. ]
 [ 58.    1.    4.  114.  318.    0.    1.  140.    0.    4.4   3.    3.
    2. ]
 [ 46.    0.    4.  138.  243.    0.    2.  152.    1.    0.    2.    0.
    3. ]]


#### 搭建训练模型

In [5]:
model = tf.keras.Sequential([
    tf.keras.layers.Dense(10, input_shape=(df.shape[1],)),
    tf.keras.layers.Dense(10, activation='relu'),
    tf.keras.layers.Dense(1)
])

model.compile(optimizer='adam',
            loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
            metrics=['accuracy'])

model.fit(train_dataset, epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x7f2ce4606c10>

### 方法1：把模型结构和模型参数一起保存

In [19]:
model.save("./models/heart_model_method1.h5")

In [20]:
model_total = tf.keras.models.load_model("./models/heart_model_method1.h5")

In [21]:
# 一个batch
input_data.shape

(4, 13)

In [22]:
model_total.predict(input_data)

array([[-0.9332351],
       [-1.0887525],
       [-2.0446286],
       [-3.007401 ]], dtype=float32)

### 方法2：模型结构保存到json，模型参数保存到h5

In [28]:
# 将模型结构保存到json文件
open("./models/heart_model_json.json", "w").write(model.to_json())

1467

In [29]:
# 将模型参数保存到.h5文件
model.save_weights("./models/heart_model_json.h5")

In [30]:
# 加载模型
model_json = tf.keras.models.model_from_json(open("./models/heart_model_json.json").read())
model_json.load_weights("./models/heart_model_json.h5")

In [31]:
# 注意需要重新编译模型
model_json.compile(optimizer='adam',
            loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
            metrics=['accuracy'])

In [32]:
# 实现预估
model_json.predict(input_data)

array([[-0.9332351],
       [-1.0887525],
       [-2.0446286],
       [-3.007401 ]], dtype=float32)

### 方法3：模型结构保存到yaml，模型参数保存到h5

In [37]:
# 将模型结构保存到yaml文件
open("./models/heart_model_yaml.yaml", "w").write(model.to_yaml())

1869

In [38]:
# 将模型参数保存到.h5文件
model.save_weights("./models/heart_model_yaml.h5")

In [39]:
# 加载模型
model_yaml = tf.keras.models.model_from_yaml(open("./models/heart_model_yaml.yaml").read())
model_yaml.load_weights("./models/heart_model_yaml.h5")

ConstructorError: could not determine a constructor for the tag 'tag:yaml.org,2002:python/object/apply:tensorflow.python.framework.tensor_shape.TensorShape'
  in "<unicode string>", line 4, column 22:
      build_input_shape: !!python/object/apply:tensorflow ... 
                         ^

In [40]:
# 注意需要重新编译模型
model_yaml.compile(optimizer='adam',
            loss=tf.keras.losses.BinaryCrossentropy(from_logits=True),
            metrics=['accuracy'])

NameError: name 'model_yaml' is not defined

In [41]:
# 实现预估
model_yaml.predict(input_data)

NameError: name 'model_yaml' is not defined