In [1]:
%config IPCompleter.greedy=True

In [2]:
import numpy as np
import tensorflow as tf
from tensorflow import keras
import json
import pprint

# 构建简单的模型

## 序列模型
最常见模型类型是层的堆叠`tf.keras.Sequential`模型，构建简单的全连接网络（即多层感知器）

In [3]:
# 创建模型
mode=keras.Sequential()

## 配置层
使用`tf.keras.layers`方法创建层，重要参数：
- `activation`：设置层的激活函数
- `kernel_initizlizer`和`bias_initializer`：创建层权重的初始化方案
- `kernel_regularizer`和`bias_regularizer`：应用层权重的正则化方案

In [4]:
# 配置层
mode.add(keras.layers.Dense(64,activation='relu'))
mode.add(keras.layers.Dense(64,activation='relu'))
mode.add(keras.layers.Dense(10,activation='softmax'))

`compile`方法配置模型的__学习流程__，三个重要参数
- `optimizer`:此对象指定训练过程
- `loss`:在优化期间最小化的函数
- `metrics`:用于监控训练

In [5]:
# 配置模型的学习流程
# 方式一：
mode.compile(optimizer=tf.train.AdamOptimizer(0.001),
             loss='categorical_crossentropy',
             metrics=['accuracy'])
# # 方法二：
# mode.compile(optimizer=tf.train.RMSPropOptimizer(0.01),
#              loss=tf.keras.losses.categorical_crossentropy,
#              metrics=[tf.keras.metrics.categorical_crossentropy])


In [6]:
def random_data():
    data = np.random.random((1000,32))
    labels=np.random.random((1000,10))
    return data,labels

## 训练
`fit`方法的三个重要参数：
- `epochs`:以周期为单位进行训练
- `batch_size`:当传递np数据时，模型将数据分成较小的批次，并在训练期间迭代这些批次
- `validation_data`:对模型进行原型设计时，需要轻松监控该模型在某些验证数据上达到的效果

### np数据

拟合数据

In [7]:
# 获取np数据
data,labels=random_data()
# 训练模型，使模型与训练数据拟合
mode.fit(data,labels,epochs=10,batch_size=32)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x207148600b8>

拟合数据并进行验证

In [8]:
data,labels=random_data()
vdata,vlabels=random_data()

mode.fit(data,labels,epochs=10,batch_size=32,validation_data=(vdata,vlabels))

Train on 1000 samples, validate on 1000 samples
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x207378708d0>

### 输入数据集

使用dataset数据

In [9]:
dataset=tf.data.Dataset.from_tensor_slices((data,labels))
dataset=dataset.batch(32)
dataset=dataset.repeat()

`fit`方法使用`steps_per_epoch`参数(表示模型在进入下一个周期之前运行的训练步数)。由于`Dataset`会生成批次数据，因此该代码段不需要`batch_size`

拟合数据

In [10]:
mode.fit(dataset,epochs=10,steps_per_epoch=30)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x20737887c18>

使用dataset数据与验证数据

In [11]:
dataset=tf.data.Dataset.from_tensor_slices((data,labels))
dataset=dataset.batch(32).repeat()

vdataset=tf.data.Dataset.from_tensor_slices((data,labels))
vdataset=vdataset.batch(32).repeat()

拟合数据并进行验证

In [12]:
mode.fit(dataset,epochs=10,steps_per_epoch=30,validation_data=vdataset,validation_steps=3)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x20737b46978>

## 评估和预测

### 评估

评估所提供数据的推理模式损失和指标

In [13]:
data,labels=random_data()
# np数据评估
mode.evaluate(data,labels,batch_size=32)
# 数据集评估
mode.evaluate(dataset,steps=30)



[11.324138259887695, 0.2125]

### 预测

在提供数据的推理中预测最后一层的输出

In [14]:
data,_=random_data()
result=mode.predict(data,batch_size=32)
print(result.shape)

(1000, 10)


In [15]:
result[:3]

array([[0.09435935, 0.10380907, 0.1081499 , 0.10928555, 0.11181375,
        0.09394258, 0.09118545, 0.10411217, 0.09785696, 0.08548521],
       [0.10236298, 0.10276906, 0.10694765, 0.10114335, 0.1043352 ,
        0.04990427, 0.10238858, 0.1277579 , 0.11241903, 0.08997203],
       [0.09669232, 0.09915235, 0.11148491, 0.10231792, 0.09097207,
        0.07128315, 0.11085076, 0.1178905 , 0.10544659, 0.09390943]],
      dtype=float32)

# 构建高级模型

## 函数式API
`tf.kerasa.Sequential`模型是层的简单堆叠，无法表示任意模型

用__Keras函数式API__可以构建复杂的模型拓扑，例如：
- 多输入模型
- 多输出模型
- 具有共享层模型（同一层被调用多次）
- 具有非序列数据流的模型（例如，剩余连接）

使用函数式API构建的模型具有以下特征：
- 层实例可调用并返回张量
- 输入张量和输出张量用于定义`tf.keras.Model`实例
- 此模型的训练方式和`Sequential`模型一样

使用函数式API构建简单的全连接网络

In [16]:
inputs=tf.keras.Input(shape=(32,))

# 层实例调用并返回张量
x=keras.layers.Dense(64,activation='relu')(inputs)
x=keras.layers.Dense(64,activation='relu')(x)
predictions = keras.layers.Dense(10,activation='softmax')(x)

在给定输入和输出的情况下实例化模型

In [17]:
model = keras.Model(inputs=inputs,outputs=predictions)

model.compile(optimizer=tf.train.RMSPropOptimizer(0.001),
             loss='categorical_crossentropy',
             metrics=['accuracy'])
model.fit(data,labels,batch_size=32,epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x2072a12d3c8>

## 模型子类化
通过`tf.keras.Model`进行子类化定义自己的__前向传播__来构建自定义的模型
- 在`__init__`方法中创建层
- 在`call`方法中定义前向传播

使用自定义前身传播进行子类化的`tf.keras.Model`：

In [18]:
class MyModel(tf.keras.Model):
    def __init__(self,num_class=10):
        super(MyModel,self).__init__(name='my_model')
        self.num_class=num_class
        self.dense_1=keras.layers.Dense(32,activation='relu')
        self.dense_2=keras.layers.Dense(num_class,activation='sigmoid')
        
    def call(self,inputs):
        '''定义前向传播'''
        x=self.dense_1(inputs)
        return self.dense_2(x)
    
    def compute_output_shape(self,input_shape):
        '''使用子类化的模型，则需要覆盖此函数'''
        shape=tf.TensorShape(input_shape).as_list()
        shape[-1]=self.num_class
        return tf.TensorShape(shape)

实例化新模型类：

In [19]:
# 创建自定义的模型
model = MyModel(10)

# 配置模型的学习流程
model.compile(optimizer=tf.train.AdamOptimizer(0.1),
             loss=tf.keras.losses.categorical_crossentropy,
             metrics=[tf.keras.metrics.categorical_crossentropy])

# 拟合数据
mode.fit(data,labels,batch_size=32,epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x20737b6c390>

## 自定义层
通过`tf.keras.layers.Layer`进行子类化并实现以下方法来创建自定义层：
- `build`：创建层的权重
- `call`：定义前向传播
- `computer_output_shape`：指定在给定输入形状的情况下如何计算层的输出形状
- 可以通过实现`get_config`方法和`from_config`类方法序列化层

使用核矩阵实现输入`matmul`的自定义层示例：

In [20]:
class MyLayer(keras.layers.Layer):
    def __init__(self,output_dim,**kwargs):
        self.output_dim=output_dim
        super(MyLayer,self).__init__(**kwargs)
    
    def build(self,input_shape):
        shape=tf.TensorShape((input_shape[1],self.output_dim))
        
#         为这一层创建一个可训练的权重变量
        self.kernel=self.add_weight(name='kernel',shape=shape,initializer='uniform',trainable=True)
        
#         最后一定要调用这个
        super(MyLayer,self).build(input_shape)
    
    def call(self,inputs):
        return tf.matmul(inputs,self.kernel)
    
    def complete_output_shape(self,input_shape):
        shape=tf.TensorShape(input_shape).as_list()
        shape[-1]=self.output_dim
        return tf.TensorShape(shape)
    
    def get_config(self):
        base_config=super(MyLayer,self).get_config()
        base_config['output_dim']=self.output_dim
        return base_config
    
    @classmethod
    def from_config(cls,config):
        return cls(**config)
    

使用自定义层创建模型：

In [21]:
# 创建序列模型
model=tf.keras.Sequential([MyLayer(10),keras.layers.Activation('softmax')])

# 配置模型的学习流程
model.compile(optimizer=tf.train.RMSPropOptimizer(0.001),
             loss=keras.losses.categorical_crossentropy,
             metrics=[keras.metrics.categorical_accuracy])
# 拟合数据
model.fit(data,labels,batch_size=32,epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x207378864e0>

## 回调
回调是传递给模型的__对象__，用于在训练期间自定义该模型并扩展其行为
- `tf.keras.callbacks.ModelCheckpoint`：定期保存模型的检查点
- `tf.keras.callbacks.LearningRateScheduler`：动态更改学习速率
- `tf.keras.callbacks.EarlyStoppint`：在验证效果不再改进时中断训练
- `tf.keras.callbacks.TensorBoard`：监控模型的行为

In [22]:
callbacks = [
  # Interrupt training if `val_loss` stops improving for over 2 epochs
  tf.keras.callbacks.EarlyStopping(patience=2, monitor='val_loss'),
  # Write TensorBoard logs to `./logs` directory
  tf.keras.callbacks.TensorBoard(log_dir='./logs')
]
model.fit(data, labels, batch_size=32, epochs=5, callbacks=callbacks,
          validation_data=(vdata, vlabels))

Train on 1000 samples, validate on 1000 samples
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x207406e8588>

# 保存和恢复

## 仅保存权重
使用`tf.keras.Model.save_weights`保存并加载模型的权重

### 检查点文件格式保存权重

In [None]:
model.save_weights('./weights/my_model')

In [None]:
model.load_weights('./weights/my_model')

### HDF5格式保存权重

In [None]:
model.save_weights('my_model.h5', save_format='h5')

In [None]:
model.load_weights('my_model.h5')

## 仅保存配置
可保存模型的配置，对模型架构进行序列化

即使没有定义原始模型的代码，该配置也可以重新创建并初始化相同的模型

__子类化模型不可序列化，因为它们的架构由`call`方法中的Python代码定义__

### json格式序列化

In [None]:
json_str=model.to_json()

In [None]:
# 格式化json_str
pprint.pprint(json.loads(json_str))

In [None]:
fresh_model=tf.keras.models.model_from_json(json_str)

### YAML格式序列化

In [None]:
yaml_str=model.to_yaml()

In [None]:
fresh_model=tf.keras.models.model_from_yaml(yaml_str)

## 保存整个模型
将整个模型保存到一个文件中，包括__权重值、模型配置、优化器配置__

便可以设置检查点并稍后从完全相同的状态继续训练，无需访问原始代码