# TensorFlow2教程-使用keras训练模型

本指南包含了TensorFlow 2.0中在以下两种情况下的训练，评估和预测（推理）模型：

+ 使用内置的训练和评估API（例如model.fit()，model.evaluate()，model.predict()）。
+ 使用eager execution 和GradientTape对象从头开始编写自定义循环。

无论是使用内置循环还是编写自己的循环，模型和评估训练在每种Keras模型中严格按照相同的方式工作，无论是Sequential 模型, 函数式 API, 还是模型子类化。



In [1]:
from __future__ import absolute_import, division, print_function
import tensorflow as tf
tf.keras.backend.clear_session()
import tensorflow.keras as keras
import tensorflow.keras.layers as layers

## 1 一般的模型构造、训练、测试流程


使用内置的训练和评估API对模型进行训练和验证。



In [2]:
# 模型构造
inputs = keras.Input(shape=(784,), name='mnist_input')
h1 = layers.Dense(64, activation='relu')(inputs)
h1 = layers.Dense(64, activation='relu')(h1)
outputs = layers.Dense(10, activation='softmax')(h1)
model = keras.Model(inputs, outputs)
# keras.utils.plot_model(model, 'net001.png', show_shapes=True)

model.compile(optimizer=keras.optimizers.RMSprop(),
             loss=keras.losses.SparseCategoricalCrossentropy(),
             metrics=[keras.metrics.SparseCategoricalAccuracy()])

端到端的模型训练。



In [3]:
# 载入数据
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()
x_train = x_train.reshape(60000, 784).astype('float32') /255
x_test = x_test.reshape(10000, 784).astype('float32') /255

# 保证还是float 32？ 否则后面会出现：TypeError: Input 'y' of 'Sub' Op has type float32 that does not match type uint8 of argument 'x'.
y_train = y_train.astype('float32')
y_test = y_test.astype('float32')



# 取验证数据
x_val = x_train[-10000:]
y_val = y_train[-10000:]

x_train = x_train[:-10000]
y_train = y_train[:-10000]

# 训练模型
history = model.fit(x_train, y_train, batch_size=64, epochs=3,
         validation_data=(x_val, y_val))
print('history:')
print(history.history)

result = model.evaluate(x_test, y_test, batch_size=128)
print('evaluate:')
print(result)
pred = model.predict(x_test[:2])
print('predict:')
print(pred)


Epoch 1/3
Epoch 2/3
Epoch 3/3
history:
{'loss': [0.3507663309574127, 0.16772893071174622, 0.1228933036327362], 'sparse_categorical_accuracy': [0.9007200002670288, 0.9501000046730042, 0.9632599949836731], 'val_loss': [0.23867085576057434, 0.13269120454788208, 0.12073920667171478], 'val_sparse_categorical_accuracy': [0.9254000186920166, 0.9611999988555908, 0.9632999897003174]}
evaluate:
[0.12699058651924133, 0.9624000191688538]
predict:
[[4.3372296e-07 9.3322342e-08 1.0640792e-04 4.9457437e-04 1.4726362e-08
  3.0706533e-07 5.5323615e-12 9.9935931e-01 4.2548677e-06 3.4671011e-05]
 [1.2598156e-08 6.5163831e-04 9.9910492e-01 2.1866495e-04 2.6674784e-11
  1.7986398e-05 6.7330387e-07 8.1296031e-10 6.0268731e-06 2.5455263e-10]]


## 2 自定义指标和损失

### 2.1 配置网络

在对模型训练之前，我们需要指定损失函数，优化器以及可选的一些要监控的指标。我们将这些配置参数作为compile()方法的参数传递给模型，对模型进行配置。



In [5]:
model.compile(optimizer=keras.optimizers.RMSprop(learning_rate=1e-3),
             loss=keras.losses.SparseCategoricalCrossentropy(),
             metrics=[keras.metrics.SparseCategoricalAccuracy()])

TensorFlow2提供许多内置的优化器，损失和指标 常见的内置参数如下：

+ 优化器： - SGD()（有或没有动量） - RMSprop() - Adam() -等等。

+ 损失： - MeanSquaredError() - KLDivergence() - CosineSimilarity() -等等。

+ 指标： - AUC() - Precision() - Recall() -等等。

### 2.2 自定义损失


用Keras提供两种方式来提供自定义损失。

+ 一、例创建一个接受输入y_true和的函数y_pred。
+ 二、构建一个继承keras.losser.Loss的子类 下面示例显示了一个损失函数，该函数计算实际数据与预测之间的平均距离：


In [6]:
def get_uncompiled_model():
    inputs=keras.Input(shape=(784,),name='digits')
    x = layers.Dense(64,activation='relu',name='dense_1')(inputs)
    x = layers.Dense(64,activation='relu',name='dense_2')(x)
    outputs=layers.Dense(10,activation='softmax',name='predictions')(x)
    model=keras.Model(inputs=inputs,outputs=outputs)
    return model
model =get_uncompiled_model()

def basic_loss_function(y_true,y_pred):
    return tf.math.reduce_mean(y_true-y_pred)
model.compile(optimizer=keras.optimizers.Adam(),
             loss=basic_loss_function)
model.fit(x_train,y_train,batch_size=64,epochs=3)

Epoch 1/3
Epoch 2/3
Epoch 3/3


<keras.callbacks.History at 0x65a032690>

如果需要试下带参数的损失函数，可以子类化tf.keras.losses.Loss。并子类化以下方法：

+ __init__(self) 接收相关参数，初始化loss之类。
+ call(self, y_true, y_pred) 使用 y_true和y_pred，计算模型损失。

下面例子，展示了WeightedCrossEntropy计算二分损失的损失函数，某个类或整个函数的损失可以通过标量修改。

In [10]:
class WeightBinaryCrossEntropy(keras.losses.Loss):
    def __init__(self,pos_weight,weight,from_logits=False,
                reduction=keras.losses.Reduction.AUTO,
                name='weight_binary_crossentropy'):
        """
        pos_weight: 正类标签权重
        weight: 整体损失权重
        from_logits: 是否使用logits来计算loss，（或使用probability）
        reduction: reduction类型
        name: 名字
        """
        super (WeightBinaryCrossEntropy,self).__init__(reduction=reduction,name=name)
        self.pos_weight=pos_weight
        self.weight=weight
        self.from_logits=from_logits
    def call(self,y_true,y_pred):
        if not self.from_logits:
            x_1 =y_true*self.pos_weight* -tf.math.log(y_pred+1e-6)
            
            x_2 = (1-y_true)* -tf.math.log(1-y_pred+1e-6)
            
            return tf.add(x_1,x_2)*self.weight
        return tf.nn.weighted_cross_entropy_with_logits(y_true,y_pred,self.pos_weight)*self.weight
model.compile(optimizer=keras.optimizers.Adam(),
             loss = WeightBinaryCrossEntropy(0.5,2))
model.fit(x_train,y_train,batch_size=64,epochs=3)
    

Epoch 1/3
Epoch 2/3
Epoch 3/3


<keras.callbacks.History at 0x65cf09ed0>

### 2.3 自定义指标

自定义指标只需继承Metric类， 并重写以下函数：

+ __init__(self)，初始化。

+ update_state(self，y_true，y_pred，sample_weight = None)，它使用目标y_true和模型预测y_pred来更新状态变量。

+ result(self)，它使用状态变量来计算最终结果。

+ reset_states(self)，重新初始化度量的状态。

状态更新和结果计算保持分开（分别在update_state()和result()中），因为在某些情况下，结果计算可能非常昂贵，并且只能定期进行。

In [12]:
# 下面是一个简单的示例，显示如何实现CatgoricalTruePositives指标，该指标计算正确分类为属于给定类的样本数量

class CatgoricalTruePostives(keras.metrics.Metric):
    def __init__(self,name='binary_true_postives',**kwargs):
        super(CatgoricalTruePostives,self).__init__(name=name,**kwargs)
        
         # 会更新的类变量
        self.true_postives=self.add_weight(name='tp',initializer='zeros')
    def update_state(self,y_true,y_pred,sample_weight=None):
        # 获取结果id
        y_pred=tf.argmax(y_pred)
        # 正确的结果
        y_true=tf.equal(tf.cast(y_pred,tf.int32),tf.cast(y_true,tf.int32))
        y_true=tf.cast(y_true,tf.float32)
        
        if sample_weight is not None:
            # 对正确结果加权重
            sample_weight=tf.cast(sample_weight,tf.float32)
            y_true = tf.multiply(sample_weight,y_true)
        # 修改正确样本总量
        return self.true_postives.assign_add(tf.reduce_sum(y_true)) # assign_add：将值加到self.true_postives
    def result(self):
        # 返回相应tensor
        return tf.identity(self.true_postives) # tf.identity：读取 self.true_postives，和assign_add 配对使用
    def reset_states(self):
        # 重置为0
        self.true_postives.assign(0.)
model.compile(optimizer=keras.optimizers.RMSprop(1e-3),
             loss=keras.losses.SparseCategoricalCrossentropy(),
             metrics=[CatgoricalTruePostives()])

model.fit(x_train, y_train,
         batch_size=64, epochs=3)
            
                
#自定义指标类里面一定要有result，update_state,reset_states 三个方法        

Epoch 1/3
Epoch 2/3
142/782 [====>.........................] - ETA: 0s - loss: 0.1943 - binary_true_postives: 1494.0000

  m.reset_state()


Epoch 3/3


<keras.callbacks.History at 0x65cf5c8d0>

使用自定义层的方式获取相关指标



In [14]:
# 也可以以定义网络层的方式添加要统计的metric
class MetricLoggingLayer(layers.Layer):
    def call(self,inputs):
        # 该层的作用就是添加指标
        self.add_metric(keras.backend.std(inputs),
                       name='std_of_activation',
                       aggregation='mean')
        # 直接把输入进行输出
        return inputs
inputs = keras.Input(shape=(784,),name='mnist_input')
h1 = layers.Dense(64,activation='relu')(inputs)

# 直接套在对应的网络层中
h1 = MetricLoggingLayer()(h1)
h1 = layers.Dense(64,activation='relu')(h1)
outputs = layers.Dense(10,activation='softmax')(h1)
model = keras.Model(inputs,outputs)
keras.utils.plot_model(model, 'net001.png', show_shapes=True)
# 配置并训练网络
model.compile(optimizer=keras.optimizers.RMSprop(),
             loss= keras.losses.SparseCategoricalCrossentropy(),
             metrics=[keras.metrics.SparseCategoricalAccuracy()])
model.fit(x_train,y_train,batch_size=32,epochs=3)


        


Epoch 1/3
Epoch 2/3
Epoch 3/3


<keras.callbacks.History at 0x661553990>

我们也可以在构建好模型后直接使用，model.add_loss和model.add_metric添加损失和指标。



In [15]:
inputs=keras.Input(shape=(784,),name='mnist_input')
h1 =layers.Dense(64,activation='relu')(inputs)
h2 = layers.Dense(10,activation='relu')(h1)
outputs = layers.Dense(10,activation='softmax')(h2)
model = keras.Model(inputs,outputs)
# 直接把计算loss或metric用到的输入(h1)带人
model.add_metric(keras.backend.std(h1),
                name='std_of_activation',
                aggregation='mean')
model.add_loss(tf.reduce_sum(h1)*0.1)

model.compile(optimizer=keras.optimizers.RMSprop(),
             loss=keras.losses.SparseCategoricalCrossentropy(),
             metrics=[keras.metrics.SparseCategoricalAccuracy()])
model.fit(x_train,y_train,batch_size=32,epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x6614fc250>

处理使用validation_data传入测试数据，还可以使用validation_split划分验证数据

ps:validation_split只能在用numpy数据训练的情况下使用



In [None]:
model.fit(x_train, y_train, batch_size=32, epochs=1, validation_split=0.2)


## 3 使用tf.data构造数据

到现在我们已经了解了如何使用使用numpy作为输入数据进行训练和验证。下面，我们将介绍如何使用tf.data作为输入数据进行。



In [None]:
def get_compiled_model():
    inputs=keras.Input(shape=(784,),name='mnist_input')
    h1=layers.Dense(64,activation='relu')(inputs)
    h2=layers.Dense(64,activation='relu')(h1)
    outputs=layers.Dense(10,activation='softmax')(h2)
    model=keras.Model(inputs,outputs)
    model.compile(optimizer=keras.optimizers.RMSprop(),
                 loss=keras.losses.SparseCategoricalCrossentropy(),
                 metrics=[keras.metrics.SparseCategoricalAccuracy()])
    return model
model=get_compiled_model()
# 构建dataset实例
train_dataset=tf.data.Dataset.from_tensor_slices((x_train,y_train))
# 打乱
train_dataset=train_dataset.shuffle(buffer_size=1024).batch(64)
# 获得验证数据
val_dataset=tf.data.Dataset.from_tensor_slices((x_val,y_val))
val_dataset=val_dataset.batch(64)

# model.fit(train_dataset, epochs=3)
# steps_per_epoch 每个epoch只训练几步
# validation_steps 每次验证，验证几步

model.fit(train_dataset,epochs=3,steps_per_epoch=100,
         validation_data=val_dataset,validation_steps=3)

如果只想对该数据集中的特定批次进行训练，则可以传递steps_per_epoch参数，即批训练多少步。同样我们可以使用train_dataset.take(), 来获取每批次中训练的数据，其和steps_per_epoc等价。



In [None]:
model = get_compiled_model()

model.fit(train_dataset.take(100), epochs=3)


In [None]:
# 模型测试
test_dataset = tf.data.Dataset.from_tensor_slices((x_test, y_test))
test_dataset = test_dataset.batch(64)

print('\n# Evaluate')
model.evaluate(test_dataset)

其他格式输入数据支持

除了numpy数值和TensorFlow Dataset,还可以用Pandas和python迭代器作为数据输入。 通常小数据推荐使用numpy， 大数据推荐使用TensorFlow Dataset。



In [16]:
model.fit(x_train, y_train, batch_size=32, epochs=1, validation_split=0.2)




<keras.callbacks.History at 0x661bd3f10>

## 3 使用tf.data构造数据

到现在我们已经了解了如何使用使用numpy作为输入数据进行训练和验证。下面，我们将介绍如何使用tf.data作为输入数据进行。



In [19]:
def get_compiled_model():
    inputs=keras.Input(shape=(784,),name='mnist_input')
    h1=layers.Dense(64,activation='relu')(inputs)
    h2=layers.Dense(64,activation='relu')(h1)
    outputs=layers.Dense(10,activation='softmax')(h2)
    model=keras.Model(inputs,outputs)
    model.compile(optimizer=keras.optimizers.RMSprop(),
                 loss=keras.losses.SparseCategoricalCrossentropy(),
                 metrics=[keras.metrics.SparseCategoricalAccuracy()])
    return model
model=get_compiled_model()
# 构建dataset实例
train_dataset=tf.data.Dataset.from_tensor_slices((x_train,y_train))
# 打乱
train_dataset=train_dataset.shuffle(buffer_size=1024).batch(64)
# 获得验证数据
val_dataset=tf.data.Dataset.from_tensor_slices((x_val,y_val))
val_dataset=val_dataset.batch(64)

# model.fit(train_dataset, epochs=3)
# steps_per_epoch 每个epoch只训练几步
# validation_steps 每次验证，验证几步

model.fit(train_dataset,epochs=3,steps_per_epoch=100,
         validation_data=val_dataset,validation_steps=3)

Epoch 1/3
Epoch 2/3
Epoch 3/3


<keras.callbacks.History at 0x65d82db50>

如果只想对该数据集中的特定批次进行训练，则可以传递steps_per_epoch参数，即批训练多少步。同样我们可以使用train_dataset.take(), 来获取每批次中训练的数据，其和steps_per_epoc等价。



In [20]:
model = get_compiled_model()

model.fit(train_dataset.take(100), epochs=3)


Epoch 1/3
Epoch 2/3
Epoch 3/3


<keras.callbacks.History at 0x6614d62d0>

In [21]:
# 模型测试
test_dataset = tf.data.Dataset.from_tensor_slices((x_test, y_test))
test_dataset = test_dataset.batch(64)

print('\n# Evaluate')
model.evaluate(test_dataset)


# Evaluate


[0.2908131778240204, 0.9150000214576721]

其他格式输入数据支持

除了numpy数值和TensorFlow Dataset,还可以用Pandas和python迭代器作为数据输入。 通常小数据推荐使用numpy， 大数据推荐使用TensorFlow Dataset。



## 4 样本权重和类权重


在模型训练时可以，可以人工设定样本权重和类权重。

“样本权重”数组是一个数字数组，用于指定批处理中每个样本在计算总损失时应具有多少权重。 它通常用于不平衡的分类问题（这个想法是为了给予很少见的类更多的权重）。 当使用的权重是1和0时，该数组可以用作损失函数的掩码（完全丢弃某些样本对总损失的贡献）。

“类权重”dict是同一概念的更具体的实例：它将类索引映射到应该用于属于该类的样本的样本权重。 例如，如果类“0”比数据中的类“1”少两倍，则可以使用class_weight = {0：1.，1：0.5}。

添加方法：

+ 使用Numpy数据时： 通过sample_weight和class_weight参数传递。
+ 使用Dataset数据时： 通过使数据集返回(input_batch, target_batch, sample_weight_batch)。
下面是一个Numpy数据中加大第5类的权重的例子。

下面是一个Numpy数据中加大第5类的权重的例子。

In [None]:
# 增加第5类的权重
import numpy as np
# 类权重
model = get_compiled_model()
class_weight={i:1.0 for i in range(10)}
# 第5类的权重为2
