# TensorFlow2教程-使用keras训练模型

本指南包含了TensorFlow 2.0中在以下两种情况下的训练，评估和预测（推理）模型：

+ 使用内置的训练和评估API（例如model.fit()，model.evaluate()，model.predict()）。
+ 使用eager execution 和GradientTape对象从头开始编写自定义循环。

无论是使用内置循环还是编写自己的循环，模型和评估训练在每种Keras模型中严格按照相同的方式工作，无论是Sequential 模型, 函数式 API, 还是模型子类化。



In [1]:
from __future__ import absolute_import, division, print_function
import tensorflow as tf
tf.keras.backend.clear_session()
import tensorflow.keras as keras
import tensorflow.keras.layers as layers

## 1 一般的模型构造、训练、测试流程


使用内置的训练和评估API对模型进行训练和验证。



In [2]:
# 模型构造
inputs = keras.Input(shape=(784,), name='mnist_input')
h1 = layers.Dense(64, activation='relu')(inputs)
h1 = layers.Dense(64, activation='relu')(h1)
outputs = layers.Dense(10, activation='softmax')(h1)
model = keras.Model(inputs, outputs)
# keras.utils.plot_model(model, 'net001.png', show_shapes=True)

model.compile(optimizer=keras.optimizers.RMSprop(),
             loss=keras.losses.SparseCategoricalCrossentropy(),
             metrics=[keras.metrics.SparseCategoricalAccuracy()])

端到端的模型训练。



In [3]:
# 载入数据
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()
x_train = x_train.reshape(60000, 784).astype('float32') /255
x_test = x_test.reshape(10000, 784).astype('float32') /255

# 保证还是float 32？ 否则后面会出现：TypeError: Input 'y' of 'Sub' Op has type float32 that does not match type uint8 of argument 'x'.
y_train = y_train.astype('float32')
y_test = y_test.astype('float32')



# 取验证数据
x_val = x_train[-10000:]
y_val = y_train[-10000:]

x_train = x_train[:-10000]
y_train = y_train[:-10000]

# 训练模型
history = model.fit(x_train, y_train, batch_size=64, epochs=3,
         validation_data=(x_val, y_val))
print('history:')
print(history.history)

result = model.evaluate(x_test, y_test, batch_size=128)
print('evaluate:')
print(result)
pred = model.predict(x_test[:2])
print('predict:')
print(pred)


Epoch 1/3
Epoch 2/3
Epoch 3/3
history:
{'loss': [0.3507663309574127, 0.16772893071174622, 0.1228933036327362], 'sparse_categorical_accuracy': [0.9007200002670288, 0.9501000046730042, 0.9632599949836731], 'val_loss': [0.23867085576057434, 0.13269120454788208, 0.12073920667171478], 'val_sparse_categorical_accuracy': [0.9254000186920166, 0.9611999988555908, 0.9632999897003174]}
evaluate:
[0.12699058651924133, 0.9624000191688538]
predict:
[[4.3372296e-07 9.3322342e-08 1.0640792e-04 4.9457437e-04 1.4726362e-08
  3.0706533e-07 5.5323615e-12 9.9935931e-01 4.2548677e-06 3.4671011e-05]
 [1.2598156e-08 6.5163831e-04 9.9910492e-01 2.1866495e-04 2.6674784e-11
  1.7986398e-05 6.7330387e-07 8.1296031e-10 6.0268731e-06 2.5455263e-10]]


## 2 自定义指标和损失

### 2.1 配置网络

在对模型训练之前，我们需要指定损失函数，优化器以及可选的一些要监控的指标。我们将这些配置参数作为compile()方法的参数传递给模型，对模型进行配置。



In [5]:
model.compile(optimizer=keras.optimizers.RMSprop(learning_rate=1e-3),
             loss=keras.losses.SparseCategoricalCrossentropy(),
             metrics=[keras.metrics.SparseCategoricalAccuracy()])

TensorFlow2提供许多内置的优化器，损失和指标 常见的内置参数如下：

+ 优化器： - SGD()（有或没有动量） - RMSprop() - Adam() -等等。

+ 损失： - MeanSquaredError() - KLDivergence() - CosineSimilarity() -等等。

+ 指标： - AUC() - Precision() - Recall() -等等。

### 2.2 自定义损失


用Keras提供两种方式来提供自定义损失。

+ 一、例创建一个接受输入y_true和的函数y_pred。
+ 二、构建一个继承keras.losser.Loss的子类 下面示例显示了一个损失函数，该函数计算实际数据与预测之间的平均距离：


In [6]:
def get_uncompiled_model():
    inputs=keras.Input(shape=(784,),name='digits')
    x = layers.Dense(64,activation='relu',name='dense_1')(inputs)
    x = layers.Dense(64,activation='relu',name='dense_2')(x)
    outputs=layers.Dense(10,activation='softmax',name='predictions')(x)
    model=keras.Model(inputs=inputs,outputs=outputs)
    return model
model =get_uncompiled_model()

def basic_loss_function(y_true,y_pred):
    return tf.math.reduce_mean(y_true-y_pred)
model.compile(optimizer=keras.optimizers.Adam(),
             loss=basic_loss_function)
model.fit(x_train,y_train,batch_size=64,epochs=3)

Epoch 1/3
Epoch 2/3
Epoch 3/3


<keras.callbacks.History at 0x65a032690>

如果需要试下带参数的损失函数，可以子类化tf.keras.losses.Loss。并子类化以下方法：

+ __init__(self) 接收相关参数，初始化loss之类。
+ call(self, y_true, y_pred) 使用 y_true和y_pred，计算模型损失。

下面例子，展示了WeightedCrossEntropy计算二分损失的损失函数，某个类或整个函数的损失可以通过标量修改。

In [10]:
class WeightBinaryCrossEntropy(keras.losses.Loss):
    def __init__(self,pos_weight,weight,from_logits=False,
                reduction=keras.losses.Reduction.AUTO,
                name='weight_binary_crossentropy'):
        """
        pos_weight: 正类标签权重
        weight: 整体损失权重
        from_logits: 是否使用logits来计算loss，（或使用probability）
        reduction: reduction类型
        name: 名字
        """
        super (WeightBinaryCrossEntropy,self).__init__(reduction=reduction,name=name)
        self.pos_weight=pos_weight
        self.weight=weight
        self.from_logits=from_logits
    def call(self,y_true,y_pred):
        if not self.from_logits:
            x_1 =y_true*self.pos_weight* -tf.math.log(y_pred+1e-6)
            
            x_2 = (1-y_true)* -tf.math.log(1-y_pred+1e-6)
            
            return tf.add(x_1,x_2)*self.weight
        return tf.nn.weighted_cross_entropy_with_logits(y_true,y_pred,self.pos_weight)*self.weight
model.compile(optimizer=keras.optimizers.Adam(),
             loss = WeightBinaryCrossEntropy(0.5,2))
model.fit(x_train,y_train,batch_size=64,epochs=3)
    

Epoch 1/3
Epoch 2/3
Epoch 3/3


<keras.callbacks.History at 0x65cf09ed0>