# 像numpy一样使用Tensorflow
## 张量和操作
- 可以使用tf.constant1()操作创建张量。

In [1]:
# 两行三列浮点数矩阵的张量
import tensorflow as tf
tf.constant([[1.,2.,3.],[4.,5.,6.]])

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[1., 2., 3.],
       [4., 5., 6.]], dtype=float32)>

In [2]:
# 标量
tf.constant(42)

<tf.Tensor: shape=(), dtype=int32, numpy=42>

就像ndarray一样tf.Tensor具有形状和数据类型

In [3]:
t=tf.constant([[1.,2.,3.],[4.,5.,6.]])
t.shape

TensorShape([2, 3])

In [4]:
t.dtype

tf.float32

索引的工作方式非常像numpy。

In [5]:
t[:,1:]

<tf.Tensor: shape=(2, 2), dtype=float32, numpy=
array([[2., 3.],
       [5., 6.]], dtype=float32)>

最重要的是可以使用各种张量操作

In [6]:
t+10

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[11., 12., 13.],
       [14., 15., 16.]], dtype=float32)>

In [7]:
tf.square(t)

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[ 1.,  4.,  9.],
       [16., 25., 36.]], dtype=float32)>

In [8]:
t@tf.transpose(t)

<tf.Tensor: shape=(2, 2), dtype=float32, numpy=
array([[14., 32.],
       [32., 77.]], dtype=float32)>

## 张量和numpy
张量可以与NumPy配合使用:你可以用numpy数组创建张量，反之亦然。你甚至可以将Tensorflow操作应用于Numpy数组，将numpy操作应用于张量。

In [9]:
import numpy as np
a=np.array([2.,4.,5.])

In [10]:
tf.constant(a)

<tf.Tensor: shape=(3,), dtype=float64, numpy=array([2., 4., 5.])>

In [11]:
t.numpy()

array([[1., 2., 3.],
       [4., 5., 6.]], dtype=float32)

In [12]:
tf.square(a)

<tf.Tensor: shape=(3,), dtype=float64, numpy=array([ 4., 16., 25.])>

In [13]:
np.square(t)

array([[ 1.,  4.,  9.],
       [16., 25., 36.]], dtype=float32)

注意默认情况下numpy使用64位精度，而TensorFlow使用32位精度。因此当你从numpy数组创建张量时，请确保设置dtype=tf.float32。

## 类型转换
Tensorflow不会自动执行任何类型转换，如果你对不兼容类型的张量操作，会引发异常。

In [14]:
# 进行类型转换
t2=tf.constant(40.,dtype=tf.float64)

In [15]:
tf.constant(2.0)+tf.cast(t2,tf.float32)

<tf.Tensor: shape=(), dtype=float32, numpy=42.0>

## 变量
到目前为止，我们看到的tf.Tensor值是不变的，无法修改它们。我们需要的是题tf.Variable

In [16]:
v=tf.Variable([[1.,2.,3.],[4.,5.,6.]])

In [17]:
v

<tf.Variable 'Variable:0' shape=(2, 3) dtype=float32, numpy=
array([[1., 2., 3.],
       [4., 5., 6.]], dtype=float32)>

## 其它数据结构
- 稀疏张量 tf.SparseTensor
- 张量数组 tf.TensorArray
- 不规则张量 tf.RaggedTensor
- 字符串张量 tf.string
- 集合 tf.sets
- 队列 tf.queue

# 定制模型和训练算法
## 自定义损失函数
来写一个huber损失函数。![huber loss](./huber.png)

In [18]:
# 此时假设阈值δ为1
def huber_fn(y_true, y_pred):
    error = y_true - y_pred
    is_small_error = tf.abs(error) < 1
    squared_loss = tf.square(error) / 2
    linear_loss  = tf.abs(error) - 0.5
    return tf.where(is_small_error, squared_loss, linear_loss)
# where是三元表达式

应仅使用tf操作。可以在编译的时候使用该损失函数model.compile(loss=huber_fn, ...)

## 保存和加载具有自定义组件的模型

In [19]:
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

housing = fetch_california_housing()
X_train_full, X_test, y_train_full, y_test = train_test_split(
    housing.data, housing.target.reshape(-1, 1), random_state=42)
X_train, X_valid, y_train, y_valid = train_test_split(
    X_train_full, y_train_full, random_state=42)

scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_valid_scaled = scaler.transform(X_valid)
X_test_scaled = scaler.transform(X_test)

In [20]:
X_train_scaled.shape

(11610, 8)

In [21]:
import keras
model = keras.models.Sequential([
    keras.layers.InputLayer(input_shape=[8]),
    keras.layers.Dense(30, activation="selu", kernel_initializer="lecun_normal"),
    keras.layers.Dense(1),
])

In [22]:
model.compile(loss=huber_fn, optimizer=keras.optimizers.Nadam(), metrics=["mae"])

In [23]:
model.fit(X_train_scaled,y_train,epochs=2,validation_data=(X_valid,y_valid))

Epoch 1/2
Epoch 2/2


<keras.callbacks.History at 0x24146ee2088>

In [24]:
model.save('my_model_with_a_custom_loss.h5')

一般而言，当加载包含自定义对象的模型时，需要将名称映射到对象上。

In [25]:
model=keras.models.load_model('my_model_with_a_custom_loss.h5',custom_objects={'huber_fn':huber_fn})

我们创建一个可以设定不同阈值的huber损失函数：

In [26]:
def create_huber(threshold=1.0):
    def huber_fn(y_true, y_pred):
        error = y_true - y_pred
        is_small_error = tf.abs(error) < threshold
        squared_loss = tf.square(error) / 2
        linear_loss = threshold*tf.abs(error) - threshold**2 / 2
        return tf.where(is_small_error, squared_loss, linear_loss)
    return huber_fn

In [27]:
model.compile(loss=create_huber(2.0),optimizer=keras.optimizers.Nadam(),metrics=['mae'])

不幸的是当你保存模型的时候不会保存阈值。这意味着在加载模型时必须指定阈值。

In [28]:
model.fit(X_train_scaled, y_train, epochs=2,
          validation_data=(X_valid_scaled, y_valid))

Epoch 1/2
Epoch 2/2


<keras.callbacks.History at 0x24147716e88>

In [29]:
model.save("my_model_with_a_custom_loss_threshold_2.h5")

In [30]:
model = keras.models.load_model("my_model_with_a_custom_loss_threshold_2.h5",
                                custom_objects={"huber_fn": create_huber(2.0)})

可以通过创建keras.losses.Loss类的子类，然后实现其get_config()方法来解决此问题。

In [31]:
class HuberLoss(keras.losses.Loss):
    def __init__(self,threshold=1.0,**kwargs):
        self.threshold=threshold
        super().__init__(**kwargs)
    def call(self,y_true,y_pred):
        error = y_true - y_pred
        is_small_error = tf.abs(error) < self.threshold
        squared_loss = tf.square(error) / 2
        linear_loss = self.threshold*tf.abs(error) - self.threshold**2 / 2
        return tf.where(is_small_error, squared_loss, linear_loss)
    def get_config(self):
        base_config=super().get_config()
        return {**base_config,'threshold':self.threshold}

然后你可以在编译模型时使用此类的任何实例。

In [32]:
model.compile(loss=HuberLoss(2.0),optimizer=keras.optimizers.Nadam(),metrics=['mae'])

In [33]:
model.fit(X_train_scaled, y_train, epochs=2,
          validation_data=(X_valid_scaled, y_valid))

Epoch 1/2
Epoch 2/2


<keras.callbacks.History at 0x24147595848>

当你保存模型的时候阈值会一起保存，当你加载模型的时候只需要将类名映射到函数本身即可。

In [34]:
model.save("my_model_with_a_custom_loss_class.h5")

In [35]:
model = keras.models.load_model("my_model_with_a_custom_loss_class.h5",
                                custom_objects={"HuberLoss": HuberLoss})

## 自定义激活函数和正则化约束

自定义激活函数softplus()

In [36]:
def my_softplus(z):
    return tf.math.log(tf.exp(z)+1.0)

自定义初始化glorot_normal()

In [37]:
def my_glorot_initializer(shape,dtype=tf.float32):
    stddev=tf.sqrt(2./(shape[0]+shape[1]))
    return tf.random.normal(shape,stddev=stddev,dtype=dtype)

自定义l1正则化

In [38]:
def my_l1_regularizer(weights):
    return tf.reduce_sum(tf.abs(0.01*weights))

确保权重为正的自定义约束keras.contraints.nonneg()

In [39]:
def my_positive_weights(weights):
    return tf.where(weights<0.,tf.zeros_like(weights),weights)

然后就可以使用这些函数了。

In [41]:
layer = keras.layers.Dense(30, activation=my_softplus, kernel_initializer=my_glorot_initializer,
                           kernel_regularizer=my_l1_regularizer, kernel_constraint=my_positive_weights)

激活函数将应用于此Dense层的输出，其结果将传递下一层。层的权重将使用初始化程序返回的值进行初始化。在每个训练步骤中，权重将传递给正则化函数以计算正则化损失，并将其添加到主要损失中以得到用于训练的最终损失。最后将在每个训练步骤结束后调用约束函数，并将层的权重替换为约束权重。

如果函数具有需要与模型一起保存的超参数，你需要继承适当的类。注意你必须要实现call()（损失、层和模型）或者__ call __()（正则化、初始化、约束）。

In [42]:
class MyL1Regularizer(keras.regularizers.Regularizer):
    def __init__(self,factor):
        self.factor=factor
    def __call__(self,weights):
        return tf.reduce_sum(tf.abs(self.factor*weights))
    def get_config(self):
        return {'factor':self.factor}

## 自定义评价指标
大多数情况下，定义一个指标函数与定义一个损失函数大致相同。

In [43]:
model.compile(optimizer=keras.optimizers.Nadam(),loss='mse',metrics=[create_huber(2.0)])

训练的每个批次，Keras都会计算该指标并跟踪自轮次开始和以来的均值。

In [44]:
percision=keras.metrics.Precision()

In [45]:
percision([0,1,1,1,0,1,0,1],[1,1,0,1,0,1,0,1])

<tf.Tensor: shape=(), dtype=float32, numpy=0.8>

前面是标签，后面是预测。正例1中5个有4个被预测正确，所以精确度为80%

自定义部分不做重点说明。详细见书。

## 自定义层

首先某些层没有权重，例如keras.layers.Flatten()。要创建一个不带权重的层，最简单的选择就是编写一个函数并将其包装在Lambda层中。

In [46]:
# 以下层对它的输入应用指数函数。
exponential_layer=keras.layers.Lambda(lambda x : tf.exp(x))

要创建自定义的有状态层(即具有权重的层),你需要创建keras.layers.Layer类的子类。

In [48]:
# 以下实现了Dense层的简化版本。
class MyDense(keras.layers.Layer):
    def __init__(self,units,activation=None,**kwargs):
        super().__init__(**kwargs)
        self.units=units
        self.activation=keras.activations.get(activation)
    def build(self,batch_input_shape):
        self.kernel=self.add_weight(name='kernel',shape=[batch_input_shape[-1],self.units],initializer='glorot_normal')
        self.bias=self.add_weight(name='bias',shape=[self.units],initializer='zeros')
        super().build(batch_input_shape) # 必须放在最后
    def call(self,X):
        return self.activationa(X@self.kernel+self.bias)
    def compute_output_shape(self,batch_input_shape):
        return tf.TensorShape(batch_input_shape.as_list()[:-1]+[self.units])
    def get_config(self):
        base_config=super().get_config()
        return {**base_config,'units':self.units,'activation':keras.activations.serialize(self.activation)}

build(self, input_shape)：此方法可用于创建依赖于输入形状的权重，使用 add_weight()。 __ call __() 将通过调用 build() 自动构建层（如果尚未构建）。

每一个方法的具体解释见书。不看也能理解。通常可以省略compute_output_shape()方法。

要创建一个具有多个输入的层，call()方法的参数应该包含所有输入的元组，同样，compute_output_shape()方法的参数应该是一个包含每个输入批处理形状的元组。

In [49]:
class MyMultiLayer(keras.layers.Layer):
    def call(self,X):
        X1,X2=X
        return [X1+X2,X1*X2,X1/X2]
    def compute_output_shape(self,batch_input_shape):
        b1,b2=batch_input_shape
        return [b1,b1,b1]

如果你的层在训练期间和测试期间需要有不同的行为，则必须将训练参数添加到call()方法并使用此参数来决定要做什么。

In [50]:
class MyGaussianNoise(keras.layers.Layer):
    def __init__(self,stddev,**kwargs):
        super().__init__(**kwargs)
        self.stddev=stddev
    def call(self,X,training=None):
        if training:
            noise=tf.random.normal(tf.shape(X),stddev=self.stddev)
            return X+noise
        else:
            return X
    def compute_output_shape(self,batch_input_shape):
        return batch_input_shape

## 自定义模型
![custom model](./custom_model.png)

**要实现此模型，首先最好要创建一个ResidualBlock层，因为我们要创建几个相同的块。**

In [51]:
class ResidualBlock(keras.layers.Layer):
    def __init__(self,n_layers,n_neurons,**kwargs):
        super().__init__(**kwargs)
        self.hidden=[keras.layers.Dense(n_neurons,activation='elu',kernel_initializer='he_normal') for _ in range(n_layers)]
    def call(self,inputs):
        Z=inputs
        for layer in self.hidden:
            Z=layer(Z) # 输入按层传递
        return inputs+Z # 拟合图中输出

这层比较特殊，因为包含其它的层。这会由keras透明处理。

接下来我们用model子类api来实现该模型。

In [52]:
class ResidualRegressor(keras.Model):
    def __init__(self,output_dim,**kwargs):
        super().__init__(**kwargs)
        self.hidden1=keras.layers.Dense(30,activation='elu',kernel_initializer='he_normal')
        self.block1=ResidualBlock(2,30)
        self.block2=ResidualBlock(2,30)
        self.out=keras.layers.Dense(output_dim)
    def call(self,inputs):
        Z=self.hidden1(inputs)
        for _ in range(1+3):
            Z=self.block1(Z) # 先走一次，再回来走三次
        Z=self.block2(Z)
        return self.out(Z)

如果你还希望能够使用save()方法保存模型和load_model()加载模型，则必须在两个ResidualBlock类和ResidualRegressor类中实现get_config()方法。（就像以前一样）