本章介紹如何使用 TensorFlow 快速建立動態模型。

模型的建構： tf.keras.Model 和 tf.keras.layers

模型的損失函數： tf.keras.losses

模型的優化器： tf.keras.optimizer

模型的評估： tf.keras.metrics

**模型（Model）與層（Layer）**

在 TensorFlow 中，推薦使用 Keras（ tf.keras ）建立模型。Keras 是一個廣為流行的高級神經網路 API，簡單、快速而不失靈活性，現已得到 TensorFlow 的官方內建和全面支援。

Keras 有兩個重要的概念： 模型（Model） 和 層（Layer） 。層將各種計算流程和變數進行了封裝（例如基本的全連接層 (Fully Connected Layer)，CNN 的卷積層 (Convolution Layer)、池化層 (Pooling Layer)… 等），而模型則將各種層進行組織和連接，並封裝成一個整體，描述了如何將輸入資料通過各種層以及運算而得到輸出。在需要模型呼叫的時候，使用 y_pred = model(X) 的形式即可。Keras 在 tf.keras.layers 下內建了深度學習中大量常用的的預定義層，同時也允許我們自定義層。

In [1]:
import tensorflow as tf

class MyModel(tf.keras.Model):
    def __init__(self):
        super().__init__()     # Python 2 下使用 super(MyModel, self).__init__()
        # 此處添加初始化程式碼（包含 call 方法中會用到的層），例如
        # layer1 = tf.keras.layers.BuiltInLayer(...)
        # layer2 = MyCustomLayer(...)

    def call(self, input):
        # 此處添加模型呼叫的程式碼（處理輸入並返回輸出），例如
        # x = layer1(input)
        # output = layer2(x)
        return output

    # 還可以添加自定義的方法

上一章中簡單的線性模型 y_pred = a * X + b ，我們可以通過 Model 類別的方式編寫如下：

In [2]:
import tensorflow as tf

X = tf.constant([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])
y = tf.constant([[10.0], [20.0]])

class Linear(tf.keras.Model):
    def __init__(self):
        super().__init__()
        self.dense = tf.keras.layers.Dense(
            units = 1,
            activation = None,
            kernel_initializer = tf.zeros_initializer(),
            bias_initializer = tf.zeros_initializer()
        )

    def call(self, input):
        output = self.dense(input)
        return output


# 以下程式碼結構與前一節類似
model = Linear()
optimizer = tf.keras.optimizers.SGD(learning_rate=0.01)
for i in range(100):
    with tf.GradientTape() as tape:
        y_pred = model(X)      # 呼叫模型 y_pred = model(X) 而不是顯式寫出 y_pred = a * X + b
        loss = tf.reduce_mean(tf.square(y_pred - y))
    grads = tape.gradient(loss, model.variables)    # 使用 model.variables 這一屬性直接獲得模型中的所有變數
    optimizer.apply_gradients(grads_and_vars=zip(grads, model.variables))
print(model.variables)

[<tf.Variable 'linear/dense/kernel:0' shape=(3, 1) dtype=float32, numpy=
array([[0.40784457],
       [1.1910652 ],
       [1.9742857 ]], dtype=float32)>, <tf.Variable 'linear/dense/bias:0' shape=(1,) dtype=float32, numpy=array([0.78322065], dtype=float32)>]
