## 模型中變數的保存與還原
```python
tf.train.Checkpoint()
```
* Checkpoint 只會保存模型的參數，不會保存模型的計算過程，一般用於在有程式碼的時候還原之前訓練好的模型參數；而要導出模型並在無程式碼下運行要用SavedModel()
* tf.train.Checkpoint 可以利用 save() 和 restore() 來儲存與還原Tensorflow中含有Checkpointable state的物件
    * tf.keras.optimizer、tf.Variable、tf.keras.Layer 或者 tf.keras.Model 物件都可以被保存
### tf.train.Checkpoint()為初始化的函數
* 參數為 \**kwargs，是一系列的key-value pairs，key可以隨意取，value為需要保存的對象
```python
checkpoint = tf.train.Checkpoint(myAwesomeModel=model, myAwesomeOptimizer=optimizer)
```
* 這裡 myAwesomeModel 是我們為待保存的模型 model 所取的任意鍵名。注意，在還原變數的時候，我們還將使用這一鍵名。
### 使用 save() 保存訓練完的模型
```python
# 儲存時會自動加上index與副檔名(.index與.data)
checkpoint.save(目錄+prefix)
```
### 使用 restore 還原模型
```python
# 先宣告待還原參數的同一模型的物件
model_to_be_restored = MyModel()
# 再次宣告一個checkpoint，key需要一樣，都為“myAwesomeModel”
checkpoint = tf.train.Checkpoint(myAwesomeModel=model_to_be_restored)   
checkpoint.restore(目錄+prefix+index)
```
*　可以使用　**tf.train.latest_checkpoint(save_path)** 來載入目錄中最近一次的存檔

[參考網站https://tf.wiki/zh_hant/basic/tools.html](https://tf.wiki/zh_hant/basic/tools.html)

## 利用MLP模型來示範 

In [None]:
import tensorflow as tf
import numpy as np
import argparse

In [None]:
class MNISTLoader():
    def __init__(self):
        mnist = tf.keras.datasets.mnist
        (self.train_data, self.train_label), (self.test_data, self.test_label) = mnist.load_data()
        # train_data.shape = (60000, 28, 28): 60000個28x28的input
        # 將像素都坐正規化，並且增加一個維度存放channel數量(1,因為為灰階)
        # 用astype()轉型
        self.train_data = np.expand_dims(self.train_data.astype(np.float32)/255.0, axis=-1) #[60000,28,28,1]
        self.test_data = np.expand_dims(self.test_data.astype(np.float32)/255.0, axis=-1) #[10000,28,28,1]
        self.train_label = self.train_label.astype(np.int32) #[60000]
        self.test_label = self.test_label.astype(np.int32) #[10000]
        self.num_train_data, self.num_test_data = self.train_data.shape[0], self.test_data.shape[0]
        
    def get_batch(self, batch_size):
        # 從資料集中隨機存取batch_size個元素return
        # index為存放的要挑選的index(一維陣列)
        index = np.random.randint(0, self.num_train_data, batch_size)
        return self.train_data[index, :], self.train_label[index]
class MLP(tf.keras.Model):
    def __init__(self):
        super().__init__()
        # Flatten層將除了第一維(batch_size)以外的維度攤平
        self.flatten = tf.keras.layers.Flatten()
        self.dense1 = tf.keras.layers.Dense(units=100, activation=tf.nn.relu)
        self.dense2 = tf.keras.layers.Dense(units=10)
    
    def call(self, inputs):      # [batch_size, 28, 28, 1]
        x = self.flatten(inputs) # [batch_size, 784]
        x = self.dense1(x)       # [batch_size, 100]
        x = self.dense2(x)       # [batch_size, 8]
        output = tf.nn.softmax(x)
        return output

In [None]:
# 示範寫成指令程式(沒在notebook上執行)
parser = argparse.ArgumentParser(description='MLP model training and testing.')
parser.add_argument('--mode', default='train', help='train or test')
parser.add_argument('--num_epochs', default=1)
parser.add_argument('--batch_size', default=50)
parser.add_argument('--learning_rate', default=0.001)
args = parser.parse_args()
data_loader = MNISTLoader()

In [None]:
def train():
    model = MLP()
    optimizer = tf.keras.optimizers.Adam(learning_rate=args.learning_rate)
    num_batches = int(data_loader.num_train_data // args.batch_size * args.num_epochs)
    
    # ........................................................
    # 宣告Checkpoint，設定對象為 model
    checkpoint = tf.train.Checkpoint(myAwesomeModel=model)     
    # ........................................................
    
    for batch_index in range(1, num_batches+1):                 
        X, y = data_loader.get_batch(args.batch_size)
        with tf.GradientTape() as tape:
            y_pred = model(X)
            loss = tf.keras.losses.sparse_categorical_crossentropy(y_true=y, y_pred=y_pred)
            loss = tf.reduce_mean(loss)
            print("batch %d: loss %f" % (batch_index, loss.numpy()))
        grads = tape.gradient(loss, model.variables)
        optimizer.apply_gradients(grads_and_vars=zip(grads, model.variables))
        
        # ........................................................
        # 每隔 100 個 Batch 保存一次
        if batch_index % 100 == 0:                             
            path = checkpoint.save('./save/model.ckpt')
            print("model saved to %s" % path)
        # ........................................................

In [None]:
def test():
    model_to_be_restored = MLP()
    # ........................................................
    # 宣告Checkpoint，設置被恢復的對象為 model_to_be_restored，key需要一樣!
    checkpoint = tf.train.Checkpoint(myAwesomeModel=model_to_be_restored)      
    checkpoint.restore(tf.train.latest_checkpoint('./save')) 
    # ........................................................
    
    y_pred = np.argmax(model_to_be_restored.predict(data_loader.test_data), axis=-1)
    print("test accuracy: %f" % (sum(y_pred == data_loader.test_label) / data_loader.num_test_data))

In [None]:
if __name__ == '__main__':
    if args.mode == 'train':
        train()
    if args.mode == 'test':
        test()

### 使用 CheckpointManager
* 如以上範例，每100個batch存一次，但大部分時候我們只想保留最後幾個
* 在宣告 Checkpoint 後接著宣告一個 CheckpointManager
    ```python
    checkpoint = tf.train.Checkpoint(model=model)
    manager = tf.train.CheckpointManager(checkpoint, directory='./save', checkpoint_name='model.ckpt', max_to_keep=k)
    ```
    * max_to_keep為保留的Checkpoint 數目
    * 需要保存模型時，直接使用 manager.save()
    * 如果想指定保存的Checkpoint的index，則可以在保存時加入checkpoint_number參數。例如manager.save(checkpoint_number=100)。