In [1]:
import numpy as np
import tensorflow as tf
from tensorflow import keras
import matplotlib.pyplot as plt
import pandas as pd

from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

In [2]:
np.random.seed(42)
tf.random.set_seed(42)

### Carregando o conjunto de dados para regressão. 

+ Vamos usar o conjunto de dados habitacional da Califórnia e criar um regressor com uma rede neural.

+ Depois de carregar os dados, dividimos em um conjunto de treinamento, um conjunto de validação e um conjunto de teste, e padronizamos todos os atributos.

In [3]:
housing = fetch_california_housing()

X_train_full, X_test, y_train_full, y_test = train_test_split(housing.data, housing.target, random_state=42)
X_train, X_valid, y_train, y_valid = train_test_split(X_train_full, y_train_full, random_state=42)

scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_valid = scaler.transform(X_valid)
X_test = scaler.transform(X_test)

### Criando e compilando o modelo.

+ Usamos a API sequencial.

In [4]:
model = keras.models.Sequential([
    keras.layers.Dense(30, activation="relu", input_shape=[8]),
    keras.layers.Dense(30, activation="relu"),
    keras.layers.Dense(1)
])

model.compile(loss="mse", optimizer=keras.optimizers.SGD(learning_rate=1e-3))

### Criando a callback `ModelCheckpoint`.

+ A callback `ModelCheckpoint` salva pontos de verificação do modelo em intervalos regulares durante o treinamento, por padrão no final de cada época.

+ Se usarmos um conjunto de validação durante o treinamento, podemos definir o parâmetro `save_best_only=True` ao criar a callback `ModelCheckpoint`. 

+ Nesse caso, a callback só salvará o modelo quando seu desempenho no conjunto de validação for o melhor até o momento. 

+ Dessa forma, não precisamos nos preocupar em treinar por muito tempo e sobreajustar ao conjunto de treinamento: basta restaurar o último modelo salvo após o treinamento e este será o melhor modelo no conjunto de validação. 

+ Esta é uma maneira simples de implementar a parada antecipada (*early-stop*).

In [5]:
checkpoint_cb = keras.callbacks.ModelCheckpoint("my_keras_model.h5", save_best_only=True)

### Treinando e avaliando o modelo salvo.

In [6]:
# Treina o modelo com a callback especificada.
history = model.fit(X_train, y_train, 
                    epochs=10,
                    validation_data=(X_valid, y_valid),
                    callbacks=[checkpoint_cb]
                   )

# Carrega o melhor modelo no conjunto de validação.
model = keras.models.load_model("my_keras_model.h5") # rollback to best model

# Avalia o modelo.
mse_test = model.evaluate(X_test, y_test)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


### Criando a callback `EarlyStopping`.

+ Outra maneira de implementar a parada antecipada é simplesmente usar a callback `EarlyStopping`. 

+ Ela interromperá o treinamento quando não medir nenhum progresso no conjunto de validação por várias épocas (definidas pelo parâmetro da paciência) e, opcionalmente, carrega o melhor modelo. 

+ Podemos combinar as duas callbacks para salvar os pontos de verificação do modelo (no caso de seu computador travar) e interromper o treinamento mais cedo quando não houver mais progresso (para evitar desperdício de tempo e recursos).

In [7]:
early_stopping_cb = keras.callbacks.EarlyStopping(patience=10, restore_best_weights=True)

### Treinando e avaliando o modelo.

 + O número de épocas pode ser definido como um valor grande, pois o treinamento será interrompido automaticamente quando não houver mais progresso. 
 
 + Além disso, não há necessidade de restaurar o melhor modelo salvo neste caso (`restore_best_weights=True`), pois a callback `EarlyStopping` armazenará os melhores pesos e os restaurará ao final do treinamento.

In [8]:
# Treina o modelo com as callbacks definidas.
history = model.fit(X_train, y_train, 
                    epochs=100,
                    validation_data=(X_valid, y_valid),
                    callbacks=[checkpoint_cb, early_stopping_cb]
                   )

# O melhor modelo é carregado ao final.
mse_test = model.evaluate(X_test, y_test)

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

Epoch 82/100
Epoch 83/100
Epoch 84/100
Epoch 85/100
Epoch 86/100
Epoch 87/100
Epoch 88/100
Epoch 89/100
Epoch 90/100
Epoch 91/100
Epoch 92/100
Epoch 93/100
Epoch 94/100
Epoch 95/100
Epoch 96/100


### Criando nossa própria callback.

+ Se precisarmos de controle extra, podemos criar facilmente nossas próprias callbacks. 

+ Por exemplo, a seguinte callback exibirá a proporção entre a perda de validação e a perda de treinamento durante o treinamento ao final de cada época (por exemplo, para detectarmos overfitting).

+ Notem que a classe `PrintValTrainRatioCallback` herda da classe `keras.callbacks.Callback`.

In [9]:
class PrintValTrainRatioCallback(keras.callbacks.Callback):
    def on_epoch_end(self, epoch, logs):
        print("\nMinha callback -> val/train: {:.2f}".format(logs["val_loss"] / logs["loss"]))

### Treinando e avaliando o modelo.

In [10]:
val_train_ratio_cb = PrintValTrainRatioCallback()

# Treina o modelo com as callbacks definidas.
history = model.fit(X_train, y_train, 
                    epochs=10,
                    validation_data=(X_valid, y_valid),
                    callbacks=[val_train_ratio_cb]
                   )

# O melhor modelo é carregado ao final.
mse_test = model.evaluate(X_test, y_test)

Epoch 1/10
Minha callback -> val/train: 1.08
Epoch 2/10
Minha callback -> val/train: 1.00
Epoch 3/10
Minha callback -> val/train: 1.02
Epoch 4/10
Minha callback -> val/train: 0.95
Epoch 5/10
Minha callback -> val/train: 1.02
Epoch 6/10
Minha callback -> val/train: 0.97
Epoch 7/10
Minha callback -> val/train: 0.97
Epoch 8/10
Minha callback -> val/train: 0.97
Epoch 9/10
Minha callback -> val/train: 1.03
Epoch 10/10
Minha callback -> val/train: 0.99


### Importante

+ Podemos implementar callbacks para cada um dos seguintes eventos:
    + on_train_begin(), 
    + on_train_end(),
    + on_epoch_begin(), 
    + on_epoch_begin(), 
    + on_batch_end(), 
    + on_batch_end().

+ Além disso, caso necessário, as callbacks também podem ser usadas durante a avaliação e a predição, por exemplo, para depuração. Para isso, devemos implementar alguns métodos.

+ Os métodos abaixo são chamados por `evaluate()`:

    + on_test_begin(),
    + on_test_end(),
    + on_test_batch_begin(), 
    + ou on_test_batch_end().

+ Os métodos abaixo são chamados por `predict()`:

    + on_predict_begin(), 
    + on_predict_end(), 
    + on_predict_batch_begin(), 
    + on_predict_batch_end().