# Introduão ao sintonizador Keras

## Visão geral

O [Keras Tuner](https://keras.io/keras_tuner/) é uma biblioteca que ajuda a escolher o conjunto ideal de hiperparâmetros para o modelo TensorFlow. O processo de selecionar o conjunto correto de hiperparâmetros para o nosso modelo é chamado de *ajusta de hiperparâmetro* ou *hypertuning*.

Os hiperparâmetros são as variáveis que regem o processo de treino e a topologia de um modelo de aprendizado de máquina. Essas variáveis são constantes ao longo do treino e impactam diretamente no desempenho de nosso modelo. Há dois tipos de hiperparâmetros:

1. **Hiperparâmetros do modelo**: influenciam a seleção do modelo, como o número e a largura de *hidden units* e;

2. **Hiperparâmetros do algoritmo**: influenciam na velocidade e na qualidade do algoritmo implementado no modelo, como a taxa de aprendizado para *Stochastic Gradient Descent* (SGD) e o número de vizinhos mais próximos para o classificador *kNearest Neighbors* (kNN).

Neste estudo usaremos o Keras Tuner para realizar o *hypertuning* para um aplicativo de classificação de imagens.

## Configurar

Vamos baixar o Keras Tuner e importar as bibliotecas que usaremos:

In [2]:
# Baixar o Keras Tuner
!pip install keras-tuner

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting keras-tuner
  Downloading keras_tuner-1.1.2-py3-none-any.whl (133 kB)
[K     |████████████████████████████████| 133 kB 8.3 MB/s 
Collecting kt-legacy
  Downloading kt_legacy-1.0.4-py3-none-any.whl (9.6 kB)
Installing collected packages: kt-legacy, keras-tuner
Successfully installed keras-tuner-1.1.2 kt-legacy-1.0.4


In [3]:
# Importar as bibliotecas
import tensorflow as tf
import keras_tuner as kt
from tensorflow import keras

## Baixar e preparar o conjunto de dados

Neste estudo, usaremos o Keras Tuner para encontrar os melhores hiperparâmetros para um modelo de apredizado de máquina que classifica imagens de roupas do conjunto de dados [Fashion MNIST](https://github.com/zalandoresearch/fashion-mnist). Vamos carregar os dados:

In [4]:
# Carregar os dados
(treino_imagens, treino_rotulos), (teste_imagens, teste_rotulos) = keras.datasets.fashion_mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz


In [5]:
# Normalizar os valores dos pixels entre 0 e 1
treino_imagens = treino_imagens.astype('float32') / 255.0
teste_imagens = teste_imagens.astype('float32') / 255.0

## Definir o modelo

Ao construir um modelo para *hypertuning*, definiremos também o espaço de pesquisa do hiperparâmetro além da arquitetura do modelo. O modelo que configuraremos para o *hipertuning* é chamado de **hipermodelo**.

Podemos definir um hipermodelo por meio de duas abordagens:

1. Usar um função de construtor de modelo e;

2. Subclassificando a classe `HyperModel`da API Keras Tuner.

Podemos também utilizar duas classes `HyperModel`predefinidas, [HyperXception](https://keras.io/api/keras_tuner/hypermodels/hyper_xception/) e [HyperResNet](https://keras.io/api/keras_tuner/hypermodels/hyper_resnet/) para aplicações que usam visão computacional.

Neste estudo usaremos uma função construtor de modelo para definir o modelo de classificação de imagem. A função de construtor de modelo retorna um modelo compilado e utiliza hiperparêmetros que definiremos sequencialmente para ajustar o modelo:

In [23]:
# Construir o modelo
def construtor_modelo(hp):
    modelo = keras.Sequential()
    modelo.add(keras.layers.Flatten(input_shape=(28, 28)))

    # Ajustar o número de neurônios na primeira camada "Dense"
    # Escolher um valor ótimo entre 32 e 512
    hp_neuronios = hp.Int('units',
                          min_value=32,
                          max_value=512,
                          step=32)
    modelo.add(keras.layers.Dense(units=hp_neuronios, activation='relu'))
    modelo.add(keras.layers.Dense(10))

    # Ajustar a taxa de aprendizado para o otimizador
    # Escolher o valor ótimo entre 10e-2, 10e-3 ou 10e-4
    hp_taxa_aprendizado = hp.Choice('learning_rate', values=[0.01,
                                                             0.001,
                                                             0.0001])
    
    # Compilar o modelo
    modelo.compile(optimizer=keras.optimizers.Adam(learning_rate=hp_taxa_aprendizado),
                   loss=keras.losses.SparseCategoricalCrossentropy(from_logits=True),
                   metrics=['accuracy'])
    
    return modelo

## Instanciar o sintonizador e executar o *hypertuning*

Vamos instanciar o sintonizadr para realzar o *hypertuning*. O Keras Tuner possui 4 sintonizadores disponíveis: `RandomSearch`, `Hyperband`, `BayesianOptimization` e `Sklearn`. Neste estudo usaremos o sintonizador [Hyperband](https://arxiv.org/pdf/1603.06560.pdf).

Para instanciar o sintonizador Hyperband, devemos especificar o hipermodelo, o `objective`a ser otimizador e o número máximo de épocas para treinar (`max_epochs`):

In [24]:
# Instanciar o sintonizador
ajustador = kt.Hyperband(construtor_modelo,
                         objective='val_accuracy',
                         max_epochs=10,
                         factor=3,
                         directory='meu_diretorio',
                         project_name='intro_keras_tuner')

O algoritmo de ajuste Hyperband utiliza alocação adaptável de recursos e parada antecipada para convergir rapidamente em um modelo de alto desempenho. Isso é realizado utilizando um suporte de estilo de campeonato esportivo. O algoritmo treina um grande número de modelos por algumas épocas e leva epnas a metade dos modelos com o melhor desempenho para a próxima rodada. A hiperbanda determina o número de modelos a serem treinados em um colchete calculando 1 + `fator` logarítmico (`max_epochs`) e arredondando-o para o inteiro mais próximo.

Criaremos um *callback* para iterromper o treino antes de atingir um determinado valor para a perda de validação:

In [12]:
# Criar um callback
parada_antecipada = tf.keras.callbacks.EarlyStopping(monitor='val_loss', patience=5)

Executaremos a pesquisa de hiperparâmetros. Os argumentos para o método de pesquisa são os mesmos usados para `tf.keras.model.fit`, além do retorno de chamada acima:

In [26]:
# Executar a pesquisa de hiperparâmetros
ajustador.search(treino_imagens,
                 treino_rotulos,
                 epochs=50,
                 validation_split=0.2,
                 callbacks=[parada_antecipada])

# Obter os hiperparâmetros ótimos
melhores_hps = ajustador.get_best_hyperparameters(num_trials=1)[0]

print(f'''
A pesquisa de hiperparâmetros está completa.
O número ótimo de neurônios para a primeira camada conectada densamente
é de {melhores_hps.get("units")} e a taxa de parendizado para o
otimizador é de {melhores_hps.get("learning_rate")}.''')

Trial 30 Complete [00h 01m 21s]
val_accuracy: 0.893750011920929

Best val_accuracy So Far: 0.893750011920929
Total elapsed time: 00h 14m 17s
INFO:tensorflow:Oracle triggered exit

A pesquisa de hiperparâmetros está completa.
O número ótimo de neurônios para a primeira camada conectada densamente
é de 448 e a taxa de parendizado para o
otimizador é de 0.001.


## Treinar o modelo

Encontraremos o número ótimo de épocas para treinar o modelo com hiperparâmetros obtidos na busca:

In [27]:
# Construir o modelo com os hiperparâmetros ótimos e treiná-lo com os dados por 50 épocas
modelo = ajustador.hypermodel.build(melhores_hps)
historia = modelo.fit(treino_imagens,
                      treino_rotulos,
                      epochs=50,
                      validation_split=0.2)

valor_acuracia_por_epoca = historia.history['val_accuracy']
melhor_epoca = valor_acuracia_por_epoca.index(max(valor_acuracia_por_epoca)) + 1
print(f'Melhor época: {melhor_epoca}')

Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Melhor época: 40


Vamos agora reinstanciar o hipermodelo e treiná-lo com o número ideal de épocas:

In [28]:
# Reinstanciar o hipermodelo
hipermodelo = ajustador.hypermodel.build(melhores_hps)

# Treinar o hipermodelo
hipermodelo.fit(treino_imagens,
                treino_rotulos,
                epochs=melhor_epoca,
                validation_split=0.2)

Epoch 1/40
Epoch 2/40
Epoch 3/40
Epoch 4/40
Epoch 5/40
Epoch 6/40
Epoch 7/40
Epoch 8/40
Epoch 9/40
Epoch 10/40
Epoch 11/40
Epoch 12/40
Epoch 13/40
Epoch 14/40
Epoch 15/40
Epoch 16/40
Epoch 17/40
Epoch 18/40
Epoch 19/40
Epoch 20/40
Epoch 21/40
Epoch 22/40
Epoch 23/40
Epoch 24/40
Epoch 25/40
Epoch 26/40
Epoch 27/40
Epoch 28/40
Epoch 29/40
Epoch 30/40
Epoch 31/40
Epoch 32/40
Epoch 33/40
Epoch 34/40
Epoch 35/40
Epoch 36/40
Epoch 37/40
Epoch 38/40
Epoch 39/40
Epoch 40/40


<keras.callbacks.History at 0x7f43baf47350>

Para terminar este estudo, avaliaremos o nosso hipermodelo nos dados de teste:

In [29]:
# Avaliar o hipermodelo
resultados = hipermodelo.evaluate(teste_imagens, teste_rotulos)
print(f'''Loss: {resultados[0]}
Acurácia: {resultados[1]}''')

Loss: 0.5141509175300598
Acurácia: 0.8845999836921692


O diretório `meu_diretorio/intro_keras_tuner` possui os logs e pontos de verificação detalhados para cada tentativa (configuração de modelo) executada durante a pesquisa de hiperparâmetros. Se executarmos novamente essa pesquisa, o Keras Tuner utilizará o estado existente desses logs para retomar a pesquisa. Caso queira que o Keras Tuner comece do zero, passe o argumento `overwrite=True` ao instanciar o sintonizador.