In [1]:
import tensorflow as tf
import sys
import matplotlib.pyplot as plt
import numpy as np
import matplotlib as mpl

In [2]:
# Cargar el dataset de MNIST fashion

fashion_mnist = tf.keras.datasets.fashion_mnist.load_data()

(X_train_full, y_train_full), (X_test, y_test) = fashion_mnist
X_train, y_train = X_train_full[:-5000], y_train_full[:-5000]
X_valid, y_valid = X_train_full[-5000:], y_train_full[-5000:]

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz


In [3]:
tf.keras.backend.clear_session()
tf.random.set_seed(42)

In [4]:
# Instalar librería keras_tuner en Colab

if "google.colab" in sys.modules:
    %pip install -q -U keras_tuner

[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/129.1 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m129.1/129.1 kB[0m [31m4.2 MB/s[0m eta [36m0:00:00[0m
[?25h

En caso de no usar Colab ver:

https://keras.io/keras_tuner/

In [5]:
import keras_tuner as kt

def build_model(hiper):
    # Definir el número de capas ocultas como un hiperparámetro ajustable
    n_hidden = hiper.Int("n_hidden", min_value=1, max_value=8)

    # Definir el número de neuronas por capa como un hiperparámetro ajustable
    n_neurons = hiper.Int("n_neurons", min_value=16, max_value=256)

    # Definir el learning rate como un hiperparámetro ajustable en escala logarítmica
    learning_rate = hiper.Float("learning_rate", min_value=1e-4, max_value=1e-2,
                             sampling="log")

    # Definir el optimizador como como una opción entre "sgd" y "adam"
    optimizer = hiper.Choice("optimizer", values=["sgd", "adam"])

    # Configurar el optimizador en función de la opción elegida
    if optimizer == "sgd":
        optimizer = tf.keras.optimizers.SGD(learning_rate=learning_rate)
    else:
        optimizer = tf.keras.optimizers.Adam(learning_rate=learning_rate)

    # Construir el modelo secuencial de Keras
    model = tf.keras.Sequential()
    model.add(tf.keras.layers.Flatten())
    for _ in range(n_hidden):
        model.add(tf.keras.layers.Dense(n_neurons, activation="relu"))
    model.add(tf.keras.layers.Dense(10, activation="softmax"))
    model.compile(loss="sparse_categorical_crossentropy", optimizer=optimizer,
                  metrics=["accuracy"])
    return model

In [6]:
# Esta celda tardar varias minutos en ejecutarse

# Crear un sintonizador de búsqueda aleatoria
random_search_tuner = kt.RandomSearch(
    build_model,  # Función que construye el modelo a optimizar
    objective="val_accuracy",  # Objetivo de optimización: precisión en datos de validación
    max_trials=5,  # Número máximo de combinaciones de hiperparámetros a probar
    overwrite=True,  # Sobrescribir los resultados anteriores si existe un experimento con el mismo nombre
    directory="my_fashion_mnist",  # Directorio donde se guardarán los resultados y checkpoints del sintonizador
    project_name="my_rnd_search",  # Nombre del proyecto de búsqueda aleatoria
    seed=42  # Semilla para reproducibilidad
)

# Ejecutar la búsqueda aleatoria con los datos de entrenamiento y validación
early_stopping = tf.keras.callbacks.EarlyStopping(patience=2, restore_best_weights=True)

random_search_tuner.search(
    X_train, y_train,  # Datos de entrenamiento
    epochs=20,  # Número de épocas de entrenamiento por cada configuración de hiperparámetros
    validation_data=(X_valid, y_valid),  # Datos de validación para evaluar el rendimiento del modelo
    callbacks=[early_stopping] # Implementar early stopping (parada temprana)
)


Trial 5 Complete [00h 02m 07s]
val_accuracy: 0.8532000184059143

Best val_accuracy So Far: 0.8636000156402588
Total elapsed time: 00h 06m 04s


In [7]:
# Obtener los 3 mejores modelos según la búsqueda aleatoria
top3_models = random_search_tuner.get_best_models(num_models=3)

# Seleccionar el mejor modelo de los tres mejores modelos obtenidos
best_model = top3_models[0]

# Devolver el mejor modelo seleccionado
best_model

<keras.src.engine.sequential.Sequential at 0x7a7dd396b100>

In [8]:
# Obtener los mejores hiperparámetros de los tres mejores modelos encontrados
top3_params = random_search_tuner.get_best_hyperparameters(num_trials=3)

# Obtener los valores de los hiperparámetros del primer conjunto de mejores hiperparámetros
top3_params[0].values

{'n_hidden': 8,
 'n_neurons': 100,
 'learning_rate': 0.0012482904754698163,
 'optimizer': 'sgd'}

In [9]:
# Obtener el mejor ensayo (trial) según el oráculo de búsqueda aleatoria
best_trial = random_search_tuner.oracle.get_best_trials(num_trials=1)[0]

# Mostrar un resumen del mejor ensayo
best_trial.summary()

Trial 1 summary
Hyperparameters:
n_hidden: 8
n_neurons: 100
learning_rate: 0.0012482904754698163
optimizer: sgd
Score: 0.8636000156402588


In [10]:
# Obtener el último valor registrado de la métrica "val_accuracy" del mejor ensayo
best_trial.metrics.get_last_value("val_accuracy")

0.8636000156402588

In [11]:
# Entrenar el mejor modelo en el dataset de entrenamiento completo
early_stopping = tf.keras.callbacks.EarlyStopping(patience=10, restore_best_weights=True)
history = best_model.fit(X_train_full, y_train_full, epochs=100, callbacks=[early_stopping])

Epoch 1/100



Epoch 2/100



Epoch 3/100



Epoch 4/100



Epoch 5/100



Epoch 6/100



Epoch 7/100



Epoch 8/100



Epoch 9/100



Epoch 10/100



Epoch 11/100



Epoch 12/100



Epoch 13/100



Epoch 14/100



Epoch 15/100



Epoch 16/100



Epoch 17/100



Epoch 18/100



Epoch 19/100



Epoch 20/100



Epoch 21/100



Epoch 22/100



Epoch 23/100



Epoch 24/100



Epoch 25/100



Epoch 26/100



Epoch 27/100



Epoch 28/100



Epoch 29/100



Epoch 30/100



Epoch 31/100



Epoch 32/100



Epoch 33/100



Epoch 34/100



Epoch 35/100



Epoch 36/100



Epoch 37/100



Epoch 38/100



Epoch 39/100



Epoch 40/100



Epoch 41/100



Epoch 42/100



Epoch 43/100



Epoch 44/100



Epoch 45/100



Epoch 46/100



Epoch 47/100



Epoch 48/100



Epoch 49/100



Epoch 50/100



Epoch 51/100



Epoch 52/100



Epoch 53/100



Epoch 54/100



Epoch 55/100



Epoch 56/100



Epoch 57/100



Epoch 58/100



Epoch 59/100



Epoch 60/100



Epoch 61/100



Epoch 62/100



Epoch 63/100



Epoch 64/100



Epoch 65/100



Epoch 66/100



Epoch 67/100



Epoch 68/100



Epoch 69/100



Epoch 70/100



Epoch 71/100



Epoch 72/100



Epoch 73/100



Epoch 74/100



Epoch 75/100



Epoch 76/100



Epoch 77/100



Epoch 78/100



Epoch 79/100



Epoch 80/100



Epoch 81/100



Epoch 82/100



Epoch 83/100



Epoch 84/100



Epoch 85/100



Epoch 86/100



Epoch 87/100



Epoch 88/100



Epoch 89/100



Epoch 90/100



Epoch 91/100



Epoch 92/100



Epoch 93/100



Epoch 94/100



Epoch 95/100



Epoch 96/100



Epoch 97/100



Epoch 98/100



Epoch 99/100



Epoch 100/100





In [12]:
# Evaluar el mejor modelo con los datos de prueba y obtener la pérdida y precisión
test_loss, test_accuracy = best_model.evaluate(X_test, y_test)

print(test_loss)
print(test_accuracy)

0.6410060524940491
0.8657000064849854
