## DIA 014: Fine-Turning del Modelo Preentrenado VGG16

Después de entrenar las capas superiores de tu modelo con VGG16 congelado, el siguiente paso es fine-tuning. Esto implica descongelar algunas capas del modelo base (VGG16) y entrenarlas junto con las capas superiores para adaptar mejor las características aprendidas al nuevo conjunto de datos (MNIST).

In [2]:
# 1. Importación de Librerías
# ------------------------------------
import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.applications import VGG16
from tensorflow.keras.callbacks import EarlyStopping
import matplotlib.pyplot as plt
import numpy as np
from sklearn.metrics import classification_report, confusion_matrix
import seaborn as sns


In [None]:
# 2. Verificación de la Disponibilidad de GPU
# ------------------------------------

# Verificar si TensorFlow detecta una GPU
gpus = tf.config.list_physical_devices('GPU')
if gpus:
    print(f"GPU(s) disponible(s): {[gpu.name for gpu in gpus]}")
else:
    print("No hay GPU disponible. El entrenamiento se realizará en CPU, lo cual puede ser más lento.")


In [None]:
# 3. Carga y Preprocesamiento de Datos
# ------------------------------------

# a. Cargar el dataset MNIST
mnist = tf.keras.datasets.mnist
(X_train, y_train), (X_test, y_test) = mnist.load_data()

# b. Normalizar los valores de píxeles de 0-255 a 0-1
X_train = X_train.astype('float32') / 255.0
X_test = X_test.astype('float32') / 255.0

# c. Añadir la dimensión de los canales (1 para escala de grises)
X_train = X_train.reshape((X_train.shape[0], 28, 28, 1))
X_test = X_test.reshape((X_test.shape[0], 28, 28, 1))

# d. Verificar la forma de los datos
print("Forma de X_train:", X_train.shape)  # (60000, 28, 28, 1)
print("Forma de X_test:", X_test.shape)    # (10000, 28, 28, 1)


In [None]:
# 4. Visualización de Datos (Opcional)
# ------------------------------------

# Función para visualizar imágenes
def mostrar_imagen(matriz, etiqueta, indice):
    plt.figure(figsize=(2,2))
    plt.imshow(matriz[indice].reshape(28, 28), cmap='gray')
    plt.title(f"Dígito: {etiqueta}")
    plt.axis('off')
    plt.show()

# Mostrar la primera imagen del conjunto de entrenamiento
mostrar_imagen(X_train, y_train, 0)


In [6]:
# 5. Definir la Función de Preprocesamiento
# ------------------------------------

def preprocesar_imagen(x, y):
    """
    Redimensiona las imágenes a 224x224 y convierte de escala de grises a RGB.
    
    Args:
        x (tf.Tensor): Imagen de entrada con forma (28, 28, 1).
        y (tf.Tensor): Etiqueta correspondiente.
        
    Returns:
        tuple: Imagen preprocesada y etiqueta.
    """
    # x tiene forma (28, 28, 1)
    
    # a. Redimensionar la imagen a 224x224
    x = tf.image.resize(x, [224, 224])
    
    # b. Convertir de escala de grises a RGB (duplicar el canal)
    x = tf.image.grayscale_to_rgb(x)
    
    # c. Normalizar los valores de píxeles a [0, 1]
    x = tf.cast(x, tf.float32) / 255.0
    
    return x, y

In [7]:
# 6. Crear los Objetos tf.data.Dataset
# ------------------------------------

# a. Crear el dataset de entrenamiento
train_ds = tf.data.Dataset.from_tensor_slices((X_train, y_train))
train_ds = train_ds.map(preprocesar_imagen, num_parallel_calls=tf.data.AUTOTUNE)
train_ds = train_ds.shuffle(buffer_size=1024).batch(64).prefetch(tf.data.AUTOTUNE)

# b. Crear el dataset de validación
val_ds = tf.data.Dataset.from_tensor_slices((X_test, y_test))
val_ds = val_ds.map(preprocesar_imagen, num_parallel_calls=tf.data.AUTOTUNE)
val_ds = val_ds.batch(64).prefetch(tf.data.AUTOTUNE)


In [None]:
# 7. Construcción del Modelo con Transfer Learning
# ------------------------------------

# a. Cargar el modelo VGG16 sin las capas superiores y con pesos preentrenados en ImageNet
base_model = VGG16(weights='imagenet', include_top=False, input_shape=(224, 224, 3))

# b. Congelar las capas del modelo base para que no se actualicen durante el entrenamiento
base_model.trainable = False

# c. Construir el modelo completo con Transfer Learning
model = models.Sequential([
    base_model,
    layers.Flatten(),
    layers.Dense(256, activation='relu'),
    layers.Dropout(0.5),
    layers.Dense(10, activation='softmax')  # 10 clases para MNIST
])

# d. Resumen del modelo
model.summary()


In [9]:
# 8. Compilación del Modelo
# ------------------------------------

# Compilar el modelo definiendo el optimizador, la función de pérdida y las métricas
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])


In [10]:
# 9. Definir Early Stopping
# ------------------------------------

# Definir Early Stopping para detener el entrenamiento si la pérdida de validación no mejora
early_stop = EarlyStopping(monitor='val_loss', patience=3, restore_best_weights=True)


In [None]:
# 10. Entrenamiento del Modelo
# ------------------------------------

# Entrenar el modelo usando los datasets de entrenamiento y validación
history = model.fit(
    train_ds,
    epochs=20,
    validation_data=val_ds,
    callbacks=[early_stop]
)


In [None]:
# 11. Evaluación del Modelo
# ------------------------------------

# Evaluar el rendimiento en el conjunto de prueba
test_loss, test_acc = model.evaluate(val_ds, verbose=2)
print(f'\nPrecisión en el conjunto de prueba: {test_acc:.4f}')


In [None]:
# 12. Visualización del Rendimiento del Modelo
# ------------------------------------

# Graficar precisión y pérdida durante el entrenamiento
plt.figure(figsize=(12, 4))

# Precisión
plt.subplot(1, 2, 1)
plt.plot(history.history['accuracy'], label='Entrenamiento')
plt.plot(history.history['val_accuracy'], label='Validación')
plt.title('Precisión durante el Entrenamiento')
plt.xlabel('Época')
plt.ylabel('Precisión')
plt.legend()

# Pérdida
plt.subplot(1, 2, 2)
plt.plot(history.history['loss'], label='Entrenamiento')
plt.plot(history.history['val_loss'], label='Validación')
plt.title('Pérdida durante el Entrenamiento')
plt.xlabel('Época')
plt.ylabel('Pérdida')
plt.legend()

plt.show()

In [None]:
# 13. Guardado y Carga del Modelo
# ------------------------------------

# a. Guardar el modelo completo en un archivo H5
model.save('modelo_cnn_transfer_learning_mnist.h5')
print("Modelo guardado como 'modelo_cnn_transfer_learning_mnist.h5'")

# b. Cargar el modelo guardado
loaded_model = tf.keras.models.load_model('modelo_cnn_transfer_learning_mnist.h5')
print("Modelo cargado exitosamente.")

In [None]:
# 14. Hacer Predicciones con el Modelo Cargado
# ------------------------------------

# a. Hacer predicciones sobre el conjunto de prueba
predicciones = loaded_model.predict(val_ds)

# b. Obtener las clases predichas
clases_predichas = np.argmax(predicciones, axis=1)

# c. Mostrar predicción para la primera imagen del conjunto de prueba
indice = 0
print(f"Etiqueta real: {y_test[indice]}")
print(f"Predicción: {clases_predichas[indice]}")
print(f"Probabilidades: {predicciones[indice]}")

# d. Visualizar la imagen con su predicción
def mostrar_prediccion(matriz, etiquetas, predicciones, indice):
    plt.figure(figsize=(2,2))
    plt.imshow(matriz[indice].reshape(28, 28), cmap='gray')
    plt.title(f"Real: {etiquetas[indice]}\nPred: {predicciones[indice]}")
    plt.axis('off')
    plt.show()

# Mostrar la primera imagen del conjunto de prueba con su predicción
mostrar_prediccion(X_test, y_test, clases_predichas, indice)


In [None]:
# 15. Evaluación Más Detallada (Opcional)
# ------------------------------------

# Imprimir el reporte de clasificación
print("Reporte de Clasificación:\n")
print(classification_report(y_test, clases_predichas))

# Generar la matriz de confusión
cm = confusion_matrix(y_test, clases_predichas)

# Visualizar la matriz de confusión
plt.figure(figsize=(10,8))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', 
            xticklabels=np.unique(y_train), 
            yticklabels=np.unique(y_train))
plt.xlabel('Predicción')
plt.ylabel('Realidad')
plt.title('Matriz de Confusión')
plt.show()


In [None]:
# 16. Día 14: Fine-Tuning del Modelo
# ------------------------------------

# a. Descongelar algunas capas del modelo base para fine-tuning
base_model.trainable = True

# b. Seleccionar cuántas capas descongelar
# Por ejemplo, descongelar las últimas 4 bloques de convolución
# VGG16 tiene 5 bloques de convolución
for layer in base_model.layers:
    if isinstance(layer, layers.Conv2D):
        if layer.name.startswith('block5'):
            layer.trainable = True
        else:
            layer.trainable = False

# c. Verificar qué capas están entrenables
for layer in base_model.layers:
    print(f"{layer.name}: {'Entrenable' if layer.trainable else 'Congelada'}")

# d. Recompilar el modelo con un optimizador de menor tasa de aprendizaje
model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=1e-5),
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

# e. Entrenar nuevamente el modelo con fine-tuning
history_ft = model.fit(
    train_ds,
    epochs=10,
    validation_data=val_ds,
    callbacks=[early_stop]
)

# f. Evaluar el modelo después del fine-tuning
test_loss_ft, test_acc_ft = model.evaluate(val_ds, verbose=2)
print(f'\nPrecisión en el conjunto de prueba después del fine-tuning: {test_acc_ft:.4f}')

# g. Visualizar el rendimiento del modelo después del fine-tuning
plt.figure(figsize=(12, 4))

# Precisión
plt.subplot(1, 2, 1)
plt.plot(history_ft.history['accuracy'], label='Entrenamiento')
plt.plot(history_ft.history['val_accuracy'], label='Validación')
plt.title('Precisión durante el Fine-Tuning')
plt.xlabel('Época')
plt.ylabel('Precisión')
plt.legend()

# Pérdida
plt.subplot(1, 2, 2)
plt.plot(history_ft.history['loss'], label='Entrenamiento')
plt.plot(history_ft.history['val_loss'], label='Validación')
plt.title('Pérdida durante el Fine-Tuning')
plt.xlabel('Época')
plt.ylabel('Pérdida')
plt.legend()

plt.show()

# h. Actualizar la matriz de confusión y el reporte de clasificación después del fine-tuning
predicciones_ft = model.predict(val_ds)
clases_predichas_ft = np.argmax(predicciones_ft, axis=1)

print("Reporte de Clasificación después del Fine-Tuning:\n")
print(classification_report(y_test, clases_predichas_ft))

# Generar la matriz de confusión
cm_ft = confusion_matrix(y_test, clases_predichas_ft)

# Visualizar la matriz de confusión
plt.figure(figsize=(10,8))
sns.heatmap(cm_ft, annot=True, fmt='d', cmap='Greens', 
            xticklabels=np.unique(y_train), 
            yticklabels=np.unique(y_train))
plt.xlabel('Predicción')
plt.ylabel('Realidad')
plt.title('Matriz de Confusión después del Fine-Tuning')
plt.show()