In [None]:
# Desactiva las advertencias para evitar saturar la salida con mensajes irrelevantes.
# Esto es útil en casos donde sabemos que las advertencias no afectan el entrenamiento.
#import warnings
#warnings.filterwarnings('ignore')

In [None]:
# Verifica la versión de TensorFlow
# Es importante comprobar la versión para asegurar compatibilidad con el código.
import tensorflow as tf
print(f"TensorFlow version: {tf.__version__}")

In [None]:
# Lista todos los paquetes instalados en el entorno actual junto con sus versiones.
# Esto es útil para verificar las dependencias y asegurarse de que las versiones son correctas.
# Ordena los paquetes por nombre antes de mostrarlos
#installed_packages = sorted(pkg_resources.working_set, key=lambda x: x.key)
#for package in installed_packages:
#    print(f"{package.key}=={package.version}")

In [None]:
# Importa módulos y librerías necesarias
import numpy as np  # Biblioteca para operaciones matemáticas y manejo de matrices
import matplotlib.pyplot as plt  # Para graficar datos y visualizar resultados

# Importa el conjunto de datos MNIST, un dataset clásico para clasificación de dígitos escritos a mano
from tf_keras.datasets import mnist
from tf_keras import models, layers
from tf_keras.utils import to_categorical

## Cargamos los datos de MNIST

In [None]:
# Carga el conjunto de datos MNIST
# Este dataset contiene imágenes de dígitos escritos a mano (28x28 píxeles en escala de grises)
# Se divide en datos de entrenamiento y prueba, junto con sus etiquetas correspondientes
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

In [None]:
# Algo de información sobre los datos de entrenamiento
print("=== Información sobre los datos ===")

# Información sobre las entradas
print("Entradas (imágenes):")
print(f"  Tipo de dato: {type(train_images)}")
print(f"  Dimensiones: {train_images.shape}")
print(f"  Tipo de contenido: {train_images.dtype}\n")

# Información sobre las etiquetas
print("Etiquetas (labels):")
print(f"  Tipo de dato: {type(train_labels)}")
print(f"  Dimensiones: {train_labels.shape}")
print(f"  Valores únicos: {set(train_labels)}")

print()
# Información sobre los datos de prueba
print("=== Información sobre los datos de prueba ===")

# Información sobre las entradas (imágenes)
print("Entradas (imágenes):")
print(f"  Tipo de dato: {type(test_images)}")  # Tipo de datos (numpy.ndarray)
print(f"  Dimensiones: {test_images.shape}")  # Dimensiones de las imágenes
print(f"  Tipo de contenido: {test_images.dtype}")  # Tipo de valores almacenados (por ejemplo, uint8)

# Información sobre las etiquetas
print("\nEtiquetas:")
print(f"  Tipo de dato: {type(test_labels)}")  # Tipo de datos (numpy.ndarray)
print(f"  Dimensiones: {test_labels.shape}")  # Dimensiones de las etiquetas
print(f"  Valores únicos: {set(test_labels)}")  # Valores únicos en las etiquetas (clases)

## Apropiamos los datos de MNIST

In [None]:
# Configura NumPy para mostrar la matriz completa sin recortes
np.set_printoptions(threshold=np.inf, linewidth=np.inf)

indice = 0

# Muestra la matriz completa de píxeles de la imagen
print(f"\nMatriz de píxeles de la imagen en el índice {indice}:",end = "\n\n")
print(train_images[indice])
# Restablece las opciones de impresión de NumPy a sus valores predeterminados
np.set_printoptions(threshold=1000, linewidth=75)

In [None]:
plt.imshow(train_images[indice], cmap='gray')  # Muestra la imagen en escala de grises
plt.title(f"Etiqueta: {train_labels[indice]}")  # Asigna un título a la imagen
plt.axis('off')  # Desactiva los ejes de la imagen
plt.show()
#0 --> negro
#255 --> blanco

In [None]:
# Muestra la etiqueta correspondiente
print(f"Etiqueta de la imagen en el índice {indice}: {train_labels[indice]}")

# Muestra las primeras 10 etiquetas como ejemplo
print("\nEjemplo de etiquetas (primeros 10 valores):")
print(train_labels[:10])  # Muestra un subconjunto de etiquetas

# Explicación adicional sobre el formato de las etiquetas
print("\nLas etiquetas son números enteros que representan los dígitos escritos a mano en las imágenes.")
print("Por ejemplo:")
for i, label in enumerate(train_labels[:5]):
    print(f" - Etiqueta {i}: {label}")


# Una RNA en keras
## Arquitectura

### Estilo Secuencial
Este enfoque es ideal para arquitecturas lineales (es decir, cada capa tiene exactamente una entrada y una salida).

- Simple y claro: Fácil de leer y mantener.
- Limitado: No admite arquitecturas complejas como múltiples entradas, múltiples salidas o conexiones entre capas que no sean estrictamente secuenciales.

In [None]:
net = models.Sequential()
net.add(layers.Dense(512, activation='relu', input_shape=(28 * 28,)))
net.add(layers.Dense(10, activation='softmax'))

In [None]:
net.summary()

In [None]:
net2 = models.Sequential()
net2.add(layers.Input(shape=(28 * 28,), name = "sapito1"))
net2.add(layers.Dense(512, activation='relu', name = "sapito2"))
net2.add(layers.Dense(10, activation='softmax', name = "sapito3"))

In [None]:
net2.summary()

### Estilo Funcional
Permite definir modelos más complejos, incluyendo arquitecturas con múltiples entradas y salidas, bifurcaciones y conexiones no lineales.
- Flexible: Admite arquitecturas complejas (por ejemplo, modelos con múltiples entradas y salidas).
- Legible: Define claramente el flujo de datos entre capas.

In [None]:
from tf_keras import Input,Model

entrada = Input(shape=(28 * 28,))
capa1 = layers.Dense(512, activation='relu')(entrada)
capa2 = layers.Dense(10, activation='softmax')(capa1)

network = Model(inputs=entrada, outputs=capa2)

### Estilo Subclassing
Permite definir tu propio modelo heredando de la clase tf.keras.Model. Es el más flexible, ya que te da control total sobre las operaciones realizadas en el modelo.

- Extremadamente flexible: Puedes definir cualquier operación personalizada.
- Requiere más código: Menos automatización, más control manual.

In [None]:
from tensorflow.keras import Model

class MiRedcita(Model):
    def __init__(self):
        super(MiRedcita, self).__init__()
        self.densa1 = layers.Dense(512, activation='relu')
        self.densa2 = layers.Dense(10, activation='softmax')

    def call(self, inputs):
        x = self.densa1(inputs)
        return self.densa2(x)

    def build_model(self):
        x = Input(shape=(28 * 28,))
        return Model(inputs=x, outputs=self.call(x))


## Resumen

In [None]:
net.summary()

In [None]:
from tf_keras.utils import plot_model

# Guardar el modelo como una imagen con plot_model
plot_model(
    net,
    to_file='network_dibujadita.png',
    show_shapes=True,
    show_layer_names=True,
    dpi=50
)


## Compilación
Define cómo se entrenará el modelo, cómo se medirá su desempeño y cómo se actualizarán los pesos de la red.

In [None]:
net.compile(
    # Define el optimizador que se utilizará para actualizar los pesos del modelo durante el entrenamiento
    optimizer='rmsprop', # Descenso del gradiente

    # Establece la función de pérdida que el modelo intentará minimizar
    loss='categorical_crossentropy', # Entropia cruzada, que tanto se diferencian 2 distribuciones de probabilidad :V

    # Lista de métricas a monitorear durante el entrenamiento y la evaluación
    metrics=['accuracy',
             'recall',
             'precision',
             'auc']
)


In [None]:
from tf_keras.metrics import Recall, Precision, AUC, Accuracy, CategoricalAccuracy

net.compile(
    optimizer='rmsprop', # Descenso del gradiente
    loss='categorical_crossentropy', # Entropia cruzada, que tanto se diferencian 2 distribuciones de probabilidad :V

    metrics=[
        Recall(name='recall'),
        Precision(name='precision'),
        AUC(name='auc'),
        Accuracy(name='accuracy'),
        CategoricalAccuracy(name='categorical_accuracy')
        ]
)

# Pre procesamiento de datos
## Vectorizar imágenes

In [None]:
# Mostrar el tamaño original de las imágenes de entrenamiento
print('Tamaño original de las entradas de entrenamiento:', train_images.shape)
print('Tamaño original de las entradas de pruebas:', test_images.shape)

# Vectorizar las imágenes
train_images = train_images.reshape((60000, 784))
test_images = test_images.reshape((10000, 784))
print('Tamaño vectorizado de las entradas de entrenamiento:', train_images.shape)
print('Tamaño vectorizado de las entradas de prueba:', test_images.shape)

## Escalar pixeles

In [None]:
# Mostrar algunos valores de píxeles antes del escalado
print("Valores de píxeles de una imagen (sin escalar):")
for i, val in enumerate(train_images[0, 405:410]):
    print(f"  Pixel {405 + i}: {val}")

# Escalar los valores de píxeles a [0, 1]
train_images = train_images.astype('float32') / 255
test_images = test_images.astype('float32') / 255

# Mostrar los mismos valores de píxeles después del escalado
print("\nLos mismos valores de píxeles de una imagen escalados a [0, 1]:")
for i, val in enumerate(train_images[0, 405:410]):
    print(f"  Pixel {405 + i}: {val:.4f}")


## Vectorizar etiquetas de imágenes

In [None]:
from tf_keras.utils import to_categorical

# Codificación One-hot
print("=== Codificación One-hot ===")
print(f"Tamaño inicial de las etiquetas: {train_labels.shape}")

print(f"Ejemplo de etiqueta antes de la codificación: {train_labels[0]}")

# Realizar la codificación One-hot
train_labels_cod = to_categorical(train_labels)
test_labels_cod = to_categorical(test_labels)

print(f"Ejemplo de etiqueta después de la codificación: {train_labels_cod[0]}")

print(f"\nTamaño de las etiquetas después de codificación One-hot: {train_labels_cod.shape}")


# Entrenar la red

In [None]:
# Entrenamiento del modelo
print("=== Entrenamiento del modelo ===")

H = net.fit(
    train_images,
    train_labels_cod,
    epochs=5,
    batch_size=128,
    validation_split=0.2,
)

# Resumen del proceso
print(f"\nDatos utilizados en el entrenamiento:")
print(f"- Datos de entrenamiento: {int(train_images.shape[0] * 0.8)} muestras")
print(f"- Datos de validación: {int(train_images.shape[0] * 0.2)} muestras")

In [None]:
# Configuración del entrenamiento
epoch = 5               # Número de épocas
total_examples = 60000  # Número total de ejemplos
validation_split = 0.2  # Porcentaje reservado para validación
batch_size = 128        # Tamaño del lote

# Calcular ejemplos de entrenamiento y validación
training_examples = int(total_examples * (1 - validation_split))  # 48,000 ejemplos para entrenamiento
validation_examples = int(total_examples * validation_split)      # 12,000 ejemplos para validación

# Calcular los pasos totales
steps_per_epoch = training_examples / batch_size  # Pasos por época para entrenamiento
total_training_steps = steps_per_epoch * epoch    # Total de pasos para entrenamiento

validation_steps = validation_examples / batch_size  # Pasos por época para validación

# Mostrar resultados
print("=== Configuración del entrenamiento ===")
print(f"Total de ejemplos: {total_examples}")
print(f"- Ejemplos para entrenamiento: {training_examples}")
print(f"- Ejemplos para validación: {validation_examples}")
print(f"Tamaño del lote: {batch_size}")

print("\n=== Cálculo de pasos ===")
print(f"Pasos por época (entrenamiento): {int(steps_per_epoch)}")
print(f"Pasos totales (entrenamiento): {int(total_training_steps)}")
print(f"Pasos por época (validación): {int(validation_steps)}")

In [None]:
"""
model.fit(
    x,                    # Datos de entrada
    y,                    # Etiquetas (objetivo)
    batch_size=None,      # Tamaño del lote
    epochs=1,             # Número de épocas
    verbose=1,            # Nivel de detalle en la salida
    callbacks=None,       # Lista de callbacks para personalizar el entrenamiento
    validation_split=0.0, # Proporción de datos reservados para validación
    validation_data=None, # Datos específicos para validación (x_val, y_val)
    shuffle=True,         # Barajar los datos en cada época
    class_weight=None,    # Ponderación de clases para manejar desequilibrio
    sample_weight=None,   # Ponderación por muestra
    initial_epoch=0,      # Época inicial (útil al reanudar entrenamiento)
    steps_per_epoch=None, # Número de pasos por época (cuando x es un generador)
    validation_steps=None,# Pasos de validación por época (cuando validation_data es un generador)
    validation_batch_size=None, # Tamaño del lote para validación
    validation_freq=1,    # Frecuencia de validación (cada cuántas épocas validar)
    max_queue_size=10,    # Tamaño de la cola para datos generados
    workers=1,            # Número de hilos de procesamiento para generadores
    use_multiprocessing=False # Usar multiprocesamiento con generadores
)
"""

> Un generador es un objeto o función que produce datos de forma secuencial, en lugar de cargar todo el conjunto de datos en memoria al mismo tiempo. Los generadores son especialmente útiles cuando trabajas con conjuntos de datos grandes que no caben en la memoria RAM.

# Probamos el modelo
## Evaluate

In [None]:
# Evaluación del modelo en datos de prueba
print("=== Evaluación del modelo en datos no conocidos ===")

# Evaluar el modelo en el conjunto de prueba
results = net.evaluate(
    test_images,
    test_labels_cod,
)

# Mostrar los resultados de evaluación
results

In [None]:
print(f"Tamaño de 'results' (evaluate): {len(results)}")  # Número de métricas + pérdida

In [None]:
# Mostrar los resultados de evaluación
print("\nResultados del modelo en el conjunto de prueba:")
print(f"- Pérdida (Loss): {results[0]:.4f}")
print(f"- Precisión (Accuracy): {results[1]:.4f}")
print(f"- Recall: {results[2]:.4f}")
print(f"- Precisión (Precision): {results[3]:.4f}")
print(f"- AUC: {results[4]:.4f}")

## Predict

In [None]:
# Realizar predicciones en el conjunto de prueba
y_pred = net.predict(test_images)

In [None]:
# Mostrar el tamaño de y_pred
print(f"Tamaño de 'y_pred' (predict): {y_pred.shape}")

indice=0
# Mostrar las probabilidades de predicción para una imagen en formato vertical
print(f"\nPredicción para una imagen: {y_pred[indice]}")

print("\nPredicción para una imagen (formato vertical):")
for i, prob in enumerate(y_pred[indice]):
    print(f"Clase {i}: {prob:.16f}")

# Clase predicha (con mayor probabilidad)
predicted_class = y_pred[0].argmax()
print(f"\nClase predicha para esta imagen: {predicted_class}")

# Clase real (etiqueta real)
real_class = test_labels[0]  # Si las etiquetas están en formato numérico
print(f"Etiqueta real para esta imagen: {real_class}")


In [None]:
y_pred[0]

In [None]:
# Convertir probabilidades a clases predichas
y_pred_classes = net.predict(test_images).argmax(axis=1)

# Generar el reporte de clasificación
from sklearn.metrics import classification_report

report = classification_report(
    test_labels,              # Etiquetas reales (en enteros)
    y_pred_classes,              # Etiquetas predichas (en enteros)
    target_names=[f"Clase {i}" for i in range(10)],  # Nombres de las clases
    digits=4
)

print("=== Classification Report ===")
print(report)


In [None]:
y_pred_classes

### ¿Qué hacen exactamente `evaluate` y `predict`?

#### **`evaluate`**:
1. Divide los datos en lotes.
2. Calcula las métricas y la pérdida para cada lote.
3. Promedia los resultados en todos los lotes.

#### **`predict`**:
1. Divide los datos en lotes.
2. Calcula las predicciones para cada lote.
3. Devuelve las predicciones concatenadas para todo el conjunto de datos.


## Visualizamos el desempeño de la red

In [None]:
# Mostrar las claves del historial de entrenamiento
print("=== Keys en el historial de entrenamiento ===")
for key in H.history.keys():
    print(f"- {key}")


In [None]:
import math

# Obtener las métricas del historial
history = H.history
metrics = ['accuracy', 'auc', 'loss', 'precision', 'recall']  # Métricas de entrenamiento
val_metrics = [f"val_{metric}" for metric in metrics]         # Métricas de validación

# Configuración de los subplots
num_metrics = len(metrics)
num_rows = 3  # Número de filas
num_cols = math.ceil(num_metrics / num_rows)  # Columnas necesarias

# Tamaño más compacto de la figura
fig, axes = plt.subplots(num_rows, num_cols, figsize=(10, 6))

# Aplanar los ejes para facilitar la iteración
axes = axes.ravel()

# Crear gráficos para cada métrica
for i, metric in enumerate(metrics):
    ax = axes[i]

    # Graficar métricas de entrenamiento y validación
    ax.plot(history[metric], label=f'Train {metric}', marker='o', linestyle='-')
    ax.plot(history[val_metrics[i]], label=f'Validation {metric}', marker='x', linestyle='--')

    # Configuración del subplot
    ax.set_title(f'Evolución de {metric}', fontsize=10)
    ax.set_ylabel(metric.capitalize(), fontsize=8)
    ax.legend(fontsize=8)
    ax.grid(True)

# Limpiar subplots vacíos si hay menos métricas que subplots
for j in range(len(metrics), len(axes)):
    fig.delaxes(axes[j])

# Ajustar espaciado entre subplots
plt.tight_layout(pad=1.0)  # Ajustar márgenes entre gráficos
plt.show()


# Jugamos a predecir con la red

In [None]:
# Índice de una imagen
img_no = 877

# Selección de la imagen
img = test_images[img_no, :]

# Tamaño original de la imagen
print(f"\nTamaño actual de la imagen: {img.shape}")

# Reformar la imagen para visualizarla correctamente
img = img.reshape((28, 28))
img = img.astype('float32') * 255  # Reescalar a rango 0-255 para visualización
print(f"Tamaño reformado de la imagen: {img.shape}")

# Visualización de la imagen
plt.imshow(img, cmap=plt.cm.gray_r)
plt.title(f"Índice: {img_no}")
plt.axis('off')
plt.show()

# Etiqueta correspondiente
print(f"Etiqueta real : {np.argmax(test_labels_cod[img_no])}")

In [None]:
# Predicción del modelo
prediccion = net.predict(test_images[img_no:img_no+1])
prediccion_class = prediccion.argmax()

print(f"Clase predicha: {prediccion}")

# Mostrar las probabilidades en formato vertical
print("\n=== Predicción del modelo ===")
print("Probabilidades por clase:")
for i, prob in enumerate(prediccion[0]):  # Iterar sobre las probabilidades de cada clase
    print(f"Clase {i}: {prob:.16f}")

# Mostrar la clase predicha
print(f"\nClase predicha: {prediccion_class}")


In [None]:
# Distribución real (etiqueta real en formato one-hot)
real_distribution = test_labels_cod[img_no]

# Crear el gráfico con dos histogramas lado a lado
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(10, 3))

# Histograma de la predicción
ax1.bar(range(10), prediccion[0], edgecolor='black', color='blue', align='center')
ax1.set_title(f'Predicción de probabilidades para la imagen {img_no}', fontsize=8)
ax1.set_ylabel('Probabilidad', fontsize=8)
ax1.set_xlabel('Clase', fontsize=8)
ax1.set_xticks(range(10))
ax1.set_xticklabels([str(i) for i in range(10)], fontsize=8)
ax1.set_ylim(0, 1)

# Añadir etiquetas sobre las barras del histograma de predicción
for i, prob in enumerate(prediccion[0]):
    ax1.text(i, prob + 0.02, f'{prob:.2f}', ha='center', va='bottom', fontsize=8)

# Histograma de la etiqueta real
ax2.bar(range(10), real_distribution, edgecolor='black', color='green', align='center')
ax2.set_title(f'Distribución real', fontsize=8)
ax2.set_ylabel('Probabilidad', fontsize=8)
ax2.set_xlabel('Clase', fontsize=8)
ax2.set_xticks(range(10))
ax2.set_xticklabels([str(i) for i in range(10)], fontsize=8)
ax2.set_ylim(0, 1)

# Añadir etiquetas sobre las barras del histograma de la etiqueta real
for i, prob in enumerate(real_distribution):
    ax2.text(i, prob + 0.02, f'{prob:.2f}', ha='center', va='bottom', fontsize=8)

# Ajustar diseño para que las gráficas no se solapen
plt.tight_layout()
plt.show()

# Mostrar la clase predicha y la etiqueta real en la consola
print(f"\nClase predicha: {prediccion_class}")
print(f"Etiqueta real: {np.argmax(real_distribution)}")


In [None]:
# Umbral de baja confianza
low_confidence_threshold = 0.2

# Realizar predicciones para todo el conjunto de prueba
predictions = network.predict(test_images)
predicted_classes = np.argmax(predictions, axis=1)  # Clases predichas
true_classes = np.argmax(test_labels_cod, axis=1)   # Clases reales

# Identificar predicciones con baja confianza
low_confidence_indices = []
for i, pred in enumerate(predictions):
    predicted_class = predicted_classes[i]
    confidence = pred[predicted_class]  # Probabilidad de la clase predicha
    if confidence < low_confidence_threshold:
        low_confidence_indices.append((i, predicted_class, confidence))

# Mostrar las primeras 10 predicciones con baja confianza
print("=== Predicciones con baja confianza ===")
for idx, predicted_class, confidence in low_confidence_indices[:10]:
    print(f"Índice: {idx}, Clase predicha: {predicted_class}, Confianza: {confidence:.4f}")

print(f"\nTotal de predicciones con baja confianza: {len(low_confidence_indices)}")


In [None]:
# Configuración de subplots para mostrar varias imágenes en una sola figura
fig, axes = plt.subplots(3, 5, figsize=(8, 6))  # 3 filas, 5 columnas
axes = axes.ravel()  # Aplanar la matriz de subplots para iterar fácilmente

for i, (idx, _, _) in enumerate(low_confidence_indices[:15]):
    # Restaurar el tamaño y reescalar para visualización
    img = test_images[idx].reshape((28, 28))
    img = img.astype('float32') * 255

    # Mostrar cada imagen en un subplot
    axes[i].imshow(img, cmap='gray')
    axes[i].set_title(f"Índice: {idx}\nReal: {test_labels[idx]}\nPred: {y_pred_classes[idx]}", fontsize=8)
    axes[i].axis('off')  # Ocultar ejes

# Ajustar el diseño para evitar solapamientos
plt.tight_layout()
plt.show()


# Laboratorio 1

---

## Ejercicio 1: Optimización de Hiperparámetros para Máxima Precisión

1. Experimenta con los siguientes hiperparámetros para maximizar la precisión en el conjunto de prueba:
   - **Optimizador**: Prueba `adam`, `sgd`.
   - **Batch size**: Experimenta con `32`, `64`, `128`.
   - **Épocas**: Prueba con `10`, `20`.
   - **Neuronas y capas**: Varía el número de neuronas y capas densas.


   - Documenta los hiperparámetros probados y sus resultados.
   - Presenta los resultados en una tabla para analizar patrones.
   - Encuentre el mejor modelo. Llamaremos este modelo MMM

---


In [94]:
import keras_tuner as kt
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras.utils import to_categorical

def build_model(hp):
    model = keras.Sequential()
    model.add(layers.Input(shape=(train_images.shape[1],)))  # Verifica que el tamaño sea correcto
    
    # Número de capas densas
    for i in range(hp.Int('num_layers', 1, 3)):
        model.add(layers.Dense(
            units=hp.Choice(f'capa{i}_neuronas', [32, 64, 128]),
            activation='relu'
        ))
    
    model.add(layers.Dense(10, activation='softmax'))  # Ajusta según el número de clases
    
    model.compile(
        optimizer=hp.Choice('optimizer', ['adam', 'sgd']),
        loss=tf.keras.losses.CategoricalCrossentropy(),
        metrics=['accuracy', tf.keras.metrics.F1Score(average='micro')]  # Corregido
    )
    
    return model

# Definir el tuner para la búsqueda en grilla
hp = kt.HyperParameters()

list_hps = []
list_train_f1 = []
list_train_acc = []
list_test_f1 = []
list_test_acc = []
list_epochs = []
list_bs = []

for epochs in [10, 20]:
    
    for batch_size in [32, 64, 128]:

        project_name = f'GS_E{epochs}BS_{batch_size}'

        tuner = kt.GridSearch(
            build_model,
            objective='val_accuracy',
            executions_per_trial=1,
            project_name=project_name,
        )        

        tuner.search(
            train_images, to_categorical(train_labels),
            epochs=epochs,
            batch_size=batch_size,
            validation_data=(test_images, to_categorical(test_labels))
        )

        import os
        import json
        import pandas as pd

        folder_path = project_name

        for root, dirs, files in os.walk(folder_path):
            for dir_name in dirs:
                dir_path = os.path.join(root, dir_name)
                for file_name in os.listdir(dir_path):
                    if file_name.startswith("trial"):
                        trial = os.path.join(dir_path, file_name)
                        with open(trial, "r") as f:
                            config = json.load(f)

                        hps = config["hyperparameters"]["values"]
                        train_f1 = config["metrics"]["metrics"]["f1_score"]["observations"][0]["value"][0]
                        train_acc = config["metrics"]["metrics"]["accuracy"]["observations"][0]["value"][0]
                        val_f1 = config["metrics"]["metrics"]["val_f1_score"]["observations"][0]["value"][0]
                        val_acc = config["metrics"]["metrics"]["val_accuracy"]["observations"][0]["value"][0]

                        list_hps.append(hps)
                        list_train_f1.append(train_f1)
                        list_train_acc.append(list_train_acc)
                        list_test_f1.append(val_f1)
                        list_test_acc.append(val_acc)
                        list_epochs.append(epoch)
                        list_bs.append(batch_size)


data = pd.DataFrame({"Hiperparametros": list_hps,
                     "epocas" : list_epochs,
                     "lotes" : list_bs,
                     "train_f1": list_train_f1,
                     "test_f1": list_test_f1,
                     "train_accuracy": list_train_acc,
                     "test_accuracy": list_test_acc,})            
    

Trial 78 Complete [00h 00m 27s]
val_accuracy: 0.9577000141143799

Best val_accuracy So Far: 0.9818000197410583
Total elapsed time: 00h 30m 29s


In [9]:
import os
import pandas as pd
import json

list_hps = []
list_train_f1 = []
list_train_acc = []
list_test_f1 = []
list_test_acc = []
list_epochs = []
list_bs = []

base_dirs = [
    "GS_E10BS_32", "GS_E10BS_64", "GS_E10BS_128",
    "GS_E20BS_32", "GS_E20BS_64", "GS_E20BS_128"
]

for folder_path in base_dirs:
    for root, dirs, files in os.walk(folder_path):
        if "trial.json" in files:
                        with open(os.path.join(root, 'trial.json'), "r") as f:
                            config = json.load(f)

                        hps = config["hyperparameters"]["values"]
                        train_f1 = config["metrics"]["metrics"]["f1_score"]["observations"][0]["value"][0]
                        train_acc = config["metrics"]["metrics"]["accuracy"]["observations"][0]["value"][0]
                        val_f1 = config["metrics"]["metrics"]["val_f1_score"]["observations"][0]["value"][0]
                        val_acc = config["metrics"]["metrics"]["val_accuracy"]["observations"][0]["value"][0]

                        list_hps.append(hps)
                        list_train_f1.append(train_f1)
                        list_train_acc.append(train_acc)
                        list_test_f1.append(val_f1)
                        list_test_acc.append(val_acc)
                        list_epochs.append(int(folder_path[-2:]))
                        list_bs.append(int(folder_path[4:6]))

data = pd.DataFrame({"Hiperparametros": list_hps,
                     "epocas" : list_epochs,
                     "lotes" : list_bs,
                     "train_f1": list_train_f1,
                     "test_f1": list_test_f1,
                     "train_accuracy": list_train_acc,
                     "test_accuracy": list_test_acc})          


In [4]:
print("Número de registros cargados:", len(list_hps))
print("Ejemplo de hiperparámetros:", list_hps[:2])  # Muestra los primeros dos registros

Número de registros cargados: 468
Ejemplo de hiperparámetros: [{'num_layers': 1, 'capa0_neuronas': 32, 'optimizer': 'adam'}, {'num_layers': 1, 'capa0_neuronas': 32, 'optimizer': 'sgd'}]


In [8]:
train_acc = config["metrics"]["metrics"]["accuracy"]["observations"][0]["value"][0]
train_acc

0.961566686630249

In [10]:
data.to_csv("output.csv", index=False)

In [None]:
print(data.dtypes)  # Muestra los tipos de datos en cada columna

Hiperparametros     object
epocas               int64
lotes                int64
train_f1           float64
test_f1            float64
train_accuracy      object
test_accuracy      float64
dtype: object


In [None]:
best_hps = tuner.get_best_hyperparameters(num_trials=1)[0]
print(f"Mejores hiperparámetros: {best_hps.values}")
#best_model = tuner.get_best_models(1)[0]

In [None]:
for trial in tuner.oracle.trials.values():
    if trial.hyperparameters.values == best_hps.values:
        print(f"Trial ID: {trial.trial_id}")
        print(f"Hiperparámetros: {trial.hyperparameters.values}")
        print(f"Score: {trial.score}")  # Si hay una métrica de evaluación
        print("-" * 50)

In [None]:
import os

carpeta = "untitled_project"

for archivo in os.listdir(carpeta):
    ruta_completa = os.path.join(carpeta, archivo)
    if os.path.isfile(ruta_completa):  # Verifica que sea un archivo y no una carpeta
        print(ruta_completa)


In [None]:
import json

with open("untitled_project/trial_0001/trial.json", "r") as f:
    config = json.load(f)


train_f1 = config["metrics"]["metrics"]["f1_score"]["observations"][0]["value"][0]
train_acc = config["metrics"]["metrics"]["accuracy"]["observations"][0]["value"][0]
val_f1 = config["metrics"]["metrics"]["val_f1_score"]["observations"][0]["value"][0]
val_acc = config["metrics"]["metrics"]["val_accuracy"]["observations"][0]["value"][0]


config["hyperparameters"]["values"]

---

## Ejercicio 2: Flexibilidad Avanzada en la Definición de la Arquitectura

1. Define la  arquitectura de MMM utilizando tres enfoques: **secuencial**, **funcional** y **subclassing**.

2. **Preguntas**:
   - Compara los tres enfoques:
     - ¿Cuál es más claro y rápido de implementar?
     - ¿Cuál es más flexible para redes personalizadas y complejas?
   - Visualiza las estructuras usando `plot_model`.

3. **Extra**:
   - Añade una capa de normalización de lotes (**BatchNormalization**) después de cada capa oculta. Evalúa cómo afecta esto a la estructura del modelo.

---

In [None]:
# Secuencial 

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers

hps = {'num_layers': 3, 'capa0_neuronas': 128, 'optimizer': 'adam', 
       'capa1_neuronas': 128, 'capa2_neuronas': 128}

model = keras.Sequential([
    layers.Dense(hps['capa0_neuronas'], activation='relu', input_shape=(train_images.shape[1],)),
    layers.BatchNormalization(),
    layers.Dense(hps['capa1_neuronas'], activation='relu'),
    layers.BatchNormalization(),
    layers.Dense(hps['capa2_neuronas'], activation='relu'),
    layers.BatchNormalization(),
    layers.Dense(10, activation='sigmoid')  # Supongamos salida binaria
])

model.compile(optimizer=hps['optimizer'], loss='binary_crossentropy', metrics=['accuracy'])
model.summary()


In [None]:
# Funcional

# Entrada
inputs = keras.Input(shape=(train_images.shape[1],))  

# Capas ocultas
x = layers.Dense(hps['capa0_neuronas'], activation='relu')(inputs)
x = layers.BatchNormalization()(x)
x = layers.Dense(hps['capa1_neuronas'], activation='relu')(x)
x = layers.BatchNormalization()(x)
x = layers.Dense(hps['capa2_neuronas'], activation='relu')(x)
x = layers.BatchNormalization()(x)

# Capa de salida
outputs = layers.Dense(10, activation='sigmoid')(x)

# Definir el modelo
model = keras.Model(inputs=inputs, outputs=outputs)

model.compile(optimizer=hps['optimizer'], loss='binary_crossentropy', metrics=['accuracy'])
model.summary()


In [None]:
# Subclasing

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers

class Model(keras.Model):
    def __init__(self, hps):
        super(Model, self).__init__()
        self.dense1 = layers.Dense(hps['capa0_neuronas'], activation='relu')
        self.bn1 = layers.BatchNormalization()  # Nueva instancia
        self.dense2 = layers.Dense(hps['capa1_neuronas'], activation='relu')
        self.bn2 = layers.BatchNormalization()  # Nueva instancia
        self.dense3 = layers.Dense(hps['capa2_neuronas'], activation='relu')
        self.bn3 = layers.BatchNormalization()  # Nueva instancia
        self.output_layer = layers.Dense(10, activation='sigmoid')

        self._build_model()

    def _build_model(self):
        inputs = tf.keras.Input(shape=(28 * 28,))
        _ = self.call(inputs)

    def call(self, inputs):
        x = self.dense1(inputs)
        x = self.bn1(x)  # Aplicar BatchNormalization después de la capa densa
        x = self.dense2(x)
        x = self.bn2(x)
        x = self.dense3(x)
        x = self.bn3(x)
        return self.output_layer(x)

# Hiperparámetros
hps = {'num_layers': 3, 'capa0_neuronas': 128, 'optimizer': 'adam', 
       'capa1_neuronas': 128, 'capa2_neuronas': 128}

# Crear y compilar el modelo
model = Model(hps)
model.compile(optimizer=hps['optimizer'], loss='binary_crossentropy', metrics=['accuracy'])
model.summary()

---
## Ejercicio 3: Explorando y Extendiendo `evaluate` y `predict`

1. Investiga las opciones avanzadas de las funciones `evaluate` y `predict` en TensorFlow/Keras. Realiza un ejemplo de la utilidad de cada una.

2. Investigue como cambia las metricas de desempeño de MMM cuando cambia el tamaño de lote.

---

## **Model.predict()**

### **x:**

- Un numpy array o una lista de arrays.
- Un tensor o una lista de tensores.
- Un tf.data.Dataset, útil para manejar grandes volúmenes de datos de manera eficiente.
- Una objeto de keras.utils.PyDataset.

### **batch_size:** Especifica cuántas muestras se procesan en cada iteración.

Si es None, el valor predeterminado es 32.
No debes especificarlo si x es un tf.data.Dataset, un generador o un keras.utils.PyDataset, ya que estos ya manejan los lotes automáticamente.

### **verbose:** (Nivel de detalle en la salida)

- "auto": Se comporta como 1 en la mayoría de los casos.
- 0: No muestra nada.
- 1: Muestra una barra de progreso.
- 2: Muestra una línea de salida por cada iteración, útil cuando se ejecuta en producción o se guarda en un archivo de logs.

### **steps** (Número total de pasos):

- Si es None, se procesa hasta agotar los datos.
- Si x es un tf.data.Dataset, y steps=None, evaluará hasta que los datos se terminen.
- si steps=N, se ejecutarán N lotes y luego la predicción se detendrá, sin importar si hay más datos en el dataset.

### **callbacks:** (Lista de funciones de callback)

Los callbacks son objetos que permiten ejecutar funciones personalizadas mientras el modelo está haciendo predicciones.

## **model.evaluate()**

### **X**:

- Un NumPy array o lista de NumPy arrays (si el modelo tiene múltiples entradas).
- Un tensor o lista de tensores.
- Un diccionario donde las claves son los nombres de las entradas del modelo y los valores son los datos correspondientes.
- Un tf.data.Dataset, que debe devolver (inputs, targets) o (inputs, targets, sample_weights).
- Un generador o keras.utils.PyDataset que devuelva (inputs, targets) o (inputs, targets, sample_weights).

### **y** (datos de salida):

Son las etiquetas o valores reales que se compararán con las predicciones del modelo.
Deben ser un NumPy array o un tensor, igual que x.
Si x es un tf.data.Dataset o un keras.utils.PyDataset, no se debe especificar y, ya que los datos de salida se obtienen automáticamente del dataset.

### **batch_size** (tamaño del lote):

Número de muestras procesadas en cada paso.
Si no se especifica, se usa 32 por defecto.
No usar este parámetro si x es un tf.data.Dataset, generador o keras.utils.PyDataset, ya que estos ya manejan los lotes automáticamente.

### **verbose** (modo de salida):

"auto": Modo automático (1 en la mayoría de los casos).
0: No muestra nada (modo silencioso).
1: Muestra una barra de progreso.
2: Muestra solo una línea por cada paso.

### **sample_weight** (pesos de muestra):

Un NumPy array opcional para dar más importancia a ciertas muestras al calcular la pérdida.
Puede ser:
Un array 1D con el mismo número de elementos que x (cada muestra tiene un peso).
Un array 2D con forma (muestras, longitud_secuencia), útil para datos secuenciales donde cada paso en la secuencia tiene un peso diferente.

### **steps** (número de pasos o batches):

Número total de lotes (batches) que se ejecutarán antes de terminar la evaluación.
Si es None, se evaluarán todos los datos.
Si x es un tf.data.Dataset y steps=None, la evaluación continuará hasta que el dataset se agote.

### **callbacks** (funciones de retroalimentación):

Lista de instancias de keras.callbacks.Callback para ejecutar acciones durante la evaluación.
Útil para monitorear métricas o guardar información en tiempo real.

### **return_dict** (formato de salida):

False (por defecto): Devuelve la pérdida y las métricas como una lista de valores.
True: Devuelve un diccionario donde las claves son los nombres de las métricas y los valores sus respectivos resultados.

## Ejercicio 4: Interpretación y Análisis del Desempeño

1.
   - **Precisión por Clase**:
     - Calcula y interpreta el desempeño del modelo para cada clase.
   - **Matriz de Confusión**:
     - Genera una matriz de confusión para identificar las clases más confundidas.
   - **Confianza en las Predicciones**:
     - Crea histogramas para visualizar la distribución de probabilidades predichas por clase.
   - **Análisis de Errores**:
     - Selecciona ejemplos mal clasificados, visualiza las imágenes y discute posibles razones de los errores.
   - Encuentre el umbral de mejor desempeño en cada clase.

---

In [None]:
import json
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

# Cargar el JSON
with open("untitled_project/trial_0068/trial.json", "r") as f:
    config = json.load(f)

# Extraer hiperparámetros
hp_values = config["hyperparameters"]["values"]
num_layers = hp_values["num_layers"]
neurons_per_layer = [hp_values[f"capa{i}_neuronas"] for i in range(num_layers)]
optimizer = hp_values["optimizer"]

# Construir el modelo
model = Sequential()
model.add(Dense(neurons_per_layer[0], activation="relu", input_shape=(train_images.shape[1],)))  # Ajusta input_dim según tu dataset

for neurons in neurons_per_layer[1:]:
    model.add(Dense(neurons, activation="relu"))

model.add(Dense(10, activation="sigmoid"))  # Asumiendo una salida binaria, cambia según tu caso

# Compilar el modelo
model.compile(optimizer=optimizer, loss="binary_crossentropy", metrics=["accuracy"])

# Cargar pesos
model.load_weights("untitled_project/trial_0068/checkpoint.weights.h5")

# Verificar la estructura
model.summary()

model.load_weights("untitled_project\\trial_0068\\checkpoint.weights.h5")


In [None]:
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import tensorflow as tf
from sklearn.metrics import classification_report, confusion_matrix

# 🚀 Hacer predicciones con el modelo
y_pred_probs = model.predict(test_images)  # Probabilidades por clase
y_pred_classes = np.argmax(y_pred_probs, axis=1)  # Clases predichas

# 1️⃣ **Precisión por Clase**
print("\n🔹 Reporte de clasificación por clase:")
print(classification_report(test_labels, y_pred_classes,digits=4))


# 2️⃣ **Matriz de Confusión**
cm = confusion_matrix(test_labels, y_pred_classes)
plt.figure(figsize=(8, 6))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=range(len(cm)), yticklabels=range(len(cm)))
plt.xlabel("Predicción")
plt.ylabel("Clase real")
plt.title("Matriz de Confusión")
plt.show()

# 3️⃣ **Confianza en las Predicciones**
plt.figure(figsize=(10, 5))
for i in range(len(np.unique(test_labels))):  # Iterar por cada clase
    plt.hist(y_pred_probs[test_labels == i, i], bins=20, alpha=0.5, label=f"Clase {i}")
plt.xlabel("Probabilidad predicha")
plt.ylabel("Frecuencia")
plt.title("Distribución de Probabilidades Predichas por Clase")
plt.legend()
plt.show()

# 4️⃣ **Análisis de Errores**: Ejemplos mal clasificados
errores_idx = np.where(y_pred_classes != test_labels)[0]  # Índices de errores
num_ejemplos = min(20, len(errores_idx))  # Mostrar hasta 5 errores

_, (imagenes_test, _) = mnist.load_data()

import matplotlib.pyplot as plt

filas = 4
columnas = 5

plt.figure(figsize=(15, 6))
for i, idx in enumerate(errores_idx[:filas * columnas]):
    plt.subplot(filas, columnas, i + 1)
    plt.imshow(imagenes_test[idx].squeeze(), cmap='gray')  # Ajustar si son imágenes en RGB
    plt.title(f"Real: {test_labels[idx]}\nPred: {y_pred_classes[idx]}")
    plt.axis("off")

plt.suptitle("Ejemplos Mal Clasificados")
plt.tight_layout()
plt.show()

# 5️⃣ **Encontrar el Mejor Umbral para cada Clase**
from sklearn.metrics import precision_recall_curve

best_thresholds = {}
for i in range(to_categorical(test_labels).shape[1]):  # Para cada clase en one-hot encoding
    precision, recall, thresholds = precision_recall_curve(to_categorical(test_labels)[:, i], y_pred_probs[:, i])
    f1_scores = 2 * (precision * recall) / (precision + recall)

    best_idx = np.argmax(f1_scores[:-1])  # Índice del mejor F1-score (evita NaN)
    best_threshold = thresholds[best_idx]
    best_f1 = f1_scores[best_idx]

    best_thresholds[i] = (best_threshold, best_f1)  # Guardar umbral y F1-score

print("\n🔹 Mejor umbral y F1-score para cada clase:")
for cls, (thresh, f1) in best_thresholds.items():
    print(f"Clase {cls}: Umbral = {thresh:.4f}, F1-score = {f1:.4f}")
