#1. Carga de datos

## 1.1 Importar librerías

In [None]:
!pip install keras-tuner

In [None]:
import numpy as np
import pandas as pd
import joblib
from matplotlib import pyplot as plt
import cv2
import seaborn as sns
from google.colab import drive

import tensorflow as tf
from tensorflow.keras import layers, models, regularizers
from tensorflow.keras.models import Sequential, load_model
from tensorflow.keras.layers import Input, Conv2D, MaxPooling2D, Dropout, Flatten, Dense
from tensorflow.keras.callbacks import ModelCheckpoint, EarlyStopping

from sklearn import metrics
from sklearn.metrics import (
    roc_curve, auc, RocCurveDisplay,
    confusion_matrix, ConfusionMatrixDisplay,
    classification_report , roc_auc_score
)
from sklearn.utils import class_weight

import keras_tuner as kt

import os

## 1.2 Cargar bases de datos procesadas

In [None]:
drive.mount('/content/drive')
x_train = joblib.load('/content/drive/MyDrive/cod/A3_helath/data/salidas/x_train.pkl')
y_train = joblib.load('/content/drive/MyDrive/cod/A3_helath/data/salidas/y_train.pkl')
x_test = joblib.load('/content/drive/MyDrive/cod/A3_helath/data/salidas/x_test.pkl')
y_test = joblib.load('/content/drive/MyDrive/cod/A3_helath/data/salidas/y_test.pkl')

x_train[0]

In [None]:
# Conversión a float32 para escalar
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')

In [None]:
# Escalado entre 0 y 1
x_train /= 255
x_test /= 255

In [None]:
# Visualizar forma de las imagenes para luego convertir a 1D
print("Shape x_train:", x_train.shape)
print("Shape x_test:", x_test.shape)

In [None]:
np.prod(x_train[1].shape) # cantidad de variables por imagen

In [None]:
np.unique(y_train, return_counts=True)
np.unique(y_test, return_counts=True)

#2. Modelos

##2.1 Red Neuronal Convolucional NNC

In [None]:
# Cantidad de clases
num_classes = len(np.unique(y_train))
print(f"Número de clases detectadas: {num_classes}")

cnn_model = Sequential()

# Primera capa convolucional y de pooling
# input_shape es solo para la primera capa
# Conv2D: 32 filtros, tamaño del filtro 3x3, activación ReLU
cnn_model.add(Conv2D(32, (3, 3), activation='relu', input_shape=x_train.shape[1:]))
# MaxPooling2D: Ventana de pooling 2x2. Reduce la resolución a la mitad.
cnn_model.add(MaxPooling2D((2, 2)))

# Segunda capa convolucional y de pooling
cnn_model.add(Conv2D(64, (3, 3), activation='relu'))
cnn_model.add(MaxPooling2D((2, 2)))

# Aplanar la salida de las capas convolucionales antes de las capas densas
cnn_model.add(Flatten())

# Capas densas
cnn_model.add(Dense(128, activation='relu'))
cnn_model.add(Dense(64, activation='relu'))

# Capa de salida para clasificación multiclase (con softmax y num_classes)
cnn_model.add(Dense(num_classes, activation='softmax'))

# Compilar el modelo
cnn_model.compile(optimizer='adam',
                  loss='sparse_categorical_crossentropy',
                  metrics=['accuracy']) # Añadir más métricas si deseamos, como AUC, Recall, Precision

# Mostrar un resumen de la arquitectura del modelo
cnn_model.summary()

# Guardar el mejor modelo
checkpoint = ModelCheckpoint("mejor_cnn_modelo.keras", monitor="val_accuracy", save_best_only=True, mode='max', verbose=1)

# Entrenamiento
history = cnn_model.fit(x_train, y_train,
                        batch_size=100,
                        epochs=5,
                        validation_data=(x_test, y_test),
                        callbacks=[checkpoint])

In [None]:
# Obtener las probabilidades de predicción para el modelo CNN en el conjunto de prueba
# El modelo CNN con activación softmax en la capa de salida ya produce probabilidades
y_pred_proba_cnn = cnn_model.predict(x_test)

# Calcular el AUC utilizando las probabilidades predichas y las etiquetas reales
# Usamos multi_class='ovr' y average='macro' para manejar clasificación multiclase
try:
    roc_auc_cnn = roc_auc_score(y_test, y_pred_proba_cnn, multi_class='ovr', average='macro')
    print(f"AUC para el modelo CNN en el conjunto de prueba: {roc_auc_cnn:.4f}")
except ValueError as e:
    print(f"No se pudo calcular el AUC para el modelo CNN. Error: {e}")
    print("Esto puede ocurrir si hay clases que no aparecen en las predicciones o en los datos reales.")

In [None]:
checkpoint

In [None]:
# Evaluar el modelo en los datos de prueba
loss, accuracy = cnn_model.evaluate(x_test, y_test, verbose=0)

# Imprimir los resultados de la evaluación
print(f"Loss en los datos de prueba: {loss:.4f}")
print(f"Precisión en los datos de prueba: {accuracy:.4f}")
print(f"AUC en los datos de prueba: {roc_auc_cnn:.4f}")

In [None]:
# Obtener las predicciones del modelo CNN en el conjunto de prueba
y_pred_cnn = np.argmax(cnn_model.predict(x_test), axis=-1)

# Definir las etiquetas de las clases (asegurarse de que coincidan con el orden)
class_labels = ['glioma', 'meningioma', 'pituitary', 'notumor']

# Matriz de confusión para el modelo CNN
cm_cnn = confusion_matrix(y_test, y_pred_cnn, labels=[0, 1, 2, 3])

# Visualizar la matriz de confusión
disp_cnn = ConfusionMatrixDisplay(confusion_matrix=cm_cnn, display_labels=class_labels)
disp_cnn.plot(cmap='Blues', xticks_rotation=45)
plt.title("Matriz de Confusión - CNN")
plt.show()

##2.2 Regularización L2 y Dropout

In [None]:
# Hiperparámetros
reg_strength = 0.001
dropout_rate = 0.3
num_classes = len(np.unique(y_train))

# Definición del modelo CNN
cnn_model2 = Sequential([
    Input(shape=x_train.shape[1:]),

    Conv2D(32, (3, 3), activation='relu', padding='same',
           kernel_regularizer=regularizers.l2(reg_strength)),
    MaxPooling2D((2, 2)),
    Dropout(dropout_rate),

    Conv2D(64, (3, 3), activation='relu', padding='same',
           kernel_regularizer=regularizers.l2(reg_strength)),
    MaxPooling2D((2, 2)),
    Dropout(dropout_rate),

    Flatten(),

    Dense(64, activation='relu',
          kernel_regularizer=regularizers.l2(reg_strength)),
    Dropout(dropout_rate),

    Dense(num_classes, activation='softmax')  # Salida multiclase
])

# Compilación
cnn_model2.compile(
    loss='sparse_categorical_crossentropy',
    optimizer='adam',
    metrics=['accuracy']
)

# Mostrar arquitectura
cnn_model2.summary()

# Callbacks
checkpoint = ModelCheckpoint("mejor_cnn_multiclase.keras",
                             monitor="val_accuracy",
                             save_best_only=True,
                             mode="max",
                             verbose=1)

early_stop = EarlyStopping(monitor='val_loss', patience=5,
                           restore_best_weights=True, verbose=1)

# Entrenamiento
history = cnn_model2.fit(
    x_train, y_train,
    batch_size=64,
    epochs=10,
    validation_data=(x_test, y_test),
    callbacks=[checkpoint, early_stop],
    verbose=2
)

Epoch 1/10

Epoch 1: val_accuracy improved from -inf to 0.74371, saving model to mejor_cnn_multiclase.keras
90/90 - 256s - 3s/step - accuracy: 0.5860 - loss: 1.2521 - val_accuracy: 0.7437 - val_loss: 0.8686
Epoch 2/10

Epoch 2: val_accuracy improved from 0.74371 to 0.75896, saving model to mejor_cnn_multiclase.keras
90/90 - 256s - 3s/step - accuracy: 0.7848 - loss: 0.7341 - val_accuracy: 0.7590 - val_loss: 0.7390
Epoch 3/10

Epoch 3: val_accuracy improved from 0.75896 to 0.83600, saving model to mejor_cnn_multiclase.keras
90/90 - 259s - 3s/step - accuracy: 0.8255 - loss: 0.6548 - val_accuracy: 0.8360 - val_loss: 0.6109
Epoch 4/10


In [None]:
# Obtener las probabilidades de predicción para el modelo CNN2 en el conjunto de prueba
y_pred_proba_cnn2 = cnn_model2.predict(x_test)

# Calcular el AUC utilizando las probabilidades predichas y las etiquetas reales
try:
    roc_auc_cnn2 = roc_auc_score(y_test, y_pred_proba_cnn2, multi_class='ovr', average='macro')
except ValueError as e:
    print(f"No se pudo calcular el AUC para el modelo CNN2. Error: {e}")
    print("Esto puede ocurrir si hay clases que no aparecen en las predicciones o en los datos reales.")
    roc_auc_cnn2 = None

# Evaluar el modelo en los datos de prueba
loss2, accuracy2 = cnn_model2.evaluate(x_test, y_test, verbose=0)

# Imprimir los resultados de la evaluación
print(f"Loss en los datos de prueba: {loss2:.4f}")
print(f"Precisión en los datos de prueba: {accuracy2:.4f}")
if roc_auc_cnn2 is not None:
    print(f"AUC en los datos de prueba: {roc_auc_cnn2:.4f}")

In [None]:
# Obtener las predicciones del modelo CNN2 en el conjunto de prueba
y_pred_cnn2 = np.argmax(y_pred_proba_cnn2, axis=-1)

# Definir las etiquetas de las clases (asegurarse de que coincidan con el orden)
class_labels = ['glioma', 'meningioma', 'pituitary', 'notumor']

# Matriz de confusión para el modelo CNN2
cm_cnn2 = confusion_matrix(y_test, y_pred_cnn2, labels=[0, 1, 2, 3])

# Visualizar la matriz de confusión
disp_cnn2 = ConfusionMatrixDisplay(confusion_matrix=cm_cnn2, display_labels=class_labels)
disp_cnn2.plot(cmap='Blues', xticks_rotation=45)
plt.title("Matriz de Confusión - CNN2 (con L2 y Dropout)")
plt.show()

## 2.3 Búsqueda de hiperparámetros

In [None]:
def build_model(hp):
    # Hiperparámetros a buscar
    dropout_rate = hp.Float('dropout', min_value=0.1, max_value=0.5, step=0.1)
    reg_strength = hp.Float("l2", min_value=0.0001, max_value=0.01, sampling="log")
    filters = hp.Int('filters', min_value=16, max_value=64, step=16)
    dense_units = hp.Int('dense_units', min_value=32, max_value=128, step=32)

    model = tf.keras.Sequential([
        tf.keras.layers.Input(shape=x_train.shape[1:]),

        tf.keras.layers.Conv2D(filters, (3, 3), activation='relu', padding='same',
                               kernel_regularizer=tf.keras.regularizers.l2(reg_strength)),
        tf.keras.layers.MaxPooling2D((2, 2)),
        tf.keras.layers.Dropout(dropout_rate),

        tf.keras.layers.Conv2D(filters * 2, (3, 3), activation='relu', padding='same',
                               kernel_regularizer=tf.keras.regularizers.l2(reg_strength)),
        tf.keras.layers.MaxPooling2D((2, 2)),
        tf.keras.layers.Dropout(dropout_rate),

        tf.keras.layers.Flatten(),
        tf.keras.layers.Dense(dense_units, activation='relu'),
        tf.keras.layers.Dropout(dropout_rate),

        tf.keras.layers.Dense(num_classes, activation='softmax')
    ])

    model.compile(
        optimizer='adam',
        loss='sparse_categorical_crossentropy',
        metrics=['accuracy']
    )

    return model

In [None]:
# Definir tuner
tuner = kt.RandomSearch(
    build_model,
    objective=kt.Objective('val_accuracy', direction='max'),
    max_trials=15,
    executions_per_trial=1,
    directory='tuner_dir',
    project_name='cnn_multiclase'
)

# Mostrar búsqueda
tuner.search_space_summary()

# Buscar
tuner.search(x_train, y_train,
             epochs=10,
             batch_size=64,
             validation_data=(x_test, y_test),
             callbacks=[EarlyStopping(patience=3, restore_best_weights=True)],
             verbose=2)

In [None]:
# Obtener el mejor modelo
cnn_model3 = tuner.get_best_models(num_models=1)[0]
cnn_model3.summary()

In [None]:
# Obtener las probabilidades de predicción para el mejor modelo (CNN3) en el conjunto de prueba
y_pred_proba_cnn3 = cnn_model3.predict(x_test)

# Calcular el AUC utilizando las probabilidades predichas y las etiquetas reales
try:
    roc_auc_cnn3 = roc_auc_score(y_test, y_pred_proba_cnn3, multi_class='ovr', average='macro')
except ValueError as e:
    print(f"No se pudo calcular el AUC para el modelo CNN3. Error: {e}")
    print("Esto puede ocurrir si hay clases que no aparecen en las predicciones o en los datos reales.")
    roc_auc_cnn3 = None

# Evaluar el mejor modelo en los datos de prueba
loss3, accuracy3 = cnn_model3.evaluate(x_test, y_test, verbose=0)

# Imprimir los resultados de la evaluación
print(f"Loss en los datos de prueba: {loss3:.4f}")
print(f"Precisión en los datos de prueba: {accuracy3:.4f}")
if roc_auc_cnn3 is not None:
    print(f"AUC en los datos de prueba: {roc_auc_cnn3:.4f}")

In [None]:
# Obtener las predicciones del modelo CNN2 en el conjunto de prueba
y_pred_cnn3 = np.argmax(y_pred_proba_cnn3, axis=-1)

# Definir las etiquetas de las clases (asegurarse de que coincidan con el orden)
class_labels = ['glioma', 'meningioma', 'pituitary', 'notumor']

# Matriz de confusión para el modelo CNN2
cm_cnn3 = confusion_matrix(y_test, y_pred_cnn3, labels=[0, 1, 2, 3])

# Visualizar la matriz de confusión
disp_cnn3 = ConfusionMatrixDisplay(confusion_matrix=cm_cnn3, display_labels=class_labels)
disp_cnn3.plot(cmap='Blues', xticks_rotation=45)
plt.title("Matriz de Confusión - CNN3 (Tunner)")
plt.show()

# Exportar mejor modelo

In [None]:
# Crear DataFrame de comparación solo para los dos modelos CNN
data_cnn = {
    'Modelo': ['CNN (base)', 'CNN (L2 + Dropout)', 'CNN (Búsquedad Hiperparámetros)'],
    'Accuracy (Test)': [accuracy, accuracy2, accuracy3],
    'AUC (Test)': [roc_auc_cnn, roc_auc_cnn2, roc_auc_cnn3],
    'Loss (Test)': [loss, loss2, loss3]
}

df_cnn_comparison = pd.DataFrame(data_cnn)

# Mostrar la tabla comparativa
print("Comparación de rendimiento entre modelos CNN:")
display(df_cnn_comparison)

In [None]:
# Exportar modelo con optimización de hiperparámetros
os.makedirs('salidas', exist_ok=True)
cnn_model3.save('salidas/best_model.keras')