# Evaluaci√≥n Comparativa de Backbones CNN para Clasificaci√≥n Binaria

En este cuaderno se eval√∫an de forma autom√°tica varios modelos preentrenados (backbones) sobre nuestro conjunto de datos binario. El objetivo es determinar cu√°l de ellos ofrece el mejor rendimiento en t√©rminos de precisi√≥n, p√©rdida de validaci√≥n, F1-Score y tiempo de entrenamiento, para seleccionarlo como base del entrenamiento final.

Este proceso es equivalente a un "LazyPredict" adaptado a Deep Learning con Keras.



## Paso 1 ‚Äì Importaci√≥n de librer√≠as

Importamos todas las dependencias necesarias para definir los modelos, gestionar los datos y registrar los resultados.


In [1]:
import time
import pandas as pd
import numpy as np
from pathlib import Path
from sklearn.metrics import f1_score

import tensorflow as tf
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Dense, GlobalAveragePooling2D
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.callbacks import EarlyStopping
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.applications import (
    MobileNetV2, EfficientNetB0, ResNet50, DenseNet121,
    InceptionV3, NASNetMobile, Xception, VGG16
)


## Paso 2 ‚Äì Rutas y carga de datos

Cargamos los conjuntos de entrenamiento, validaci√≥n y prueba desde archivos CSV, y los preparamos para su uso mediante `ImageDataGenerator`. Esta fase incluye la normalizaci√≥n y el redimensionamiento de las im√°genes.


In [9]:
from pathlib import Path
import pandas as pd
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# Rutas de los CSVs
DATA_SPLIT_DIR = Path("../data/binario_split")
TRAIN_CSV = DATA_SPLIT_DIR / "train.csv"
VAL_CSV   = DATA_SPLIT_DIR / "val.csv"

# Par√°metros
IMG_SIZE = (224, 224)
BATCH_SIZE = 32

# Carga de los CSVs sin codificaci√≥n
df_train = pd.read_csv(TRAIN_CSV)
df_val = pd.read_csv(VAL_CSV)

# Preprocesamiento de im√°genes
datagen = ImageDataGenerator(rescale=1./255)

# Generador para entrenamiento
train_gen = datagen.flow_from_dataframe(
    dataframe=df_train,
    x_col="filepath",      # columna con la ruta a la imagen
    y_col="label",         # etiqueta binaria como string
    directory=None,        # rutas ya incluidas en 'filepath'
    target_size=IMG_SIZE,
    batch_size=BATCH_SIZE,
    class_mode="binary"
)

# Generador para validaci√≥n
val_gen = datagen.flow_from_dataframe(
    dataframe=df_val,
    x_col="filepath",
    y_col="label",
    directory=None,
    target_size=IMG_SIZE,
    batch_size=BATCH_SIZE,
    class_mode="binary"
)



Found 6907 validated image filenames belonging to 2 classes.
Found 987 validated image filenames belonging to 2 classes.


## Paso 3 ‚Äì Funci√≥n constructora de modelos

Definimos una funci√≥n que crea un modelo CNN con un backbone preentrenado y una capa densa de salida para clasificaci√≥n binaria. Se congelan los pesos del modelo base para reducir el tiempo de entrenamiento.


In [10]:
def build_model(backbone_fn, input_shape=(224, 224, 3)):
    base = backbone_fn(include_top=False, weights="imagenet", input_shape=input_shape)
    base.trainable = False  # No entrenamos el backbone

    x = GlobalAveragePooling2D()(base.output)
    output = Dense(1, activation='sigmoid')(x)

    model = Model(inputs=base.input, outputs=output)
    model.compile(optimizer=Adam(1e-4), loss='binary_crossentropy', metrics=['accuracy'])
    return model


## Paso 4 ‚Äì Selecci√≥n de modelos a comparar

Especificamos los modelos preentrenados que evaluaremos como posibles candidatos a utilizar en el entrenamiento final.


In [11]:
backbones = {
    "MobileNetV2": MobileNetV2,
    "EfficientNetB0": EfficientNetB0,
    "ResNet50": ResNet50,
    "DenseNet121": DenseNet121,
    "InceptionV3": InceptionV3,
    "NASNetMobile": NASNetMobile,
    "Xception": Xception,
    "VGG16": VGG16
}


## Paso 5 ‚Äì Entrenamiento y evaluaci√≥n de cada backbone

Entrenamos cada uno de los modelos por unas pocas √©pocas para tener una idea comparativa. Se mide el tiempo de entrenamiento, la precisi√≥n de validaci√≥n, la p√©rdida y el F1-Score.


In [12]:
resultados = []

for nombre, backbone_fn in backbones.items():
    print(f"\nüîç Entrenando backbone: {nombre}")
    start = time.time()

    model = build_model(backbone_fn, input_shape=(224, 224, 3))
    es = EarlyStopping(monitor="val_accuracy", patience=2, restore_best_weights=True)

    history = model.fit(
        train_gen,
        validation_data=val_gen,
        epochs=5,
        callbacks=[es],
        verbose=0
    )

    val_acc = history.history["val_accuracy"][-1]
    val_loss = history.history["val_loss"][-1]

    # Evaluar F1
    val_gen.reset()
    y_true = val_gen.classes
    y_pred_prob = model.predict(val_gen)
    y_pred = (y_pred_prob > 0.5).astype(int)
    f1 = f1_score(y_true, y_pred)

    duracion = time.time() - start
    resultados.append({
        "Backbone": nombre,
        "Val Accuracy": round(val_acc, 4),
        "Val Loss": round(val_loss, 4),
        "F1 Score": round(f1, 4),
        "Tiempo (s)": int(duracion)
    })



üîç Entrenando backbone: MobileNetV2


  self._warn_if_super_not_called()


[1m31/31[0m [32m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[37m[0m [1m6s[0m 169ms/step

üîç Entrenando backbone: EfficientNetB0
[1m31/31[0m [32m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[37m[0m [1m12s[0m 343ms/step

üîç Entrenando backbone: ResNet50
Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/resnet/resnet50_weights_tf_dim_ordering_tf_kernels_notop.h5
[1m94765736/94765736[0m [32m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[37m[0m [1m3s[0m 0us/step
[1m31/31[0m [32m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[37m[0m [1m23s[0m 698ms/step

üîç Entrenando backbone: DenseNet121
Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/densenet/densenet121_weights_tf_dim_ordering_tf_kernels_notop.h5
[1m29084464/29084464[0m [32m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[37m[0m [1m2s[0m 0us/

## Paso 6 ‚Äì Comparativa final de resultados

Mostramos los resultados ordenados por F1 Score para facilitar la selecci√≥n del mejor modelo.


In [13]:
df_resultados = pd.DataFrame(resultados)
df_resultados = df_resultados.sort_values(by="F1 Score", ascending=False).reset_index(drop=True)
df_resultados


Unnamed: 0,Backbone,Val Accuracy,Val Loss,F1 Score,Tiempo (s)
0,DenseNet121,0.619,0.6517,0.5068,946
1,InceptionV3,0.6413,0.6361,0.467,523
2,MobileNetV2,0.6353,0.6426,0.4395,187
3,NASNetMobile,0.6261,0.6526,0.439,390
4,Xception,0.6596,0.6317,0.4233,1113
5,ResNet50,0.5988,0.681,0.3956,852
6,VGG16,0.6272,0.6713,0.3917,2198
7,EfficientNetB0,0.5066,0.6942,0.0,242


## Paso 7 ‚Äì Guardado de resultados

Guardamos la tabla comparativa para documentaci√≥n futura y trazabilidad del proceso de selecci√≥n.


In [14]:
df_resultados.to_csv("../models/resumen_backbones.csv", index=False)
