# 1. librerías necesarias para construir, entrenar y evaluar el modelo CNN VGG16, además de herramientas para manejo de datos, visualización y métricas.

In [None]:
import tensorflow as tf
from tensorflow.keras.applications import VGG16
from tensorflow.keras.layers import Dense, GlobalAveragePooling2D, Dropout
from tensorflow.keras.models import Model
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.callbacks import EarlyStopping, ReduceLROnPlateau, ModelCheckpoint
import matplotlib.pyplot as plt
import os
import numpy as np
from sklearn.utils.class_weight import compute_class_weight
from sklearn.metrics import classification_report, confusion_matrix
import seaborn as sns


# 2. Definicion de hiperparametros

In [None]:
IMG_SIZE = (128, 224)
BATCH_SIZE = 64
EPOCHS = 20
LR_VGG = 1e-5


# 3. verficacion de rutas de datos

In [None]:
base_dir = 'data/dataset'
train_dir = os.path.join(base_dir, 'train')
val_dir = os.path.join(base_dir, 'val')
test_dir = os.path.join(base_dir, 'test')


# 4. Detecion automatica de clases 

In [None]:
def get_classes_from_directory(directory):
    return sorted([
        d for d in os.listdir(directory)
        if os.path.isdir(os.path.join(directory, d)) and not d.startswith('.')
    ])

CLASSES = get_classes_from_directory(train_dir)
NUM_CLASSES = len(CLASSES)

print(CLASSES)


# 5. Aumentacion de datos para entrenamiento

In [None]:
train_datagen = ImageDataGenerator(
    rescale=1./255,
    rotation_range=25,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.15,
    zoom_range=0.2,
    horizontal_flip=True,
    brightness_range=[0.7, 1.3],
    channel_shift_range=30.0,
    fill_mode='nearest',
    dtype='float32'
)

val_test_datagen = ImageDataGenerator(rescale=1./255, dtype='float32')


## train_datagen = ImageDataGGenerator(..)

este generador solo usa el cojunto den entrenamiento

Argumentos utilizados: 

| Parámetro                     | Descripción                                                                                                   |
| ----------------------------- | ------------------------------------------------------------------------------------------------------------- |
| `rescale=1./255`              | Escala los píxeles de \[0, 255] a \[0, 1], necesario para redes neuronales.                                   |
| `rotation_range=25`           | Gira la imagen aleatoriamente entre -25° y 25°.                                                               |
| `width_shift_range=0.2`       | Desplaza la imagen horizontalmente hasta un 20% del ancho.                                                    |
| `height_shift_range=0.2`      | Desplaza la imagen verticalmente hasta un 20% de la altura.                                                   |
| `shear_range=0.15`            | Aplica una distorsión en forma de cizalla (shear), inclinando la imagen.                                      |
| `zoom_range=0.2`              | Aplica zoom aleatorio hasta un 20% más o menos.                                                               |
| `horizontal_flip=True`        | Voltea horizontalmente la imagen (izquierda/derecha), útil para simetría.                                     |
| `brightness_range=[0.7, 1.3]` | Ajusta el brillo aleatoriamente entre 70% y 130%.                                                             |
| `channel_shift_range=30.0`    | Cambia aleatoriamente los valores de los canales de color (RGB) hasta ±30 unidades.                           |
| `fill_mode='nearest'`         | Cuando se hace una transformación que genera espacios vacíos, los rellena con el valor del píxel más cercano. |
| `dtype='float32'`             | El tipo de datos que va a tener cada imagen generada (por defecto es `float32`).                              |



basicamente lo que hace toma una imagen original y crea nuevas versiones modificadas aleatoriamente en cada epoca del entranamiento.




## val_test_datagen = ImageDataGenerator(..)

este lo utilizamos para validacion y test . no aplicamos ningun tipo de aumento, ya que no queremos alterar los datos al evaluar el rendimiento del modelo 

1. rescale=1/255 -> normaliza los pixeles

2. dtype='float32' -> mismo tipo de dato del anterior

# 6. Generadores de datos

In [None]:
train_generator = train_datagen.flow_from_directory(
    train_dir,
    target_size=IMG_SIZE,
    batch_size=BATCH_SIZE,
    class_mode='categorical',
    classes=CLASSES
)

val_generator = val_test_datagen.flow_from_directory(
    val_dir,
    target_size=IMG_SIZE,
    batch_size=BATCH_SIZE,
    class_mode='categorical',
    classes=CLASSES
)

test_generator = val_test_datagen.flow_from_directory(
    test_dir,
    target_size=IMG_SIZE,
    batch_size=BATCH_SIZE,
    class_mode='categorical',
    shuffle=False,
    classes=CLASSES
)


esta porcion de codigo leen las imagenes de disco , le asginana etiquetas segun la clase que es, la transforma y la entraga en lotes a la red neuronal para el entrenamiento la validacion y el testeo

# 7. Calculo de pesos por clase para balancear el entrenamiento

In [None]:
class_weights_array = compute_class_weight(
    class_weight='balanced',
    classes=np.unique(train_generator.classes),
    y=train_generator.classes
)
class_weights = dict(enumerate(class_weights_array))


Este código calcula pesos para cada clase según su frecuencia en los datos de entrenamiento, de forma que las clases menos frecuentes tengan un peso mayor. Esto ayuda a que el modelo no se sesgue hacia las clases más comunes.

1. compute_class_weight con 'balanced' genera esos pesos automáticamente.

2. class_weights es un diccionario {clase: peso} que luego se usa en el entrenamiento para darle más importancia a las clases minoritarias.

# 8. Construccion del modelo VGG16 

base_model = VGG16(
    weights='imagenet', 
    include_top=False, # quitamos la capa final de clasificacion 
    input_shape=(IMG_SIZE[0], IMG_SIZE[1], 3)) 
base_model.trainable = False


se carga el modelo preentrenado (sin la capa de clasificacion final) con pesos de imageNet. congelamos la capa convulacional para usarlo como extratctor de caracteristicas

In [None]:
inputs = tf.keras.Input(shape=(IMG_SIZE[0], IMG_SIZE[1], 3))
x = base_model(inputs, training=False)
x = GlobalAveragePooling2D()(x)
x = Dense(256, activation='relu', kernel_regularizer='l2')(x)
x = Dropout(0.5)(x)
outputs = Dense(NUM_CLASSES, activation='softmax')(x)


1. creamos un tensor de entrada con la forma de la imagen 

2. pasamos esa entrada por el modelo base para extraer las caractetitsitcas 

3. aplicamos **GolbalAvergaePooling** para convertir el mapa de caracteristicas 2d un en vector 1D para poder pasarla a la capa siguiente

4. tenemos una capa densa con 256 con relu con regularizacion L2

5. aplicamos Droput con tasa 0.5 para desactivar aletoriamete 50% de la neuronas durante el entrenamiento 

6. creamos la capa de salida con **NUM_CLASSES** neuronaes, con activacion softmaz para multiclase

In [None]:
model = Model(inputs, outputs, name="VGG16")  # creamos el modelo completo con entrada y salida definida

Compilo el modelo con : 

1. optimizador Adam

2. la funcion de perdida es entropia cruzada 

3. metrica principal es el **accuracy**

In [None]:
model.compile(
    optimizer=Adam(learning_rate=LR_VGG),
    loss='categorical_crossentropy',
    metrics=['accuracy']
)


# ![Descripción de la imagen](./img/tl_vgg16.png)


**OBS: SOLOS LAS DOS CAPAS DENSE SON ENTRENABLES**

In [None]:
model.summary()

# 9.  Callbacks para control del entrenamiento

callbacks = [
    EarlyStopping(patience=4, restore_best_weights=True, verbose=1),
    ReduceLROnPlateau(factor=0.2, patience=2, verbose=1),
    ModelCheckpoint('output/best_vgg.h5', save_best_only=True, monitor='val_accuracy'),
]


1. EarlyStopping

    - Función: Detiene el entrenamiento si no mejora durante 4 épocas.

    - Ventaja: Evita el sobreentrenamiento y ahorra tiempo.

    - restore_best_weights=True: Recupera los mejores pesos al final.

2. ReduceLROnPlateau

    - Función: Reduce el learning rate si no mejora en 2 épocas.

    - Ventaja: Permite ajustes finos al estancarse el modelo.

    - factor=0.2: Reduce el LR al 20% del actual.

3. ModelCheckpoint

    - Función: Guarda el modelo cada vez que mejora la precisión en validación (val_accuracy).

    - Ventaja: Conserva automáticamente la mejor versión del modelo.

    - save_best_only=True: Solo guarda si mejora respecto al anterior.

# 10. Entranamiento del modelo

In [None]:
print("\\nEntrenando VGG16...")
history = model.fit(
    train_generator,
    epochs=EPOCHS,
    validation_data=val_generator,
    callbacks=callbacks,
    class_weight=class_weights,
    verbose=1
)


# 11 . Visualizacion, Prediccion y evaluacion

In [None]:
# ===============================
# 🔮 PREDICCIÓN Y EVALUACIÓN FINAL
# ===============================

# 1. Realiza predicciones sobre el conjunto de prueba
y_pred = model.predict(test_generator)

# 2. Convierte las probabilidades (softmax) en clases predichas (índices)
y_pred_classes = np.argmax(y_pred, axis=1)

# 3. Extrae las clases verdaderas del generador
y_true = test_generator.classes

# 4. Obtiene los nombres de las clases
labels = list(test_generator.class_indices.values())     # Ej: [0, 1, 2]
target_names = list(test_generator.class_indices.keys()) # Ej: ['Commercial', 'Private',..]

# 5. Imprime un reporte de clasificación detallado
print("\nClassification Report for VGG16:")
print(classification_report(
    y_true,               # etiquetas reales
    y_pred_classes,       # etiquetas predichas
    labels=labels,        # las clases como números
    target_names=target_names, # nombres de las clases
    digits=4,             # mostrar 4 decimales
    zero_division=0       # evitar error si una clase no fue predicha
))

# 6. Crea matriz de confusión
cm = confusion_matrix(y_true, y_pred_classes, labels=labels)

# 7. Grafica la matriz de confusión
plt.figure(figsize=(8, 6))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues',
            xticklabels=target_names,
            yticklabels=target_names)
plt.title('Matriz de Confusión - VGG16')
plt.ylabel('Verdaderos')
plt.xlabel('Predicciones')
plt.savefig('output/VGG16_confusion_matrix.png')  # Guarda la imagen
plt.close()  # Cierra la figura para evitar sobrecarga

# ===============================
# 📈 GRÁFICO DE ENTRENAMIENTO
# ===============================

plt.figure(figsize=(12, 4))

# Precisión
plt.subplot(1, 2, 1)
plt.plot(history.history['accuracy'], label='Entrenamiento')
plt.plot(history.history['val_accuracy'], label='Validación')
plt.title('Precisión - VGG16')
plt.ylabel('Precisión')
plt.xlabel('Época')
plt.legend()

# Pérdida
plt.subplot(1, 2, 2)
plt.plot(history.history['loss'], label='Entrenamiento')
plt.plot(history.history['val_loss'], label='Validación')
plt.title('Pérdida - VGG16')
plt.ylabel('Pérdida')
plt.xlabel('Época')
plt.legend()

plt.tight_layout()
plt.savefig('output/VGG16_history.png')  # Guarda los gráficos de entrenamiento
plt.close()

# ===============================
# ✅ MENSAJE FINAL
# ===============================
print("\nEntrenamiento y evaluación VGG16 completados!")
