
# üéØ Actividad Pr√°ctica ‚Äî Sesi√≥n 5 (45‚Äì50 min)

**Duraci√≥n total sugerida:** 50‚Äì60 min


> üìù **Nota :**  
> El c√≥digo que se muestra a continuaci√≥n est√° intencionadamente presentado en **celdas de texto (Markdown)**.  
> La idea es que usted pueda **copiarlo, adaptarlo y crear su propio notebook**, tomando decisiones sobre la estructura de la CNN y los hiperpar√°metros.  
>
> Este enfoque busca promover la comprensi√≥n profunda del modelo y no solo su ejecuci√≥n.

Este ejercicio busca que usted analice la arquitectura de una CNN simple y explore c√≥mo los hiperpar√°metros afectan su comportamiento.


## PARTE 1: Entendiendo una CNN simple y sus hiperpar√°metros

En esta primera parte construiremos una CNN peque√±a utilizando el dataset MNIST.
El objetivo es comprender la estructura b√°sica de una red convolucional y reflexionar sobre el impacto de modificar sus hiperpar√°metros.

```python
import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.datasets import mnist

# Cargar datos MNIST
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# Normalizar y adaptar formato (28x28x1)
x_train = x_train.astype("float32") / 255.0
x_test  = x_test.astype("float32") / 255.0

# A√±adir dimensi√≥n de canal (blanco y negro)
x_train = x_train[..., tf.newaxis]   # (60000, 28, 28, 1)
x_test  = x_test[..., tf.newaxis]

num_clases = 10




### Ahora que tenemos los datos listos, construiremos una CNN simple para identificar sus partes fundamentales y sus respectivos hiperpar√°metros modificables.
```python
# MODELO CNN SIMPLE
modelo_cnn = models.Sequential([
    # Capa convolucional 1
    layers.Conv2D(
        filters=32,          # ‚Üê hiperpar√°metro 1
        kernel_size=(3, 3),  # ‚Üê hiperpar√°metro 2
        activation="relu",
        input_shape=(28, 28, 1)
    ),
    layers.MaxPooling2D(pool_size=(2, 2)),  # ‚Üê hiperpar√°metro 3

    # Capa convolucional 2
    layers.Conv2D(
        filters=64,          # ‚Üê hiperpar√°metro 4
        kernel_size=(3, 3),
        activation="relu"
    ),
    layers.MaxPooling2D(pool_size=(2, 2)),

    layers.Flatten(),

    layers.Dense(64, activation="relu"),     # ‚Üê hiperpar√°metro 5 (n√∫mero de neuronas)
    layers.Dense(num_clases, activation="softmax")
])

# Compilaci√≥n del modelo
modelo_cnn.compile(
    optimizer="adam",
    loss="sparse_categorical_crossentropy",
    metrics=["accuracy"]
)

# Resumen de la arquitectura
modelo_cnn.summary()


### La siguiente secci√≥n permite configurar la cantidad de iteraciones (√©pocas) que ejecutar√° el modelo.

```python
historial = modelo_cnn.fit(
    x_train, y_train,
    epochs=2,              # ‚Üê hiperpar√°metro 6
    batch_size=128,        # ‚Üê hiperpar√°metro 7
    validation_split=0.1,
    verbose=1
)


###Considerando solo la vista -y no ejecucion del codigo - reflexione a partir de la sig uiente pregunta:  ¬øQu√© cree que pasar√≠a si‚Ä¶?

* Duplicamos filters en la primera capa de 32 ‚Üí 64.

* Quitamos una capa de MaxPooling2D.

* Aumentamos kernel_size de (3,3) a (5,5).

* Aumentamos la capa densa final de 64 ‚Üí 256 neuronas.

* Aumentamos epochs de 2 ‚Üí 10.

### ¬øC√≥mo cree que cambiar√≠a‚Ä¶?

* El tiempo de entrenamiento.

* El riesgo de sobreajuste (overfitting).

* La capacidad del modelo para aprender patrones m√°s complejos.

### Modifique 1 o 2 hyperparametros y ejecute el entrenamiento muy breve (1‚Äì2 epochs).

* Compare el accuracy y el tiempo de entrenamiento.

### Glosario de Hiperpar√°metros

A continuaci√≥n se describen los principales hiperpar√°metros utilizados en la CNN simple construida en esta actividad:

**1. `filters`**  
N√∫mero de filtros (o kernels) en una capa convolucional.  
M√°s filtros permiten detectar m√°s tipos de patrones, pero aumentan el costo computacional y el riesgo de sobreajuste.

**2. `kernel_size`**  
Tama√±o del filtro que ‚Äúrecorre‚Äù la imagen (ej.: 3√ó3, 5√ó5).  
Un kernel m√°s grande capta patrones m√°s amplios, pero puede perder detalle y hacer el modelo m√°s lento.

**3. `pool_size`**  
Tama√±o de la ventana usada en MaxPooling.  
Reduce la dimensi√≥n espacial del mapa de caracter√≠sticas, haciendo el modelo m√°s eficiente y menos propenso al sobreajuste.

**4. `filters` (segunda capa)**  
Igual que el hiperpar√°metro 1, pero en una capa m√°s profunda.  
Generalmente se aumenta (32‚Üí64‚Üí128) para aprender patrones m√°s complejos.

**5. `units` en `Dense`**  
N√∫mero de neuronas en la capa completamente conectada.  
M√°s neuronas permiten representar relaciones m√°s complejas, pero incrementan el riesgo de sobreajuste.

**6. `epochs`**  
Cantidad de pasadas completas por todo el conjunto de entrenamiento.  
M√°s √©pocas permiten aprender m√°s, pero pueden llevar a sobreentrenamiento.

**7. `batch_size`**  
Cantidad de muestras procesadas por el modelo en cada actualizaci√≥n de par√°metros.  
Batches peque√±os ‚Üí aprendizaje m√°s ruidoso pero potencialmente mejor generalizaci√≥n.  
Batches grandes ‚Üí entrenamiento m√°s estable y r√°pido, pero con riesgo de sobreajuste.


## PARTE 2: Explorando EfficientNetB0 y sus hiperpar√°metros

En esta segunda parte trabajaremos con **EfficientNetB0**, un modelo moderno de *Transfer Learning* entrenado originalmente sobre el dataset ImageNet.

El objetivo es identificar sus componentes principales, reconocer los hiperpar√°metros m√°s relevantes y reflexionar sobre c√≥mo estos afectan el comportamiento del modelo.

> üìù Nota para participantes  
> Al igual que en la secci√≥n anterior, el siguiente c√≥digo se presenta en formato de texto (Markdown).  
> Se espera que usted **cree su propio notebook** y copie, adapte o modifique este modelo seg√∫n los cambios que desee explorar.

### Paso 1: Cargar EfficientNetB0 preentrenado

```python
from tensorflow.keras.applications import EfficientNetB0
from tensorflow.keras import layers, models, optimizers

# Cargar EfficientNetB0 sin la parte final (include_top=False)
base_model = EfficientNetB0(
    weights="imagenet",
    include_top=False,
    input_shape=(224, 224, 3)    # ‚Üê hiperpar√°metro 1 (tama√±o de entrada)
)

# Congelar la base convolucional (no se entrena)
base_model.trainable = False      # ‚Üê hiperpar√°metro 2 (capas entrenables)


### Paso 2: Crear un nuevo clasificador final
```python
inputs = layers.Input(shape=(224, 224, 3))
x = base_model(inputs, training=False)
x = layers.GlobalAveragePooling2D()(x)
x = layers.Dropout(0.2)(x)        # ‚Üê hiperpar√°metro 3 (tasa de dropout)
outputs = layers.Dense(5, activation="softmax")(x)   # ‚Üê hiperpar√°metro 4 (n√∫mero de clases)

modelo_eff = models.Model(inputs, outputs)


### Paso 3: Compilar el modelo
```python
modelo_eff.compile(
    optimizer=optimizers.Adam(learning_rate=1e-3),  # ‚Üê hiperpar√°metro 5 (learning rate)
    loss="sparse_categorical_crossentropy",
    metrics=["accuracy"]
)

modelo_eff.summary()


### Sin ejecutar el c√≥digo, reflexione a partir de la siguiente pregunta: ¬øQu√© cree que ocurrir√≠a si‚Ä¶?

* Cambiamos input_shape de (224,224,3) a (128,128,3).

* Descongelamos parcialmente la base (base_model.trainable = True).

* Aumentamos el Dropout de 0.2 a 0.5.

* Cambiamos la tasa de aprendizaje de 1e-3 a 1e-5.

* Aumentamos la capa final de 5 a 10 clases.

### ¬øC√≥mo cree que cambiar√≠an‚Ä¶?

* El tiempo de entrenamiento.

* El riesgo de sobreajuste (overfitting).

* La capacidad del modelo para generalizar.

* La estabilidad del gradiente al entrenar.

### Glosario de Hiperpar√°metros en EfficientNetB0

A continuaci√≥n se describen los hiperpar√°metros principales utilizados en el modelo EfficientNetB0 presentado en esta actividad:

**1. `input_shape`**  
Dimensi√≥n de entrada esperada por el modelo (ej.: 224√ó224√ó3).  
Controla cu√°nto debe redimensionarse cada imagen antes de entrar a la red.  
Tama√±os menores reducen el costo computacional pero pueden perder detalle importante.

**2. `base_model.trainable`**  
Indica si las capas convolucionales preentrenadas pueden actualizarse durante el entrenamiento.  
- `False` ‚Üí solo se entrena la "cabeza" final (m√°s r√°pido y estable).  
- `True` ‚Üí se ajustan todas las capas (mayor capacidad, pero tambi√©n mayor riesgo de sobreajuste y necesidad de datos).

**3. `Dropout`**  
Fracci√≥n de neuronas que se ‚Äúapagan‚Äù aleatoriamente durante el entrenamiento.  
Ayuda a prevenir sobreajuste, especialmente en modelos grandes.

**4. `Dense(units)` (n√∫mero de clases)**  
Cantidad de neuronas en la capa final.  
Debe coincidir con el n√∫mero de clases a predecir.  
Un n√∫mero mayor no implica necesariamente mejor rendimiento.

**5. `learning_rate`**  
Velocidad con la que se actualizan los pesos del modelo durante el entrenamiento.  
- Valores altos ‚Üí aprendizaje r√°pido pero inestable.  
- Valores muy bajos ‚Üí aprendizaje lento y posible estancamiento.

**6. `optimizer`** (Adam en este caso)  
Algoritmo que ajusta los pesos para minimizar la funci√≥n de p√©rdida.  
Adam combina ventajas de AdaGrad y RMSProp y funciona bien en la mayor√≠a de problemas.

**7. `GlobalAveragePooling2D`**  
Reduce cada mapa de caracter√≠sticas a un √∫nico valor promedio.  
Disminuye dr√°sticamente el n√∫mero de par√°metros y ayuda a evitar sobreentrenamiento.

**8. `include_top=False`**  
Indica que no se utiliza la parte final del modelo preentrenado (clasificador original de ImageNet).  
Permite agregar un clasificador propio para un nuevo conjunto de clases.



## ¬øEfficientNetB0 es una CNN?

S√≠. EfficientNetB0 es una red neuronal convolucional (CNN), igual que la que construimos en la Parte 1.  
La diferencia es que EfficientNetB0 es **mucho m√°s profunda y compleja**, e incluye:
- decenas de capas convolucionales,
- capas avanzadas como MBConv y SE blocks,
- normalizaci√≥n,
- etapas de reducci√≥n progresiva del tama√±o espacial.

En esta actividad no analizamos cada capa internamente (ser√≠a demasiado complejo), sino que
utilizamos EfficientNetB0 como **modelo preentrenado** para aplicar Transfer Learning.


## Nota importante: ¬øQu√© hace realmente EfficientNetB0?

En la actividad anterior, usted utiliz√≥ **MobileNetV2** para clasificar im√°genes reales de su computador.  
Gracias a eso, pudo observar directamente:

- las predicciones del modelo,  
- los aciertos y errores,  
- los patrones que reconoce,  
- y los sesgos que pueden aparecer.

En esta segunda parte, el objetivo es distinto:  
**no buscamos volver a clasificar im√°genes**, sino comprender la estructura interna de un modelo moderno, **EfficientNetB0**, y explorar algunos de sus hiperpar√°metros clave.

**EfficientNetB0** es tambi√©n una **red neuronal convolucional (CNN)**, igual que **MobileNetV2**, pero mucho m√°s profunda y compleja.  
Aqu√≠ nos enfocamos en:

- c√≥mo est√° construida su base convolucional,
- qu√© significa congelar o descongelar capas,
- c√≥mo influyen hiperpar√°metros como `input_shape`, `dropout` o `learning_rate`,
- y c√≥mo estos cambios afectan el proceso de entrenamiento.

Si aun as√≠ desea **comprobar que EfficientNetB0 puede clasificar im√°genes reales**, tal como lo hizo MobileNetV2, puede hacerlo ejecutando la celda de c√≥digo que se encuentra m√°s abajo.  
Esa celda permite cargar una imagen desde su computador y obtener una predicci√≥n con el modelo que acaba de construir.


```python
# ================================================
# CLASIFICAR IM√ÅGENES REALES CON EfficientNetB0
# ================================================

import numpy as np
from tensorflow.keras.preprocessing import image
from google.colab import files
import matplotlib.pyplot as plt

# 1. Subir imagen desde el computador
uploaded = files.upload()

for fn in uploaded.keys():
    img_path = fn
    print("Imagen cargada:", fn)

    # 2. Cargar y preprocesar la imagen
    img = image.load_img(img_path, target_size=(224, 224))
    x = image.img_to_array(img)
    x = np.expand_dims(x, axis=0)

    # 3. Mostrar imagen cargada
    plt.imshow(image.load_img(img_path))
    plt.axis("off")
    plt.show()

    # 4. Obtener predicci√≥n (probabilidades)
    pred = modelo_eff.predict(x)
    print("\nVector de probabilidades:", pred)

    # 5. Mostrar la clase predicha
    pred_class = np.argmax(pred)
    print(f"\nClase predicha: {pred_class}")


Si opto por clasificar imagenes, lo mas probable es que las siguientes preguntas lo respresenten en un 100%:
* ¬øPor qu√© esta CNN tiene solo 5 clases?
* ¬øC√≥mo se interpreta el vector de probabilidades?

En esta actividad, la capa final de **EfficientNetB0** fue definida as√≠:

```python
outputs = layers.Dense(5, activation="softmax")(x)
```
Esto significa que hemos creado un clasificador con 5 categor√≠as posibles.
El modelo no conoce los nombres reales de esas clases (por ejemplo ‚Äúperro‚Äù, ‚Äúauto‚Äù, etc.).
Solo sabe que debe asignar una probabilidad a cada una de las 5 clases numeradas:
* Clase 0
* Clase 1
* Clase 2
* Clase 3
* Clase 4

Ahora bien, cuando ejecutamos:
```python
pred = modelo_eff.predict(x)
```
obtendremos un vector como:
```python
[0.02, 0.65, 0.10, 0.20, 0.03]
```
Cada n√∫mero representa la probabilidad estimada de que la imagen pertenezca a una de las clases:
* 0.02 : probabilidad de ser clase 0
* 0.65 : probabilidad de ser clase 1
* 0.10 : probabilidad de ser clase 2
* 0.20 : probabilidad de ser clase 3
* 0.03 : probabilidad de ser clase 4

La clase predicha es aquella con la probabilidad m√°s alta:
```python
np.argmax(pred)   # en este caso, 1
```
Es decir, el modelo clasifica la imagen como clase 1.