# <font style="color:rgb(50,120,229)"> Implementando LeNet-5 </font>

En este cuaderno, construiremos un modelo de la arquitectura CNN LenNet-5 en Keras y lo utilizaremos para realizar clasificación en el conjunto de datos MNIST. 

LenNet-5 es un modelo CNN pequeño que se presentó por primera vez en 1998. Aunque esta red es muy pequeña, tiene un rendimiento mucho mejor que una red MLP estándar porque las CNN son mucho más efectivas en el procesamiento de datos de imágenes. 

<center>
<img src="./images/LeNet-5_architecture.png" width=800px>
</center>

In [None]:
EPOCHS = 50
NUM_CLASSES = 10
IMAGE_SIZE = (28, 28, 1)

### <font style="color:rgb(50,120,229)"> 1. Cargar el conjunto de datos MNIST </font>

Primero, cargaremos el conjunto de datos MNIST.

<center>
<img src="./images/mnist.png" width=800px>
</center>

In [None]:
from keras.datasets import mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()

## <font style="color:rgb(50,120,229)"> 2 Visualizar algunas imágenes </font>

Vamos a crear una función para visualizar algunas imágenes del conjunto de datos MNIST.

In [None]:
from matplotlib import pyplot as plt
plt.style.use("ggplot")

for i in range(9):
    plt.subplot(330 + 1 + i)
    plt.imshow(x_train[i], cmap='gray')
    plt.axis('off')
plt.show()

In [7]:
#TODO: Importa la función to_categorical de keras.utils y convierte las etiquetas a one-hot encoding

## <font style="color:rgb(50,120,229)"> 2. Modelar LenNet-5 </font>


La arquitectura de LenNet-5 es:

- **Capa de entrada**: La imagen de entrada es de tamaño `32x32x1`.
- **Capa 1**: Convolucional con 6 filtros de tamaño `5x5` y función de activación `ReLU`.
- **Capa 2**: MaxPooling con un filtro de tamaño `2x2`.
- **Capa 3**: Convolucional con 16 filtros de tamaño `5x5` y función de activación `ReLU`.
- **Capa 4**: MaxPooling con un filtro de tamaño `2x2`.
- **Capa 5**: Aplanar la salida de la capa anterior.
- **Capa 6**: Totalmente conectada con 120 neuronas y función de activación `ReLU`.
- **Capa 7**: Totalmente conectada con 84 neuronas y función de activación `ReLU`.
- **Capa de salida**: Totalmente conectada con 10 neuronas (número de clases en MNIST) y función de activación `Softmax`.

In [None]:
#TODO: Crea un modelo Secuencial

Recuerda que las imágenes del MNIST tienen un tamaño de `28x28`. 

Definiremos una capa de entrada que cumpla con estas dimensiones y luego las reescalaremos a `32x32` para que coincidan con las dimensiones de entrada esperadas por la red LenNet-5.

In [None]:
#TODO: Define una capa de entrada que reciba una imagen de 28x28

Como mencionamos anteriormente, la red LenNet-5 espera imágenes de tamaño `32x32`. Por lo tanto, necesitamos reescalar las imágenes de entrada de `28x28` a `32x32`.

Esto se puede lograr utilizando la capa `Resizing` de Keras. 

```python
from keras.layers import Resizing

model.add(
    Resizing(height, width, interpolation="bilinear", crop_to_aspect_ratio=False, pad_to_aspect_ratio=False, fill_mode="constant", fill_value=0.0)
)
```

**Parámetros:**

- `height`: Altura de la imagen de salida.
- `width`: Ancho de la imagen de salida.
- `interpolation`: Método de interpolación utilizado para redimensionar la imagen. Puede ser uno de los siguientes valores: `nearest`, `bilinear`, `bicubic`, `lanczos3`, `lanczos5`.
- `crop_to_aspect_ratio`: Si es `True`, la imagen se recortará para que tenga la misma relación de aspecto que la imagen de entrada.
- `pad_to_aspect_ratio`: Si es `True`, la imagen se rellenará para que tenga la misma relación de aspecto que la imagen de entrada.
- `fill_mode`: Cuando pad_to_aspect_ratio es `True`, este parámetro especifica el método de relleno. Solo `constant` es compatible.
- `fill_value`: Valor de relleno cuando `fill_mode` es `constant`.

In [None]:
#TODO: Agrega una capa de resizing con fill_mode='constant' y valor de relleno 0

Otro paso importante es normalizar las imágenes. Cuando se trabaja con imágenes la normalización común es dividir por 255.0 para que los valores de píxeles estén en el rango `[0, 1]`.

Este proceso se puede conseguir con la capa `Rescaling` de Keras.

```python
from keras.layers import Rescaling

model.add(Rescaling(scale=1.0 / 255))
```

**Parámetros:**

- `scale`: Factor de escala.

In [None]:
#TODO: Añade una capa Rescaling al modelo

La siguiente capa es una capa convolucional con 6 filtros de tamaño `5x5` y función de activación `ReLU`. 

```python
from keras.layers import Conv2D

model.add(
    Conv2D(
        filters=6,
        kernel_size=(5, 5),
        strides=(1, 1),
        padding="valid",
        activation="relu",
    )
)
```

**Parámetros:**

- `filters`: Número de filtros.
- `kernel_size`: Tamaño del kernel.
- `strides`: Desplazamiento del kernel.
- `padding`: Método de relleno.
- `activation`: Función de activación.

In [None]:
#TODO: Agrega la primera capa convolucional al modelo

Después de la capa convolucional, agregamos una capa de MaxPooling con un filtro de tamaño `2x2`.

```python
from keras.layers import MaxPooling2D

model.add(MaxPooling2D(pool_size=(2, 2), strides=(2, 2)))
```

**Parámetros:**

- `pool_size`: Tamaño del filtro.
- `strides`: Desplazamiento del filtro.

In [None]:
#TODO: Agrega una capa de MaxPooling2D al modelo

In [None]:
#TODO: Agrega la segunda capa convolucional al modelo y la capa de MaxPooling2D

Despues de la última capa de agrupación, aplanamos la salida de la capa anterior. Esto se puede hacer con la capa `Flatten` de Keras.

```python
from keras.layers import Flatten

model.add(Flatten())
```

**Aplanar la salida es necesario para conectar la salida de la capa convolucional a la capa totalmente conectada.**

In [None]:
#TODO: Agrega una capa de Flatten al modelo

In [None]:
#TODO: Agrega las capas densas al modelo

In [None]:
#TODO: Muestra un resumen del modelo

## <font style="color:rgb(50,120,229)"> 4. Entrenar LenNet-5 </font>

In [8]:
#TODO: Compila el modelo utilizando el optimizador 'adam', la función de pérdida 'categorical_crossentropy' y la métrica 'accuracy'

In [9]:
#TODO: Entrena el modelo con los datos de entrenamiento, utiliza un validation_split del 0.2

In [11]:
#TODO: Grafica la pérdida y la precisión del modelo

## <font style="color:rgb(50,120,229)"> 5. Evaluación del modelo </font>

Finalmente, evaluaremos el modelo en el conjunto de datos de prueba y visualizaremos algunas predicciones. 

Esto nos dará una idea de cómo se desempeña nuestro modelo en datos que nunca ha visto antes.

In [10]:
#TODO: Evalúa el modelo con los datos de test

### <font style="color:rgb(50,120,229)"> 5.1. Visualizar algunas predicciones </font>

In [12]:
#TODO: Realiza algunas predicciones con los datos de test y muestra las imágenes y su predicción