# Lab 3: Introducción al Deep Learning
En este laboratorio se busca introducir los principios del aprendizaje profundo (*deep learning*) aplicado a un problema de clasificación multi-clase.

In [1]:
# librerías a utilizar
import numpy as np
import matplotlib.pyplot as plt

# Librerías de DL
import tensorflow as tf
from tensorflow import keras
import tensorflow_datasets as tfds

# ajustando parámetros de gráficos
plt.rcParams["image.cmap"] = "binary"

## Exploración de los datos

**Fashion MNIST** es un conjunto de datos utilizado comúnmente en la comunidad de aprendizaje automático y visión por computadora para tareas de clasificación de imágenes. Es similar en estructura al conjunto de datos MNIST original, pero en lugar de dígitos escritos a mano, consiste en imágenes de prendas de vestir y accesorios.
- **Imágenes:** Fashion MNIST consta de 60,000 imágenes de entrenamiento en blanco y negro y 10,000 imágenes de prueba. Cada imagen tiene un tamaño de 28x28 píxeles.
- **Categorías:** El conjunto de datos se divide en 10 categorías diferentes de prendas de vestir y accesorios. Cada categoría representa un tipo de artículo, como camisetas, pantalones, vestidos, zapatos, bolsos, etc.
- **Clasificación:** El objetivo principal de Fashion MNIST es permitir la clasificación de imágenes en una de las 10 categorías. Es un problema de clasificación multiclase en el que se debe asignar una etiqueta a cada imagen que indique la categoría de la prenda representada en la imagen.

In [None]:
# descargando los datos
fashion_mnist = keras.datasets.fashion_mnist

In [None]:
# cargando los datos
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

**Prueba 1:** visualice diferentes muestras del conjunto de entrenamiento cargado del Fashion MNIST.

**Prueba 2:** Teniendo en cuenta la siguiente codificación, genere una estructura de datos que permita acceder a los datos usando el índice disponible en las etiquetas (*labels*).

| cod | Item         |
|:---:|:------------:|
|  0  | Camiseta/top |
|  1  | Pantalón     |
|  2  | Jersey       |
|  3  | Vestido      |
|  4  | Abrigo       |
|  5  | Sandalia     |
|  6  | Camisa       |
|  7  | Zapatilla    |
|  8  | Bolso        |
|  9  | Botín        |

## Preparación de los datos
La preparación de datos es un paso crítico en el proceso de entrenamiento de una red neuronal y es esencial por varias razones:

- **Compatibilidad con la red neuronal:** Las redes neuronales tienen ciertas expectativas sobre la forma en que los datos se presentan. Por ejemplo, la mayoría de las redes neuronales funcionan mejor cuando los datos de entrada están en un rango específico, como valores entre 0 y 1 o -1 y 1. Además, la entrada debe tener una estructura uniforme, como un tamaño de imagen fijo o una secuencia de longitud constante. La preparación de datos asegura que los datos cumplan con estas expectativas.

- **Mejora del rendimiento:** La preparación adecuada de datos puede mejorar significativamente el rendimiento del modelo. Esto incluye la reducción del riesgo de sobreajuste (overfitting) al eliminar datos ruidosos o duplicados, así como la mejora de la capacidad de generalización del modelo.

- **Eficiencia de entrenamiento:** La preparación de datos puede acelerar el proceso de entrenamiento al reducir la complejidad de los datos y alinearlos con las capacidades de la red neuronal, lo que resulta en tiempos de entrenamiento más cortos.

Para normalizar los datos (es decir, escalarlos o ajustarlos de manera que tengan una distribución específica o rango), se suelen utilizar los siguientes métodos:
- **Normalización min-max:** Escala las características para que estén dentro del rango [0, 1] utilizando la siguiente fórmula: $$\hat{X} = \frac{X - min(X)}{max(X) - min(X)}$$
- **Estandarización:** Transforma las características para que tengan una media (mean) de 0 y una desviación estándar (standard deviation) de 1 mediante la siguiente fórmula: $$\hat{X} = \frac{X - \mu_{X}}{\sigma_{X}}$$

**Prueba 3:** normalice las imágenes de los conjuntos de entrenamiento y testeo.

## Configuración de la arquitectura

Los bloques de construccion basicos de una red neuronal son las capas o layers. Las capas extraen representaciones de el set de datos que se les alimentan. Con suerte, estas representaciones son considerables para el problema que estamos solucionando.

Para una primera prueba se va a realizar una arquitectura con una sola capa oculta y una capa de salida con 10 unidades, como se muestra en la siguiente figura:

<center>
<img src="img/nn.png" width=75%>
</center>


In [None]:
# generando el modelo


In [None]:
# mostrando la estructura de la red


### Compilando el modelo
Antes de que el modelo este listo para entrenar , se necesitan algunas configuraciones mas. Estas son agregadas durante el paso de compilacion del modelo:

- **Loss function** Esto mide que tan exacto es el modelo durante el entrenamiento. Quiere minimizar esta funcion para dirigir el modelo en la direccion adecuada.
- **Optimizer** Esto es como el modelo se actualiza basado en el set de datos que ve y la funcion de perdida.
- **Metrics** Se usan para monitorear los pasos de entrenamiento y de pruebas. El siguiente ejemplo usa accuracy (exactitud) , la fraccion de la imagenes que son correctamente clasificadas.

### Entrenando el modelo

Entrenar un modelo implica ajustar sus parámetros internos para que pueda realizar una tarea específica de manera efectiva utilizando un conjunto de datos de entrenamiento. El objetivo final del entrenamiento es que el modelo pueda hacer predicciones precisas o tomar decisiones adecuadas sobre nuevos datos que no haya visto antes.

### Evaluando el modelo
Para evaluar el desempeño del modelo entrenado, se calculan las métricas en los datos de testeo. Normalmente la exactitud sobre el set de datos es un poco menor que la exactitud sobre el set de entrenamiento.

**Prueba 4:** utilice la función `.evaluate(X, Y)` para medir el desempeño del modelo entrenado. ¿Qué tan bien generaliza los datos en el conjunto de testeo?

**Prueba 5:** vamos a realizar una predicción sobre una imagen en particular. Para ello:
- Seleccione una imagen en el conjunto de testeo.
- Utilice el método `.predict(X)` del modelo sobre la imagen seleccionada.
- Obtenga la etiqueta que predijo el modelo.
- Haga una visualización que permita mostrar las probabilidades calculadas, la imagen y la clase.

---
### <font color='red'>**Challenge:**</font> EMNIST
Realice un modelo clasificador que permita identificar la letra correspondiente. Utilice la base de datos del EMNIST que se descarga en las siguientes líneas de código.

In [None]:
# descargando el dataset
train, info_train = tfds.load("emnist/letters", split="train", with_info=True)
test, info_test = tfds.load("emnist/letters", split="test", with_info=True)

# cargando el dataset en memoria
train_dataset = tfds.as_dataframe(train, info_train)
test_dataset = tfds.as_dataframe(test, info_test)

# guardando los arreglos
train_images, train_labels = np.stack(train_dataset.image), np.stack(train_dataset.label)
test_images, test_labels = np.stack(test_dataset.image), np.stack(test_dataset.label)

In [None]:
# visualizando algunos ejemplos
tfds.show_examples(train, info_train)

In [None]:
# programe su modelo clasificador