# Clasificación Básica: Predecir una imagen de moda

En el siguiente notebook entrenaremos un modelo de redes neuronales para clasificar imágenes de ropa, como zapatos y camisetas.

Para ello, utilizaremos las librerías tanto keras como Tensorflow, en concreto, centrándonos en la primera [tf.keras](https://www.tensorflow.org/guide/keras).

In [1]:
# TensorFlow y tf.keras
import tensorflow as tf
from tensorflow import keras

# Librerias de ayuda
import numpy as np
import matplotlib.pyplot as plt

print(tf.__version__)

2.4.1


## Importar el set de datos de moda de MNIST

Utilizaremos el datest de [Fashion MNIST](https://github.com/zalandoresearch/fashion-mnist), que contiene mas de 70,000 imágenes de 10 categorías. Las imágenes muestran artículos individuales de ropa a una resolución baja (28 por 28 pixeles), tal como se ve en la siguiente imagen:

<table>
  <tr><td>
    <img src="https://tensorflow.org/images/fashion-mnist-sprite.png"
         alt="Fashion MNIST sprite"  width="600">
  </td></tr>
  <tr><td align="center">
    <b>Figure 1.</b> <a href="https://github.com/zalandoresearch/fashion-mnist">Fashion-MNIST samples</a> (by Zalando, MIT License).<br/>&nbsp;
  </td></tr>
</table>

Para importar y cargar el set de datos de MNIST directamente de TensorFlow:

In [2]:
fashion_mnist = keras.datasets.fashion_mnist

(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

La *class* de ropa que la imagen representa.

<table>
  <tr>
    <th>Label</th>
    <th>Class</th>
  </tr>
  <tr>
    <td>0</td>
    <td>T-shirt/top</td>
  </tr>
  <tr>
    <td>1</td>
    <td>Trouser</td>
  </tr>
    <tr>
    <td>2</td>
    <td>Pullover</td>
  </tr>
    <tr>
    <td>3</td>
    <td>Dress</td>
  </tr>
    <tr>
    <td>4</td>
    <td>Coat</td>
  </tr>
    <tr>
    <td>5</td>
    <td>Sandal</td>
  </tr>
    <tr>
    <td>6</td>
    <td>Shirt</td>
  </tr>
    <tr>
    <td>7</td>
    <td>Sneaker</td>
  </tr>
    <tr>
    <td>8</td>
    <td>Bag</td>
  </tr>
    <tr>
    <td>9</td>
    <td>Ankle boot</td>
  </tr>
</table>

Cada imagen es mapeada a una única etiqueta. Ya que los *Class names* no están incluidos en el dataset, los guardamos en la siguiente lista:

In [3]:
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

## Explora el set de datos:

* ¿Cuántas imaágenes hay en train?
* ¿Y en test?
* ¿De cuántos pixels se compone cada imagen?
* ¿Cuáles son los valores de los labels?

## Pre-procesamiento del set de datos

### Representando imágenes

Inspecciona y representa la primera imagen del dataset de train. Para ello, utiliza la función `imshow` de matplotlib.

### Escalado

Escala los conjuntos de train y test para que vayan del 0 al 1. No hace falta usar ninguna librería, con realizar una división en cada conjunto será suficiente.

### Mostrando imágenes

Para verificar que el set de datos esta en el formato adecuado y que están listos para construir y entrenar la red, muestra las primeras 25 imágenes del *training set* y el nombre de cada clase debajo de cada imagen.

Para ello, utiliza la función ``plt.imshow()`` y los labels de los ejes. Además, puedes utilizar un subplot de 5x5 para que se muestren los datos de una forma más legible:

# Construir el Modelo

Pasemos a construir la red neuronal requiere configurar las capas del modelo y luego compilar el modelo.

### Configurar las Capas

Construye un modelo con keras, donde especifiques las siguientes capas:
  * **Entrada**: hemos visto que tienen que ser de un tipo concreto y de un tamaño definido por los datos de entrada del modelo
  * **Hidden layers**: 1 capa densa de 128 neuronas
  * **Salida**: una capa con tantas neuronas como clases tengamos que predecir

### Compila el modelo

Antes de que el modelo este listo para entrenar , se necesitan algunas configuraciones más. Estas son agregadas durante el paso de compilación del modelo:

* **Loss function**: mide la exactitud del modelo durante el entrenamiento. Busca minimizar esta función para dirigir el modelo en la dirección adecuada.
* **Optimizer**: indica cómo el modelo se actualiza basado en el set de datos que ve y la función de pérdida.
* **Metrics**: utilizado para monitorear los pasos de train y test.

Como es un problema de clasificación multiclase, tendrás que usar `sparse_categorical_crossentropy` como función de coste. En cuanto a las métricas, usa simplemente `accuracy`. Como optimizador, empezaremos utilizando ``adam``.

### Entrenar el Modelo

Empieza entrenándolo con 10 epochs:

## Evaluar Accuracy

Una vez lo hemos entrenado, prueba el rendimiento del modelo con los datos de test:

## Predecir

Con el modelo entrenado podemos realizar predicciones sobre imágenes. Utiliza el modelo para ver qué obtenemos con las imágenes de test. Comprueba las 5 primeras imágenes.

Una prediccion es un array de 10 números. Estos representan el nivel de "confianza" del modelo sobre las imágenes de cada uno de los 10 artículos de moda/ropa. Puedes revisar cuál tiene el nivel más alto de confianza para identificar a qué clase se corresponde.

### Comprobaciones globales

Utiliza lo que acabas de ver para evaluar cómo de bien predecimos cada clase de ropa:

### EXTRA

Como has podido ver, hemos utilizado una configuración en concreto. Sin embargo, hemos comentado que estos parámetros pueden ser cambiados y obtener diferentes resultados. Por ello, proeba a cambiar diferentes parámetros buscando el mejor modelo posible basado en el score de los datos de test.

Prueba cambiando:
  * Número de neuronas
  * Optimizador
  * Nº epochs (¿early stopping?)