# MultiLayer Perceptron con el conjunto de datos MNIST

MNIST es un conjunto de datos que representa una tarea de clasificación de pequeñas imágenes (28x28 píxeles). Las imágenes se agrupan en 10 clases, los dígitos del 0 al 9.

Aunque es una tarea de clasificación de imágenes vamos a emplear topologías de redes neuronales MLP en lugar de topologías más avanzadas (segunda práctica de APR) basadas en redes convolucionales. El motivo de esta decisión es que MNIST es un conunto ampliamente empleado por lo que el alumno podrá encontrar muchas referencias e incluso compararse con el estado del arte en esta tarea.



## Imágenes de MNIST

Un ejemplo de una de las imágenes del conjunto de datos disponible:

![ejemplo mnist](mnist.webp)

### Representación lineal de las imágenes

Se requiere una representación lineal (1D) de las imágenes para poder emplearlas como datos de entrada en un MLP. Para ellos lo usual es concatenar cada una de las filas de la imagen convirtiendo el tensor bidimensional (28x28) en un tensor unidimensional (784).

![MNIST](mnist.gif "MNIST")

## Lectura de los datos y conversión con **Keras**

Vamos a implemetar la importación de este conjunto de datos y la conversión en tensores unidimensionales. Para ello Keras nY numpy nos proveen de una serie de utilidades. 

In [None]:
## ASUMIENDO KERAS V2

from tensorflow import keras
from keras.datasets import mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()

print('training set', x_train.shape)
print('test set', x_test.shape)

import numpy as np
print(np.max(x_train)) # <-- comprobar que las imágenes vienen normalizadas entre 0 y 255, niveles de gris de 8 bits

Importante resaltar que al importar MNIST tenemos en realidad dos conjuntos de datos: *training* y *test*. Además, por cada conjunto de datos tenemos dos arrays, uno con los datos (imágenes) y otro con las etiquetas (clases) asociadas a dichas imágenes.

A continuación realizamos algunas modificaciones necesarias: 

1. convertimos los arrays a 1D
2. normalizamos los valores para que estén en el intervalo [0..1]
3. convertimos las etiquetas de clase en un one-hot vector

In [None]:
x_train = x_train.reshape(60000, 784)
x_test = x_test.reshape(10000, 784)
x_train = x_train.astype('float32') # <-- convertir a float32 para que la normalización sea en coma flotante
x_test = x_test.astype('float32')

# Normalize [0..255]-->[0..1]
x_train /= 255
x_test /= 255

# convert class vectors to binary class matrices
num_classes=10
y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)

Con este código estamos listos para crear las primeras redes neuronales MLP y entrenar los modelos