# MultiLayer Perceptron con el conjunto de datos MNIST

MNIST es un conjunto de datos que representa una tarea de clasificación de pequeñas imágenes (28x28 píxeles). Las imágenes se agrupan en 10 clases, los dígitos del 0 al 9.

Aunque es una tarea de clasificación de imágenes vamos a emplear topologías de redes neuronales MLP en lugar de topologías más avanzadas (segunda práctica de APR) basadas en redes convolucionales. El motivo de esta decisión es que MNIST es un conunto ampliamente empleado por lo que el alumno podrá encontrar muchas referencias e incluso compararse con el estado del arte en esta tarea.



## Imágenes de MNIST

Un ejemplo de una de las imágenes del conjunto de datos disponible:

![ejemplo mnist](mnist.webp)

### Representación lineal de las imágenes

Se requiere una representación lineal (1D) de las imágenes para poder emplearlas como datos de entrada en un MLP. Para ellos lo usual es concatenar cada una de las filas de la imagen convirtiendo el tensor bidimensional (28x28) en un tensor unidimensional (784).

![MNIST](mnist.gif "MNIST")

## Lectura de los datos y conversión con **Keras**

Vamos a implemetar la importación de este conjunto de datos y la conversión en tensores unidimensionales. Para ello Keras nY numpy nos proveen de una serie de utilidades. 

In [1]:
pip install tensorflow

Defaulting to user installation because normal site-packages is not writeable
Collecting tensorflow
  Using cached tensorflow-2.14.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (489.8 MB)
Collecting opt-einsum>=2.3.2
  Using cached opt_einsum-3.3.0-py3-none-any.whl (65 kB)
Collecting wrapt<1.15,>=1.11.0
  Using cached wrapt-1.14.1-cp310-cp310-manylinux_2_5_x86_64.manylinux1_x86_64.manylinux_2_17_x86_64.manylinux2014_x86_64.whl (77 kB)
Collecting tensorflow-io-gcs-filesystem>=0.23.1
  Using cached tensorflow_io_gcs_filesystem-0.34.0-cp310-cp310-manylinux_2_12_x86_64.manylinux2010_x86_64.whl (2.4 MB)
Collecting absl-py>=1.0.0
  Using cached absl_py-2.0.0-py3-none-any.whl (130 kB)
Collecting tensorflow-estimator<2.15,>=2.14.0
  Using cached tensorflow_estimator-2.14.0-py2.py3-none-any.whl (440 kB)
Collecting google-pasta>=0.1.1
  Using cached google_pasta-0.2.0-py3-none-any.whl (57 kB)
Collecting tensorboard<2.15,>=2.14
  Downloading tensorboard-2.14.1-py3-none-any.whl (5.5

In [2]:
## ASUMIENDO KERAS V2

from tensorflow import keras
from keras.datasets import mnist

(x_train, y_train), (x_test, y_test) = mnist.load_data()

print('training set', x_train.shape)
print('test set', x_test.shape)

import numpy as np
print(np.max(x_train)) # <-- comprobar que las imágenes vienen normalizadas entre 0 y 255, niveles de gris de 8 bits

2023-10-04 15:50:45.802584: I tensorflow/core/util/port.cc:111] oneDNN custom operations are on. You may see slightly different numerical results due to floating-point round-off errors from different computation orders. To turn them off, set the environment variable `TF_ENABLE_ONEDNN_OPTS=0`.
2023-10-04 15:50:45.804060: I tensorflow/tsl/cuda/cudart_stub.cc:28] Could not find cuda drivers on your machine, GPU will not be used.
2023-10-04 15:50:45.829979: E tensorflow/compiler/xla/stream_executor/cuda/cuda_dnn.cc:9342] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
2023-10-04 15:50:45.830006: E tensorflow/compiler/xla/stream_executor/cuda/cuda_fft.cc:609] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
2023-10-04 15:50:45.830033: E tensorflow/compiler/xla/stream_executor/cuda/cuda_blas.cc:1518] Unable to register cuBLAS factory: Attempting to regi

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
training set (60000, 28, 28)
test set (10000, 28, 28)
255


Importante resaltar que al importar MNIST tenemos en realidad dos conjuntos de datos: *training* y *test*. Además, por cada conjunto de datos tenemos dos arrays, uno con los datos (imágenes) y otro con las etiquetas (clases) asociadas a dichas imágenes.

A continuación realizamos algunas modificaciones necesarias: 

1. convertimos los arrays a 1D
2. normalizamos los valores para que estén en el intervalo [0..1]
3. convertimos las etiquetas de clase en un one-hot vector

In [None]:
x_train = x_train.reshape(60000, 784)
x_test = x_test.reshape(10000, 784)
x_train = x_train.astype('float32') # <-- convertir a float32 para que la normalización sea en coma flotante
x_test = x_test.astype('float32')

# Normalize [0..255]-->[0..1]
x_train /= 255
x_test /= 255

# convert class vectors to binary class matrices
num_classes=10
y_train = keras.utils.to_categorical(y_train, num_classes)
y_test = keras.utils.to_categorical(y_test, num_classes)

Con este código estamos listos para crear las primeras redes neuronales MLP y entrenar los modelos