# Clasificación con Tensorflow: Dataset Fashion MNIST

Esta Guia usa tf.keras, un API de alto nivel para construir y entrenar modelos en Tensorflow. El dataset Fashion MNIST contiene más de 70000 imagenes en 10 categorias. Las imagenes muestran articulos individuales de ropa a una resolucion baja (28 por 28 pixeles) 

In [None]:
from __future__ import absolute_import, division, print_function, unicode_literals

from plot_functions_mnist import *
# TensorFlow y tf.keras
import tensorflow as tf ##pip install tensorflow
from tensorflow import keras

# Librerias de ayuda
import numpy as np
import matplotlib.pyplot as plt


60,000 imagenes son usadas para entrenar la red neuronal y 10,000 imagenes son usadas para evaluar si aprende la red a clasificar imagenes. Vamos a importar y cargar el set de datos de MNIST directamente de TensorFlow

Al cargar el set de datos, devuelve cuatro objetos en NumPy:

+ Los objetos train_images y train_labels son los objetos de training — el modelo de datos los usa para aprender.
+ El modelo es probado contra los objetos test set, el test_images, y test_labels.

In [None]:
fashion_mnist = keras.datasets.fashion_mnist

(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

print(train_labels)

 Los labels son números enteros, que van del 0 al 9. Estos corresponden a la clase de ropa que la imagen representa. Cada imagen es mapeada a una unica etiqueta.

In [None]:

class_dict = {
  'T-shirt/top': 0,
  'Trouser': 1,
  'Pullover': 2,
    'Dress':3,
    'Coat': 4,
    'Sandal':5,
    'Shirt':6,
    'Sneaker':7,
    'Bag':8, 
    'Ankle boot':9
}

Exploremos el formato del set de datos antes de entrenar el modelo. Lo siguiente muestra que hay 60,000 imágenes en el set de entrenamiento, con cada imagen representada por píxeles de 28x28

In [None]:

##dimensiones del dataset


In [None]:
#número de ejemplos en el entrenamiento


In [None]:
#número de ejemplos en el conjunto de test


## Preprocesado de datos

El set de datos debe ser pre-procesado antes de entrenar la red. Si inspeccionamos la primera imagen en el set de entrenamiento, veremos que los valores de los pixeles estan entre 0 y 255:

In [None]:
plt.figure()
plt.imshow(train_images[0])
plt.colorbar()
plt.grid(False)
plt.show()

Escalamos los valores de cada pixel de la imagen en un rango de 0 a 1 antes de alimentarlos al modelo de la red neuronal. Para hacerlo, dividimos los valores por 255. Es importante que el training set y el testing set se pre-procesen siempre de la misma forma

In [None]:
train_images = train_images / 255.0

test_images = test_images / 255.0

Para verificar que el set de datos está en el formato adecuado y podemos construir y entrenar la red, vamos a mostrar las primeras 25 imagenes de el training set y mostramos el nombre de cada clase debajo de cada imagen

In [None]:
plt.figure(figsize=(10,10))
for i in range(25):
    plt.subplot(5,5,i+1) ##vamos a mostrar las gráficas posicionadas en 5 filas y 5 columnas
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(train_images[i], cmap=plt.cm.binary)#blanco y negro
    plt.xlabel(class_names[train_labels[i]])
plt.show()

## Construimos el modelo

Construir la red neuronal requiere configurar las capas del modelo y luego compilar el modelo.

La mayoria de aprendizaje profundo consiste de unir capas sencillas. La mayoria de las capas como tf.keras.layers.Dense, tienen parametros que son aprendidos durante el entrenamiento.

La primera capa de esta red, tf.keras.layers.Flatten, transforma el formato de las imágenes de un arreglo bi-dimensional (de 28 por 28 pixeles) a un arreglo uni dimensional (de 28*28 pixeles = 784 pixeles). Es como si separamos cada capa de las filas de pixeles de una imagen y las alineamos todas. Esta capa no tiene parametros que aprender; solo reformatea el conjunto de datos.

Después de que los píxeles están "aplanados", la secuencia consiste de dos capas tf.keras.layers.Dense. Estas están densamente conectadas, o completamente conectadas. La primera capa Dense tiene 128 nodos (o neuronas). La segunda (y última) capa es una capa de 10 nodos softmax que devuelve 10 probabilidades que suman a 1. Estas indican la probabilidad de que la actual imagen pertenezca a una de las 10 clases.

In [None]:
model = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),##reformateo de la disposición de los pixeles
    keras.layers.Dense(128, activation='relu'),## 128 neuronas completamente conectadas
    keras.layers.Dense(10, activation='softmax')##devuelve una probabilidad para cada numero del 0 al 9
])

Antes de que el modelo esté listo para entrenar , se necesitan algunas configuraciones más. Estas son agregadas durante la compilación del modelo:

+ Loss function —Esto mide qué tan exacto es el modelo durante el entrenamiento. Queremos minimizar esta función para dirigir el modelo en la dirección adecuada.
+ Optimizer — Esto es como el modelo se actualiza basado en el set de datos que ve y la función de pérdida.
+ Metrics — Se usan para monitorear los pasos de entrenamiento y de pruebas. Este ejemplo usa el accuracy (exactitud) , que indica la fracción de la imagenes que son correctamente clasificadas.

In [None]:
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

## Entrenamos el modelo

Entrenar el modelo de red neuronal requiere de los siguientes pasos:

+ Pasamos los datos de entrenamiento al modelo. En este ejemplo , el set de datos de entrenamiento está en los objetos train_images y train_labels.
+ El modelo aprende a asociar imágenes y etiquetas.
+ Le pedimos al modelo que haga predicciones sobre un set de datos que se encuentran en el objeto test_images. Verificamos que las predicciones sean iguales a las etiquetas del objeto test_labels.

Para comenzar a entrenar, llamamos al método model.fit, es llamado así porque fit (ajusta) el modelo a el set de datos de entrenamiento:

In [None]:
model.fit(train_images, train_labels, epochs=10)

 Este modelo alcanza una exactitud de 0.90 (o 90%) sobre el set de datos de entrenamiento.

## Hacer predicciones

In [None]:

print(class_dict)

Con el modelo entrenado, podemos usarlo para hacer predicciones sobre nuevas imágenes.

Aquí, el modelo ha predecido la etiqueta para cada imagen en el set de datos de test (prueba). Miremos la primera predicción:

In [None]:
predictions = model.predict(test_images)


In [None]:
predictions[0]

Ua prediccion es un arreglo de 10 números. Estos representan el nivel de "confianza" del modelo sobre las imágenes de cada uno de los 10 articulos de moda/ropa. Podemos revisar cual tiene el nivel más alto de confianza:

In [None]:
np.argmax(predictions[0])

Entonces,el modelo tiene mayor confianza que esta imagen es un bota de tobillo "ankle boot" o lo que es lo mismo, class_names[9]. Examinando las etiquetas de test o de pruebas muestra que esta clasificaion es correcta:

In [None]:
test_labels[0]

Graficamos esto para poder ver todo el set de la prediccion de las 10 clases.

In [None]:
i = 0
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_image(i, predictions[i], test_labels, test_images)
plt.subplot(1,2,2)
plot_value_array(i, predictions[i],  test_labels)
plt.show()

In [None]:
i = 12
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_image(i, predictions[i], test_labels, test_images)
plt.subplot(1,2,2)
plot_value_array(i, predictions[i],  test_labels)
plt.show()

In [None]:
# Plot the first X test images, their predicted labels, and the true labels.
# Color correct predictions in blue and incorrect predictions in red.
num_rows = 5
num_cols = 3
num_images = num_rows*num_cols
plt.figure(figsize=(2*2*num_cols, 2*num_rows))
for i in range(num_images):
  plt.subplot(num_rows, 2*num_cols, 2*i+1)
  plot_image(i, predictions[i], test_labels, test_images)
  plt.subplot(num_rows, 2*num_cols, 2*i+2)
  plot_value_array(i, predictions[i], test_labels)
plt.tight_layout()
plt.show()

## Vamos a probar con el dataset MNIST (Para el Reto...)

¿Os atrevéis a intentar repetir el proceso con otro dataset? Este es muy similar, pero con números escritos a mano.

In [None]:
mnist = keras.datasets.mnist

(train_images, train_labels), (test_images, test_labels) = mnist.load_data()



In [None]:
plt.figure()
plt.imshow(train_images[1])
plt.colorbar()
plt.grid(False)
plt.show()