# Clasificando Fashion-MNIST

Ahora es su turno de construir y entrenar una red neuronal. Utilizará el [Fashion-MNIST dataset](https://github.com/zalandoresearch/fashion-mnist), un reemplazo al MNIST dataset. MNIST es en realidad bastante trivial con las redes neuronales en las que puede lograr fácilmente una precisión superior al 97%. Fashion-MNIST es un conjunto de imágenes de ropa en escala de grises de 28x28. Es más complejo que MNIST, por lo que es una mejor representación del rendimiento real de su red y una mejor representación de los conjuntos de datos que utilizará en el mundo real.

<img src='assets/fashion-mnist-sprite.png' width=500px>

En este cuaderno, creará su propia red neuronal. En su mayor parte, podría simplemente copiar y pegar el código de la Parte 3, pero no estaría aprendiendo. Es importante que usted mismo escriba el código y lo haga funcionar. No dude en consultar los cuadernos anteriores mientras trabaja en esto.


En primer lugar, importemos nuestros recursos y descarguemos el conjunto de datos Fashion-MNIST de `tensorflow_datasets`.

## Importar recursos

In [None]:
#importe el paquete de warnings     https://docs.python.org/es/3/library/warnings.html 

#
#warnings.filterwarnings('ignore')

In [None]:
%matplotlib inline
%config InlineBackend.figure_format = 'retina'          #https://ryanwingate.com/visualization/matplotlib/inline-backend-on-retina-displays/

#importe numpy
#importe pyplot de matplotlib

#importe tensorflow

#importe datasets de tensorflow

#Muestre una barra de progreso de las epoch


In [None]:
#import logging para mostrar que esta sucediendo, 


#instancialo y 


#establece el nivel del logger (que tipo de mensajes va a mostrar)



In [None]:
#imprima la version de TensorFlow


#imprima la version de Keras


#Imprima si esta disponible una GPU para correr TensorFlow sobre esta, en caso contrario que tambien lo indique




## Cargar el conjunto de datos

Ahora vamos a cargar el conjunto de datos Fashion-MNIST usando `tensorflow_datasets` como ya lo hemos hecho. En este caso, sin embargo, vamos a omitir el argumento "split".  Esto significa queusará el valor predeterminado para` split` que es `split = None`. Cuando `split=None`, el `tensorflow_datasets` regresa un **dictionario** con todas las divisiones disponibles para el conjunto de datos que estás cargando. Sin embargo, si la división se da explícitamente, como `split='train'`, entonces `tensorflow_datasets` regresa un objeto `tf.data.Dataset`.

En nuestro caso, vamos a cargar el conjunto de datos `fashion_mnist`. Si miramos la [documentación](https://www.tensorflow.org/datasets/catalog/fashion_mnist#statistics) veremos que este conjunto de datos en particular tiene 2 divisiones, la de entrenamiento (`train`) y la de prueba (`test`). También vemos que la división `train` tiene 60,000 ejemplos y que la división` test` tiene 10,000 ejemplos.

Ahora, carguemos el conjunto de datos `fashion_mnist` e inspeccionemos los valores devueltos.

In [None]:
#Cargue el dataset de fashion_MNIST y la informacion de este mismo en su forma "as_supervised = True"            #https://www.tensorflow.org/datasets/api_docs/python/tfds/load



In [None]:
# Checar que el dataset es de typo dictionario


# Imprimir las keys del dataset (dictionary)



En la celda de abajo, vamos a guardar los datos de entrenamiento y los datos de prueba en diferentes variables.

In [None]:
#asignar a los datos del training_set y de test_set su contenido respectivo



Ahora, echemos un vistazo al `dataset_info`

In [None]:
# Display la dataset_info



Podemos acceder a la información en `dataset_info` muy fácilmente. Como podemos ver, la información de `features` y` splits` está contenida en diccionarios. Podemos acceder a la información que queremos accediendo a la clave y el valor particulares en estos diccionarios. Comenzamos mirando los valores de claves particulares en estos:

In [None]:
#Veamos la forma (shape) y el dtype de 'image' contenido en 'features' dentro del diccionario


In [None]:
#Veamos la forma, el dtype y sus num_classes de 'label' contenido en 'features' dentro del diccionario


In [None]:
#Accedamos a num_examples de 'train' contenido en 'splits' dentro del diccionario

Ahora podemos usar la notación de puntos para acceder a la información que queremos. A continuación se muestran algunos ejemplos.

In [None]:
#asignemos a una variable la shape de 'image'
shape_images =

#asignemos a una variable las num_classes de 'label'
num_classes = 

#asignemos a una variable las num_examples de 'train' contenido en 'splits' 
num_training_examples =

#asignemos a una variable las num_examples de 'test' contenido en 'splits' 
num_test_examples =



#Mostremos un mensaje en pantalla con el numero de clases y la forma que tiene el dataset

print('...'.format(...))
print('...', ...)


#Mostremos un mensaje en pantalla con el numero de imagenes contenidas en los conjuntos de entrenamiento y prueba
print('\nThere are {:,} images in the test set'.format(...))
print('There are {:,} images in the training set'.format(...))

## Explore el conjunto de datos

Las imágenes de este conjunto de datos son matrices de 28 $\times$ 28 con valores de píxeles en el rango de ` [0, 255] `. Las *etiquetas* (*labels*) son una matriz de números enteros, en el rango "[0, 9]". Estos corresponden a la *clase* (*class*) de ropa que representa la imagen:

<table>
  <tr>
    <th>Label</th>
    <th>Class</th> 
  </tr>
  <tr>
    <td>0</td>
    <td>T-shirt/top</td> 
  </tr>
  <tr>
    <td>1</td>
    <td>Trouser</td> 
  </tr>
    <tr>
    <td>2</td>
    <td>Pullover</td> 
  </tr>
    <tr>
    <td>3</td>
    <td>Dress</td> 
  </tr>
    <tr>
    <td>4</td>
    <td>Coat</td> 
  </tr>
    <tr>
    <td>5</td>
    <td>Sandal</td> 
  </tr>
    <tr>
    <td>6</td>
    <td>Shirt</td> 
  </tr>
    <tr>
    <td>7</td>
    <td>Sneaker</td> 
  </tr>
    <tr>
    <td>8</td>
    <td>Bag</td> 
  </tr>
    <tr>
    <td>9</td>
    <td>Ankle boot</td> 
  </tr>
</table>

Cada imagen se asigna a una sola etiqueta. Dado que los * nombres de clase * no están incluidos con el conjunto de datos, los creamos aquí para usarlos más adelante al trazar las imágenes:

In [None]:
#creemos la lista del total de clases
class_names = ['...']

In [None]:
#Mostramos el 'dtype' y el 'shape' de un elemento del conjunto de datos de entrenamiento con ayuda de un ciclo for
for ..., ... in ... :                                                                                           #HINT: https://www.tensorflow.org/tutorials/load_data/text
    print('The images in the training set have:\n\u2022 dtype:', image.dtype, '\n\u2022 shape:', image.shape)

In [None]:
#Similar al anterior, ahora asigna a las variables 'image' y 'label'  el contenido de ese elemento convirtiendo
for ..., ... in ... :
    image = ...                                                                                                  #HINT: https://numpy.org/doc/stable/reference/generated/numpy.squeeze.html
    label = ...


#imprimir en una la imagen del elemento 
plt.imshow(..., cmap= plt.cm.binary)
plt.colorbar()
plt.show()


#mostrar la etiqueta de esa imagen
print('The label of this image is:', ...)
#mostrar la clase de la etiqueta de esa imagen
print('The class name of this image is:', ...[...])

## Crear Pipeline

In [None]:
def normalize(image, label):
    image = tf.cast(image, tf.float32)
    image /= 255
    return image, label

batch_size = 64

training_batches = training_set.cache().shuffle(num_training_examples//4).batch(batch_size).map(normalize).prefetch(1)
testing_batches = test_set.cache().batch(batch_size).map(normalize).prefetch(1)

## Construir el modelo
> **Ejercicio:** Aquí debes definir tu propia red neuronal. Siéntase libre de crear un modelo con tantas capas y neuronas como desee. Debe tener en cuenta que, al igual que con MNIST, cada imagen es 28 $\times$ 28 which is a total of 784 pixels, y hay 10 clases. Su modelo debe incluir al menos una capa oculta. Le sugerimos que utilice las funciones de activación de ReLU para las capas ocultas y una función de activación softmax para la capa de salida.

In [None]:
## Solution


## Entrenar al modelo
> **Ejercicio:** Compile el modelo que creó anteriormente usando un optimizador `adam`, una función de pérdida` sparse_categorical_crossentropy` y la métrica de `precisión` (`accuracy` ). Luego entrena el modelo durante 5 épocas. Debería poder obtener la pérdida de entrenamiento (training loss) por debajo de 0.4.

In [None]:
## Solution


## Evaluar la pérdida y la precisión en el conjunto de prueba

Ahora veamos cómo funciona el modelo en el conjunto de prueba (`test set`). Esta vez, usaremos todos los ejemplos en nuestro conjunto de prueba para evaluar la pérdida (`loss`) y precisión de nuestro modelo (`accuracy`). Recuerde, las imágenes de la prueba son imágenes que el modelo nunca ha visto antes.

In [None]:
loss, accuracy = my_model. ...(...) #evaluemos

print('\nLoss on the TEST Set: {:,.3f}'.format(...))  #perdida
print('Accuracy on the TEST Set: {:.3%}'.format(...)) #precision

## Validar Predicciones

In [None]:
for image_batch, label_batch in testing_batches.take(1):
    ps = my_model.predict(image_batch)
    first_image = image_batch.numpy().squeeze()[0]
    first_label = label_batch.numpy()[0]

fig, (ax1, ax2) = plt.subplots(figsize=(6,9), ncols=2)
ax1.imshow(first_image, cmap = plt.cm.binary)
ax1.axis('off')
ax1.set_title(class_names[first_label])
ax2.barh(np.arange(10), ps[0])
ax2.set_aspect(0.1)
ax2.set_yticks(np.arange(10))
ax2.set_yticklabels(class_names, size='small');
ax2.set_title('Class Probability')
ax2.set_xlim(0, 1.1)
plt.tight_layout()