
# <center>Clasificación de prendas de vestir</center>
**Julio 2020** <br>
**Intructor:** Eduardo Marín Nicolalde

## 0. Introducción
El objetivo de este notebook es comparar el performance de redes neuronales profundas con distintos grado de profundidad e hiperparámetros.

## 1. Importar módulos

In [0]:
#librerías
import tensorflow as tf
from tensorflow import keras
import numpy as np
import matplotlib.pyplot as plt
print("tf version: ",tf.__version__)

## 2. Datos: The Fashion MNIST dataset

Este ejercicio emplea el [Fashion MNIST](https://github.com/zalandoresearch/fashion-mnist) que contiene 70.000 imágenes en escala de grises clasificadas en 10 categorías. Cada imagen representa una prenda de vestir con una resolución de 28x28 pixels.

<table>
  <tr><td>
    <img src="https://tensorflow.org/images/fashion-mnist-sprite.png"
         alt="Fashion MNIST sprite"  width="600">
  </td></tr>
  <tr><td align="center">
    <b>Figura 1.</b> <a href="https://github.com/zalandoresearch/fashion-mnist">Fashion-MNIST samples</a> (by Zalando, MIT License).<br/>&nbsp;
  </td></tr>
</table>

El dataset puede descargarse fácilmente con el siguiente código:

In [0]:
#El código devuelve 4 arreglos numéricos de numpy: 2 training sets y 2 test sets
#Imágenes: son tensores 2D de 28x28
#Pixels:   Valores entre 0 y 255
#Labels:   arreglo e enteros entre 0 y 9 (prendas de vestir)
#Training set: 60,000 imágenes, Testing set: 10,000 imágenes

fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

Las imágenes son arreglos numéricos de 28x28 pixels cuyos valores están entre 0 y 255 identificando la intensidad del color. La variable objetivo tiene etiquetas desde 0 hasta 9 que corresponden a las siguientes categorías:
<table>
  <tr>
    <th>Label</th>
    <th>Class</th>
  </tr>
  <tr>
    <td>0</td>
    <td>Camiseta/top</td>
  </tr>
  <tr>
    <td>1</td>
    <td>Pantalones</td>
  </tr>
    <tr>
    <td>2</td>
    <td>Suéter</td>
  </tr>
    <tr>
    <td>3</td>
    <td>Vestido</td>
  </tr>
    <tr>
    <td>4</td>
    <td>Saco</td>
  </tr>
    <tr>
    <td>5</td>
    <td>Sandalias</td>
  </tr>
    <tr>
    <td>6</td>
    <td>Camisa</td>
  </tr>
    <tr>
    <td>7</td>
    <td>Zapatos</td>
  </tr>
    <tr>
    <td>8</td>
    <td>Bolso</td>
  </tr>
    <tr>
    <td>9</td>
    <td>Botines</td>
  </tr>
</table>

Utilizaremos el objeto `class_names` para identificar las categorías.

In [0]:
class_names = ['Camiseta/top', 'Pantalones', 'Suéter', 'Vestido', 'Saco',
               'Sandalias', 'Camisa', 'Zapatos', 'Bolso', 'Botines']
print("train_images:", train_images.shape)
print("test_images:" , test_images.shape)

## 3. Preprocesamiento de datos

Tenemos 60000 imágenes de 28x28 pixels

In [0]:
print(train_labels[:10])
len(train_labels)

**Previsualización de imágenes**

Observaremos una imagen en su formato tensorial y su representación gráfica.

In [0]:
train_images[20]

In [0]:
plt.figure()
plt.imshow(train_images[20])
plt.colorbar()
plt.grid(False)
plt.show()

**Normalización**

Escalamiento de imágenes para que los valores estén entre 0 y 1 y no entre 0 y 255.

In [0]:
train_images = train_images / 255.0
test_images  = test_images  / 255.0

In [0]:
plt.figure(figsize=(10,10))
for i in range(25):
  plt.subplot(5,5, i+1)
  plt.xticks([])
  plt.yticks([])
  plt.grid(False)
  plt.imshow(train_images[i], cmap=plt.cm.binary)
  plt.xlabel(class_names[train_labels[i]])
  
plt.show()

## 4. Arquitecturas
### 4.1 Modelo 1: 3-layer Neural Network

La primera capa vectoriza el arreglo numérico. En otras palabras, transforma una arreglo bidimensional de 28x28 a un arreglo unidimensional de 28X28 = 784 pixels. 

In [0]:
# Paso 1: Arquitectura
# Ojo: Los nombres de las capas y modelos no pueden contener espacios en blanco
model_3 = keras.Sequential(layers=[
    keras.layers.Flatten(input_shape=(28,28)       , name = "Aplanamiento"),
    keras.layers.Dense(units = 128, activation=tf.nn.relu  , name = "128-ReLu"),
    keras.layers.Dense(units = 10 , activation=tf.nn.softmax, name = "OutputLayer")],
                                                     name = "3-layerNeuralNetwork")
model_3.summary() 

# Paso 2: Compilación
model_3.compile(optimizer = tf.keras.optimizers.Adam(learning_rate=0.001),
                loss      = 'sparse_categorical_crossentropy',
                metrics   = ['accuracy'])

In [0]:
# Paso 3: Entrenamiento 
# 5 épocas, división de datos train/validation de 80%/20%

model_3.fit(train_images, train_labels, epochs=5, batch_size= 10000, validation_split=0.2)

In [0]:
# Paso 4: Evaluación sobre el testing set
test_loss, test_acc = model_3.evaluate(test_images, test_labels)
print("Model - 3 layers - test loss:"    , test_loss)
print("Model - 3 layers - test accuracy:", test_acc)

### 4.3 ¿Más profundidad implica mayor precisión?
> **Ejercicio**:<br>
> **1.** Entrene un modelo de 6  capas ocultas y 128 unidades cada una<br>
> **2.** Entrene un modelo de 12 capas ocultas y 128 unidades cada una<br>
> **3.** Comente sus resultados: ¿Mas profundidad implica mayor precisión?<br>


In [0]:
#Su código aquí


In [0]:
#Su código aquí


### 4.4 ¿Más iteraciones implica mayor precisión?
En el siguiente ejemplo modificaremos el número de épocas para analizar los efectos sobre las métricas de evaluación

In [0]:
# NN-3, 50 epochs 
history_NN3_50=model_3.fit(train_images, train_labels, epochs=50, batch_size=10000, validation_split=0.2)

test_loss, test_acc = model_3.evaluate(test_images, test_labels)
print("Model - 3 layers - test loss:", test_loss * 100)
print("Model - 3 layers - test accuracy:", test_acc * 100)

In [0]:
#Evaluación de loss function
plt.plot(history_NN3_50.history['loss'], 'blue')
plt.plot(history_NN3_50.history['val_loss'], 'orange')
plt.title('Loss para NN-3')
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['train', 'validate'], loc='upper left')

#Evaluación de accuracy
fig, ax = plt.subplots()
ax.plot(history_NN3_50.history['accuracy'], 'green')
ax.plot(history_NN3_50.history['val_accuracy'], 'red')
plt.title('Accuracy para NN-3')
plt.ylabel('accuracy')
plt.xlabel('epoch')
plt.legend(['train', 'validate'], loc='upper left')

> **Ejercicio**:<br>
> **1.** Reentrene el modelo de 6  capas ocultas con 50 épocas<br>
> **2.** Reentrene el modelo de 12 capas ocultas con 50 épocas<br>
> **3.** Comente sus resultados: 

In [0]:
#Su código aqui 


In [0]:
#Su código aqui 


### 4.5 Cree su propio modelo
En base a los resultados de las simulaciones anteriores, modifique los hiperparámetros del modelo para encontrar una solución estable, que pueda ser generalizada a los datos de testing.


In [0]:
#Su código aquí

### 5. Predicciones

Para el modelo de 3 capas, comprobaremos la calidad de las predicciones 

In [0]:
predictions_3NN = model_3.predict(test_images)
predictions_3NN.shape

Verificación de predicciones

In [0]:
i = 10

print("Vector de probabilidades para predicción:\n", predictions_3NN[i],"\n")
print("Predicción (argumento máximo):\n", np.argmax(predictions_3NN[i]))
print("Verdadera categoría:\n", test_labels[i])
print("Nombre  categoría predicha:\n", class_names[np.argmax(predictions_3NN[i])])
print("Nombre  categoría real:\n", class_names[test_labels[i]])

In [0]:
plt.figure()
plt.imshow(test_images[i])
plt.colorbar()
plt.grid(False)
display()

### 6. Fin
