##### Copyright 2018 The TensorFlow Authors.

In [None]:
#@title Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

In [None]:
#@title MIT License
#
# Copyright (c) 2017 François Chollet
#
# Permission is hereby granted, free of charge, to any person obtaining a
# copy of this software and associated documentation files (the "Software"),
# to deal in the Software without restriction, including without limitation
# the rights to use, copy, modify, merge, publish, distribute, sublicense,
# and/or sell copies of the Software, and to permit persons to whom the
# Software is furnished to do so, subject to the following conditions:
#
# The above copyright notice and this permission notice shall be included in
# all copies or substantial portions of the Software.
#
# THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
# IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
# FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL
# THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
# LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING
# FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER
# DEALINGS IN THE SOFTWARE.


# Etrenamiento de Red Neuronal:

<h1>Codigo original</h1>
<table class="tfo-notebook-buttons" align="left">
  <td>
    <a target="_blank" href="https://www.tensorflow.org/tutorials/keras/basic_classification"><img src="https://www.tensorflow.org/images/tf_logo_32px.png" />View on TensorFlow.org</a>
  </td>
  <td>
    <a target="_blank" href="https://github.com/tensorflow/docs/blob/master/site/en/tutorials/keras/basic_classification.ipynb"><img src="https://www.tensorflow.org/images/GitHub-Mark-32px.png" />View source on GitHub</a>
  </td>
</table>

<h1>Mi version del codigo</h1>
<table class="tfo-notebook-buttons" align="left">
  <td>
    <a target="_blank" href="https://colab.research.google.com/github/adawolfs/Computer-Vision-Jalapa/blob/master/deep-learning/tensorflow/basic_classification.ipynb"><img src="https://cdn-images-1.medium.com/max/200/1*i_ncmAcN81MRMNRDcenKiw.png"/> Abrir en Colab </a>
  </td>
</table>

En este ejemplo se entrenara un modelo de red neuronal para la clasificación de imagenes de ropa, como camisas y pantalones. 

Esta guia utiliza [tf.keras](https://www.tensorflow.org/guide/keras), un API de alto nivel para crear y entrenar modelos en TensorFlow

In [None]:
from __future__ import absolute_import, division, print_function

# TensorFlow and tf.keras
import tensorflow as tf
from tensorflow import keras

# Helper libraries
import numpy as np
import matplotlib.pyplot as plt

print(tf.__version__)

## Importar el dataset "Fashion MNIST"

Esta guia hace uso del dataset [Fashion MNIST](https://github.com/zalandoresearch/fashion-mnist) el cual cuenta con 70,000 imagenes en escala de grises distribuidas en 10 categorias. Las imagenes muestran prendas individuales en baja resolucion (28 by 28 pixels), como se muestra aqui:

<table>
  <tr><td>
    <img src="https://tensorflow.org/images/fashion-mnist-sprite.png"
         alt="Fashion MNIST sprite"  width="600">
  </td></tr>
  <tr><td align="center">
    <b>Figure 1.</b> <a href="https://github.com/zalandoresearch/fashion-mnist">Fashion-MNIST samples</a> (by Zalando, MIT License).<br/>&nbsp;
  </td></tr>
</table>

Fashion MNIST fue creado como un reemplazo para el clasico [MNIST](http://yann.lecun.com/exdb/mnist/) dataset usado comunmente como un "Hello World" para programas de computer vision utilizando machine learning.

Utilizaremos 60,000 imagenes para entrenar la red y 10,000 imagenes para evaluar que tan bien la re aprede a clasificar imagenes. Se puede accesar a Fashion MNIST directamente desde TensorFlow, solo importando y cargando la data de la siguiente manera:

In [None]:
fashion_mnist = keras.datasets.fashion_mnist

(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

Al cargar el dataset este devuelve cuatro arrays de NumPy:

* Los arrays `train_images` y `train_labels` son los *datos de entrenamiento* por ende seran utilizados por el modelo para aprender.
* EL modelo es evaluado utilizando los *datos de test*, el array `test_images` y `test_labels`.

Las imagenes son arrays de NumPy de 28x28, con valores de pixel que varian entre 0 y 255. Los *labels* son un array de enteros, que van desde el 0 al 9. Estos corresponden a la *classe* de ropa que la imagen representa:

<table>
  <tr>
    <th>Label</th>
    <th>Class</th> 
  </tr>
  <tr>
    <td>0</td>
    <td>T-shirt/top</td> 
  </tr>
  <tr>
    <td>1</td>
    <td>Trouser</td> 
  </tr>
    <tr>
    <td>2</td>
    <td>Pullover</td> 
  </tr>
    <tr>
    <td>3</td>
    <td>Dress</td> 
  </tr>
    <tr>
    <td>4</td>
    <td>Coat</td> 
  </tr>
    <tr>
    <td>5</td>
    <td>Sandal</td> 
  </tr>
    <tr>
    <td>6</td>
    <td>Shirt</td> 
  </tr>
    <tr>
    <td>7</td>
    <td>Sneaker</td> 
  </tr>
    <tr>
    <td>8</td>
    <td>Bag</td> 
  </tr>
    <tr>
    <td>9</td>
    <td>Ankle boot</td> 
  </tr>
</table>

Cada imagen es mapeada a un solo label. Ya que los *nombres de las clases* no estan incluidos en el dataset, es necesario crearlos, para luego utilizarlos cuando se esten mostrando las imagenes:
Each image is mapped to a single label. Since the *class names* are not included with the dataset, store them here to use later when plotting the images:

In [None]:
class_names = ['Camiseta', 'Pantalones', 'Sueter', 'Vestido', 'Abrigo', 
               'Sandaleas', 'Camisa', 'Tenis', 'Bolsa', 'Botines']

## Explorando la data

Vamos a explorar el formate del dataset antes de empezar a entrenar el modelo. Acontinuacion vemos que hay 60,000 imagenes en el set de entrenamiento, y cada imagen representada como una matriz de 28 x 28 pixels:

In [None]:
train_images.shape

60,000 labels en el set de entrenamiento:

In [None]:
len(train_labels)

Cada label es un entero entre 0 y 9:

In [None]:
train_labels

There are 10,000 images in the test set. Again, each image is represented as 28 x 28 pixels:

In [None]:
test_images.shape

Y el set de test contiene 10,000 labels:

In [None]:
len(test_labels)

## Procesando la data:

La data debe de ser preprocesada antes de empezar el entrenamiento. Is inspectamos la primera imagen del set de entrenamiento, encontraremos que los valores de los pixels varian entre 0 y 255:

In [None]:
plt.figure()
plt.imshow(train_images[1])
plt.colorbar()
plt.grid(False)
plt.show()

Escalaremos esos valores para que esten en el rango de 0 a 1 antes de llevarlos a la red neuronal. Para esto dividiremos los valores por 255. es importante que el *set de entrenamiento* y el *set de test* sean procesados de la misma manera:

In [None]:
train_images = train_images / 255.0

test_images = test_images / 255.0

Mostrar las primeras 25 imagenes de el *set de entrenamiento* y mostrar la clase a la que corresponden cada una. Es importante verificar que la data tiene el formato correcto y asi tener todo listo para costruir y entrenar el modelo.

In [None]:
plt.figure(figsize=(10,10))
for i in range(25):
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(train_images[i], cmap=plt.cm.binary)
    plt.xlabel(class_names[train_labels[i]])
plt.show()

## Construyendo el modelo:

Costruir el modelo de la red neuronal require confugurar las capas de el modelo y luego compilarlo.

### Definir las capas

El bloque basico para construir una red neuronal son los *layers*.

In [None]:
model = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(128, activation=tf.nn.relu),
    keras.layers.Dense(10, activation=tf.nn.softmax)
])

La primera capa de esta red es: `tf.keras.layers.Flatten`, La cual transforma las imagenes de un array de 28x28 a un array de 1x784. transforms the format of the images from a 2d-array (of 28 by 28 pixels), to a 1d-array of 28 * 28 = 784 pixels. Think of this layer as unstacking rows of pixels in the image and lining them up. This layer has no parameters to learn; it only reformats the data.

Despues de esta capa la red neuronal continua con dos capas `tf.keras.layers.Dense`. Estas capas *densas* son redes totalmente conectadas, lo que significa que todas las neuronas en la capa estan conectadas a todas las neuronas en la capa siguiente. La primera capa `Dense` tiene 128 neuronas. La segunda capa consta de 10 neuronas con una funcion *softmax* la cual retorna un array de 10 probabilidades, la cual suma a 1. Cada neurona contiene un valor el cual indica la probabilidad de que la actual imagen pertenezca a una de las 10 clases.

### Compilar el modelo

Antes de que el modelo este listo para ser entrenado, se necesitan algunas otras configuraciones. Las cuales son agregadas durante el proceso de compilación:

* *Loss function* —Se encarga de medir que tan preciso es el modelo durante el entrenamiento. En medida de que el resultado de esta funcion se minimize se puede apreciar si el modelo esta "aprendiendo".
* *Optimizer* —Algoritmo utilizado para actualizar el modelo basado en la que se ve y la función de perdida.
* *Metrics* —Utilizado para monitorear el entrenamiento y los pasos de test. El siguiente ejemplo utiliza *accuracy*.

In [None]:
model.compile(optimizer='adam', 
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

## Entrenar el modelo

Entrenar el modelo requiere de los siguientes pasos:

1. Alimentar el modelo con la data de entrenamiento, para este ejemplo se usaran los arrays `train_images` y `train_labels`.
2. El modelo aprende a asociar imagenes y etiquetas.
3. Pedimos al modelo que haga predicciónes sobre la data de test que para este ejemplo es el array `test_images`. Luego se verificaran estas predicciones utilizando el array `test_labels`. 

Para empezar en entrenamiento, es necesario llamar el metodo `model.fit` el cual empieza el proceso de *ajuste* en la data de entrenamiento:

In [None]:
model.fit(train_images, train_labels, epochs=5)

En medida de que el modelo se entrena a si mismo, los valores de perdida (loss) y precisión (accuracy) se muestran.
Este modelo alcanza un nivel de precisión de aproximadamente 0.88 ( 88%) en la data de entrenamiento.

## Evaluar la precisión

Ahora compararemos el desempeño del modelo en la data de prueba:

In [None]:
test_loss, test_acc = model.evaluate(test_images, test_labels)

print('Test accuracy:', test_acc)

Al parecer la precisión en el conjunto de datos de prueba es un poco menor que la precisión en el conjunto de datos de entrenamiento. Esta brecha entre la precisión del entrenamiento y la precisión de la prueba es un ejemplo de *overfitting*. El ajuste excesivo es cuando un modelo de machine learning se comporta peor con los datos nuevos que con los datos de entrenamiento.

## Hacer predicciónes:

Con el modelo entrenado, ya podemos realizar predicciónes en algunas imagenes.

In [None]:
predictions = model.predict(test_images)

El modelo ha realizado predicciones sobre los labels de cada imagen en el set de test. Veamos que tal le va en la primera predicción:

In [None]:
predictions[0]

Una predicción e un array de 10 numeros. Los cuales representan el nuvel de *confianza* que el modelo tiene en que una imagen corresponda a cada uno de las 10 diferentes clases de prendas. Acontinuación mostramos el label con el mayor nivel de confianza:

In [None]:
np.argmax(predictions[0])

Asi que el modelo tiene un alto nivel de confianza en que la imagen sea un Botin o `class_names[9]`. Y podemos asegurarnos de que el valor sea el correcto inspectando el valor correspondiente:

In [None]:
test_labels[0]

Podemos ver todos los niveles utilizando:

In [None]:
def plot_image(i, predictions_array, true_label, img):
  predictions_array, true_label, img = predictions_array[i], true_label[i], img[i]
  plt.grid(False)
  plt.xticks([])
  plt.yticks([])
  
  plt.imshow(img, cmap=plt.cm.binary)

  predicted_label = np.argmax(predictions_array)
  if predicted_label == true_label:
    color = 'blue'
  else:
    color = 'red'
  
  plt.xlabel("{} {:2.0f}% ({})".format(class_names[predicted_label],
                                100*np.max(predictions_array),
                                class_names[true_label]),
                                color=color)

def plot_value_array(i, predictions_array, true_label):
  predictions_array, true_label = predictions_array[i], true_label[i]
  plt.grid(False)
  plt.xticks([])
  plt.yticks([])
  thisplot = plt.bar(range(10), predictions_array, color="#777777")
  plt.ylim([0, 1]) 
  predicted_label = np.argmax(predictions_array)
 
  thisplot[predicted_label].set_color('red')
  thisplot[true_label].set_color('blue')

Veamos la imagen en el index 0 y 12. 

In [None]:
i = 0
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_image(i, predictions, test_labels, test_images)
plt.subplot(1,2,2)
plot_value_array(i, predictions,  test_labels)
plt.show()

In [None]:
i = 12
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_image(i, predictions, test_labels, test_images)
plt.subplot(1,2,2)
plot_value_array(i, predictions,  test_labels)
plt.show()

Ahora con más imagenes. Las predicciónes correctas son azules y las incorrectas son rojas. El numero reprecenta el porcentaje para la etiqueta que se ha predicho. Notar que puede estar mal aun cuando se esta muy seguro.

In [None]:
# Plot the first X test images, their predicted label, and the true label
# Color correct predictions in blue, incorrect predictions in red
num_rows = 5
num_cols = 3
num_images = num_rows*num_cols
plt.figure(figsize=(2*2*num_cols, 2*num_rows))
for i in range(num_images):
  plt.subplot(num_rows, 2*num_cols, 2*i+1)
  plot_image(i, predictions, test_labels, test_images)
  plt.subplot(num_rows, 2*num_cols, 2*i+2)
  plot_value_array(i, predictions, test_labels)
plt.show()

Finalmente utilizar el modelo entrenado para realizar una predicción sobre una sola imagen.

In [None]:
# Grab an image from the test dataset
img = test_images[0]

print(img.shape)

Los modelos de `tf.keras` estan optimizados para realizar predicciones sobre un *batch*, o collección de ejemplos a la vez. Por ello se debera proveer este dentro de una lista:

In [None]:
# Add the image to a batch where it's the only member.
img = (np.expand_dims(img,0))

print(img.shape)

Ahora predecir sobre la imagen

In [None]:
predictions_single = model.predict(img)

print(predictions_single)

In [None]:
plot_value_array(0, predictions_single, test_labels)
plt.xticks(range(10), class_names, rotation=45)
plt.show()

El `model.predict` retorna una lista de listas, una por cada imagen en el conjunto de datos. Asi que sera necesario ecoger la predicción para esta unica imagen:

In [None]:
prediction_result = np.argmax(predictions_single[0])
print(prediction_result)

Y como antes, el modelo ha concluido en que pertenece a la clase 9.