<table align="left">
  <td>
    <a href="https://colab.research.google.com/github/marcoteran/deeplearning/blob/master/notebooks/3.3_deeplearning_cnn.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Abrir en Colab" title="Abrir y ejecutar en Google Colaboratory"/></a>
  </td>
  <td>
    <a target="_blank" href="https://kaggle.com/kernels/welcome?src=https://github.com/marcoteran/deeplearning/blob/master/notebooks/3.3_deeplearning_cnn.ipynb"><img src="https://kaggle.com/static/images/open-in-kaggle.svg" alt="Abrir en Kaggle" title="Abrir y ejecutar en Kaggle"/></a>
  </td>
</table>

### Ejemplo de cÃ³digo
# SesiÃ³n 09: Redes Neuronales Convolucionales
## Deep Learning y series de tiempo

**Name:** Marco Teran **E-mail:** marco.tulio.teran@gmail.com,
[Website](http://marcoteran.github.io/),
[Github](https://github.com/marcoteran),
[LinkedIn](https://www.linkedin.com/in/marcoteran/).
___

### Importar librerÃ­as importantes

Empezamos con las importaciones estÃ¡ndar:

In [None]:
import warnings
warnings.filterwarnings('ignore')
#import mlutils
import numpy as np
import pandas as pd
import importlib
#importlib.reload(mlutils)
#reload(mlutils) Python2

# Visualizations
import matplotlib.pyplot as plt
#import seaborn as sns; sns.set()  # for plot styling
from IPython.display import Image
from IPython.core.display import HTML 
%matplotlib inline

# Machine learning
from sklearn.datasets import make_blobs, make_moons
from sklearn.cluster import KMeans, SpectralClustering, AgglomerativeClustering, DBSCAN
from IPython.display import HTML
from sklearn.metrics import accuracy_score
from sklearn.metrics import confusion_matrix
from scipy.stats import mode
from sklearn.metrics import pairwise_distances_argmin

In [None]:
# Deep learning
import tensorflow as tf
from tensorflow import keras
print(tf.__version__)

# Â¿QuÃ© son las Redes convolucionales?

Una **red neuronal convolucional** es un tipo de red neuronal artificial donde las neuronas corresponden a campos receptivos de una manera muy similar a las neuronas en la corteza visual primaria (V1) de un cerebro biolÃ³gico. Este tipo de red es una variaciÃ³n de un perceptron multicapa, sin embargo, debido a que su aplicaciÃ³n es realizada en matrices bidimensionales, son muy efectivas para tareas de visiÃ³n artificial, como en la clasificaciÃ³n y segmentaciÃ³n de imÃ¡genes, entre otras aplicaciones.
![CNN](https://pedrofrodenas.github.io/assets/images/net.png)

## Ejemplo 1: clasificaciÃ³n de digitos MNIST

Tutorial de Deep Learning con Keras para clasificar la base de datos MNIST.

In [None]:
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Conv2D
from tensorflow.keras.layers import MaxPooling2D
from tensorflow.python.keras.layers import Reshape
from tensorflow.python.keras.layers import Dense, Flatten
from tensorflow.keras.optimizers import Adam

### Carga de la base de datos MNIST
Nota que al ser una base de datos tan popular ya existen scripts para descargar, descomprimir y formar el conjunto de datos de entreno y de test.
En un caso real, hay que programar las funciones que se encarguen de la descarga, la importaciÃ³n, la unificaciÃ³n de las imagenes para que todas tengan el mismo tamaÃ±o, etcâ€¦ Este paso normalmente es de los que ocupan mÃ¡s tiempo.

Los datos del MNIST estÃ¡n disponibles directamente en el API de los conjuntos de datos de tf.keras. Lo cargas asÃ­:

In [None]:
# Para descargar la base de datos MNIST
mnist = tf.keras.datasets.mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
print("TamaÃ±o de:")
print (train_images.shape)
print (train_labels.shape)

print("TamaÃ±o de:")
print("- Set de entranamiento:\t{}".format(len(train_images)))
print("- Set de testeo:\t\t{}".format(len(test_images)))
# Convert data to float32 for GPU optimization
train_images = train_images.astype('float32') / 255
test_images = test_images.astype('float32') / 255


El conjunto de datos MNIST ahora se ha cargado y consiste en 70,000 imÃ¡genes y nÃºmeros de clase para las imÃ¡genes. El conjunto de datos se divide en 3 subconjuntos. Uno se utiliza para entrenar la red, otro para testearla y otro para validar que el entreno se este realizando correctamente.

MNIST contiene imagenes de nÃºmeros manuscritos que van desde el 0 hasta el 9, por tanto tenemos 10 clases a clasificar. Las imagenes se almacenan en un vector y las etiquetas en otro.
Las etiquetas sirven para decirle a la red que nÃºmero es una determinada imagen a la hora de entrenar. En la fase de test sirven para comprobar si la red neuronal ha clasificado bien un determinado nÃºmero.

In [None]:
picnumber=25
plt.imshow(train_images[picnumber], cmap=plt.cm.binary)
# Ver la etiqueta
print(train_labels[picnumber])

#### Preprocesado de datos de entrada 

In [None]:
train_images = train_images.reshape((60000, 28, 28, 1))
train_images = train_images.astype('float32') / 255

test_images = test_images.reshape((10000, 28, 28, 1))
test_images = test_images.astype('float32') / 255

# Cambio a variables categoricas

from tensorflow.keras.utils import to_categorical

train_labels = to_categorical(train_labels, num_classes=10)
test_labels = to_categorical(test_labels, num_classes=10)

print (train_images.shape)
print (train_labels.shape)

In [None]:
print(test_labels[0])

### ConstrucciÃ³n de una Red neuronal convolucional

Keras dispone de dos modos para construir una arquitectura de red, el sequential mode y el functional mode. En este tutorial usaremos el sequential mode que es el mÃ¡s simple.

En el sequential mode se aÃ±aden capas de neuronas para formar la arquitectura neuronal. En la primera capa se deben especificar las dimensiones de los datos de entrada.
En nuestro caso las imagenes se encuentran en un vector de una fila y 28*28 columnas. Una vez introducido el vector a la red hay que modificarlo para que se realice la convoluciÃ³n correctamente. Transformando el vector de [1, 784] a una matriz de [28, 28] que es la imagen que se puede visualizar.

In [None]:
# Llamamos al constructor del modelo sequential
model = Sequential()

# Capa convolucional con funcion de activacion ReLU y max-pooling.
model.add(Conv2D(32, (5, 5), activation='relu', input_shape=(28, 28, 1)))
model.add(MaxPooling2D((2, 2)))

Comprobar la estructura de la red
Para comprobar la estructura de la red y el nÃºmero de parÃ¡metros entrenables usamos la siguiente sentencia.

In [None]:
model.summary()

DefiniciÃ³n de una red convolucional de mÃ¡s capas

In [None]:
model = Sequential()
model.add(Conv2D(32, (5, 5), activation='relu', input_shape=(28, 28, 1)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(64, (5, 5), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.summary()

Ultima capa de la red, del tipo Dense. Nota que hay ``num_classes=10`` neuronas en esta capa. La clasificacion
se hara comprobando que neurona obtiene a la salida un numero mayor.

In [None]:
from tensorflow.keras.layers import Dense
from tensorflow.keras.layers import Flatten

model.add(Flatten())
model.add(Dense(10, activation='softmax'))

Comprobar la estructura de la red

In [None]:
model.summary()

### CompilaciÃ³n del modelo

Se ha definido la estructura de la red neuronal convolucional, ahora hay que aÃ±adir el tipo de optimizador y las mÃ©tricas que se van a utilizar.

Los modelos de Deep Learning generalmente son entrenados por un optimizador de descenso de gradiente estocÃ¡stico. Hay muchas variaciones de descendencia de gradiente estocÃ¡stica: ``Adam``, ``RMSProp``, ``Adagrad``, etc. Todas permiten establecer el learning rate.
Cuando mÃ¡s pequeÃ±o sea este parÃ¡metro mÃ¡s tardarÃ¡ la red en entrenar y mÃ¡s precisiÃ³n se obtendrÃ¡ para el conjunto de datos de entreno. Hay que elegir un learning rate optimo para cada problema de Deep Learning. Si es muy pequeÃ±o la red aprenderÃ¡ del ruido que hay en todas las imÃ¡genes y no de la funciÃ³n subyacente que relaciona las entradas y las salidas.

Cuando se da este problema se obtiene una gran precisiÃ³n para el conjunto de datos de entreno y disminuye para el de test porque la red se ha especializado en reconocer el conjunto de datos para el que ha sido entrenada y ha perdido la habilidad de generalizar para otros casos. Este problema se conoce como overfitting

In [None]:
model.compile(loss='categorical_crossentropy',
              optimizer='sgd',
              metrics=['accuracy'])

### Entrenamiento de la red

Ahora que ya se ha definido la estructura de red, el optimizador, learning rate y metricas ya se puede entrenar la red.

* Mientras se va entrenando la red aparece la cantidad de Ã©pocas o epoch completadas. Una Ã©poca o epoch es cuando la red ha visto todas las imagenes que contiene la base de datos. El nÃºmero de epocas serÃ¡ otro hiperparÃ¡metro a elegir.
* No es posible entrenar la red pasandole todas las imÃ¡genes a la vez porque la memoria RAM es un recurso limitado.
* Por tanto se le pasan en grupos de un determinado nÃºmero de imagenes conocido como batch size, cuento mÃ¡s grande sea este parÃ¡metro menos se tardarÃ¡ en completar el entreno. El batch size estrÃ¡ limitado por la memoria RAM del computador.

In [None]:
model.fit(train_images, train_labels,
          batch_size=100,
          epochs=5,
          verbose=1)

#### EvaluaciÃ³n de la red
Para ver si la red ha aprendido a clasificar bien los nÃºmeros manuscritos hay que comprobar la precisiÃ³n que obtiene en el conjunto de datos de test. Para este conjunto no ha sido entrenada la red.

In [None]:
test_loss, test_acc = model.evaluate(test_images, test_labels)

print('Test accuracy:', test_acc)

El parÃ¡mtro ``test_acc`` es la precisiÃ³n que ha obtenido la red para el conjunto de entreno.
Ahora hay que comprobar si clasifica bien las imÃ¡genes del conjunto de test. Estas imÃ¡genes aÃºn no las ha visto la red y no tiene informaciÃ³n de ellas.

#### Guardar el modelo
Es Ãºtil gurdar un modelo que ha sido entrenado satisfactoriamente para su posterior uso. De esta manera no hay que entrenar de nuevo la red y se pueden realizar prediciones con el modelo guardado.

* **NOTA:** SerÃ¡ necesario instalar el paquete h5py para poder guardar modelos.

In [None]:
# Definir la carpeta donde se guarda el modelo y su nombre.
# En este caso se guarda en el mismo directorio que contiene este script
nombre_model = 'modelo.h5'

# Guardamos el modelo y todos los pesos entrenados
model.save(nombre_model)

___

## Ejemplo 2: Conjunto de datos Fashion-MNIST

Echemos un vistazo a un escenario en el que podemos reconocer diferentes prendas de vestir, entrenadas a partir de un conjunto de datos que contiene 10 tipos diferentes.

![Datos Fashion-MNIST](https://www.researchgate.net/profile/Greeshma_K_V/publication/340299295/figure/fig1/AS:875121904476163@1585656729996/Fashion-MNIST-Dataset-Images-with-Labels-and-Description-II-LITERATURE-REVIEW-In-image.jpg)

### Carga de datos

Los datos del MNIST de la moda estÃ¡n disponibles directamente en el API de los conjuntos de datos de tf.keras. Lo cargas asÃ­:

In [None]:
fashion_mnist = keras.datasets.fashion_mnist
# Convert data to float32 for GPU optimization
train_images = train_images.astype('float32') / 255
test_images = test_images.astype('float32') / 255


Llamar a ``load_data`` en el objeto le darÃ¡ dos conjuntos de dos listas, estos serÃ¡n los valores de entrenamiento y prueba para los grÃ¡ficos que contienen las prendas de vestir y sus etiquetas.

In [None]:
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

In [None]:
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

Â¿CÃ³mo son estos valores? Imprimamos una imagen de entrenamiento, y una etiqueta de entrenamiento para ver... Experimentemos con diferentes Ã­ndices en la matriz.

In [None]:
picnumber=42
plt.imshow(train_images[picnumber], cmap=plt.cm.binary)
# Ver la etiqueta
print(train_labels[picnumber])

In [None]:
train_images = train_images.reshape((60000, 28, 28, 1))
train_images = train_images.astype('float32') / 255

test_images = test_images.reshape((10000, 28, 28, 1))
test_images = test_images.astype('float32') / 255

### Modelo 1: modelo de base basado en el mismo modelo que el usado para el conjunto datos digits MNIST 

In [None]:
model = Sequential()
model.add(Conv2D(32, (5, 5), activation='relu', input_shape=(28, 28, 1)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(64, (5, 5), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Flatten())
model.add(Dense(10, activation='softmax'))

In [None]:
model.summary()

In [None]:
model.compile(optimizer='sgd',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=5)
test_loss, test_acc = model.evaluate(test_images,  test_labels)
print('Test accuracy:', test_acc)

In [None]:
predictions = model.predict(test_images)

In [None]:
predictions[5]

In [None]:
test_labels[5]

In [None]:
def plot_image(i, predictions_array, true_label, img):
    predictions_array, true_label, img = predictions_array, true_label[i], img[i]
    plt.grid(False)
    plt.xticks([])
    plt.yticks([])

    plt.imshow(img, cmap=plt.cm.binary)    

    predicted_label = np.argmax(predictions_array)
    if predicted_label == true_label:
        color = 'blue'
    else:
        color = 'red'
    
    plt.xlabel("{} {:2.0f}% ({})".format(class_names[predicted_label],
                                         100*np.max(predictions_array),
                                         class_names[true_label]),
               color=color)

def plot_value_array(i, predictions_array, true_label):
    predictions_array, true_label = predictions_array, true_label[i]
    plt.grid(False)
    plt.xticks(range(10))
    plt.yticks([])
    thisplot = plt.bar(range(10), predictions_array, color="#00FF00")
    plt.ylim([0, 1])
    predicted_label = np.argmax(predictions_array)
    
    thisplot[predicted_label].set_color('red')
    thisplot[true_label].set_color('black')

In [None]:
train_images = train_images.reshape((60000, 28, 28))
test_images = test_images.reshape((10000, 28, 28))

In [None]:
i = 5
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_image(i, predictions[i], test_labels, test_images)
plt.subplot(1,2,2)
plot_value_array(i, predictions[i],  test_labels)
plt.show()

### Mejoramiento de los modelos

In [None]:
num_rows = 7
num_cols = 2
num_images = num_rows*num_cols
plt.figure(figsize=(2*2*num_cols, 2*num_rows))
for i in range(num_images):
  plt.subplot(num_rows, 2*num_cols, 2*i+1)
  plot_image(i, predictions[i], test_labels, test_images)
  plt.subplot(num_rows, 2*num_cols, 2*i+2)     
  plot_value_array(i, predictions[i], test_labels)
plt.tight_layout()
plt.show()

In [None]:
train_images = train_images.reshape((60000, 28, 28, 1))
test_images = test_images.reshape((10000, 28, 28, 1))

### Modelo 2: Duplicando las neuronas de modelo base y aÃ±adiendo una capa densa de 64 neuronas

In [None]:
model = Sequential()

model.add(Conv2D(64, (7, 7), activation="relu", padding="same", input_shape=(28, 28, 1)))
model.add(MaxPooling2D(2, 2))
model.add(Conv2D(128, (3, 3), activation="relu", padding="same"))
model.add(MaxPooling2D(2, 2))
model.add(Flatten())
model.add(Dense(64, activation="relu"))
model.add(Dense(10, activation="softmax"))

In [None]:
model.compile(optimizer='sgd',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=5)

test_loss, test_acc = model.evaluate(test_images,  test_labels)
print('\nTest accuracy:', test_acc)

### Modelo 3: modelo 3 cambiando al optimizador 'adam'

In [None]:
model = Sequential()

model.add(Conv2D(64, (7, 7), activation="relu", padding="same", input_shape=(28, 28, 1)))
model.add(MaxPooling2D(2, 2))
model.add(Conv2D(128, (3, 3), activation="relu", padding="same"))
model.add(MaxPooling2D(2, 2))
model.add(Flatten())
model.add(Dense(64, activation="relu"))
model.add(Dense(10, activation="softmax"))

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=5)

test_loss, test_acc = model.evaluate(test_images,  test_labels)
print('\nTest accuracy:', test_acc)

### Modelo 4: Buscando un modelo mÃ¡s complejo que usa capas BatchNormalization y Dropout

Crearemos una funciÃ³n que permita recrear una red convolucional

In [None]:
from tensorflow.keras.layers import Dropout, BatchNormalization


def make_model():
    model = Sequential()
    model.add(Conv2D(filters=32, kernel_size=(3, 3), activation='relu', strides=1, padding='same', input_shape=(28,28,1)))
    model.add(BatchNormalization())

    model.add(Conv2D(filters=32, kernel_size=(3, 3), activation='relu', strides=1, padding='same'))
    model.add(BatchNormalization())
    model.add(Dropout(0.25))

    model.add(Conv2D(filters=64, kernel_size=(3, 3), activation='relu', strides=1, padding='same'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.25))
    
    model.add(Conv2D(filters=128, kernel_size=(3, 3), activation='relu', strides=1, padding='same'))
    model.add(BatchNormalization())
    model.add(Dropout(0.25))

    model.add(Flatten())
    model.add(Dense(512, activation='relu'))
    model.add(BatchNormalization())
    model.add(Dropout(0.5))
    model.add(Dense(128, activation='relu'))
    model.add(BatchNormalization())
    model.add(Dropout(0.5))
    model.add(Dense(10, activation='softmax'))
    
    return model

In [None]:
model = make_model()
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=5)

test_loss, test_acc = model.evaluate(test_images,  test_labels)
print('\nTest accuracy:', test_acc)

### Modelo 5: Modelo anterior aÃ±adiendo mÃ¡s epochs (10 epochs)

In [None]:
model = make_model()


model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=10)
test_loss, test_acc = model.evaluate(test_images,  test_labels)

print('\nTest accuracy:', test_acc)

### Modelo 6: Modelo anterior aÃ±adiendo mÃ¡s epochs (30 epochs)

In [None]:
model = make_model()

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=30)
test_loss, test_acc = model.evaluate(test_images,  test_labels)

print('\nTest accuracy:', test_acc)

### Modelo 7: Modelo anterior aÃ±adiendo mÃ¡s epochs (30 epochs) y diferentes hiperparÃ¡metros al optimizador Adam

In [None]:
# Consider using tf.data for efficient data pipeline optimization.
# Example: train_dataset = tf.data.Dataset.from_tensor_slices((train_images, train_labels))
# train_dataset = train_dataset.shuffle(buffer_size=1024).batch(64)
model = make_model()

optimizer = tf.keras.optimizers.Adam (lr=0.001)

model.compile(optimizer=optimizer,
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

reduce_lr = tf.keras.callbacks.LearningRateScheduler(lambda x: 1e-3 * 0.9 ** x)

model.fit(train_images, train_labels, epochs=30, callbacks=[reduce_lr])

test_loss, test_acc = model.evaluate(test_images,  test_labels)
print('\nTest accuracy:', test_acc)
# Monitor GPU utilization during training
import tensorflow as tf
physical_devices = tf.config.experimental.list_physical_devices('GPU')
if len(physical_devices) > 0:
    tf.config.experimental.set_memory_growth(physical_devices[0], True)


In [None]:
predictions = model.predict(test_images)

train_images = train_images.reshape((60000, 28, 28))
test_images = test_images.reshape((10000, 28, 28))


num_rows = 7
num_cols = 2
num_images = num_rows*num_cols
plt.figure(figsize=(2*2*num_cols, 2*num_rows))
for i in range(num_images):
    plt.subplot(num_rows, 2*num_cols, 2*i+1)
    plot_image(i, predictions[i], test_labels, test_images)
    plt.subplot(num_rows, 2*num_cols, 2*i+2)     
    plot_value_array(i, predictions[i], test_labels)

plt.tight_layout()
plt.show()

## Referencias generales

- [Redes neuronales convolucionales](https://es.wikipedia.org/wiki/Redes_neuronales_convolucionales)
- [Convolutional Neural Network (CNN) with TensorFlow](https://www.tensorflow.org/tutorials/images/cnn)

___
Â¡Todo bien! Â¡Es todo por hoy! ðŸ˜€