<table align="left">
  <td>
    <a href="https://colab.research.google.com/github/marcoteran/deeplearning/blob/master/notebooks/3.3_deeplearning_cnn.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Abrir en Colab" title="Abrir y ejecutar en Google Colaboratory"/></a>
  </td>
  <td>
    <a target="_blank" href="https://kaggle.com/kernels/welcome?src=https://github.com/marcoteran/deeplearning/blob/master/notebooks/3.3_deeplearning_cnn.ipynb"><img src="https://kaggle.com/static/images/open-in-kaggle.svg" alt="Abrir en Kaggle" title="Abrir y ejecutar en Kaggle"/></a>
  </td>
</table>

### Ejemplo de Código: Sesión 09
## Redes Neuronales Convolucionales (CNN) para Deep Learning y Series de Tiempo

**Autor:** Marco Teran
Correo Electrónico: marco.tulio.teran@gmail.com

### Importación de Librerías Esenciales
Se inicia con la importación de librerías estándar requeridas:

In [None]:
import warnings
warnings.filterwarnings('ignore')
#import mlutils
import numpy as np
import pandas as pd
import importlib
#importlib.reload(mlutils)
#reload(mlutils) Python2

# Visualizations
import matplotlib.pyplot as plt
#import seaborn as sns; sns.set()  # for plot styling
from IPython.display import Image
from IPython.core.display import HTML 
%matplotlib inline

# Machine learning
from sklearn.datasets import make_blobs, make_moons
from sklearn.cluster import KMeans, SpectralClustering, AgglomerativeClustering, DBSCAN
from IPython.display import HTML
from sklearn.metrics import accuracy_score
from sklearn.metrics import confusion_matrix
from scipy.stats import mode
from sklearn.metrics import pairwise_distances_argmin

In [None]:
# Deep learning
import tensorflow as tf
from tensorflow import keras
print(tf.__version__)

## Redes Neuronales Convolucionales (CNN)
Una CNN es una categoría de red neuronal diseñada para reconocer patrones en un conjunto de datos multidimensional. Emula la manera en que el cerebro humano percibe y reconoce visualmente patrones. Las CNN son particularmente útiles en tareas de visión artificial, tales como clasificación y segmentación de imágenes.

## Ejemplo 1: Clasificación de Dígitos con el Conjunto de Datos MNIST

Este segmento ofrece un tutorial práctico de Deep Learning utilizando Keras para clasificar dígitos mediante el conjunto de datos MNIST.

In [None]:
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Conv2D
from tensorflow.keras.layers import MaxPooling2D
from tensorflow.python.keras.layers import Reshape
from tensorflow.python.keras.layers import Dense, Flatten
from tensorflow.keras.optimizers import Adam

### Carga del Conjunto de Datos MNIST
El conjunto de datos MNIST es ampliamente reconocido y utilizado. Existen scripts predefinidos que facilitan su descarga, descompresión y segmentación en conjuntos de entrenamiento y prueba.

___

In [None]:
# Para descargar la base de datos MNIST
mnist = tf.keras.datasets.mnist
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
print("Tamaño de:")
print (train_images.shape)
print (train_labels.shape)

print("Tamaño de:")
print("- Set de entranamiento:\t{}".format(len(train_images)))
print("- Set de testeo:\t\t{}".format(len(test_images)))

## Ejemplo 2: Clasificación con el Conjunto de Datos Fashion-MNIST

Este ejemplo demuestra la clasificación de prendas de vestir utilizando el conjunto de datos Fashion-MNIST, que contiene imágenes de 10 categorías distintas de prendas.

In [None]:
picnumber=25
plt.imshow(train_images[picnumber], cmap=plt.cm.binary)
# Ver la etiqueta
print(train_labels[picnumber])

### Carga de Datos de Fashion-MNIST
El conjunto de datos Fashion-MNIST está disponible directamente en el API de tf.keras. Se puede cargar de la siguiente manera:

In [None]:
train_images = train_images.reshape((60000, 28, 28, 1))
train_images = train_images.astype('float32') / 255

test_images = test_images.reshape((10000, 28, 28, 1))
test_images = test_images.astype('float32') / 255

# Cambio a variables categoricas

from tensorflow.keras.utils import to_categorical

train_labels = to_categorical(train_labels, num_classes=10)
test_labels = to_categorical(test_labels, num_classes=10)

print (train_images.shape)
print (train_labels.shape)

In [None]:
print(test_labels[0])

Al ejecutar `load_data` se obtienen dos conjuntos de listas, correspondientes a los datos de entrenamiento y prueba, cada uno con las imágenes y sus etiquetas respectivas.

### Modelo Base para Fashion-MNIST
Se presenta un modelo base de red neuronal convolucional para la clasificación de imágenes en el conjunto de datos Fashion-MNIST.

### Optimización de Modelos

In [None]:
# Llamamos al constructor del modelo sequential
model = Sequential()

# Capa convolucional con funcion de activacion ReLU y max-pooling.
model.add(Conv2D(32, (5, 5), activation='relu', input_shape=(28, 28, 1)))
model.add(MaxPooling2D((2, 2)))

### Modelo Mejorado con Más Neuronas
Este modelo mejora el anterior duplicando el número de neuronas y añadiendo una capa densa de 64 neuronas.

In [None]:
model.summary()

### Modelo con Optimizador 'Adam'
En este modelo se introduce el optimizador 'Adam' para mejorar la convergencia durante el entrenamiento.

In [None]:
model = Sequential()
model.add(Conv2D(32, (5, 5), activation='relu', input_shape=(28, 28, 1)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(64, (5, 5), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.summary()

### Modelo Avanzado con BatchNormalization y Dropout
Se presenta un modelo más complejo y robusto que incorpora capas de BatchNormalization y Dropout para mejorar la generalización.

In [None]:
from tensorflow.keras.layers import Dense
from tensorflow.keras.layers import Flatten

model.add(Flatten())
model.add(Dense(10, activation='softmax'))

### Definición de Función para Crear CNN
Se define una función que facilita la creación y configuración de redes neuronales convolucionales.

In [None]:
model.summary()

### Modelo con Más Epochs (10)
Se entrena el modelo avanzado durante 10 epochs para observar su comportamiento y rendimiento.

### Modelo con Más Epochs (30)
Este modelo se entrena durante 30 epochs para evaluar su rendimiento con un mayor número de iteraciones.

### Modelo con Hyperparámetros Ajustados
Se ajustan los hiperparámetros del optimizador Adam y se entrena el modelo durante 30 epochs.

In [None]:
model.compile(loss='categorical_crossentropy',
              optimizer='sgd',
              metrics=['accuracy'])

## Referencias
- [Wikipedia: Redes Neuronales Convolucionales](https://es.wikipedia.org/wiki/Redes_neuronales_convolucionales)
- [TensorFlow: CNN Tutorial](https://www.tensorflow.org/tutorials/images/cnn)

___
¡Fin del Notebook!

In [None]:
model.fit(train_images, train_labels,
          batch_size=100,
          epochs=5,
          verbose=1)

#### Evaluación de la red
Para ver si la red ha aprendido a clasificar bien los números manuscritos hay que comprobar la precisión que obtiene en el conjunto de datos de test. Para este conjunto no ha sido entrenada la red.

In [None]:
test_loss, test_acc = model.evaluate(test_images, test_labels)

print('Test accuracy:', test_acc)

El parámtro ``test_acc`` es la precisión que ha obtenido la red para el conjunto de entreno.
Ahora hay que comprobar si clasifica bien las imágenes del conjunto de test. Estas imágenes aún no las ha visto la red y no tiene información de ellas.

#### Guardar el modelo
Es útil gurdar un modelo que ha sido entrenado satisfactoriamente para su posterior uso. De esta manera no hay que entrenar de nuevo la red y se pueden realizar prediciones con el modelo guardado.

* **NOTA:** Será necesario instalar el paquete h5py para poder guardar modelos.

In [None]:
# Definir la carpeta donde se guarda el modelo y su nombre.
# En este caso se guarda en el mismo directorio que contiene este script
nombre_model = 'modelo.h5'

# Guardamos el modelo y todos los pesos entrenados
model.save(nombre_model)

___

## Ejemplo 2: Conjunto de datos Fashion-MNIST

Echemos un vistazo a un escenario en el que podemos reconocer diferentes prendas de vestir, entrenadas a partir de un conjunto de datos que contiene 10 tipos diferentes.

![Datos Fashion-MNIST](https://www.researchgate.net/profile/Greeshma_K_V/publication/340299295/figure/fig1/AS:875121904476163@1585656729996/Fashion-MNIST-Dataset-Images-with-Labels-and-Description-II-LITERATURE-REVIEW-In-image.jpg)

### Carga de datos

Los datos del MNIST de la moda están disponibles directamente en el API de los conjuntos de datos de tf.keras. Lo cargas así:

In [None]:
fashion_mnist = keras.datasets.fashion_mnist

Llamar a ``load_data`` en el objeto le dará dos conjuntos de dos listas, estos serán los valores de entrenamiento y prueba para los gráficos que contienen las prendas de vestir y sus etiquetas.

In [None]:
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()

In [None]:
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']

¿Cómo son estos valores? Imprimamos una imagen de entrenamiento, y una etiqueta de entrenamiento para ver... Experimentemos con diferentes índices en la matriz.

In [None]:
picnumber=42
plt.imshow(train_images[picnumber], cmap=plt.cm.binary)
# Ver la etiqueta
print(train_labels[picnumber])

In [None]:
train_images = train_images.reshape((60000, 28, 28, 1))
train_images = train_images.astype('float32') / 255

test_images = test_images.reshape((10000, 28, 28, 1))
test_images = test_images.astype('float32') / 255

### Modelo 1: modelo de base basado en el mismo modelo que el usado para el conjunto datos digits MNIST 

In [None]:
model = Sequential()
model.add(Conv2D(32, (5, 5), activation='relu', input_shape=(28, 28, 1)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(64, (5, 5), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Flatten())
model.add(Dense(10, activation='softmax'))

In [None]:
model.summary()

In [None]:
model.compile(optimizer='sgd',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=5)
test_loss, test_acc = model.evaluate(test_images,  test_labels)
print('Test accuracy:', test_acc)

In [None]:
predictions = model.predict(test_images)

In [None]:
predictions[5]

In [None]:
test_labels[5]

In [None]:
def plot_image(i, predictions_array, true_label, img):
    predictions_array, true_label, img = predictions_array, true_label[i], img[i]
    plt.grid(False)
    plt.xticks([])
    plt.yticks([])

    plt.imshow(img, cmap=plt.cm.binary)    

    predicted_label = np.argmax(predictions_array)
    if predicted_label == true_label:
        color = 'blue'
    else:
        color = 'red'
    
    plt.xlabel("{} {:2.0f}% ({})".format(class_names[predicted_label],
                                         100*np.max(predictions_array),
                                         class_names[true_label]),
               color=color)

def plot_value_array(i, predictions_array, true_label):
    predictions_array, true_label = predictions_array, true_label[i]
    plt.grid(False)
    plt.xticks(range(10))
    plt.yticks([])
    thisplot = plt.bar(range(10), predictions_array, color="#00FF00")
    plt.ylim([0, 1])
    predicted_label = np.argmax(predictions_array)
    
    thisplot[predicted_label].set_color('red')
    thisplot[true_label].set_color('black')

In [None]:
train_images = train_images.reshape((60000, 28, 28))
test_images = test_images.reshape((10000, 28, 28))

In [None]:
i = 5
plt.figure(figsize=(6,3))
plt.subplot(1,2,1)
plot_image(i, predictions[i], test_labels, test_images)
plt.subplot(1,2,2)
plot_value_array(i, predictions[i],  test_labels)
plt.show()

### Mejoramiento de los modelos

In [None]:
num_rows = 7
num_cols = 2
num_images = num_rows*num_cols
plt.figure(figsize=(2*2*num_cols, 2*num_rows))
for i in range(num_images):
  plt.subplot(num_rows, 2*num_cols, 2*i+1)
  plot_image(i, predictions[i], test_labels, test_images)
  plt.subplot(num_rows, 2*num_cols, 2*i+2)     
  plot_value_array(i, predictions[i], test_labels)
plt.tight_layout()
plt.show()

In [None]:
train_images = train_images.reshape((60000, 28, 28, 1))
test_images = test_images.reshape((10000, 28, 28, 1))

### Modelo 2: Duplicando las neuronas de modelo base y añadiendo una capa densa de 64 neuronas

In [None]:
model = Sequential()

model.add(Conv2D(64, (7, 7), activation="relu", padding="same", input_shape=(28, 28, 1)))
model.add(MaxPooling2D(2, 2))
model.add(Conv2D(128, (3, 3), activation="relu", padding="same"))
model.add(MaxPooling2D(2, 2))
model.add(Flatten())
model.add(Dense(64, activation="relu"))
model.add(Dense(10, activation="softmax"))

In [None]:
model.compile(optimizer='sgd',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=5)

test_loss, test_acc = model.evaluate(test_images,  test_labels)
print('\nTest accuracy:', test_acc)

### Modelo 3: modelo 3 cambiando al optimizador 'adam'

In [None]:
model = Sequential()

model.add(Conv2D(64, (7, 7), activation="relu", padding="same", input_shape=(28, 28, 1)))
model.add(MaxPooling2D(2, 2))
model.add(Conv2D(128, (3, 3), activation="relu", padding="same"))
model.add(MaxPooling2D(2, 2))
model.add(Flatten())
model.add(Dense(64, activation="relu"))
model.add(Dense(10, activation="softmax"))

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=5)

test_loss, test_acc = model.evaluate(test_images,  test_labels)
print('\nTest accuracy:', test_acc)

### Modelo 4: Buscando un modelo más complejo que usa capas BatchNormalization y Dropout

Crearemos una función que permita recrear una red convolucional

In [None]:
from tensorflow.keras.layers import Dropout, BatchNormalization


def make_model():
    model = Sequential()
    model.add(Conv2D(filters=32, kernel_size=(3, 3), activation='relu', strides=1, padding='same', input_shape=(28,28,1)))
    model.add(BatchNormalization())

    model.add(Conv2D(filters=32, kernel_size=(3, 3), activation='relu', strides=1, padding='same'))
    model.add(BatchNormalization())
    model.add(Dropout(0.25))

    model.add(Conv2D(filters=64, kernel_size=(3, 3), activation='relu', strides=1, padding='same'))
    model.add(MaxPooling2D(pool_size=(2, 2)))
    model.add(Dropout(0.25))
    
    model.add(Conv2D(filters=128, kernel_size=(3, 3), activation='relu', strides=1, padding='same'))
    model.add(BatchNormalization())
    model.add(Dropout(0.25))

    model.add(Flatten())
    model.add(Dense(512, activation='relu'))
    model.add(BatchNormalization())
    model.add(Dropout(0.5))
    model.add(Dense(128, activation='relu'))
    model.add(BatchNormalization())
    model.add(Dropout(0.5))
    model.add(Dense(10, activation='softmax'))
    
    return model

In [None]:
model = make_model()
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=5)

test_loss, test_acc = model.evaluate(test_images,  test_labels)
print('\nTest accuracy:', test_acc)

### Modelo 5: Modelo anterior añadiendo más epochs (10 epochs)

In [None]:
model = make_model()


model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=10)
test_loss, test_acc = model.evaluate(test_images,  test_labels)

print('\nTest accuracy:', test_acc)

### Modelo 6: Modelo anterior añadiendo más epochs (30 epochs)

In [None]:
model = make_model()

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

model.fit(train_images, train_labels, epochs=30)
test_loss, test_acc = model.evaluate(test_images,  test_labels)

print('\nTest accuracy:', test_acc)

### Modelo 7: Modelo anterior añadiendo más epochs (30 epochs) y diferentes hiperparámetros al optimizador Adam

In [None]:
model = make_model()

optimizer = tf.keras.optimizers.Adam (lr=0.001)

model.compile(optimizer=optimizer,
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

reduce_lr = tf.keras.callbacks.LearningRateScheduler(lambda x: 1e-3 * 0.9 ** x)

model.fit(train_images, train_labels, epochs=30, callbacks=[reduce_lr])

test_loss, test_acc = model.evaluate(test_images,  test_labels)
print('\nTest accuracy:', test_acc)

In [None]:
predictions = model.predict(test_images)

train_images = train_images.reshape((60000, 28, 28))
test_images = test_images.reshape((10000, 28, 28))


num_rows = 7
num_cols = 2
num_images = num_rows*num_cols
plt.figure(figsize=(2*2*num_cols, 2*num_rows))
for i in range(num_images):
    plt.subplot(num_rows, 2*num_cols, 2*i+1)
    plot_image(i, predictions[i], test_labels, test_images)
    plt.subplot(num_rows, 2*num_cols, 2*i+2)     
    plot_value_array(i, predictions[i], test_labels)

plt.tight_layout()
plt.show()

## Referencias generales

- [Redes neuronales convolucionales](https://es.wikipedia.org/wiki/Redes_neuronales_convolucionales)
- [Convolutional Neural Network (CNN) with TensorFlow](https://www.tensorflow.org/tutorials/images/cnn)

___
¡Todo bien! ¡Es todo por hoy! 😀