<a href="https://colab.research.google.com/github/victorsergio/intro-to-deep-learning-2021/blob/main/Week_05_Lab_Convolutional_Neural_Networks.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Semana 05: Predicción de clima mostrado en una imagen con Redes Neuronales Convolucionales

En este laboratorio realizará una predicción del clima mostrado en una imagen utilizando una Red Neuronal Convolucional CNN creada con Tensorflow.

Esta CNN sera entrenada con un conjunto de datos formado por imágenes a color (RGB) de paisajes con 4 tipos diferentes de clima, (nuboso, lluvioso, soleado, amanecer).

**Este laboratorio consta de 2 partes. En la primera parte creará la clasificación utilizando la información completa de todos los canales de las imágenes, en la segunda parte realizará un nuevo experimento ejecutando el mismo modelo (con los mismos hiperparámetros) pero esta vez convirtiendo las imágenes a escala de grises.**

Temas de aprendizaje objetivo:
- Visualización de métricas con Tensorboard
- Callbacks
- Early Stopping
- Redes Neuronales Convolucionales
- Kernels, padding, stride, funciones de activación
- Sequential Model
- Data Generators, entrenamiento, validación y prueba.
- Matriz de confusión
- Predicciones y vector de probabilidades
- Lectura de imágenes desde archivos para un problema de   aprendizaje supervisado
-  Preprocesamiento de imágenes (scaling)
- Dropout
- Evaluate vs Predict
- Funciones de pérdida a optimizar





### Parte 1: Imágenes en modo RGB

In [1]:
# - Importe la librería tensorflow.
#   https://www.tensorflow.org/tutorials/quickstart/advanced

# code:



In [2]:
# - Cargue la extensión Tensorboard para el notebook.
# - Importe la librería datetime.
# - Cree el objeto log_dir. 
# - Cree el objeto callback tensorboard_callback.
#   https://www.tensorflow.org/tensorboard/get_started

# code:




In [None]:
# - Ejecute el panel de TensorBoard para observar las gráficas de accuracy y loss.
#   https://www.tensorflow.org/tensorboard/get_started


# code:


In [None]:
# - Descargue el conjunto de datos de clima de aquí: https://github.com/victorsergio/intro-to-deep-learning-2021/raw/main/weather-data.zip
#   , utilizando el comando wget.
#   https://www.tutorialspoint.com/google_colab/google_colab_invoking_system_commands.htm


# code:



In [None]:
# - Extraiga el conjunto de datos descargado previamente con el comando unzip.
#   Puede observar los archivos extraidos en el navegador de archivos que esta a la derecha.
#   Observe la estructura de archivos usada para resolver un problema de clasificación con aprendizaje supervisado.
#   https://linuxize.com/post/how-to-unzip-files-in-linux/

# code:



In [6]:
# - Cree un objeto data_preprocessor, re-escale los valores de los píxel a un rango entre 0-1, 
#   especifique una partición para el conjunto de datos de validación, por ejemplo 20%
#   https://www.tensorflow.org/api_docs/python/tf/keras/preprocessing/image/ImageDataGenerator

# code:
data_preprocessor = 

In [None]:
# - Cree un generador de datos de entrenamiento, que lea las imágenes desde un directorio
#   utilizando el metodo flow_from_directory del objeto creato anteriormente data_preprocessor
#   https://www.tensorflow.org/api_docs/python/tf/keras/preprocessing/image/ImageDataGenerator

# - Parámetros:
#   - Tamaño de imagen (considere reducir el tamaño de las imágenes (i.e. 48px x 48px)
#   - Tamaño de batch
#   - class mode
#   - color_mode
#   - seed
#   - shuffle
#   - subset

# code:
train_generator = 


In [None]:
# - Cree el generador para los datos de validación

# code:
validation_generator = 


In [10]:

# - Cree un nuevo objeto data_preprocessor para ser utilizado con los datos de entrenamiento, re-escale los valores de los píxel a un rango entre 0-1,
#   No debe crear un subset. 
#   https://www.tensorflow.org/api_docs/python/tf/keras/preprocessing/image/ImageDataGenerator

# code:
test_data_preprocessor = 

In [None]:
# - Cree un generador de datos de prueba, que lea las imágenes desde un directorio
#   utilizando el metodo flow_from_directory del objeto creado anteriormente test_data_preprocessor.
# - Recuerde que no deseamos que el conjunto de datos de prueba sea aleatorizado y deseamos entregar
#   un ejemplo por vez con batch_size.
# - No hay un subset.
#   https://www.tensorflow.org/api_docs/python/tf/keras/preprocessing/image/ImageDataGenerator

# - Parámetros:
#   - Tamaño de imagen
#   - Tamaño de batch
#   - class mode
#   - color_mode
#   - seed
#   - shuffle

# code:
test_generator = 

In [None]:
# - Ejecute lo siguiente para observar un batch devuelto por el generador de entrenamiento, analice el significado de lo mostrado.

sample = train_generator.next()
sample

In [13]:
# - Defina la estructura de su modelo convolucional,
#   Aspectos a tomar en cuenta:
#    - Uso del modelo secuencial: https://www.tensorflow.org/api_docs/python/tf/keras/Sequential
#    - Estructura canónica de una red convolucional para clasificación, (convolución, activación, pooling) 1 o mas veces
#      vectorización, capa densa, activación, capa densa, softmax.
#    - Tamaño de kernel. 
#    - Función de activación para los bloques convolucionales.
#    - Shape de entrada (tamaño de imagen, número de canales).
#    - Ventana de pooling.
#    - Padding.
#    - Dropout, si es deseado.
#    - Número de salidas de la ultima capa densa.
#    - Función de activación de la ultima capa densa.
#    https://www.tensorflow.org/api_docs/python/tf/keras/layers/Conv2D
#    https://www.tensorflow.org/tutorials/images/cnn

# code:





In [None]:
# - Ejectute lo siguiente para observar la definición del modelo creado anteriormente.
model.summary()

In [15]:

# - Cree un callback early stopping, para monitorear la pérdida de validación val_loss, para evitar el overfitting.
# - Parámetros:
#   - monitor
#   - patience
#   - restore_best_weights
#   https://www.tensorflow.org/api_docs/python/tf/keras/callbacks/EarlyStopping

# code:

early_stopping_callback = 

In [16]:
# - Defina con el método compile, el optimizador Adam, learning rate, la función de pérdida a minimizar, el parámetro from_logits
#   , y la métrica a mostrar en el entrenamiento.
# https://www.tensorflow.org/api_docs/python/tf/keras/Model#compile
# https://www.tensorflow.org/api_docs/python/tf/keras/losses/CategoricalCrossentropy
# https://www.tensorflow.org/api_docs/python/tf/keras/optimizers/Adam


# code:



In [None]:
# - Entrene el modelo con el metodo fit.
#   - Especifique el generador de entrenamiento, 
#     generador de validación,
#     número de épocas a entrenar,
#     callback de tensorboard,
#     callback de early stoppinng.

#   https://www.tensorflow.org/api_docs/python/tf/keras/Model#fit


# code:
history = 


In [None]:
# - Evalúe los resultados con el método evaluate, sobre los datos entregados por el generador de datos de prueba.
#   https://www.tensorflow.org/api_docs/python/tf/keras/Model#evaluate


# code:




In [19]:
# - Obtenga las predicciones entregadas por su modelo con el método predict sobre los datos del generador de prueba.
#   https://www.tensorflow.org/api_docs/python/tf/keras/Model#predict

# code:
probs = 


In [None]:
# - Debe obtener la misma cantidad de predicciones que la cantidad de elementos en su conjunto de prueba,
#   debe obtener una probabilidad por cada clase, para cada ejemplo en el conjunto de prueba, analice el significado
#   de la salida mostrada.

print(probs.shape)


In [None]:
# - Observe los vectores de probabilidades predichos, analice el significado de la salida mostrada.
probs

In [22]:
# importe la librería numpy
# https://numpy.org/doc/stable/user/absolute_beginners.html

# code:



In [28]:
# - Con argmax se puede obtener la posición del elemento en el vector de probabilidades que tenga el valor mayor.
#   Utilicelo para obtener la representacion entera de la etiqueta con mayor probabilidad en cada vector.
#   https://numpy.org/doc/stable/reference/generated/numpy.argmax.html

# code:
predicted_labels = 

In [None]:
# - Observe las clases que predice su modelo
predicted_labels

In [None]:
# - Observe que debe obtener una predicción para cada ejemplo en el conjunto de datos de prueba
predicted_labels.shape

In [None]:
# - Estas son las etiquetas verdaderas para cada ejemplo en conjunto de prueba, estan ordenadas debido
#   a que no aleatorizamos el generador del conjunto de datos de prueba en la definición.
#   Observe visualmente la similitud entre las etiquetas que predice su modelo (ver matriz anterior) y las etiquetas
#   base mostradas aquí. Analice y observe las diferencias.


test_generator.classes

In [None]:
# - Es de utilidad conocer la relación  del número entero que representa a cada clase con su string.

test_generator.class_indices

In [35]:
# - Importe confusion_matrix del paquete sklearn y cree la matriz de confusión, esta matriz se visualizará de una forma numérica simple.
#   https://scikit-learn.org/stable/modules/generated/sklearn.metrics.confusion_matrix.html

# code:
from 

# Calculate the confusion matrix. confusion_matrix()
cm = 

In [None]:
# Aquí se desplegara la matriz de confusión en forma numérica
cm

In [None]:
# - Se obtienen los strings que reprsentan a cada clase
class_names = test_generator.class_indices.keys()
print(class_names)

In [40]:
# - Función que devuelve el número entero que corresponde a un string que representa a una clase.
def getKey(dct,value):
     return [key for key in dct if (dct[key] == value)]

In [None]:
# - Con la librería Seaborn se muestra la matriz de confusión con una mejor visualizacion gráfica, esta matriz de confusión esta normalizada.
#   Observe y analice que parámetros recibe sns.heatmap()
#   Analice los resultados.

import seaborn as sns
sns.heatmap(cm/cm.astype(np.float).sum(axis=1), annot=True, fmt='.2%',xticklabels=class_names, yticklabels=class_names)

In [None]:
# - Esta matriz de confusión no esta normalizada, observe la diferencia entre los parámetros enviados a sns.heatmap anteriormente.
#   Analice los resultados.
sns.heatmap(cm, annot=True,xticklabels=class_names, yticklabels=class_names)

In [43]:
# - Este método utiliza la librería matplot lib para mostrar de forma gráfica un vector de probabilidades 
#   para un ejemplo específico, también muestra la etiqueta base, aquí puede observar los
#   ejemplos en los que su modelo comete errores.

from matplotlib import pyplot as plt

def show_probabilities_graph(class_ids,probs,true_label):
  plt.rcdefaults()
  fig, ax = plt.subplots()

  y_pos = np.arange(len(class_ids))


  ax.barh(y_pos, probs, align='center', color='green', ecolor='black')
  ax.set_yticks(y_pos)
  ax.set_yticklabels(class_ids)
  ax.invert_yaxis()  # labels read top-to-bottom
  ax.set_xlabel('Prob')
  ax.set_title('True label: '+true_label)

  plt.show()

In [44]:
# - Reinicio del generador para recorrer los ejemplos del conjunto de prueba secuencialmente.
test_generator.reset()
i = - 1  # to start in 0 position

In [None]:
# - Obtener y mostrar una imagen del generador
i = i + 1
image  = test_generator.next()[0]
image = image.reshape(image.shape[1:])

plt.figure()
plt.imshow(image) 
plt.show()




In [None]:
# - Mostrar el vector de probabilidades en forma gráfica para la imagen anterior.
# - Observe como esto corresponde a los valores de las matrices que se mostraron anteriormente.

# - Ejecute la celda anterior para seleccionar la siguiente imagen del generador y ejecute esta celda para ver los resultados,
#   puede hacer eso varias veces para ir recorriendo el conjunto de datos de prueba.


show_probabilities_graph(class_names,probs[i], str(getKey(test_generator.class_indices,test_generator.classes[i]))+" "+str(i) )


###Parte 2: Imágenes en modo de escala de grises

En una nueva copia de este notebook, ejecute un experimento en el cual utilice el mismo modelo (misma estructura e hiperparámetros), modificando solamente lo necesario para que el modelo utilice las imagenes en escala de grises.

Compare los resultados, analice las diferencias obtenidas en la matriz de confusión, métricas y fase de entrenamiento. Escriba en la celda de abajo sus hallazgos y conclusiones.

###**Escriba aquí las conclusiones obtenidas al observar los resultados de los dos diferentes experimentos:**