# Surface Crack Binary Classification Dataset

La detección de grietas juega un rol importante en la inspección y monitoreo de estructuras civiles. Si estas no son detectadas a tiempo, su propagación puede llegar a reducir paulatinamente la resistencia de la estructura y en el peor de los casos, provocar su colapso u otro tipo de daño irreversible. En general, la inspección manual para la detección de grietas suele ser un proceso tedioso y, en ocasiones, no resulta del todo efectivo al requerir del juicio subjetivo de un experto.

Para integrar su conocimientos de Deep Learning a esta problemática, en esta tarea desarrollará modelos CNN para la detección binaria de grietas en imágenes de distinta calidad y resolución.

<img src="https://raw.githubusercontent.com/cherrerab/deeplearningfallas/master/tarea_02/bin/banner.png" height="180">

Cada uno de los datasets que utilizará en esta tarea contiene 2400 imágenes de superficies de hormigón con y sin grietas, junto con sus respectivas etiquetas para la clasificación. Los datasets han sido previamente separados en conjuntos de entrenamiento y testing, para una correcta evaluación de los modelos, en una proporción 80-20. De esta manera, para cada dataset tendrá 1920 imágenes para llevar a cabo el entrenamiento y 480 para testing.

Dos aspectos o consideraciones importantes a la hora de desarrollar modelos de clasificación mediante redes convolucionales son la resolución y la calidad de las imágenes a utilizar. ¿Es necesario contar con imágenes de un gran resolución para obtener buenos resultados? ¿Qué tanto influye la presencia de ruido en el desempeño de un modelo CNN?

Con el fin de determinar el efecto de estos factores, en esta tarea cuenta con los siguientes datasets en escala de grises.

- `clean_cracks_96px.npz`: dataset original con imágenes de 96x96px.
- `clean_cracks_28px.npz`: dataset original con las imágenes escaladas a 28x28px.
- `noisy_cracks_96px.npz`: dataset con imágenes con ruido uniforme agregado de 96x96px.
- `noisy_cracks_28px.npz`: dataset con imágenes con ruido uniforme agregado de 28x28px.

<img src="https://raw.githubusercontent.com/cherrerab/deeplearningfallas/master/tarea_02/bin/banner_2.png" height="180">

Como se mencionó anteriormente, cada uno de estos archivos cuenta con los conjuntos `X_train`, `Y_train`, `X_test` e `Y_test`, previamente definidos. En este caso, las imágenes se encuentran aplanadas en los datasets, de modo que los conjuntos `X_train` y `X_test` son de la forma `(n_samples, width*height)`. Por otro lado, vale señalar que las etiquetas `Y_train` e `Y_test` no se encuentran con `one-hot-encoding` y son de la forma `(n_samples, )`. Recuerde utilizar `np.reshape` y `keras.to_categorical` para reestructurar los arreglos a una forma compatible con las estructuras y capas de `keras`.

Para facilitar la carga de los archivos a un entorno de Google Colab, los archivos han sido cargados a un Google Drive. Copie el siguiente bloque de código en su Notebook para ejecutar la rutina de descarga. Los archivos serán cargados en el directorio `\content\datasets`.


In [None]:
!pip install -U -q PyDrive

import os
from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive
from google.colab import auth
from oauth2client.client import GoogleCredentials

# inicializar GoogleDrive con credenciales de autorización
auth.authenticate_user()
gauth = GoogleAuth()
gauth.credentials = GoogleCredentials.get_application_default()
drive = GoogleDrive(gauth)

# crear carpeta para descargar los archivos .npz
!mkdir /content/datasets

# Google Drive IDs para descargar los archivos .npz
files_id = [('clean_cracks_28px.npz', '1_ch0hhoNdXjnAW21OKiXgwwl8UqmzdP_'),
            ('clean_cracks_96px.npz', '1d3pfc8GMVg6InF_-h0jCiG6d0uEYfuAp'),
            ('noisy_cracks_28px.npz', '1YdiNowffR9ihXoQdqR56eTNzhi1ZaVCn'),
            ('noisy_cracks_96px.npz', '1W2Civt30hWM3j1Lo4QiEHVDh15IE7ma-')]

# comenzar descarga
print('descargando datasets: ', end='')

for filename, id in files_id:
  save_path = os.path.join('/content/datasets', filename)

  # descargar y guardar en /content/datasets
  downloaded = drive.CreateFile({'id': id}) 
  downloaded.GetContentFile(save_path)

# indicar descarga terminada
print('done')

## Formato de Entrega

Los entregables de esta tarea son los siguientes.
- Jupyter Notebook (.ipynb): Todo el procesamiento de la tarea debe estar contenido en un único Notebook. Considere este archivo como un informe de metodología donde se reporten todos los pasos y bloques de código utilizados para resolver el problema. **Sea ordenado**; utilice comentarios en su código y bloques de texto para mejorar la legibilidad del Notebook.

- Reporte Resultados (.pdf): Este archivo debe contener los resultados obtenidos en su tarea, junto con un análisis correspondiente. Considere este documento como la sección de Resultados y Análisis de la tarea. En este sentido, debe mantener un formato de informe estándar.

## Recomendaciones

- Active el acelerador de GPU dentro del entorno de Colab. El entrenamiento de modelos convolucionales suele requerir bastante más tiempo que el de modelos MLP o Fully Connected. En este sentido, procure también comenzar su tarea con anticipación pues no existirán extensiones de plazo para la entrega.

## 1. Classification Models

Para cada una de los 4 datasets anteriormente descritos, implemente y optimice lo que más pueda un modelo convolucional de clasificación binaria mediante `keras`. Es decir, ajuste los hiperparámetros de cada modelo tal de maximizar el `accuracy` de clasificación en un conjunto de validación `(X_val, Y_val)`. Luego, para cada uno de estos cuatro modelos CNN reporte:

- Media del accuracy en el conjunto de testing `(X_test, Y_test)` para 2 iteraciones.
- Arquitectura o esquema del modelo.
- Matriz de confusión.
- Gráfico de la función de pérdida durante el entrenamiento.

Comente sobre las diferencias de desempeño al utilizar los distintos datasets de imágenes.

## 2. Transfer Learning
Similar al VGG-16, el ResNet es un modelo convolucional desarrollado por el equipo de Microsoft como arquitectura de visión computacional. Propuesto en el paper Deep Residual Learning for Image Recognition (2015), ResNet ganó el concurso ILSRVC 2015 superando el desempeño humano sobre el ImageNet dataset.

https://keras.io/api/applications/resnet/#resnet50-function

Mediante transfer learning, utilice la sección convolucional de ResNet50 para construir un modelo de clasificación de grietas. En particular, los pesos de la sección ResNet deben permanecer congelados durante el entrenamiento de este nuevo modelo.

Entrene este modelo sobre los datasets `clean_cracks_96px` y `noisy_cracks_96px`. Para cada uno reporte:
- Media del accuracy en el conjunto de testing `(X_test, Y_test)` para 2 iteraciones.
- Matriz de confusión.
- Gráfico de la función de pérdida durante el entrenamiento.

Comente sobre las diferencias de desempeño respecto a los resultados de la Parte 1.
