## Carga de datos

**Estructura del directorio del conjunto de datos de la imagen**:

**Nota: Los nombres de los directorios y sub-directorios que se muestran aquí son sólo para propósitos de explicación que pueden diferir del código.

Supongamos que tenemos un directorio principal (carpeta) de las imágenes, entonces podemos subdividirlo en subdirectorios (subcarpetas) de imágenes de "entrenamiento" (*training*), "validación" (*validation*) y "prueba" (*testing*). 

Entonces los directorios de "Entrenamiento" contienen sub-directorios(sub-carpetas) llamados "infectados" (*infected*) y "No infectados" (*uninfected*))que contienen imágenes apropiadas en los respectivos sub-directorios.

Del mismo modo, los directorios de "validación" y "prueba" también contienen subdirectorios (subcarpetas) denominados "infectado" y "no infectado" que contienen las imágenes adecuadas en los respectivos subdirectorios.


**Entrenamiento**: Las imágenes de este directorio se utilizarán para el entrenamiento de los datos.

**Validación**: Las imágenes de este directorio se utilizarán para validar el entrenamiento del modelo. El conjunto de datos de validación nos permite ver lo bien que los datos generalizan la clasificación.

**Prueba**: Las imágenes de este directorio se utilizarán para probar lo bien que se ha entrenado el modelo.


<img src="https://drive.google.com/uc?id=1-AMSvB19tME043-_oC9BQJIydiVCuukb" width= 600>



In [None]:
!git clone https://github.com/procodingclass/PRO-M3-Pneumothorax-Image-Dataset

Cloning into 'PRO-M3-Pneumothorax-Image-Dataset'...
remote: Enumerating objects: 637, done.[K
remote: Total 637 (delta 0), reused 0 (delta 0), pack-reused 637[K
Receiving objects: 100% (637/637), 231.39 MiB | 32.68 MiB/s, done.
Resolving deltas: 100% (9/9), done.
Checking out files: 100% (601/601), done.


## Procesamiento de imagen

1. Convertir cada imagen en una matriz.
2. Mapear las etiquetas de cada imagen.
3. Aumentar cada imagen.

### Procesamiento de imagen: Mapear cada imagen con etiquetas

<center><b>Mapear cada imagen con etiquetas</b><br><img src="https://drive.google.com/uc?id=1_b1xd8UxuouE3zoTwzRxq3zPxzsnTF0U" width= 1000>

### Procesamiento de imagen: Aumento de datos

Algunas técnicas de aumento de datos:

*   Rotación de imagen.
*   Desplazamiento de la altura y ancho de la imagen.
*   Giro horizontal y vertical de la imagen.
*   Cambio de tamaño de la imagen.
*   Zoom de la imagen.


<img src="https://drive.google.com/uc?id=1WiQYLCyavp0KlCXoHYIRT5KrjNLLR-Um" width= 400>











#### Entrenamiento de datos

In [None]:
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.preprocessing.image import img_to_array, load_img


# Aumento de datos aleatorio (Cambio de tamaño, rotación, giros, zoom, transformaciones) usando ImageDataGenerator 
training_data_generator = ImageDataGenerator(
    rescale = 1.0/255,
    rotation_range=40,
    width_shift_range=0.3,
    height_shift_range=0.3,
    zoom_range=0.3,
    horizontal_flip=True,
    vertical_flip=True,
    fill_mode='nearest')


# Directorio de la imagen
training_image_directory = "/content/PRO-M3-Pneumothorax-Image-Dataset/training_dataset"

# Generación de aumento de datos procesados
training_augmented_images = training_data_generator.flow_from_directory(
    training_image_directory,
    target_size=(180,180))

Found 200 images belonging to 2 classes.


#### Validation Data

In [None]:
# Aumento de datos aleatorio (cambio de tamaño) usando ImageDataGenerator
validation_data_generator = ImageDataGenerator(rescale = 1.0/255)

# Directorio de la imagen
validation_image_directory = "/content/PRO-M3-Pneumothorax-Image-Dataset/validation_dataset"

# Generación de aumento de datos procesados
validation_augmented_images = validation_data_generator.flow_from_directory(
    validation_image_directory,
    target_size=(180,180))

Found 200 images belonging to 2 classes.


#### Etiquetas de las clases

In [None]:
training_augmented_images.class_indices

{'infected': 0, 'uninfected': 1}

##  Arquitectura de las redes neuronales convolucionales
Un modelo CNN consiste de:

1. **Capas de aprendizaje de características**:

   1.1 Capas de convolución + capas de activación (RELU).

   1.2 Capas de agrupación o *pooling*

2. **Capas de clasificación**:

   2.1 Capas para aplanar.

   2.2 Capas completamente conectadas (densas) 

   2.3 Capas completamente conectadas (densas) con Softmax




<img src="https://drive.google.com/uc?id=1OD6XteFaDvTTliIDn2xa6pP_iH_gk1xO" width= 1500>


**Visualización de la extracción de características(convolución + Relu)**

La convolución es un cálculo matemático entre dos matrices, la matriz de imágenes y la matriz de filtros, que da una nueva matriz de imágenes.


Visualmente podemos entender que el detector de características/filtro se mueve sobre la imagen para extraer características de la misma.



[<img src="https://drive.google.com/uc?id=1Sw7iKlkJbP_PCt6tNwhwc3VVQupG7YOi" width= 500>](https://)


## Matemáticamente:

**Conv2D Layer**

La convolución es un cálculo matemático entre dos matrices 2D, la matriz de imágenes y la matriz de filtros, que da lugar a una nueva matriz de imágenes.

Se toma una porción de la matriz de la imagen de entrada, llamada submatriz (de tamaño igual al tamaño del filtro), empezando por la parte superior izquierda.

Esta submatriz se multiplica por la matriz del filtro. Podemos multiplicar una matriz con otra, multiplicando el primer elemento por el primer elemento de ambas matrices (el segundo elemento por el segundo elemento de ambas matrices y así sucesivamente).

Después de multiplicar, el resultado se suma, lo que da el valor del 1er elemento de la nueva matriz de imagen.

Luego nos desplazamos hacia la derecha en una columna y repetimos los pasos anteriores para obtener el valor del segundo elemento de la nueva matriz.

Una vez terminada toda la fila, nos desplazamos una fila hacia abajo y repetimos los pasos anteriores para obtener el valor de todos los elementos de la nueva matriz, uno por uno.

Todo el proceso se repite con diferentes filtros, para obtener diferentes salidas, que en conjunto es la salida de la 1ª capa Conv2D.

Estas salidas de la 1ª capa Conv2D se dan a la 2ª capa Conv2D y se realizan las convoluciones.

Esto se repite para todas las capas del modelo CNN.



<img src="https://drive.google.com/uc?id=1IRxv0-ZJb1Rm7VAS08Q29fLB0RpCTCSw" width= 800>


**ReLU**

ReLU se define como una función, y= f(x) tal que asigna x para todos los valores x > 0 y 0 para todos los valores x<0.

<img src="https://drive.google.com/uc?id=1p_1QMI8B926gbChOaqBHGioxW38vMhSw" width= 600>


**MaxPooling2D**

Primero, hay una matriz de entrada (por ejemplo, 4x4) y otra matriz de un tamaño específico (por ejemplo 2x2) a la que se le conoce como pool. El tamaño de la matriz pool siempre es menor que el tamaño de la matriz de entrada.
Pool se suele usar para recursos que se almacenan listos para ser usados, en lugar de ser adquiridos y liberados después.

Luego, el valor máximo se toma de la sub-matriz que tenga igual tamaño que la matriz pool.

El resultado después de aplicar Max Pooling será la nueva matriz con tamaño igual a la mitad del tamaño de la matriz de entrada original

Dado que nuestra matriz de entrada es de 4x4, después del max pooling, la nueva matriz será 2x2, lo que reduce la dimensión de la matriz.



<img src="https://drive.google.com/uc?id=1YN6RSi6HxDj9tCgQTSm-sP6wUrJ7Iu-D" width= 800>



## Definir el modelo de red neuronal convolucional (CNN)

In [None]:
model = tf.keras.models.Sequential([
    
    # 1a Capa de convolución y capa pooling 
    tf.keras.layers.Conv2D(64, (3,3), activation='relu', input_shape=(180, 180, 3)),
    tf.keras.layers.MaxPooling2D(2, 2),

    # 2a Capa de convolución y capa pooling
    tf.keras.layers.Conv2D(64, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),

    # 3a Capa de convolución y capa pooling
    tf.keras.layers.Conv2D(128, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),

    # 4a Capa de convolución y capa pooling
    tf.keras.layers.Conv2D(128, (3,3), activation='relu'),
    tf.keras.layers.MaxPooling2D(2,2),

    # Aplanar los resultados para ingresarlos a la capa densa
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dropout(0.5),

    # Capa de clasificación
    tf.keras.layers.Dense(512, activation='relu'),
    tf.keras.layers.Dense(2, activation='softmax')
])

## Resumen del modelo

In [None]:
model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d (Conv2D)              (None, 178, 178, 64)      1792      
_________________________________________________________________
max_pooling2d (MaxPooling2D) (None, 89, 89, 64)        0         
_________________________________________________________________
conv2d_1 (Conv2D)            (None, 87, 87, 64)        36928     
_________________________________________________________________
max_pooling2d_1 (MaxPooling2 (None, 43, 43, 64)        0         
_________________________________________________________________
conv2d_2 (Conv2D)            (None, 41, 41, 128)       73856     
_________________________________________________________________
max_pooling2d_2 (MaxPooling2 (None, 20, 20, 128)       0         
_________________________________________________________________
conv2d_3 (Conv2D)            (None, 18, 18, 128)       1

## Visualización de las salidas intermedias de las capas de convolución


Podemos ver la salida de las **4 capas convolucionales** (conv2d, conv2d_1, conv2d_2, conv2d_3) con capas de  **max pooling** (max_pooling2d, max_pooling2d_1, max_pooling2d_2, max_pooling2d_3)

**Nota: Esta imagen está creada solo con fines explicativos.**

Al comienzo de una red convolucional, el filtro (detector de características/kernel) detecta patrones simples, como líneas horizontales, líneas verticales y esquinas, formas simples. 

En las capas posteriores de la red, los filtros (detector de características/kernel) son complejos que detectan formas, objetos y otras estructuras complejas, lo que se hace utilizando la característica anteriormente generada y sus características simples detectadas, para construir otras más complejas. 


*Nota: A medida que profundizamos en las capas, las características se vuelven cada vez más complejas y, por lo tanto, menos interpretables visualmente. Se comienzan a programar conceptos de nivel superior, como bordes, esquinas y ángulos únicos. Las presentaciones superiores llevan cada vez menos información sobre los contenidos visuales de la imagen, y cada vez más información relacionada con la clase de la imagen, por lo que las salidas de la capa densa no se mostrarán para una explicación visual.*



<img src="https://s3-whjr-curriculum-uploads.whjr.online/b941c8bd-c137-449f-ae8f-7233735a7845.jpg" width= 800>

