# Laboratorio 4 - Clasificación de imágenes
Javier Anleu - 17149

Rodrigo Alvarado - 16106

Marco Flores - 16260

# Introducción

**Retinopatía Diabética**

La retinopatía diabética (DR por sus siglas en inglés) es una condición exclusiva de las personas diabéticas, donde los vasos sanguíneos de la retina se ven afectados por los altos niveles de azúcar, dificultando la visión y eventualmente causando ceguera. Es una de las complicaciones oftalmológicas de la diabetes, junto con las cataratas y el glaucoma de ángulo abierto. La condición puede causar otras complicaciones en el ojo, donde resaltan el edema diabético macular y el glaucoma neovascular. 

**Síntomas**

La DR no muestra síntomas en sus primeras etapas, pero conforme avanza, comienza a mostrar sangrado en el vítreo de la retina, causado por el daño a los vasos sanguíneos. Para el paciente, esto suele verse como manchas oscuras en su visión que forman patrones similares a los de telarañas. Para poder determinar si un paciente tiene DR, se hace una dilatación de pupilas, lo que permite examinar a detalle la retina y determinar si hay sangrado, por mínimo que sea.

Aunque el sangrado puede sanar por su cuenta, se debe tratar lo antes posible ya que existe un riesgo de dañar permanentemente la retina y que suceda nuevamente el sangrado.

**¿Cómo se ve la enfermedad?**

![alt text](https://media.nature.com/m685/nature-assets/nrdp/2016/nrdp201612/images_hires/nrdp201612-f4.jpg)

El grado de la enfermedad se puede determinar principalmente por el nivel de sangrado. En las figuras a) y b) se pueden ver retinopatías leves no proliferativas, caracterizadas por una hemorragias leves, donde también se pueden ver algunos microaneurismas. En la figura c), se puede ver una retinopatía diabética proliferativa, con un grado de hemorragia considerablemente mayor, cicatrización y daño a la retina, y la formación de nuevos vasos sanguíneos en el disco óptico, que pueden interferir con la visión. En la figura d), la condición ha avanzado lo suficiente para causar un edema diabético macular. En esta figura se puede ver bastante daño a la retina y bastante sangrado en varias áreas, así como la inflamación de los vasos sanguíneos (Wong *et al.* 2016). 

**Fuentes**

National Eye Institute. (2019). *Diabetic Retinopathy*. Recuperado de: https://nei.nih.gov/learn-about-eye-health/eye-conditions-and-diseases/diabetic-retinopathy

Wong, T. Y., Cheung, C. M. G., Larsen, M., Sharma, S., y Simó, S. (2016). Diabetic retinopathy. *Nature Reviews Disease Primers, 2,* 16012. doi:10.1038/nrdp.2016.12

# Análisis Exploratorio y Preprocesamiento de Imágenes
*El análisis exploratorio y balanceo de las imágenes se encuentra en el archivo adjunto en R.*

Para determinar la distribución de las clasificaciones de las imágenes, se evaluó la frecuencia con la que aparecía cada categoría:

0: 1805
1: 370
2: 999
3: 193
4: 295



Debido a que las imágenes donde no se muestra retinopatía de ningún tipo y aquellas con retinopatía moderada tienen una considerable proporción de imágenes más grande, se procedió a balancear obteniendo imágenes aleatorias de estas categorías para tener, en promedio, 300 imágenes de cada una.

0: 299
1: 370
2: 299
3: 193
4: 295

Este nuevo dataset balanceado se almacenó en el archivo *trainBalanced.csv*.


In [0]:
from google.colab import drive
drive.mount("/content/drive", force_remount=True)

Mounted at /content/drive


In [0]:
# Corroborando conexión al dataset en Drive
import os
print(os.listdir("drive/My Drive/Dataset Retinopatía Diabética"))

['train.csv', 'sample_submission.csv', 'test.csv', 'train_images', 'test_images', 'trainBalanced.csv']


In [0]:
# Bibliotecas para NN
import keras
from keras.models import Sequential
from keras.layers import Dense, Dropout, Flatten
from keras.layers import Conv2D, MaxPooling2D
from keras.utils import to_categorical
from keras.preprocessing import image
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from keras.utils import to_categorical
from tqdm import tqdm

Using TensorFlow backend.


In [0]:
# Obtención de la lista de imágenes
train = pd.read_csv('drive/My Drive/Dataset Retinopatía Diabética/trainBalanced.csv')
train['id_code'][0]

'1df0431bfa73'

Para procesar las imágenes, se colocaron todas a un tamaño de 360x360, el cual fue determinado como aceptable por encontrarse entre los parámetros de procesamiento más usados (y computables) sin sacrificar demasiado la calidad de la imagen (seguía siendo clara a simple vista)

In [0]:
# Procesamiento de imágenes
train_image = []
for i in tqdm(range(train.shape[0])):
    img = image.load_img('drive/My Drive/Dataset Retinopatía Diabética/train_images/'+ train['id_code'][i] +'.png', target_size=(360,360, 1), color_mode="grayscale")
    img = image.img_to_array(img)
    img = img/255
    train_image.append(img)
X = np.array(train_image)

100%|██████████| 1456/1456 [03:15<00:00,  7.46it/s]


In [0]:
# Corroborando que se obtuvo el array de imágenes procesadas
X[0]

array([[[0.],
        [0.],
        [0.],
        ...,
        [0.],
        [0.],
        [0.]],

       [[0.],
        [0.],
        [0.],
        ...,
        [0.],
        [0.],
        [0.]],

       [[0.],
        [0.],
        [0.],
        ...,
        [0.],
        [0.],
        [0.]],

       ...,

       [[0.],
        [0.],
        [0.],
        ...,
        [0.],
        [0.],
        [0.]],

       [[0.],
        [0.],
        [0.],
        ...,
        [0.],
        [0.],
        [0.]],

       [[0.],
        [0.],
        [0.],
        ...,
        [0.],
        [0.],
        [0.]]], dtype=float32)

In [0]:
# Conversión del tipo de dato para la clasificación
y = train['diagnosis'].values
y = to_categorical(y)

In [0]:
# Creación del conjunto de entrenamiento y de prueba
# Se trabajará con el 70% para entrenamiento y el 30% para validación
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42, test_size=0.3)

# Modelo Simple - Simple Neural Network

In [0]:
simple_model = Sequential()
simple_model.add(Dense(32, kernel_size=(3, 3),activation='relu',input_shape=(360,360,1)))
simple_model.add(Dense(5, activation='softmax'))

In [0]:
simple_model.compile(loss='categorical_crossentropy',optimizer='Adam',metrics=['accuracy'])

In [0]:
simple_model.fit(X_train, y_train, epochs=10, validation_data=(X_test, y_test))

# Modelo con Deep Learning - Convolutional Neural Network

In [0]:
# Creación del modelo 1 -- Este fue el mejor con 10 épocas.
model = Sequential()
model.add(Conv2D(32, kernel_size=(3, 3),activation='relu',input_shape=(360,360,1)))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(rate = 0.25))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dropout(rate = 0.5))
model.add(Dense(5, activation='softmax'))






Instructions for updating:
Please use `rate` instead of `keep_prob`. Rate should be set to `rate = 1 - keep_prob`.


In [0]:
model.compile(loss='categorical_crossentropy',optimizer='Adam',metrics=['accuracy'])





In [0]:
model.fit(X_train, y_train, epochs=10, validation_data=(X_test, y_test))

Instructions for updating:
Use tf.where in 2.0, which has the same broadcast rule as np.where
Train on 1019 samples, validate on 437 samples
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x7fea66f2c860>

In [0]:
model.fit(X_train, y_train, epochs=25, validation_data=(X_test, y_test))

Train on 1019 samples, validate on 437 samples
Epoch 1/25
Epoch 2/25
Epoch 3/25
Epoch 4/25
Epoch 5/25
Epoch 6/25
Epoch 7/25
Epoch 8/25
Epoch 9/25
Epoch 10/25
Epoch 11/25
Epoch 12/25
Epoch 13/25
Epoch 14/25
Epoch 15/25
Epoch 16/25
Epoch 17/25
Epoch 18/25
Epoch 19/25
Epoch 20/25
Epoch 21/25
Epoch 22/25
Epoch 23/25
Epoch 24/25
Epoch 25/25


<keras.callbacks.History at 0x7fe9f671c940>

In [0]:
model.fit(X_train, y_train, epochs=50, validation_data=(X_test, y_test))

Train on 1019 samples, validate on 437 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50

In [0]:
# Creación del modelo 2 
model = Sequential()
model.add(Conv2D(32, kernel_size=(3, 3),activation='relu',input_shape=(360,360,1)))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(3, 3)))
model.add(Dropout(rate = 0.75))
model.add(Flatten())
model.add(Dense(256, activation='relu'))
model.add(Dropout(rate = 0.75))
model.add(Dense(5, activation='softmax'))



In [0]:
model.compile(loss='categorical_crossentropy',optimizer='Adam',metrics=['accuracy'])

In [0]:
model.fit(X_train, y_train, epochs=10, validation_data=(X_test, y_test))

Train on 1019 samples, validate on 437 samples
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x7f2e703e3fd0>

In [0]:
# Creación del modelo 3 
model = Sequential()
model.add(Conv2D(32, kernel_size=(3, 3),activation='relu',input_shape=(360,360,1)))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D(pool_size=(3, 3)))
model.add(Dropout(rate = 0.25))
model.add(Flatten())
model.add(Dense(256, activation='relu'))
model.add(Dropout(rate = 0.25))
model.add(Dense(5, activation='softmax'))

In [0]:
model.compile(loss='categorical_crossentropy',optimizer='Adam',metrics=['accuracy'])





In [0]:
model.fit(X_train, y_train, epochs=15, validation_data=(X_test, y_test))

Instructions for updating:
Use tf.where in 2.0, which has the same broadcast rule as np.where
Train on 1019 samples, validate on 437 samples
Epoch 1/15
Epoch 2/15
Epoch 3/15
Epoch 4/15
Epoch 5/15
Epoch 6/15
Epoch 7/15
Epoch 8/15
Epoch 9/15
Epoch 10/15
Epoch 11/15
Epoch 12/15
Epoch 13/15
Epoch 14/15
Epoch 15/15


<keras.callbacks.History at 0x7fd2ef7b68d0>

In [0]:
# Creación del modelo 4 
model = Sequential()
model.add(Conv2D(32, kernel_size=(3, 3),activation='relu',input_shape=(360,360,1)))
model.add(Conv2D(64, (2, 2), activation='relu'))
model.add(MaxPooling2D(pool_size=(3, 3)))
model.add(Dropout(rate = 0.50))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dropout(rate = 0.50))
model.add(Dense(5, activation='relu'))

In [0]:
model.compile(loss='categorical_crossentropy',optimizer='Adam',metrics=['accuracy'])

In [0]:
model.fit(X_train, y_train, epochs=10, validation_data=(X_test, y_test))

Train on 1019 samples, validate on 437 samples
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x7f89d82eb978>

In [0]:
simple_model = Sequential()
simple_model.add(Dense(32, kernel_size=(3, 3),activation='relu',input_shape=(360,360,1)))
simple_model.add(Dense(5, activation='softmax'))

simple_model.compile(loss='categorical_crossentropy',optimizer='Adam',metrics=['accuracy'])

In [0]:
simple_model.fit(X_train, y_train, epochs=10, validation_data=(X_test, y_test))

# Análisis de los modelos obtenidos

Los modelos obtenidos mostraron una exactitud ligeramente superior al 50%. Esto se debe en parte a que, con el dataset balanceado para evitar cualquier sesgo en el modelo, se disminuía considerablemente el número de imágenes disponibles para entrenar a la red convolucional. 

Al jugar con los hiperparámetros, se encontró que el ideal era trabajar con un pool de dimensión 2x2, una capa de densidad de 128 nodos, y la función de activación softmax para la capa final. El número de épocas ideal para el entrenamiento era de 50.  

En comparación, el modelo con una red neuronal simple obtuvo un accuracy de 38% en el mejor model, el cual es menor al del mejor modelo de la red convolucional. La mejora considerable en el desempeño del algoritmo de CNN contra el de la red neuronal simple se debe al funcionamiento de esta. La red convolucional utiliza un proceso similar al de la visión de algunos mamíferos como gatos, donde se ha demostrado que generan las imágenes que visualizan generando mini regiones de una imagen, las cuales se traslapan para poder extraer las características de lo que están viendo. Esto es lo que le permite a la red convolucional extraer las características de una imagen (utilizando *pooling*), optimizando el algoritmo para reconocer las características que permiten diferenciar las clasificaciones que se esperan. 

Debido a que no se obtuvo un rendimiento superior al 60%, los modelos obtenidos son ligeramente mejores que algo aleatorio. Debido a que este modelo se supone debe usarse en la diagnosis de retinopatía diabética, una condición médica que puede tener implicaciones severas para una persona, no se recomienda utilizar este modelo para diagnosticar la severidad de la enfermedad. Para mejorar la exactitud del algoritmo, se recomendaría obtener un dataset con un mayor número de imágenes, para determinar si un mayor número puede aumentar la eactitud o si sería recomendable cambiar la topología de la red neuronal de una manera más drástica. Cabe considerar que se tienen varias limitaciones al momento de generar los modelos debido al alto costo computacional. 