![Texto alternativo](https://th.bing.com/th/id/OIP.vlilh4SbxOVKDv5f-q3FsgAAAA?pid=ImgDet&rs=1)

# <font color= lightblue> Proyecto de Ciencia de Datos </font>



*   Héctor César Ornelas León
*   Ricardo Damián Hernández Ramírez





# Detección de tumores cerebrales mediante Redes Neuronales Convolucionales

## Introducción
* La detección temprana y precisa de tumores cerebrales es de vital importancia en el campo de la medicina y la neurociencia ya que permite un tratamiento oportuno y más efectivo. Bajo este contexto, este proyecto tiene como objetivo entrenar una arquitectura de Redes Neuronales Convolucionales (CNN, por sus siglas en inglés) para interpretar imágenes de resonancia magnética y detectar patrones asociados a tumores cerebrales.

* La relevancia de esta iniciativa se fundamenta en la necesidad  de optimizar los métodos de detección y diagnóstico, especialmente en un contexto donde la complejidad de los tumores cerebrales demanda enfoques más avanzados. La aplicación de técnicas de inteligencia artificial, como las CNN, no solo busca mejorar la precisión de la clasificación, sino también agilizar la identificación de patologías y favorecer tratamientos más personalizados y oportunos.

* Para llevar a cabo este proyecto, se hará uso de  un conjunto de datos que incluye imágenes de resonancia magnética con cuatro clases distintas: Normal, Meningioma, Glioma y Pituitaria.


## Antecedentes

* Los tumores cerebrales son crecimientos anormales de células en el cerebro. La clasificación de tumores cerebrales en subtipos, como Meningioma, Glioma y Pituitaria es fundamental, ya que diferentes tumores requieren enfoques terapéuticos distintos.

* Según la Clínica Mayo, Los Meningiomas son los tumores cerebrales primarios más comunes, representando más del 30% de todos los casos. Los gliomas son un tipo de tumor que se origina en las células gliales, que son las que rodean y dan soporte a las neuronas. Los gliomas pueden afectar al funcionamiento del cerebro y la médula espinal, y su gravedad depende de su localizacióny tamaño, mientras que  los tumores Pituitarios son benignos, representando alrededor del 10% de los tumores cerebrales. (Tumor cerebral, Mayo Clinic, 2023).

* El conjunto de datos utilizado en este proyecto se obtuvo de [Kaggle](https://www.kaggle.com/datasets/thomasdubail/brain-tumors-256x256/data)., una plataforma en línea que ofrece conjuntos de datos, competiciones y recursos relacionados con la ciencia de datos y el aprendizaje automático. Este conjunto de datos consta de aproximadamente 3,000 imágenes de resonancias magnéticas, las cuales se dividen en cuatro clases: Normal, Meningioma, Glioma y Pituitaria.



## Objetivos generales

* Desarrollar un modelo de Redes Neuronales Convolucionales (CNN) eficiente y preciso que pueda identificar de manera efectiva los patrones asociados a los diferentes tipos de tumores cerebrales en las imágenes de resonancia magnética.

## Objetivos específicos

* Recolectar un conjunto de datos de resonancias magnéticas de tumores cerebrales y realizar tareas de preprocesamiento como normalización para mejorar la calidad y diversidad del conjunto de entrenamiento.

* Seleccionar una arquitectura de Redes Neuronales Convolucionales (CNN) óptima para la detección de patrones asociados a diferentes tipos de tumores cerebrales.

* Evaluar el rendimiento del modelo utilizando métricas específicas para problemas de clasificación en imágenes médicas, como precisión, recall y F1-score.

* Implementar una API que permita ejecutar nuestro modelo como un servicio, facilitando así su accesibilidad y uso.

*  Crear una imagen de Docker que contenga el entorno necesario para ejecutar el modelo en diferentes instancias.



## Planteamiento del problema

* Los tumores cerebrales son muy complejos y se caracterizan por una amplia variabilidad en su tamaño y ubicación, lo que dificulta la comprensión completa de la naturaleza de estos tumores. Además, el análisis de resonancias magnéticas para su detección y diagnóstico requiere de la experiencia de un neurocirujano especializado.

* En muchos países en vías de desarrollo, la falta de médicos especializados y la falta de conocimiento sobre los tumores cerebrales dificultan la generación de informes a partir de resonancias magnéticas. Esto no solo ralentiza los procesos de diagnóstico y detección temprana, sino que también obstaculiza el acceso a una atención médica oportuna y efectia.

* Por lo tanto, existe una necesidad  de desarrollar soluciones que aprovechen la tecnología de la inteligencia artificial, como las Redes Neuronales Convolucionales (CNN), para asistir en la detección temprana y el diagnóstico preciso de tumores cerebrales a partir de imágenes de IRM. Esta innovación tiene el potencial de superar las limitaciones geográficas y de recursos, permitiendo un acceso más amplio a un diagnóstico oportuno y una atención médica eficaz para los pacientes con tumores cerebrales.


## EDA

En esta parte vimos como lucen las imagenes, además descubrimos  que la distribución de las imágenes de tumores cerebrales es desigual. Hay una mayor proporción de imágenes de gliomas y meningiomas que de tumores pituitarios y cerebros sin ningún tumor. Es importante tomar esto en cuenta ya que puede plantear desafíos durante el desarrollo del modelo. La sobreabundancia de imágenes de Glioma y Meningioma podría influir en la capacidad del modelo para generalizar de manera efectiva a las clases menos representadas, como los tumores pituitarios y las imágenes normales.

## Data Wrangling

Se separaron las imágenes usando train_test_split en tres directorios: train (80%), validation (10%) y test (10%). Esto para tener las imágenes preparadas para el entrenamiento del modelo..

## Dataset final a trabajar

Decidimos utilizar este dataset debido a que tenemos interés en abordar un caso del área médica. Los tumores cerebrales nos parecen un tema bastante complejo, pero a la vez interesante.

Por medio del análisis exploratorio, pudimos apreciar que las clases están desbalanceadas, debido a la reducida cantidad de imágenes disponibles, por lo que decidimos investigar como abordar este problema de la mejor manera posible. Encontramos que, debido a la complejidad de los tumores cerebrales, es complicado aplicar técnicas de aumento de datos, ya que no suelen ser efectivas en el campo médico porque no aportan suficiente información adicional de manera natural.

Otro de los motivos por los cuales decidimos trabajar con estos datos, es que la gran mayoría de los conjuntos de datos públicos contienen una cantidad similar de imágenes a este dataset por temas de privacidad.


Por esta razón, hemos decidido trabajar con los datos obtenidos originalmente.

## Entrenamiento con MLflow

Se han implementado tres arquitecturas de modelos diferentes: VGG16, ResNet50 e InceptionNet, con el objetivo de evaluar y comparar su rendimiento en el conjunto de datos.

## Generadores de datos:
Primero se crearon los generadores de datos utilizando la clase ImageDataGenerator de TensorFlow/Keras. Estos generadores son esenciales para el entrenamiento y evaluación eficientes de modelos de aprendizaje profundo con grandes conjuntos de imágenes.

Parámetros Principales:
* batch_size: Define el tamaño de los lotes de datos que se utilizarán durante el entrenamien* to.
* target_size: Especifica las dimensiones a las que se redimensionarán las imágenes de entr

## Generador conjunto de entrenaminto:

Se crea un objeto ImageDataGenerator para el conjunto de entrenamiento, con una transformación que normaliza los valores de píxeles entre 0 y 1 (rescale=1.
/255.).
Se utiliza el generador para crear un flujo de datos desde un directorio específico (train_dir), con parámetros como el tamaño objetivo de las imágenes, el tamaño del lote y el modo d

## Generador connjunto de Validación:

Similar al generador de entrenamiento, se crea un generador de datos para el conjunto de validación utilizando el mismo proceso.
Generador de Datos para Conjunto de Prueba:

Un generador de datos separado se configura para el conjunto de prueba, siguiendo los mism

## Modelos
Para el entrenamiento de los modelos Se utiliza MLflow para realizar un seguimiento del entrenamiento y registrar el modelo, incluyendo su resumen, métricas y configuración en un experimento específico. Durante el entrenamiento, se registran las métricas de rendimiento y el modelo se guarda en MLflow para su posterior análisis y comparación


`VGG16`: La arquitectura VGG16 se carga con pesos preentrenados en el conjunto de datos "imagenet" y se utiliza como base del modelo. La capa superior se excluye y la base se congela para evitar actualizaciones de pesos durante el entrenamiento. Se agrega una capa de aplanamiento, seguida de una capa de dropout para regularización y una capa densa de salida con activación softmax para la clasificación en 4 clases. El modelo se entrena durante 15 épocas utilizando conjuntos de entrenamiento y validación, y se utiliza MLflow para realizar un seguimiento del rendimiento del modelo. Se registran métricas como precisión y pérdida, y se guarda el modelo entrenado en MLflow con una firma de inferencia definida en función de las entradas y salidas del modelo. Este enfoque proporciona un marco completo para el desarrollo, entrenamiento y registro de modelos de aprendizaje profundo, permitiendo un análisis posterior y comparación de resultados

`VGG16 v2`: Este modelo es parecido al modelo VGG16 descrito anteriormente, la unica diferencia es la adición de capas adicionales. Se carga la parte convolucional de VGG16 (base_model) con pesos preentrenados en el conjunto de datos "imagenet" y se congela para mantener esos pesos durante el entrenamiento. Luego, se construye un modelo secuencial (vgg_v2) al que se añaden capas adicionales para adaptarse a la tarea específica. Después de la base preentrenada, se agregan dos capas convolucionales seguidas de capas de agrupación para extraer características más específicas. Posteriormente, se añaden capas densas con funciones de activación ReLU y capas de dropout para regularización. La capa de salida consta de cuatro neuronas con una activación softmax, indicando una clasificación en cuatro clases. El modelo se compila con el optimizador Adam y la función de pérdida 'sparse_categorical_crossentropy'. 

`ResNet50`: Se define un modelo de clasificación utilizando la arquitectura preentrenada ResNet50 en TensorFlow/Keras. La arquitectura ResNet50 se carga y congela para preservar los pesos aprendidos previamente. Se construye un modelo secuencial adicional que extiende la salida de ResNet50 con capas adicionales. Después de la capa de salida de ResNet50, se aplica una capa de pooling global promedio para resumir la información esencial. Luego, se añaden capas de aplanamiento, una capa densa con activación ReLU y una capa de dropout para regularización. La capa de salida consiste en cuatro neuronas con activación softmax para la clasificación en cuatro clases. El modelo se compila con la función de pérdida 'sparse_categorical_crossentropy', el optimizador Adam con una tasa de aprendizaje específica, y se evalúa utilizando la métrica de precisión. MLflow se utiliza para realizar un seguimiento del entrenamiento, registrar métricas y guardar el modelo entrenado, proporcionando una estructura flexible y modular para la creación y evaluación de modelos de clasificación con ResNet50.


`InceptionV3`: De igual forma se utiliza un modelo preentrenado esta vez utilizando la arquitectura de InceptionV3, seguida de capas personalizadas diseñadas para adaptar la red a la tarea específica. Se introduce una capa de pooling global promedio para resumir características clave y reducir la complejidad computacional. A continuación, se añaden capas de aplanamiento y capas densas, incluyendo capas de dropout para regularización y prevenir el sobreajuste. La capa de salida consta de cuatro neuronas con activación softmax, indicando la clasificación en cuatro clases. El modelo se compila con el optimizador Adam, la función de pérdida 'sparse_categorical_crossentropy' y se evalúa utilizando la métrica de precisión

## Selección del modelo

Se seleccionó el modelo VGG V2 pues mostró un accuracy mayor a los demás en el conjunto de validación.

![image.png](attachment:6a57dfeb-cd06-4de9-8a12-0cb9d77d1df1.png)

El accuracy puede no ser la mejor métrica para nuestra tarea. Las métricas robustas como precision, recall y f1-score proporcionan una visión más completa del rendimiento del modelo. Sin embargo, cabe destacar que la calidad de las imágenes puede ser un factor crítico en el rendimiento del modelo, especialmente en tareas de clasificación de tumores. Imágenes de baja calidad, ruido o variabilidad en las condiciones de captura pueden dificultar la tarea de clasificación.

Además, la generación de datos adicionales puede ser un desafío en este contexto, ya que se trata de imágenes de tumores, generar datos adicionales de manera efectiva implica replicar de manera precisa la variabilidad y la complejidad de las condiciones reales en las que se capturaron las imágenes originales. Esto puede ser difícil de lograr y puede introducir ruido si no se tiene un control preciso sobre las condiciones de generación de datos.



## Implementación de la API

El código se encuentra en la carpeta API, en este código se implementa una API utilizando FastAPI para realizar predicciones de diagnóstico de tumores cerebrales basadas en imágenes médicas. La API espera recibir imágenes en formato .jpg o .jpeg mediante solicitudes POST en la ruta "/api/v0/predict". Antes de procesar la imagen, se verifica la validez del token de acceso proporcionado mediante el mecanismo de seguridad APIKey de FastAPI.

Una vez validado el token, la API verifica que el archivo de imagen tenga la extensión permitida (.jpg o .jpeg). Si la verificación es exitosa, la imagen se procesa y redimensiona a 224x224 píxeles. Se utiliza la biblioteca MLflow para carganuestroun modelo preentrenado de clasificación de tumores cerebrales (VGGv2) y realizar predicciones sobre la imagen procesada. Las clases de diagnóstico incluyen "Glioma Tumor", "Meningioma Tumor", "Normal" y "Pituitary Tumor". La predicción se devuelve como un resultado JSON con la etiqueta de diagnóstico correspondiente.

La API se ejecuta en el servidor local en el puerto 8000 y puede ser accedida para realizar predicciones de diagnóstico de tumores cerebrales mediante solicitudes POST con imágenes y el token de acceso adecuado.

## Prueba API funcionando de forma local




![prueba_local](C:\Users\insp3\Desktop\BrainTumors_CNN\informe\imagenes\postman_local.jpg)


## Contenedor

Para contenerizar la API se creó un archivo Dockerfile. Este Dockerfile se basa en la imagen python:3.10-slim-buster. En el proceso de construcción, se configura el directorio de trabajo en "/API". Se actualiza el sistema operativo, se instalan paquetes esenciales como procps, y se ajusta la zona horaria al horario de la Ciudad de México. Además, se instala la biblioteca libgomp1 como una dependencia adicional. Se copian los archivos requirements.txt y main.py al directorio de trabajo, seguido de la instalación de las dependencias Python especificadas en requirements.txt. 

El puerto 8000 se expone para permitir el acceso a la aplicación desde fuera del contenedor. Finalmente, se configura el comando por defecto para iniciar la aplicación FastAPI utilizando Uvicorn en el host "0.0.0.0" y el puerto 8000. En resumen, este Dockerfile asegura un entorno de ejecución eficiente para la aplicación FastAPI, gestionando dependencias y configuraciones esenciales.







## Despliegue del servicio en la nube

La instancia se crea con el nombre Grupo 4 en la nube se creo desde AWS siguiendo los mismos pasos que en clases:

* Desde una imagen de Ubuntu.
* Tipo de instancia t2.micro.
* Con acceso por medio de una llave pem.

![aws](C:\Users\insp3\Desktop\BrainTumors_CNN\informe\imagenes\instancia.png)


## Reglas de seguridad

En las reglas de seguridad se dio acceso SSH desde la IP de la red donde se configuró la instancia, también se atendió la indicación de dar acceso público con el protocolo HTTP y HTTPS, así como al protocolo TCP desde el puerto 8000 que es donde se reciben las peticiones de la API.

![seguridad](C:\Users\insp3\Desktop\BrainTumors_CNN\informe\imagenes\reglas_instance.jpg)



## Prueba API funcionando en la nube

![aws_api](C:\Users\insp3\Desktop\BrainTumors_CNN\informe\imagenes\aws.jpg)



![aws_api](C:\Users\insp3\Desktop\BrainTumors_CNN\informe\imagenes\postman_nube.jpg)


## Conclusiones

El proyectó logró desarrollarse satisfactoriamente y cumplir con los requisitos establecidos. El modelo clasifica correctamente y la API funciona como se espera.

La mayor dificultad se presentó al momento de desarrollar los modelos. Nuestros recursos computacionales eran limitados y tuvimos que hacer uso de Google colab para entrenar el modelo. Además, ningún modelo presentaba buen rendimiento basándonos en métricas como precision, recall, f1-score etc. OPtamos por escoger el modelo con mayor accuracy en el conjunto de validación y al parecer el modelo logra clasificar correctamente las imágenes.   
e.

Como recomendación para futuras mejo se sugiere c Considerar la posibilidad de ampliar el conjunto de datos mediante la recopilación de más imágenes, lo que podría contribuir a mitigar el desbalance de clases y mejorar la capacidad del modelo para generaliza También, ezadas: Evaluar el rendimiento de arquitecturas de redes neuronales más avcomo las arquitecturas de deep learning.ínico realete.

## Referencias

* Alqudah, A. M., Alquraan, H., Abu Qasmieh, I., Alqudah, A., & Al-Sharu, W. (2019). Brain Tumor Classification Using Deep Learning Technique - A Comparison 
between Cropped, Uncropped, and Segmented Lesion Images with Different 
Sizes. International Journal of Advanced Trends in Computer Science and Engineering.
Disponible en http://www.warse.org/IJATCSE/static/pdf/file/ijatcse155862019.pdf
