<h1 style="color:blue;">Redes Neuronales Convolucionales para la detección de puntos anatómicos en imágenes cefálicas laterales</h1>

<p>En este proyecto busco utilizar algunas arquitecturas de redes neuronales convolucionales para determinar cual de ellas se adecúa mejor a la detección de puntos anatómicos en imágenes radiográficas cefálicas laterales, intentaré hacerlo lo mas sencillo posible.</p>

<h2 style="color:red;">Data Utilizada</h2>

<p>Para realizar esta investigación, voy a usar una data disponible de forma gratuita en <a href="http://www-o.ntust.edu.tw/~cweiwang/ISBI2015/challenge1/index.html">Dataset</a>, de la misma, solo utilice la data con labels "senior".</p>

<h3>Breve Descripción de la data</h3>

<p>Los datos a utilizar consisten en 400 imágenes de imágenes radiográficas cefálicas laterales (escala de grises) junto con un vector que indica la posición de 19 puntos anatómicos, etiquetados por un especialista senior en el área (ver link del dataset para mayor detalle).</p>

<h2 style="color:red;">Preprocesamiento y Data Augmentation</h2>

<p>Para hacer el modelo más general, las imágenes fueron preprocesadas para cumplir con:</p>

* Imágenes cuadradas de 128x128 pixeles.
* Imágenes normalizadas (rango de intensidad de pixeles de -1 a 1).
* Para tener mayor cantidad de datos y evitar overfit, se aumentó la data al hacer flip horizontal y vertical, para un total de 1200 imágenes con sus labels (400 originales + 400 flip horizontal + 400 flip vertical).
* Igualmente, para evitar overfit, las imágenes están organizadas en 1 original - 1 flip h - 1 flip v. Nota: Es cierto que lo ideal sería mezclar todo, sin embargo, las imágenes "flipeadas" distan tanto de la original que no creo que el efecto sea tan evidente, de todas formas es un punto a explorar.
* El training set consta de 900 imágenes, mientras que el test set de 300 imágenes.

<h2 style="color:red;">Entorno de Ejecución</h2>

<p>Debido a diversas limitantes, la mejor opción que tengo disponible es, sin dudas, usando el entorno acelerado por GPU en Google Colab (no se imaginan cuanto lo agardezco), la forma de setearlo la obtuve de este post de <a href="https://www.kdnuggets.com/2018/02/google-colab-free-gpu-tutorial-tensorflow-keras-pytorch.html">KDnuggets.</a> Recomiendo ampliamente darle una hojeada para entender mejor como funciona.<br><br>
    Para hacer mas sencillo el código, se utilizará Keras con backend TensorFlow, lo cual hace el modelo muy fácil de armar, depurar y leer. La data está almacenada en mi Google Drive, la compartiré en cuanto esté seguro que tengo permiso de hacerlo, igual la data original es accesible en el link de la sección "Data Utilizada".</p>


<h1>Estableciendo la conexión con nuestro Google Drive</h1>

In [None]:
!apt-get install -y -qq software-properties-common python-software-properties module-init-tools
!add-apt-repository -y ppa:alessandro-strada/ppa 2>&1 > /dev/null
!apt-get update -qq 2>&1 > /dev/null
!apt-get -y install -qq google-drive-ocamlfuse fuse
from google.colab import auth
auth.authenticate_user()
from oauth2client.client import GoogleCredentials
creds = GoogleCredentials.get_application_default()
import getpass
!google-drive-ocamlfuse -headless -id={creds.client_id} -secret={creds.client_secret} < /dev/null 2>&1 | grep URL
vcode = getpass.getpass()
!echo {vcode} | google-drive-ocamlfuse -headless -id={creds.client_id} -secret={creds.client_secret}

<p>El código anterior tendrá dos puntos en los que nos indica un link al cual debemos acceder para iniciar nuestra sesión en Google y darle autorización a nuestra aplicación para acceder al Drive. Es tan sencillo como copiar los códigos de autenticación en los campos indicados.</p>

<p>Procedemos a montar nuestro Drive a través de la referencia "drive"</p>

In [None]:
!mkdir -p drive
!google-drive-ocamlfuse drive

<p>Ahora, verificamos que nuestro entorno en Google Colab tiene configurado el entorno acelerado por GPU, lo cual nos debería arrojar <b>['/device:GPU:0']</b> en caso afirmativo.</p>

<p><b>Nota: </b> El programa debe funcionar aun cuando no se encuentre acelerado por GPU, sin embargo, la diferencia en rapidez (y por tanto en viabilidad de la investigación) es muy considerable en mi caso, siendo alrededor de 20 a 30 veces más rápido, sin contar el hecho de que el computador no queda "esclavizado" por el uso exhaustivo de CPU y Memoria RAM.</p>

In [None]:
import tensorflow as tf
from tensorflow.python.client import device_lib

def get_available_gpus():
    local_device_protos = device_lib.list_local_devices()
    return [x.name for x in local_device_protos if x.device_type == 'GPU']

get_available_gpus()

<h1>Importando librerías necesarias y cargando el training y test set</h1>

In [None]:
!pip install -q keras #En caso de que no lo esté

import pickle
from keras.models import Sequential, load_model, Model
from keras.layers import Dense, Dropout, Activation, Flatten, Input, Convolution2D, MaxPooling2D, concatenate
import pickle
import numpy as np
import matplotlib.pyplot as plt
import keras.optimizers
from keras.utils import plot_model
import h5py

<p>Cargamos la data desde nuestro Drive en un diccionario con dos índices princiaples:</p>

* Diccionario['Img'] para obtener las imágenes (matriz de intensidad de grises).
* Diccionario['Lbl'] para obtener los labels.

<p>Es importante notar que índices iguales corresponden al par Imagen-Label respectivo, esto es, Diccionario['Img'][15] es una imagen cuyo label está guardado en Diccionario['Lbl'][15].</p>
    
<p>La ruta dentro de mi sesión de Google Drive para obtener la data a evaluar es "drive/ColabRuns/ImagenesFlipLabelsSenior128.pickle". Como se puede notar, es un archivo tipo 'pickle', para facilitar su lectura y por ser ligero en espacio que ocupa.</p>

In [None]:
Diccionario = pickle.load(open("drive/ColabRuns/ImagenesFlipLabelsSenior128.pickle","rb"))

<p>Definimos nuestras variables de training y test según lo especificado anteriormente<p>

In [None]:
X_train=np.array(Diccionario['Img'][0:900]).reshape(900,128,128,1).astype('float32')
Y_train=np.array(Diccionario['Lbl'][0:900]).reshape(900,38).astype('float32')

X_test=np.array(Diccionario['Img'][900:1200]).reshape(300,128,128,1).astype('float32')
Y_test=np.array(Diccionario['Lbl'][900:1200]).reshape(300,38).astype('float32')

<p>Algunas notas sobre el reshape y el astype:</p>
* reshape(900,128,128,1) corresponde a 900 imágenes, de 128 x 128 pixeles, de 1 canal cada una.
* reshape(900,38) corresponde a 900 labels, cada uno de 38 elementos (19 pares de coordenadas).
* astype('float32') es un tipo de dato aceptado por TensorFlow y Keras, cuando se guardó la data en un archivo 'pickle', los datos pueden no ser devueltos en un formato aceptable.

<p>Una vez cumplido lo explicado anteriormente, llegamos al punto en que debemos definir la arquitectura de red neuronal convolucional en si, en este caso, usaremos una arquitectura del tipo "AlexNet", que no es mas que una arquitectura secuencial, pero que se reconoce como el punto de inflexión que hizo posible el actual desarrollo y uso de las CNNs en el área de visión por computador.</p>

<p><b>Nota: </b>Las demás arquitecturas a evaluar serán exactamente iguales hasta aquí.</p>