# EJEMPLO - RED NEURONAL PARA DIAGNOSTICO DE LA DIABETES DE PIMA INDIANS

Este ejemplo considera los siguientes objetivos:
- Cargar datos desde un archivo CSV para usar con Keras.
- Definir y compilar un modelo de Perceptron multicapa en Keras.
- Evaluar un modelo Keras en un conjunto de datos de validación.

Los pasos para poder crear este modelo, son los siguientes:
1. Cargar datos.
2. Definir el Modelo.
3. Compilar el Modelo.
4. Entrenar el Modelo.
5. Evaluar el Modelo.
6. Unir todos los pasos anteriores.

## Cargar datos
### Datasets
Se utilizara un dataset de la Universidad de California Irvine (Diabetes de Pima Indians). Este dataset es un conjunto de datos disponible de manera gratuita desde el repositorio UCI Machine Learning. Describe los datos de registros médicos de los pacientes de de Pima y describe si ellos tuvieron diabetes dentro de un periodo de cinco años. Es un problema de clasificación binaria (aparición de diabetes como 1 o no como 0). Las variables de entrada que describen a cada paciente son numéricas y tienen escalas variables. A continuación se enumeran los ocho atributos para el conjunto de datos:
1. Número de veces embarazada.
2. Concentración de glucosa plasmática a 2 horas en una prueba oral de tolerancia a la glucosa.
3. Presión arterial diastólica (mm Hg).
4. Grosor del pliegue de la piel del tríceps (mm).
5. Insulina en suero de 2 horas (mu U / ml).
6. Índice de masa corporal.
7. Función de pedigrí de diabetes.
8. Edad (años).
9. Clase, aparición de diabetes dentro de los cinco años.
Debido a que todos los atributos son numericos, es facil utilizarlos directo en la red neuronal. Este dataset contiene 768 registros.
La precisión base de todas las predicciones que se realizan es del 65.1%. Los mejores resultados se encuentran en el rango de 77.7% de precisión utilizando 10-fold cross validation.

### Cargar dataset
En el siguiente código, se importan las librerias de Keras y numpy.
Debido a que todos los datos son numéricos, se puede importar el archivo directo con numpy.
También se inicia el generador aleatorio con la variable seed, para que siempre obtengamos los mismos resultados.

In [5]:
from keras.models import Sequential
from keras.layers import Dense
import numpy

seed = 7
numpy.random.seed(seed)

# Cargar el dataset de los indios Pima.
dataset = numpy.loadtxt("Datasets\pima-indians-diabetes.csv", delimiter=",")

# Dividir los datos en features y label.
X = dataset[:, 0:8]
Y = dataset[:, 8]

### Definir el modelo
Los modelos en Keras son definidos como una sequencias de capas. Podemos crear un modelo sequencia (Sequencial) y agregar capas una a una hasta que cumplan nuestros requerimientos.
El primer paso es asegurarnos que la primer capa tenga el numero correcto de entradas. Esto se consigue con el argumento input_dim, en este caso utilizaremos el valor de 8 debido a que son 8 variables que se alimentaran en la capa de entrada.
¿Cómo saber el numero de capas y sus tipos? Esta es una pregunta complicada pero normalmente se experimenta y a prueba y error se puede llegar a un resultado óptimo. En este caso vamos a utilizar una red conectada completamente con 3 capas.
Capas completamente conectadas son definidas mediante la clase Dense. En esta clase se define el numero de neuronas como primer argumento, como segundo argumento se define el método de inicialización, y la función de activación. En este caso vamos a iniciar los pesos de la red con un valor aleatorio muy pequeño utilizando una distribución uniforme (uniform), en Keras el valor va de 0 a 0.05. Otra opción seria utilizar una distribución de Gauss (normal).
En las primeras dos capas se definirá una función de activación relu y para la capa de salida una función sigmoid. En el pasado las funciones sigmoid y tanh eran las utilizadas en todas las capas, pero ha sido demostrado que el desempeño mejora utilizando la función rectifier como activación. En nuestro caso utilizamos la función sigmoid en la capada de salida para asegurarnos que el valor de salido oscila entre 0 y 1 y es mas fácil definir el resultado en la clasificación binaria.

In [18]:
model = Sequential()
model.add(Dense(12, input_dim=8, activation='relu'))
model.add(Dense(8, activation='relu'))
model.add(Dense(1, activation='sigmoid'))
model.summary()

Model: "sequential_5"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_13 (Dense)             (None, 12)                108       
_________________________________________________________________
dense_14 (Dense)             (None, 8)                 104       
_________________________________________________________________
dense_15 (Dense)             (None, 1)                 9         
Total params: 221
Trainable params: 221
Non-trainable params: 0
_________________________________________________________________


### Compilar el modelo
Una vez que el modelo esta definido, se procede a compilarlo. Al compilar el modelo se mandan llamar las librerias en el backend, en nuestro caso Tensorflow. En este caso el backend automáticamente selecciona la mejor forma de representar la red neuronal para entrenamiento y realizar predicciones en el hardware. Cuando se compila el modelo, se deben definir algunas propiedades adicionales requeridas para el entrenamiento del modelo:
Especifica la función de perdida o loss function, que es utilizada para evaluar los pesos. También debes definir el optimizador utilizado para buscar entre los pesos de la red y algunas métricas opcionales que se require colectar y reportar durante el entrenamiento. En este ejemplo utilizaremos una función de perdida binary_crossentropy, que es una función logarítmica de perdida. Se utilizará una función para los calcular los gradientes llamada adam. Al ser un problema de clasificación binaria, se coleccionará y reportará la precision de la clasificación utilizando accuracy.

In [19]:
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])
#model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

### Entrenar el modelo
Una vez que este definido y compilado el modelo, es tiempo de ejecutar el modelo con los datos. Se entrena el modelo llamando la función fit() en el modelo.
El proceso de entrenamiento se ejecuta cierto numero de veces utilizando el dataset, este numero de veces es llamado epochs, y se define utilizando el parámetro nb_epoch. También podemos definir el numero de instances que son evaluadas antes de que los pesos sean actualizados en la red neuronal. Este parámetro se llama batch_size. En este problema se definirá un numero pequeño de epochs (150) y un valor relativamente pequeño de el batch (10).

In [20]:
model.fit(X, Y, epochs=150, batch_size=50)

#model.fit(X, Y, epochs=50, batch_size=250, verbose=2, validation_split=0.2)

Epoch 1/150
Epoch 2/150
Epoch 3/150
Epoch 4/150
Epoch 5/150
Epoch 6/150
Epoch 7/150
Epoch 8/150
Epoch 9/150
Epoch 10/150
Epoch 11/150
Epoch 12/150
Epoch 13/150
Epoch 14/150
Epoch 15/150
Epoch 16/150
Epoch 17/150
Epoch 18/150
Epoch 19/150
Epoch 20/150
Epoch 21/150
Epoch 22/150
Epoch 23/150
Epoch 24/150
Epoch 25/150
Epoch 26/150
Epoch 27/150
Epoch 28/150
Epoch 29/150
Epoch 30/150
Epoch 31/150
Epoch 32/150
Epoch 33/150
Epoch 34/150
Epoch 35/150
Epoch 36/150
Epoch 37/150
Epoch 38/150
Epoch 39/150
Epoch 40/150
Epoch 41/150
Epoch 42/150
Epoch 43/150
Epoch 44/150
Epoch 45/150
Epoch 46/150
Epoch 47/150
Epoch 48/150
Epoch 49/150
Epoch 50/150
Epoch 51/150
Epoch 52/150
Epoch 53/150
Epoch 54/150
Epoch 55/150
Epoch 56/150
Epoch 57/150
Epoch 58/150
Epoch 59/150
Epoch 60/150
Epoch 61/150
Epoch 62/150
Epoch 63/150
Epoch 64/150
Epoch 65/150
Epoch 66/150
Epoch 67/150
Epoch 68/150
Epoch 69/150
Epoch 70/150
Epoch 71/150
Epoch 72/150
Epoch 73/150
Epoch 74/150
Epoch 75/150
Epoch 76/150
Epoch 77/150
Epoch 78

Epoch 81/150
Epoch 82/150
Epoch 83/150
Epoch 84/150
Epoch 85/150
Epoch 86/150
Epoch 87/150
Epoch 88/150
Epoch 89/150
Epoch 90/150
Epoch 91/150
Epoch 92/150
Epoch 93/150
Epoch 94/150
Epoch 95/150
Epoch 96/150
Epoch 97/150
Epoch 98/150
Epoch 99/150
Epoch 100/150
Epoch 101/150
Epoch 102/150
Epoch 103/150
Epoch 104/150
Epoch 105/150
Epoch 106/150
Epoch 107/150
Epoch 108/150
Epoch 109/150
Epoch 110/150
Epoch 111/150
Epoch 112/150
Epoch 113/150
Epoch 114/150
Epoch 115/150
Epoch 116/150
Epoch 117/150
Epoch 118/150
Epoch 119/150
Epoch 120/150
Epoch 121/150
Epoch 122/150
Epoch 123/150
Epoch 124/150
Epoch 125/150
Epoch 126/150
Epoch 127/150
Epoch 128/150
Epoch 129/150
Epoch 130/150
Epoch 131/150
Epoch 132/150
Epoch 133/150
Epoch 134/150
Epoch 135/150
Epoch 136/150
Epoch 137/150
Epoch 138/150
Epoch 139/150
Epoch 140/150
Epoch 141/150
Epoch 142/150
Epoch 143/150
Epoch 144/150
Epoch 145/150
Epoch 146/150
Epoch 147/150
Epoch 148/150
Epoch 149/150
Epoch 150/150


<keras.callbacks.callbacks.History at 0x1f2b4a8e888>

# Evalúar el modelo
Una ves entrenado el modelo utilizando el dataset completo, se debe evaluar el rendimiento de la red neuronal. Estos dara una idea de que tan bien modelamos nuestro dataset, pero no tendremos idea como se desempeñara el modelo con datos nuevos. En la realidad se debe de separar el dataset de training y el dataset de testing.
Se puede evaluar el modelo en tu dataset de training utilizando la función evaluation() del modelo, pasándole la misma entrada y salida utilizada para el entrenamiento. Esto generará una predicción por cada registro, se podrán colectar scores, average loss y otras métricas como accuracy.

In [21]:
scores = model.evaluate(X, Y)
print("%s: %.2f%%" % (model.metrics_names[1], scores[1]*100))

accuracy: 68.49%
