# Your First Deep Learning Project in Python with Keras Step-By-Step

**Keras** es una herramienta *open-source* poderosa y fácil de usar para desarrollar y evaluar modelos de **deep learning**. Contiene las librerías de computación numérica eficiente **Theano** y **TensorFlow**, además de permitir definir y entrenar modelos de redes neuronales en pocas líneas de código.

## 1. Load Data

El primer paso es definir las funciones y clases que vamos a utilizar en este tutorial. Vamos a utilizar la librería **NumPy** para cargar el *dataset* y dos clases de la librería **Keras** para definir el modelo.

In [1]:
# first neural network with keras tutorial
from numpy import loadtxt
from keras.models import Sequential
from keras.layers import Dense

En este tutorial, vamos a utilizar el *Pima Indians diabetes dataset*, que describe información médica sobre pacientes y si desarrollaron diabetes en los últimos 5 años.

Por ende, es un problema de clasificación binaria. Todas las variables de entrada son numéricas, lo que facilita trabajar con redes neuronales.

Las variables del *dataset* se resumen a continuación:

**Variables de entrada (X):**

1. Número de veces embarazada.
2. Concentración de glucosa en plasma.
3. Presión sanguínea.
4. Triceps skin fold thickness
5. Insulina
6. Índice de masa corporal
7. Función pedigree diabetes
8. Edad

**Variables de salida (Y):**
1. Variable de clase (1 o 0).


Una vez cargados los datos, se pueden seleccionar las primeras 8 columnas y, por aparte, la columna de salida.

In [2]:
# load the dataset
from google.colab import files
uploaded = files.upload()
dataset = loadtxt('pima-indians-diabetes.csv', delimiter=',')
# split into input (X) and output (y) variables
X = dataset[:,0:8]
y = dataset[:,8]

Saving pima-indians-diabetes.csv to pima-indians-diabetes.csv


## 2. Define Keras Model

Los modelos en Keras se definen como una secuencia de capas. Vamos a crear un *modelo secuencial* y agregar capas, una por una, hasta estar satisfechos con la arquitectura de la red. 

Lo primero que se debe verificar es que la capa de entrada tenga el número correcto de *input features*. Esto se puede especificar al crear la primera capa, con el argumento **input_dim** y, para este ejemplo, asignar 8 por 8 variables de entrada.

De manera general, la mejor arquitectura de la red se encuentra a través de un proceso de prueba y error. Típicamente, se necesita una red lo suficientemente grande para capturar la estructura del problema. En este ejemplo, utilizaremos una red **fully-connected** con tres capas.

Las capas *fully-connected* son definidas con la **Dense class**. Se puede especificar el número de neuronas o nodos en la capa como el primer argumento, y se puede especificar la función de activación utilizando el argumento **activation**. 

Vamos a utilizar la función ReLU en las primeras dos capas y la función sigmoide en la capa de salida, para garantizar que la red devuelve un valor entre 0 y 1, fácilmente mapeable a una probabilidad de pertenecer a alguna de las 2 clases.

La arquitectura de la red se completa al agregar en cada capa:
- El modelo espera filas de datos con 8 variables (*input_dim=8*).
- La primera capa utiliza 12 nodos y utiliza la función ReLU.
- La segunda capa oculta tiene 8 nodos y utiliza la función ReLU.
- La capa de salida tiene un nodo y utiliza la función sigmoide.

In [3]:
# define the keras model
model = Sequential()
model.add(Dense(12, input_dim=8, activation='relu'))
model.add(Dense(8, activation='relu'))
model.add(Dense(1, activation='sigmoid'))

**Nota:** lo más confuso aquí es que la forma de la entrada al modelo se define con un argumento en la primera capa oculta. Esto significa que la línea de código que agrega la primera capa densa está haciendo 2 cosas: define la capa de entrada y la primera capa oculta.

## 3. Compile Keras Model

Ahora que el modelo está definido, se puede *compilar*.

La compilación del modelo utiliza librerías numéricas eficientes (llamadas el *backend*) como **Theano** o **TensorFlow**. El *backend* automáticamente elige la mejor manera de representar la red para el entrenamiento y las predicciones en el hardware disponible, como CPU, GPU o distribuido. 

Al compilar, se debe especificar la *loss function* a usar para evaluar el conjunto de pesos, el **optimizer** es utilizado para buscar a través de los diferentes pesos de la red y cualquier otra métrica opcional que se desee recolectar y reportar durante el entrenamiento.

En este caso, vamos a utilizar **cross entropy** como la *loss function*. Esta *loss* es para problemas de clasificación binaria y está definida en Keras como **binary_crossentropy**.

Vamos a definir el **optimizer** como el algoritmo estocástico y eficiente gradiente del descenso **adam**. Esta es una versión popular del algoritmo porque se ajusta automáticamente y ofrece buenos resultados para una gran variedad de problemas. 

Finalmente, puesto que es un problema de clasificación, vamos a recolectar y reportar la precisión en la clasificación, definida mediante el argumento **metrics**. 

In [4]:
# compile the keras model
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

## 4. Fit Keras Model

Ahora, se puede ejecutar el modelo sobre los datos.

Se puede entrenar o *fit* el modelo sobre los datos cargados mediante la función **fit()**. El entrenamiento ocurre durante *epochs* y cada *epoch* está dividida en uno o más *batches*.

> **Epoch:** one pass through all of the rows in the training dataset.

> **Batch:** one or more samples considered by the model within an epoch before weights are updated.

El proceso de entrenamiento se ejecutará por un número fijo de iteraciones a través del *dataset*, que se especifica mediante el argumento **epoch**. También, se deben especificar el número de filas en el *dataset* que se considerarán antes de actualizar los pesos del modelo entre cada *epoch*, mediante el argumento **batch_size**. 

Estas configuraciones, por lo general, pueden elegirse mediante prueba y error. El modelo siempre tendrá algún error, pero el tamaño del error se estabilizará después de algún punto para la configuración dada. Esto se llama *model convergence*.

El siguiente código es el trabajo que ocurre en el CPU o GPU.

In [5]:
# fit the keras model on the dataset
model.fit(X, y, epochs=150, batch_size=10)

Epoch 1/150
Epoch 2/150
Epoch 3/150
Epoch 4/150
Epoch 5/150
Epoch 6/150
Epoch 7/150
Epoch 8/150
Epoch 9/150
Epoch 10/150
Epoch 11/150
Epoch 12/150
Epoch 13/150
Epoch 14/150
Epoch 15/150
Epoch 16/150
Epoch 17/150
Epoch 18/150
Epoch 19/150
Epoch 20/150
Epoch 21/150
Epoch 22/150
Epoch 23/150
Epoch 24/150
Epoch 25/150
Epoch 26/150
Epoch 27/150
Epoch 28/150
Epoch 29/150
Epoch 30/150
Epoch 31/150
Epoch 32/150
Epoch 33/150
Epoch 34/150
Epoch 35/150
Epoch 36/150
Epoch 37/150
Epoch 38/150
Epoch 39/150
Epoch 40/150
Epoch 41/150
Epoch 42/150
Epoch 43/150
Epoch 44/150
Epoch 45/150
Epoch 46/150
Epoch 47/150
Epoch 48/150
Epoch 49/150
Epoch 50/150
Epoch 51/150
Epoch 52/150
Epoch 53/150
Epoch 54/150
Epoch 55/150
Epoch 56/150
Epoch 57/150
Epoch 58/150
Epoch 59/150
Epoch 60/150
Epoch 61/150
Epoch 62/150
Epoch 63/150
Epoch 64/150
Epoch 65/150
Epoch 66/150
Epoch 67/150
Epoch 68/150
Epoch 69/150
Epoch 70/150
Epoch 71/150
Epoch 72/150
Epoch 73/150
Epoch 74/150
Epoch 75/150
Epoch 76/150
Epoch 77/150
Epoch 78

<keras.callbacks.History at 0x7f647dc06810>

## 5. Evaluate Keras Model