# Crea tu Primera Red Neural con Keras Paso a Paso
## 1. Datos de carga de la Red Neuronal

Siempre que trabajemos con **algoritmos de machine learning** que utilicen un proceso estocástico (por ejemplo, números aleatorios), es una buena idea establecer la semilla del número aleatorio.

Esto es para que pueda ejecutar el mismo código una y otra vez y obtener el mismo resultado. Esto es útil si necesita demostrar un resultado, comparar algoritmos usando la misma fuente de aleatoriedad o depurar una parte de su código.

Puede inicializar el generador de números aleatorios con cualquier semilla que desee, por ejemplo:

In [1]:
# Crea tu primer MLP en Keras
from keras.models import Sequential
from keras.layers import Dense
import numpy
# Fija las semillas aleatorias para la reproducibilidad
numpy.random.seed(7)

Ahora podemos cargar nuestros datos. En este tutorial, vamos a utilizar el conjunto de datos sobre el inicio de la diabetes en los indígenas Pima.  Ahora puede cargar el archivo directamente usando la función loadtxt() de NumPy. Hay ocho variables de entrada y una variable de salida (la última columna). Una vez cargado podemos dividir el conjunto de datos en variables de entrada (X) y la variable de clase de salida (Y).

In [3]:
# carga los datos
dataset = numpy.loadtxt("Data/pima-indians-diabetes.csv", delimiter=",")
# dividido en variables de entrada (X) y salida (Y)
X = dataset[:,0:8]
Y = dataset[:,8]

In [None]:
#print(dataset[0:10,:])
#print(X[0:10,:])
#print(Y)

Hemos inicializado nuestro generador de números aleatorios para asegurarnos de que nuestros resultados sean reproducibles y cargamos nuestros datos. Ahora estamos listos para definir nuestro modelo de red neuronal.

Tenga en cuenta que el conjunto de datos tiene 9 columnas y el rango 0:8 seleccionará las columnas de 0 a 7, deteniéndose antes del índice 8 (ya que éste es el resultado final, el cual es conocido).

## 2. Definir el modelo de la Red Neuronal
Los modelos en Keras se definen como una secuencia de capas. Creamos un modelo secuencial y añadimos capas una a una hasta que estamos satisfechos con nuestra topología de red. Lo primero que hay que hacer es asegurarse de que la capa de entrada tiene el número correcto de entradas. Esto se puede especificar al crear la primera capa con el argumento input_dim y establecerlo en 8 para las 8 variables de entrada.

**¿Cómo sabemos el número de capas y sus tipos?**
Esta es una pregunta muy difícil. Hay estructuras de redes expertas que podemos utilizar y a menudo la mejor estructura de red se encuentra a través de un proceso de experimentación de ensayo y error. Por lo general, se necesita una red lo suficientemente grande para capturar la estructura del problema.

En este ejemplo, utilizaremos una estructura de red conectada con tres capas.

Las capas completamente conectadas se densifican utilizando la clase **Dense**. Podemos especificar el número de neuronas en la capa como el primer argumento y especificar la función de activación usando el argumento de activación. Usaremos la **función de activación del rectificador (relu)** en las dos primeras capas y la **función de activación sigmoide** en la capa de salida. Antes las funciones de activación sigmoide y tanh eran preferidas para todas las capas. Hoy en día, se observa un mejor rendimiento utilizando la función de activación del rectificador. Utilizamos una función de activación sigmoide en la capa de salida para asegurarnos de que nuestra salida de red está entre 0 y 1 y es fácil de mapear a cualquier probabilidad de clase 1 o encajar en una clase dura de cualquiera de las dos clases con un umbral por defecto de 0,5. Unimos todo sumando cada capa. La primera capa oculta tiene 12 neuronas y espera 8 variables de entrada (p. ej. entrada dim=8). La segunda capa oculta tiene 8 neuronas y finalmente la capa de salida que tiene 1 neurona para predecir la clase (inicio de diabetes o no).

In [4]:
# crea el modelo
model = Sequential()
model.add(Dense(12, input_dim=8, activation='relu'))
model.add(Dense(8, activation='relu'))
model.add(Dense(1, activation='sigmoid'))

Aquí podemos ver la estructura de la red neuronal:

Capa visible (8 entradas)>>Capa oculta (12 neuronas)>>Capa oculta (8 neuronas)>>Capa de salida (1)

In [5]:
model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 12)                108       
_________________________________________________________________
dense_1 (Dense)              (None, 8)                 104       
_________________________________________________________________
dense_2 (Dense)              (None, 1)                 9         
Total params: 221
Trainable params: 221
Non-trainable params: 0
_________________________________________________________________


## 3. Modelo de compilación de la Red Neuronal
Ahora que el modelo está definido, podemos compilarlo.

La compilación del modelo utiliza las eficientes librerías numéricas de backend como Theano o TensorFlow. El backend elige automáticamente la mejor manera de representar la red para entrenar y hacer predicciones para que se ejecuten en su hardware, como CPU o GPU o incluso distribuidas.

Al compilar, debemos especificar algunas propiedades adicionales necesarias para la formación de la red. Recuerde que entrenar una red significa encontrar el mejor conjunto de pesos para hacer predicciones para este problema.

Debemos especificar la función de pérdida a utilizar para evaluar un conjunto de pesos, el optimizador utilizado para buscar a través de diferentes pesos para la red y cualquier métrica opcional que nos gustaría recopilar y reportar durante el entrenamiento.

En este caso, utilizaremos la **pérdida logarítmica**, que para un problema de clasificación binaria se define en Keras como “binary_crossentropy”. También utilizaremos el algoritmo de **descenso de gradiente eficiente “adam”** por su alta eficiencia en estos problemas.

Finalmente, debido a que es un problema de clasificación, recopilaremos y reportaremos la exactitud de la clasificación como la métrica.

In [6]:
# Compila el modelo
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

## 4. Modelo de ajuste de la Red Neuronal
Hemos definido nuestro modelo y lo hemos compilado listo para un cálculo eficiente. Ahora es el momento de ejecutar el modelo sobre algunos datos. Podemos entrenar o ajustar nuestro modelo a los datos cargados llamando a la función **fit()** en el modelo.

El proceso de entrenamiento se ejecutará para un número fijo de iteraciones denominado **epochs o épocas**. También podemos establecer el número de instancias que se evalúan antes de que se realice una actualización de peso en la red llamada **batch_size** y establecerlo mediante el argumento **batch_size**. Para este problema utilizaremos un pequeño número de **epochs (150)** y un **batch_size relativamente pequeño (10)**. Una vez más, estos pueden ser elegidos experimentalmente por ensayo y error.

In [7]:
# Ajusta el modelo
model.fit(X, Y, epochs=150, batch_size=10)

Epoch 1/150
Epoch 2/150
Epoch 3/150
Epoch 4/150
Epoch 5/150
Epoch 6/150
Epoch 7/150
Epoch 8/150
Epoch 9/150
Epoch 10/150
Epoch 11/150
Epoch 12/150
Epoch 13/150
Epoch 14/150
Epoch 15/150
Epoch 16/150
Epoch 17/150
Epoch 18/150
Epoch 19/150
Epoch 20/150
Epoch 21/150
Epoch 22/150
Epoch 23/150
Epoch 24/150
Epoch 25/150
Epoch 26/150
Epoch 27/150
Epoch 28/150
Epoch 29/150
Epoch 30/150
Epoch 31/150
Epoch 32/150
Epoch 33/150
Epoch 34/150
Epoch 35/150
Epoch 36/150
Epoch 37/150
Epoch 38/150
Epoch 39/150
Epoch 40/150
Epoch 41/150
Epoch 42/150
Epoch 43/150
Epoch 44/150
Epoch 45/150
Epoch 46/150
Epoch 47/150
Epoch 48/150
Epoch 49/150
Epoch 50/150
Epoch 51/150
Epoch 52/150
Epoch 53/150
Epoch 54/150
Epoch 55/150
Epoch 56/150
Epoch 57/150
Epoch 58/150
Epoch 59/150
Epoch 60/150
Epoch 61/150
Epoch 62/150
Epoch 63/150
Epoch 64/150
Epoch 65/150
Epoch 66/150
Epoch 67/150
Epoch 68/150
Epoch 69/150
Epoch 70/150
Epoch 71/150
Epoch 72/150
Epoch 73/150
Epoch 74/150
Epoch 75/150
Epoch 76/150
Epoch 77/150
Epoch 78

<keras.callbacks.History at 0x7f3010383610>

Aquí es donde se realiza el trabajo en la CPU o GPU pero no se necesita ninguna GPU para este ejemplo.

## 5. Evaluar el modelo de la Red Neuronal
Hemos entrenado nuestra red neuronal en todo el conjunto de datos y podemos evaluar el rendimiento de la red en el mismo conjunto de datos.

Esto sólo nos dará una idea de lo bien que hemos modelado el conjunto de datos, pero no nos dará una idea de lo bien que el algoritmo podría funcionar con los nuevos datos. Hemos hecho esto por simplicidad, pero lo ideal sería que separara sus datos en conjuntos de datos de entreno y de prueba para la formación y evaluación de su modelo. Resaltamos esta frase ya que es importante:

**lo ideal sería que separara sus datos en conjuntos de datos de entreno y de prueba para la formación y evaluación de su modelo.**

Usted puede evaluar su modelo en su conjunto de datos de entrenamiento usando la función evaluate() y pasarle la misma entrada y salida usada para entrenar el modelo.

Esto generará una predicción para cada par de entrada y salida y recogerá las puntuaciones, incluyendo la pérdida media y cualquier métrica que haya configurado, como la precisión.

In [8]:
# evalua el modelo
scores = model.evaluate(X, Y)
print("\n%s: %.2f%%" % (model.metrics_names[1], scores[1]*100))


accuracy: 77.60%


Al ejecutar este ejemplo, debería ver un mensaje para cada una de los 150 épocas que imprimen la pérdida y la precisión de cada uno, seguido de la evaluación final del modelo entrenado en el conjunto de datos de entrenamiento.

Tenga en cuenta que la habilidad de su modelo puede variar.

Las redes neuronales son un algoritmo estocástico, lo que significa que el mismo algoritmo con los mismos datos puede entrenar un modelo diferente con habilidades diferentes. Esto es una característica, no un error.

## 7. Hacer predicciones
La pregunta número 1 que hacer es:

Después de entrenar a mi modelo, ¿cómo puedo usarlo para hacer predicciones sobre nuevos datos?

Podemos adaptar el ejemplo anterior y usarlo para generar predicciones sobre el conjunto de datos de entrenamiento, pretendiendo que es un nuevo conjunto de datos que no hemos visto antes.

Hacer predicciones es tan fácil como llamar a model.predict(). Estamos utilizando una función de activación sigmoide en la capa de salida, por lo que las predicciones estarán en el rango entre 0 y 1. Podemos convertirlas fácilmente en una predicción binaria nítida para esta tarea de clasificación redondeándolas.

El ejemplo completo que hace predicciones para cada registro en los datos de entrenamiento se enumeran a continuación.

In [9]:
# calcula las predicciones
predictions = model.predict(X)
# redondeamos las predicciones
rounded = [round(x[0]) for x in predictions]
print(rounded)

[1, 0, 1, 0, 1, 0, 0, 1, 1, 0, 0, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 1, 1, 0, 1, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 1, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 1, 0, 1, 1, 1, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 1, 1, 0, 1, 1, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0, 1, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 1, 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 1, 0, 0, 1, 1, 0, 0, 1, 0, 1, 

Al ejecutar este ejemplo modificado ahora se imprimen las predicciones para cada patrón de entrada. Podríamos usar estas predicciones directamente en nuestra aplicación si fuera necesario. 

Estos 1 o 0 que han salido por consola definen si el usuario tiene diabetes o no y lo podemos comparar con la última columna que tenemos del excel para ver si nuestra predicción es buena.
