# **Introducción a Keras**
------

Keras es una librería Python especializada en redes neuronales artificiales, tanto clásicas como más modernas (redes convolucionales, redes recurrentes, etc.). Es algo más complicada de utilizar que Scikit-learn al tener una API de más bajo nivel, que requiere que el usuario defina la estructura del modelo programáticamente.

Se trata de una librería Python de alto nivel para trabajar con redes neuronales artificiales. Para ello utiliza paquetes de cálculo numérico y simbólico como Theano, TensorFlow o CNTK, lo que evita al usuario tener que programar los algoritmos básicos en lenguajes de bajo nivel como C, C++ o CUDA.

Primero preparamos los datos:

In [8]:
from keras.datasets.boston_housing import load_data
(X, y), (X_test, y_test) = load_data()

In [3]:
X.shape

(404, 13)

In [4]:
y.shape

(404,)

In [5]:
X_test.shape

(102, 13)

In [6]:
y_test.shape

(102,)

Definir una red neuronal básica en Keras es sencillo. Lo primero es elegir el tipo de modelo a utilizar. La clase ``Sequential`` es la más sencilla y permite hacer redes neuronales feed-forward por capas con una única entrada y una única salida. La clase ``Model`` es más compleja y permite diseñar arquitecturas con varias entradas y salidas, bifurcaciones internas, etc.
Para nuestros objetivos es suficiente con utilizar la clase ``Sequential``. Un MLP se define así:

In [11]:
from keras.layers import Dense, Activation
from keras.models import Sequential

input_dim = X.shape[1:]
output_dim = y.shape[1:] if len(y.shape) > 1 else 1

model = Sequential([
    Dense(32, activation='relu', input_shape=input_dim),
    Dense(output_dim, activation='linear')
])

Una vez definido, y a diferencia de lo que vimos en sklearn, un modelo keras debe ser compilado. En este paso se determinan el algoritmo de entrenamiento y los meta-parámetros relativos a este.

In [12]:
from keras.optimizers import SGD

model.compile(loss='mean_squared_error', optimizer=SGD(), metrics=['mse', 'mae'])

Ahora el modelo se puede entrenar y evaluar:

In [13]:
history = model.fit(X, y, batch_size=100, epochs=100, verbose=1, validation_split=0.1)

score = model.evaluate(X_test, y_test, verbose=0)
print('Test mse:', score[0])
print('Test mae:', score[1])

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

El resultado no es muy bueno, por varios motivos:

* Los datos no se han estandarizado
* El dataset tiene varios outliers concentrados hacia el final y sería recomendable hacer un particionado train-test aleatorio

Sería conveniente poder aprovechar las utilidades de sklearn para resolver estos problemas. En versiones antiguas de keras existía un wrapper para hacerlo compatible con sklearn, pero ahora es necesario utilizar librerías externas para ello.