In [None]:
# Práctica de Deep Learning

In [2]:
from __future__ import print_function
import keras
from hyperopt import Trials, STATUS_OK, tpe
from hyperas import optim
from hyperas.distributions import choice, uniform, conditional

## Boston Housing Dataset

En este ejercicio vamos a intentar predecir la mediana del precio en un barrio de Boston (a mediados de los 70) a partir de una algunos datos sobre el barrio en la época, como la tasa de criminalidad, el número medio de habitaciones por vivienda en la zona, etc. 

Trabajaremos con el Boston Housing Dataset. Ya hemos utilizado este pequeño conjunto de datos en clase: solamente contamos con 404 instancias para entrenamiento y 102 para testing. Para cada instancia contamos con los siguientes 13 rasgos, acompañados de la siguiente descripción:

1. Per capita crime rate.
2. Proportion of residential land zoned for lots over 25,000 square feet.
3. Proportion of non-retail business acres per town.
4. Charles River dummy variable (= 1 if tract bounds river; 0 otherwise).
5. Nitric oxides concentration (parts per 10 million).
6. Average number of rooms per dwelling.
7. Proportion of owner-occupied units built prior to 1940.
8. Weighted distances to five Boston employment centres.
9. Index of accessibility to radial highways.
10. Full-value property-tax rate per $10,000.
11. Pupil-teacher ratio by town.
12. 1000 * (Bk - 0.63) ** 2 where Bk is the proportion of Black people by town.
13. % lower status of the population.

Este conjunto de datos ya viene empaquetado como parte del módulo `keras.datasets`. Tas un rápido examen, veremos que cada rasgo tiene un rango de valores diferente. Por eso los normalizaremos todos para que su media sea 0 y desviación estándar 1.

La variable target viene expresada en miles de dólares y los precios están típicamente entre 10 000 y 50 000 dólares (recordemos que los datos son del los años 70).

El siguiente código carga y preprocesa los datos.

In [3]:
from keras.datasets import boston_housing

def get_data():
    (X_train, Y_train), (X_test, Y_test) =  boston_housing.load_data()
    
    mean = X_train.mean(axis=0)
    X_train -= mean
    std = X_train.std(axis=0)
    X_train /= std

    X_test -= mean
    X_test /= std
    
    return X_train, Y_train, X_test, Y_test

## Ejercicio1: Regresión con una FFN (5 ptos.)

Para este problema de regresión, se pide implementar la función `build_model` para que defina y devuelva una FFN con 2 capas ocultas, con 32 neuronas en cada una de ellas. La función de activación en las capas ocultas será ReLU y la red incluirá Dropout con una tasa del 50%.

In [4]:
from keras.models import Sequential
from keras.layers.core import Dense
from keras.layers import Dropout

def build_model():
    
    # Construimos y compilamos el modelo
    model = Sequential()
    model.add(Dropout(0.5, input_shape=(13,)))
    model.add(Dense(32, activation='relu'))
    model.add(Dropout(0.5))
    model.add(Dense(32, activation='relu'))
    model.add(Dropout(0.5))
    model.add(Dense(1,))
    
    model.compile(loss='mean_squared_error', optimizer='adam')
    
    return model

El siguiente código entrena la red y evalúa los resultados sobre el conjunto de test.

In [4]:
num_epochs = 100
X_train, Y_train, X_test, Y_test = get_data()
model = build_model()
model.fit(X_train, Y_train,
      epochs=num_epochs, batch_size=1, verbose=1)
test_mse = model.evaluate(X_test, Y_test, verbose=1)
print("Mean Squared Error on test set:", test_mse)

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

## Ejercicio 2: Selección de hiperparámetros (5 ptos.)

<a href='http://hyperopt.github.io/hyperopt/'>Hyperopt</a> es una biblioteca Python para optimizar hiperparámetros de modelos de Aprendizaje Automático utilizando un algoritmo eficiente de optimización llamado Tree of Parzen Estimators.

<a href='http://maxpumperla.github.io/hyperas/'>Hyperas</a> es una biblioteca que hace todavía más fácil trabajar con Hyperopt y Keras. 

Se pide implementar la función `fit_and_eval_model` en la que crearemos el modelo, lo entrenaremos y lo evaluaremos sobre el conjunto de entrenamiento. Para definir el espacio de hiperparámetros en que Hyperas buscará los valores óptimos, al crear el modelo en lugar de utilizar un valor concreto para el hiperparámetro (por ejemplo, el número de neuronas en una capa) usaremos expresiones como `{{choice([128, 256, 512])}}`. En este caso los valores permitidos para el hiperparámetro serían 128, 256 ó 512.

El espacio de hiperparámetros que queremos definir es:

- Número de capas ocultas: 2 ó 3
- Número de neuronas en cada capa oculta: 32, 64 ó 128.
- Una distribución uniforme en el intervalo [0,1] para cada capa de Drop Out.
- Función de activación en las capas ocultas: relu, sigmoid o tanh.

Échale un vistazo a <a href='http://maxpumperla.github.io/hyperas/'>los ejemplos de la web de Hyperas</a> para que te sirvan de inspiración.

In [5]:
from keras.models import Sequential
from keras.layers.core import Dense, Dropout, Activation


def fit_and_eval_model(X_train, Y_train, X_test, Y_test):
    num_epochs = 1
    # Completar el codigo y ademas sustuir las 
    # 2 lineas siguientes para asignar valores a model y test_mse 
    model = Sequential()
    model.add(Dropout({{uniform(0, 1)}},input_shape=(13,)))
    model.add(Dense({{choice([32, 64, 128])}}))
    model.add(Activation({{choice(['relu', 'sigmoid', 'tanh'])}}))
    model.add(Dropout({{uniform(0, 1)}}))
    model.add(Dense({{choice([32, 64, 128])}}))
    model.add(Activation({{choice(['relu', 'sigmoid', 'tanh'])}}))
    model.add(Dropout({{uniform(0, 1)}}))
    
    if conditional({{choice(['four', 'five'])}}) == 'five':
        model.add(Dense({{choice([32, 64, 128])}}))
        model.add(Activation({{choice(['relu', 'sigmoid', 'tanh'])}}))
        model.add(Dropout({{uniform(0, 1)}}))
        
    model.add(Dense(1,))

    model.compile(loss='mean_squared_error', optimizer='adam')
    
    model.fit(X_train, Y_train, epochs=num_epochs, batch_size=1, verbose=1)
    
    test_mse = model.evaluate(X_test, Y_test, verbose=1)
    print("Mean Squared Error on test set:", test_mse)
    
    return {'loss': test_mse, 'status': STATUS_OK, 'model': model}

In [6]:
X_train, Y_train, X_test, Y_test = get_data()

best_run, best_model = optim.minimize(model=fit_and_eval_model,
                          data=get_data,
                          algo=tpe.suggest,
                          max_evals=10,
                          trials=Trials(),
                          notebook_name='Practica_Deep_Learning',
                          eval_space=True)

>>> Imports:
#coding=utf-8

from __future__ import print_function

try:
    import keras
except:
    pass

try:
    from hyperopt import Trials, STATUS_OK, tpe
except:
    pass

try:
    from hyperas import optim
except:
    pass

try:
    from hyperas.distributions import choice, uniform, conditional
except:
    pass

try:
    from keras.datasets import boston_housing
except:
    pass

try:
    from keras.models import Sequential
except:
    pass

try:
    from keras.layers.core import Dense
except:
    pass

try:
    from keras.layers import Dropout
except:
    pass

try:
    from keras.models import Sequential
except:
    pass

try:
    from keras.layers.core import Dense, Dropout, Activation
except:
    pass

>>> Hyperas search space:

def get_space():
    return {
        'Dropout': hp.uniform('Dropout', 0, 1),
        'Dense': hp.choice('Dense', [32, 64, 128]),
        'Activation': hp.choice('Activation', ['relu', 'sigmoid', 'tanh']),
        'Dropout_1': hp.uniform('Dropout_1',

In [7]:
best_run

{'Activation': 'relu',
 'Activation_1': 'relu',
 'Activation_2': 'sigmoid',
 'Dense': 32,
 'Dense_1': 64,
 'Dense_2': 32,
 'Dropout': 0.31116431424968705,
 'Dropout_1': 0.20670036025517124,
 'Dropout_2': 0.08078306361277332,
 'Dropout_3': 0.8231073400537193,
 'conditional': 'four'}

In [8]:
print("Evaluation of best performing model:")
print(best_model.evaluate(X_test, Y_test))

Evaluation of best performing model:
45.3039278517
