# Clasificación de sonido ambiente 
---
# Modelado y Evaluacion con Red Neuronal Multicapa

Precargar datos del notebook 2

In [2]:
# retrieve the preprocessed data from previous notebook

%store -r x_train 
%store -r x_test 
%store -r y_train 
%store -r y_test 
%store -r yy 
%store -r le

## Construir el modelo
Construimos una red neuronal meidante un perceptrón multicapa (MLP) usando *Keras* y un backend de *Tensorflow*.

Se plantea un modelo secuencial para que podamos construir el modelo capa por capa.

Se plantea una arquitectura de modelo simple, copuesta por:
- *Capa de entrada con 40 nodos*, la que nuestra funcion MFCC de extración de caracteristicas nos devuelve un conjunto de datos de 1x40

- *Capas ocultas de 256 nodos*, estas capas tendrán una capa densa con una función de activación de tipo "ReLu", (se ha demostrado que esta función de activación funciona bien en redes neuronales). También destacar que aplicaremos un valor de abandono del 50% en nuestras dos primeras capas. Esto excluirá al azar los nodos de cada ciclo de actualización, lo que a su vez da como resultado una red que es capaz de respondr mejor a la generalización y es menos probable se produzca sobreajuste los datos de entrenamiento.

- *Capa de salida de 10 nodos*, que coinciden con el número de clasificaciones posibles. La activación es para nuestra capa de salida es softmax. Softmax hace que la salida sume 1, por lo que la salida puede interpretarse como probabilidades. El modelo hará su predicción según la opción que tenga la mayor probabilidad.

In [3]:
import numpy as np
from keras.models import Sequential
from keras.layers import Dense, Dropout, Activation, Flatten
from keras.layers import Convolution2D, MaxPooling2D
from keras.optimizers import Adam
from keras.utils import np_utils
from sklearn import metrics 

num_labels = yy.shape[1]
filter_size = 2

# Construct model 
model = Sequential()

model.add(Dense(256, input_shape=(40,)))
model.add(Activation('relu'))
model.add(Dropout(0.5))

model.add(Dense(256))
model.add(Activation('relu'))
model.add(Dropout(0.5))

model.add(Dense(num_labels))
model.add(Activation('softmax'))

Using TensorFlow backend.


## Compilar el modelo
Para compilar nuestro modelo, utilizaremos los siguientes tres parámetros:

* Función de pérdida: utilizaremos `categorical_crossentropy`. Esta es la opción más común para la clasificación. Una puntuación más baja indica que el modelo está funcionando mejor.

* Métricas: utilizaremos la métrica de `accuracy` que nos permitirá ver el puntaje de precisión en los datos de validación cuando entrenemos el modelo.

* Optimizador: aquí usaremos `adam`, que generalmente es un buen optimizador para muchos casos de uso.

In [5]:
# Compile the model
model.compile(loss='categorical_crossentropy', metrics=['accuracy'], optimizer='adam') 

In [6]:
# Display model architecture summary 
model.summary()

# Calculate pre-training accuracy 
score = model.evaluate(x_test, y_test, verbose=0)
accuracy = 100*score[1]

print("Pre-training accuracy: %.4f%%" % accuracy)

Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_1 (Dense)              (None, 256)               10496     
_________________________________________________________________
activation_1 (Activation)    (None, 256)               0         
_________________________________________________________________
dropout_1 (Dropout)          (None, 256)               0         
_________________________________________________________________
dense_2 (Dense)              (None, 256)               65792     
_________________________________________________________________
activation_2 (Activation)    (None, 256)               0         
_________________________________________________________________
dropout_2 (Dropout)          (None, 256)               0         
_________________________________________________________________
dense_3 (Dense)              (None, 10)               

## Entrenar el modelo

Se empieza probando con un número de epocas baja y se prueba hasta ver donde alcanza un valor asintotico donde por más que subamos las epocas no conseguimos que el modelo mejore significativamente.

Por otro el tamaño del bloje debe ser suficientemente bajo, ya que tener un tamaño de lote grande puede reducir la capacidad de generalización del modelo.

In [7]:
from keras.callbacks import ModelCheckpoint 
from datetime import datetime 

num_epochs = 100
num_batch_size = 32

checkpointer = ModelCheckpoint(filepath='saved_models/weights.best.basic_mlp.hdf5', 
                               verbose=1, save_best_only=True)
start = datetime.now()

model.fit(x_train, y_train, batch_size=num_batch_size, epochs=num_epochs, 
          validation_data=(x_test, y_test), callbacks=[checkpointer], verbose=1)


duration = datetime.now() - start
print("Training completed in time: ", duration)

Train on 32 samples, validate on 8 samples
Epoch 1/100

Epoch 00001: val_loss improved from inf to 19.44147, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 2/100

Epoch 00002: val_loss improved from 19.44147 to 17.43100, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 3/100

Epoch 00003: val_loss improved from 17.43100 to 16.33628, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 4/100

Epoch 00004: val_loss improved from 16.33628 to 15.97365, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 5/100

Epoch 00005: val_loss did not improve from 15.97365
Epoch 6/100

Epoch 00006: val_loss did not improve from 15.97365
Epoch 7/100

Epoch 00007: val_loss did not improve from 15.97365
Epoch 8/100

Epoch 00008: val_loss improved from 15.97365 to 15.51121, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 9/100

Epoch 00009: val_loss improved from 15.51121 to 14.31606, saving model to saved_models/weights.best.basic_mlp.hdf5


Epoch 00033: val_loss improved from 1.28189 to 1.04310, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 34/100

Epoch 00034: val_loss improved from 1.04310 to 0.78261, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 35/100

Epoch 00035: val_loss improved from 0.78261 to 0.63634, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 36/100

Epoch 00036: val_loss improved from 0.63634 to 0.48688, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 37/100

Epoch 00037: val_loss improved from 0.48688 to 0.34997, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 38/100

Epoch 00038: val_loss improved from 0.34997 to 0.26737, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 39/100

Epoch 00039: val_loss improved from 0.26737 to 0.22359, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 40/100

Epoch 00040: val_loss improved from 0.22359 to 0.16795, saving model to saved_models/weights.best.basic_mlp.hd

Epoch 70/100

Epoch 00070: val_loss improved from 0.01483 to 0.01058, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 71/100

Epoch 00071: val_loss improved from 0.01058 to 0.00760, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 72/100

Epoch 00072: val_loss improved from 0.00760 to 0.00609, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 73/100

Epoch 00073: val_loss improved from 0.00609 to 0.00511, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 74/100

Epoch 00074: val_loss improved from 0.00511 to 0.00448, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 75/100

Epoch 00075: val_loss improved from 0.00448 to 0.00404, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 76/100

Epoch 00076: val_loss improved from 0.00404 to 0.00372, saving model to saved_models/weights.best.basic_mlp.hdf5
Epoch 77/100

Epoch 00077: val_loss improved from 0.00372 to 0.00341, saving model to saved_models/weights.best

## Evaluar el modelo
Finalmente para determiar la precisión del modelo generado llamamos a la función evaluate y le pasamos los datos de test que hemos definido previamente.

In [9]:
# Evaluating the model on the testing set
score = model.evaluate(x_test, y_test, verbose=0)
print("Testing Accuracy: ", score[1])

Testing Accuracy:  1.0
