<a href="https://colab.research.google.com/github/concongo/MNIST-keras-deeplearning/blob/master/cuaderno3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Deep Learning

## Perceptrón multicapa

### Ejercicio obligatorio: Perceptrón multicapa con una capa Dense

[Keras](https://keras.io/) es una librería Python de alto nivel para trabajar con redes neuronales artificiales. Para ello utiliza paquetes de cálculo numérico y simbólico como Theano, TensorFlow o CNTK, lo que evita al usuario tener que programar los algoritmos básicos en lenguajes de bajo nivel como C, C++ o CUDA. Definir una red neuronal básica en Keras es así de sencillo:

In [1]:
from keras.layers import Dense, Activation
from keras.models import Sequential

model = Sequential([
    Dense(32, activation='relu', input_shape=(784,)),
    Dense(10, activation='softmax')
])

Using TensorFlow backend.


A diferencia de Scikit-learn, esta es una librería específica para redes neuronales, pero también incluye algunas utilidades básicas para cargar datos como el dataset de [MNIST](http://yann.lecun.com/exdb/mnist/). Las imágenes de MNIST son de dígitos (de 0 a 9) manuscritos, en escala de grises (valores de 0 a 255) y de 28x28 (784) píxeles. El problema consiste en clasificar las imágenes en cada una de las 10 clases:

In [0]:
from keras.datasets import mnist
from keras.utils import to_categorical

(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train = x_train.reshape(60000, 784) / 255
x_test = x_test.reshape(10000, 784) / 255
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
y_train = to_categorical(y_train, num_classes=10)
y_test = to_categorical(y_test, num_classes=10)

Entrenar la red neuronal con los datos de train de MNIST y calcular las predicciones es también fácil:

In [4]:
from keras.optimizers import SGD

model.compile(loss='categorical_crossentropy',
              optimizer=SGD(),
              metrics=['accuracy'])

history = model.fit(x_train, y_train, batch_size=10, epochs=10,
                    verbose=1, validation_split=0.1)

score = model.evaluate(x_test, y_test, verbose=0)
print('Test loss:', score[0])
print('Test accuracy:', score[1])

Train on 54000 samples, validate on 6000 samples
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Test loss: 0.1328852920230478
Test accuracy: 0.9625999927520752


La accuracy en test no está mal, pero es muy mejorable. Prueba a crear una red neuronal con alguna capa densa más, entrénala durante más épocas y comprueba su accuracy en test:

## Red convolucional

### Ejercicio obligatorio: red convolucional con una capa Conv2D y una capa Dense

Como ya vimos en la teoría, las redes neuronales con capas convolucionales son especialmente potentes para procesamiento de imágenes. Estas capas se suelen colocar a la entrada de la red, seguidas de capas densas justo antes de la salida. Para poder aprovechar estas capas es necesario dejar las imágenes en su forma original 28x28:

In [0]:
from keras.datasets import mnist
from keras.utils import to_categorical

(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train = x_train.reshape(60000, 28, 28, 1) / 255
x_test = x_test.reshape(10000, 28, 28, 1) / 255
x_train = x_train.astype('float32')
x_test = x_test.astype('float32')
y_train = to_categorical(y_train, num_classes=10)
y_test = to_categorical(y_test, num_classes=10)

Intenta crear una red neuronal con una capa [Conv2D](https://keras.io/layers/convolutional/#conv2d
) y una capa [Dense](https://keras.io/layers/core/#dense
) y repite el experimento anterior. Una indicación: entre la última capa convolucional y la primera densa debes usar una capa [Flatten](https://keras.io/layers/core/#flatten
):

### Ejercicio opcional: red convolucional avanzada

Todavía es posible hacerlo mejor. Intenta entrenar y hacer el scoring con una red neuronal más compleja, intercalando varias capas convolucionales y de pooling (pista: un buen modelo es la red LeNet-5). Puedes probar también otros métodos de optimización (Adam, RMSProp, etc.), regularizaciones (L1, L2, Dropout). Intenta conseguir el mejor resultado posible: