# Clasiﬁcador de números escritos a mano:

### Imágenes MNIST:

In [1]:
#Importamos la librería numpy de python como np:
import numpy as np  
#Se inicializa una semilla aleatoria constante para asegurarnos que la comparación de los modelos es consistente
np.random.seed(0)  #for reproducibility            
#Se importan todas las librerias necesarias de Keras:
from keras.datasets import mnist #Dataset de MNIST
#Y_train vector de 60000 elementos, con valores del 0 al 9
#Y_test vector de 10000 elementos, con valores del 0 al 9
(X_train, Y_train), (X_test, Y_test) = mnist.load_data() #Se almacenan las imágenes en variables
from keras.models import Sequential 
from keras.layers import Dense, Activation
from keras.layers import Convolution2D, MaxPooling2D
from keras.layers import Dropout, Flatten
from keras.utils import np_utils

Using TensorFlow backend.


In [2]:
n_pixels = X_train.shape[1] * X_train.shape[2] #X_train.shape = (60000, 28, 28)
#Se transorma X_train en una matriz 60000x28x28x1
X_train = X_train.reshape(X_train.shape[0], X_train.shape[1], X_train.shape[2], 1).astype('float32') 
#Se transorma X_test en una matriz 10000x28x28x1
X_test = X_test.reshape(X_test.shape[0], X_test.shape[1], X_test.shape[2], 1).astype('float32')
#Normalizamos el conjunto de datos entre 0 y 1:
X_train = X_train / 255 
X_test = X_test / 255
###Codificamos los vectores en matrices binarias
#Con to_categorical se transforma en una matriz con las mismas columnas que clases. 
Y_train = np_utils.to_categorical(Y_train) 
Y_test = np_utils.to_categorical(Y_test) 
num_classes = Y_test.shape[1] #10 tipos de clases, números del 0 al 9
#Y_test.shape = (10000, 10), Matriz 10000 fil x 10 col(=clases)

### Modelo de CNN:

Se va a añadir respecto al modelo inicial una capa convolucional más.

In [3]:
def CNN(): 
    model = Sequential() #Se crea un modelo secuencial, capa tras capa 
    #Capa Conv1:
    model.add(Convolution2D(32, 5, 5, init='glorot_uniform', border_mode='valid', input_shape=(28, 28, 1), activation='relu')) 
    #Capa Conv2:
    model.add(Convolution2D(32, 5, 5, init='glorot_uniform', border_mode='valid', activation='relu')) 
    #Capa Pooling:
    model.add(MaxPooling2D(pool_size=(2, 2))) 
    #Capa Dropout:
    model.add(Dropout(0.25)) 
    #Capa Flatten:
    model.add(Flatten()) 
    #Capa Fully-conected:
    model.add(Dense(128, activation='relu')) 
    #Capa de salida:
    model.add(Dense(num_classes, activation='softmax')) #Softmax pasar a probabilidad (entre 0 y 1) a las neuronas de salida
    #Compile calcula la función gradiente y prepara el modelo para su entrenamiento
    #Se define el tipo de pérdida y el optimizador
    model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy']) 
    return model


### Entrenamiento de la Red CNN:

In [4]:
model = CNN()
model.fit(X_train, Y_train, validation_data=(X_test, Y_test), nb_epoch=10, batch_size=200, verbose=2) 

Instructions for updating:
Colocations handled automatically by placer.
Instructions for updating:
Please use `rate` instead of `keep_prob`. Rate should be set to `rate = 1 - keep_prob`.


  after removing the cwd from sys.path.
  


Instructions for updating:
Use tf.cast instead.


  


Train on 60000 samples, validate on 10000 samples
Epoch 1/10
 - 178s - loss: 0.1983 - acc: 0.9428 - val_loss: 0.0458 - val_acc: 0.9857
Epoch 2/10
 - 177s - loss: 0.0555 - acc: 0.9831 - val_loss: 0.0339 - val_acc: 0.9893
Epoch 3/10
 - 177s - loss: 0.0382 - acc: 0.9886 - val_loss: 0.0328 - val_acc: 0.9889
Epoch 4/10
 - 177s - loss: 0.0304 - acc: 0.9903 - val_loss: 0.0328 - val_acc: 0.9887
Epoch 5/10
 - 177s - loss: 0.0252 - acc: 0.9922 - val_loss: 0.0272 - val_acc: 0.9910
Epoch 6/10
 - 178s - loss: 0.0198 - acc: 0.9937 - val_loss: 0.0259 - val_acc: 0.9919
Epoch 7/10
 - 177s - loss: 0.0165 - acc: 0.9944 - val_loss: 0.0301 - val_acc: 0.9909
Epoch 8/10
 - 178s - loss: 0.0150 - acc: 0.9950 - val_loss: 0.0355 - val_acc: 0.9903
Epoch 9/10
 - 179s - loss: 0.0126 - acc: 0.9959 - val_loss: 0.0367 - val_acc: 0.9908
Epoch 10/10
 - 177s - loss: 0.0116 - acc: 0.9963 - val_loss: 0.0341 - val_acc: 0.9920


<keras.callbacks.History at 0x1c1ef0a4e10>

### Cálculo de la función pérdida:

In [5]:
score = model.evaluate(X_test, Y_test, verbose=1)
print('Test accuracy:', score[1])

Test accuracy: 0.992


En el modelo inicial se obtenía un 98,97%. Se ha mejorado el modelo en un 0,23%.

### Guardar el modelo entrenado:

Para no tener que entrenar la red neuronal creada cada vez que se quiera usar, se crea un archivo donde se guarda el modelo creado, y otro donde se guardan los pesos obtenidos para las neuronas después del entranmiento.

In [17]:
import os 
dir = './cnn/'
if not os.path.exists(dir):
    os.mkdir(dir)
model.save('./cnn/modelo_mnist.h5')#Se guarda la estructura de la cnn
model.save_weights('./cnn/pesos_mnist.h5')#Se guardan los pesos de la cnn