# Ejemplo de la sección 1 del capítulo 2 libro "deep learning with python" de François Chollet

In [47]:
from keras.datasets import mnist

Datos de entrenamiento y test

In [48]:
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

Arquitectura de la red

In [49]:
from keras import models
from keras import layers

network = models.Sequential()
network.add(layers.Dense(512, activation="relu", input_shape=(28*28,)))
network.add(layers.Dense(10, activation="softmax"))

## Compilación de la red
Aquí se define qué mecanismo se usará para ajustar los pesos (optimizer),  la función de error que se usará para minimizar y calcular el gradiente descendente, y la métrica que se usará para monitorizar el entrenamiento y el testeo (por ejemplo porcentaje de casos correctamente clasificados)

In [50]:
network.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])

## Preprocesamiento de los datos de entrada de entrenamiento y test

Los datos de entrada tienen una "forma" (shape) de (60000,28,28) para los de entrenamiento y de (10000, 28, 28) los de test, es decir hay 60000 datos de entrenamiento y 10000 de test, cada uno de ellos consistente en un tensor de 28 x 28 que representa al número escrito a mano. Los elementos de los tensores de entrada están en en rango [0, 255] y representan la intensidad de cada pixel.

La red que acabamos de crear necesita unos datos de entrada con una forma (28 * 28,) y con valores comprendidos en el rango [0, 1].

En este paso convertimos los datos de entrenamiento y test para adaptarlos a este requisito


In [51]:
train_images = train_images.reshape(60000, 28*28)
train_images = train_images.astype('float32')/255

test_images = test_images.reshape(10000, 28*28)
test_images = test_images.astype('float32')/255


## Preprocesamiento de los datos de salida (labels) de entrenamiento y test
Los datos de salida se correponden con los números representados por cada dato de entrada, por ello están en el rango [0,9], y tienen una forma (60000,) para los de entrenamiento y (10000,) para los de test. 

La red que acabamos de construir requiere como salida tensores de forma (10,), es decir, debemos convertir los datos de entrenamiento de salida de (60000,) a (60000,10) y los de test de (10000, ) a (10000,10). La forma de convertir un valor escalar (categoría) a un vector de 10 dimensiones es mediante categorización de tipo one hot encoding. Esto se hace con la función to_categorical(). Por ejemplo el valor 3 se transformaría en [0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0].

In [52]:
from keras.utils import to_categorical
train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

## Entrenamiento de la red

In [53]:
network.fit(train_images, train_labels, epochs=5, batch_size=128)

Instructions for updating:
Use tf.cast instead.
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7fcef8d8f0b8>

## Test de los resultados

In [54]:
test_loss, test_accuracy = network.evaluate(test_images, test_labels)
print(test_loss, test_accuracy)

0.07268736336533911 0.9788
