<a href="https://colab.research.google.com/github/cesern/redes-neuronales/blob/master/tensorflow_red_simple_cnn/tensorflow_red_simple-cnn.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<img src="https://github.com/cesern/redes-neuronales/blob/master/tensorflow_red_simple_cnn/imagenes/rn3.png?raw=1" width="200">
<img src="http://www.identidadbuho.uson.mx/assets/letragrama-rgb-150.jpg" width="200">

# [Curso de Redes Neuronales](https://curso-redes-neuronales-unison.github.io/Temario/)

# Una red neuronal multicapa simple usando TensorFlow


[**Julio Waissman Vilanova**](http://mat.uson.mx/~juliowaissman/), 2 de octubre de 2018.



En esta libreta se muestra el ejemplo básico para una red convolucional
aplicada al conjunto de datos [MNIST](http://yann.lecun.com/exdb/mnist/).

Esta libreta es una modificación para redes convolucionales del ejemplo de la red multicapa simple presentada anteriormente. De hecho está copiada la libreta y solo se hacen pequeños cambios.

In [0]:
import numpy as np
import tensorflow as tf

## 1. Cargar datos

Primero cargamos los archivos que se utilizan para el aprendizaje. Para otro tipo de problemas, es necesario hacer un proceso conocido como *Data Wrangling*, que normalmente se realiza con la ayuda de *Pandas*. 

In [2]:
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data/", one_hot=True)

Instructions for updating:
Please use alternatives such as official/mnist/dataset.py from tensorflow/models.
Instructions for updating:
Please write your own downloading logic.
Instructions for updating:
Please use urllib or similar directly.
Successfully downloaded train-images-idx3-ubyte.gz 9912422 bytes.
Instructions for updating:
Please use tf.data to implement this functionality.
Extracting /tmp/data/train-images-idx3-ubyte.gz
Successfully downloaded train-labels-idx1-ubyte.gz 28881 bytes.
Instructions for updating:
Please use tf.data to implement this functionality.
Extracting /tmp/data/train-labels-idx1-ubyte.gz
Instructions for updating:
Please use tf.one_hot on tensors.
Successfully downloaded t10k-images-idx3-ubyte.gz 1648877 bytes.
Extracting /tmp/data/t10k-images-idx3-ubyte.gz
Successfully downloaded t10k-labels-idx1-ubyte.gz 4542 bytes.
Extracting /tmp/data/t10k-labels-idx1-ubyte.gz
Instructions for updating:
Please use alternatives such as official/mnist/dataset.py from t

Para que un aprendizaje tenga sentido es necesario tener bien separado un conjunto de datos de aprendizaje y otro de prueba (en caso de grandes conjuntos de datos es la opción). Como vemos tanto las imágenes como las etiquetas están separados en archivos de datos y de aprendizaje.

El objeto `mnist` es un objeto tensorflow que contiene 3 objetos tipo tensorflow: *test*, *train* y *validation*, los cuales a su vez contienen *ndarrays* de *numpy*. La estructura es la misma para cada conjunto de datos. Veamos su estructura:


In [3]:
print("Tipo de images: {}".format(type(mnist.train.images)))
print("Tipo de epochs_completed: {}".format(type(mnist.train.epochs_completed)))
print("Tipo de labels: {}".format(type(mnist.train.labels)))
print("Tipo de next_batch: {}".format(type(mnist.train.next_batch)))
print("Tipo de num_examples: {}".format(type(mnist.train.num_examples)))

Tipo de images: <class 'numpy.ndarray'>
Tipo de epochs_completed: <class 'int'>
Tipo de labels: <class 'numpy.ndarray'>
Tipo de next_batch: <class 'method'>
Tipo de num_examples: <class 'int'>


Como generar el conjunto de datos para ser utilizado dentro de TensorFlow es objeto de otra libreta. Por el momento concentremonos en como hacer una red neuronal rápido y sin dolor.

Sin embargo, vamos a ver unos cuantos datos que nos pueden ser de útilidad para la construcción de la red neuronal.

In [4]:
print("Forma del ndarray con las imágenes: {}".format(mnist.train.images.shape))
print("Forma del ndarray con las etiquetas: {}".format(mnist.train.labels.shape))
print("-" * 79)
print("Número de imagenes de entrenamiento: {}".format(mnist.train.images.shape[0]))
print("Tamaño de las imagenes: {}".format(mnist.train.images.shape[1]))
print("Clases diferentes: {}".format(mnist.train.labels.shape[1]))


Forma del ndarray con las imágenes: (55000, 784)
Forma del ndarray con las etiquetas: (55000, 10)
-------------------------------------------------------------------------------
Número de imagenes de entrenamiento: 55000
Tamaño de las imagenes: 784
Clases diferentes: 10


## 2. Construcción de la red neuronal

Para hacer una red neuronal lo más genérica posible y que podamos reutilizar en otros proyectos, vamos a establecer los parámetros base independientemente de la inicialización de la red, independientemente de la forma en que construimos la red. 

Comencemos por establecer una función genérica que nos forme una red neuronal con dos capas convolucionales y una capa oculta densa posterior. No agrego más comentarios porque, con la experiencia de las libretas anteriores, la construcción de la red neuronal se explica sola.

In [0]:
def cnn_mnist(x, pesos, sesgos, dropout):
    """
    Genera una red neuronal de dos capas para usar en TensorFlow
    
    Parámetros
    ----------
    pesos: un diccionario con cuatro etiquetas: 'c1', 'c2', w1' y 'wo'
           en donde cada una es una tf.Variable conteniendo una 
           matriz con los pesos tanto de los filtros convolucionales 'c1' y'c2'
           como de las capas densas 'w1' y 'wo'
                  
    sesgos: un diccionario con cuatro etiquetas: 'b1', 'b2, 'b3' y 'bo'
            en donde cada una es una tf.Variable conteniendo un
            vector de dimensión [numero_de_neuronas_capa]
            
    dropout: Un flotante 0 <= dropout <= 1 con el porcentaje de dropout 
             en la capa densa oculta
                   
    Devuelve
    --------
    Un ops de tensorflow que calcula la salida de una red neuronal
    con dos capas convolucionales, una capa oculta, y activaciones RELU.
    
    """
    # Ajusta el vector de entrada de (-1, 784) que son los ejemplos que entran
    # a la red para reconocimiento y/o aprendizaje, a un tensor de dimensión
    # [-1, 28, 28, 1] (el último 1 implica que es una imagen BW, o una sola capa)
    x = tf.reshape(x, shape=[-1, 28, 28, 1])
       
    # Primera capa convolucional con activación ReLU y max_pool de 2X2
    capa_1 = tf.nn.conv2d(x, pesos['c1'], strides=[1, 1, 1, 1], padding='SAME')
    capa_1 = tf.nn.bias_add(capa_1, sesgos['b1'])
    capa_1 = tf.nn.relu(capa_1)
    capa_1m = tf.nn.max_pool(capa_1, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')
    
    # Segunda capa convolucional con activación ReLU
    capa_2 = tf.nn.conv2d(capa_1m, pesos['c2'], strides=[1, 1, 1, 1], padding='SAME')
    capa_2 = tf.nn.bias_add(capa_2, sesgos['b2'])
    capa_2 = tf.nn.relu(capa_2)
    capa_2m = tf.nn.max_pool(capa_2, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')

    # Desenrollamos las imágenes para poder aplicar capas densas
    capa_2desen = tf.reshape(capa_2m, [-1, pesos['w1'].get_shape().as_list()[0]])
    
    # Capa oculta densa con activación ReLU
    capa_3 = tf.matmul(capa_2desen, pesos['w1'])
    capa_3 = tf.add(capa_3, sesgos['b3'])
    capa_3 = tf.nn.relu(capa_3)
    
    # Se le agrega Dropout por la generalización
    capa_3 = tf.nn.dropout(capa_3, dropout)

    # Capa de salida con activación lineal
    # En Tensorflow la salida es siempre lineal, y luego se especifica
    # la función de salida a la hora de calcularla como vamos a ver 
    # más adelante
    capa_salida = tf.matmul(capa_3, pesos['wo']) 
    capa_salida = tf.add(capa_salida, sesgos['bo'])
    return capa_salida

Y ahora necesitamos poder generar los datos de entrada a la red neuronal de
alguna manera posible. Afortunadamente sabemos exactamente que necesitaos, así
que vamos a hacer una función que nos genere las variables de peso y sesgo.

Por el momento, y muy a la brava, solo vamos a generarlas con números aletorios con una 
distribución $\mathcal{N}(0, 1)$.

In [0]:
def inicializa_pesos(filtro1, filtro2, n1, n2, n3):
    """
    Genera un diccionario con pesos  
    para ser utilizado en la función red_neuronal_dos_capas_ocultas
    
    Parámetros
    ----------
    filtro1: (x, y) tupla con el tamaño del primer filtro convolucional

    filtro2: (x, y) tupla con el tamaño del segundo filtro convolucional

    n1: Número de imágenes generadas con el primer filtro
    
    n2: Número de imagenes generadas con el segundo filtro
    
    n3: Número de neuronas en la capa oculta

    Asumimos que es una red para MNIST, por lo que la entrada son imágenes de 28 x 28 x 1 (BW)
    y que tenemos 10 valores de salida diferentes
    
    Como hacemos maxpool de 2x2, las imagenes despues de la primer capa convolucional seran de 
    14 x 14, y las imágenes que salgan de la segunda capa convolucional serán de 7 x 7
    
    Devuelve
    --------
    Dos diccionarios, uno con los pesos por capa y otro con los sesgos por capa
    
    """
    pesos = {
        'c1': tf.Variable(tf.random_normal([filtro1[0], filtro1[1], 1, n1])),
        'c2': tf.Variable(tf.random_normal([filtro2[0], filtro2[1], n1, n2])),
        'w1': tf.Variable(tf.random_normal([7 * 7 * n2, n3])),
        'wo': tf.Variable(tf.random_normal([n3, 10]))
    }
    
    sesgos = {
        'b1': tf.Variable(tf.random_normal([n1])),
        'b2': tf.Variable(tf.random_normal([n2])),
        'b3': tf.Variable(tf.random_normal([n3])),
        'bo': tf.Variable(tf.random_normal([10]))
    }
    
    return pesos, sesgos

Ahora necesitamos establecer los parámetros de la topología de la red neuronal. 
Tomemos en cuenta que estos prámetros los podríamos haber establecido desde
la primer celda, si el fin es estar variando los parámetros para escoger los que 
ofrezcan mejor desempeño.

In [0]:
num_entradas = 784  #  Lo sabemos por la inspección que hicimos a mnist
num_salidas = 10    # Ídem

# Aqui es donde podemos jugar
filtro1 = (5, 5)
filtro2 = (5, 5)
n1 = 32
n2 = 64
n3 = 1024

¡A construir la red! Para esto vamos a necesitar crear las entradas
con un placeholder, y crear nuestra topología de red neuronal.

Observa que la dimensión de x será [None, num_entradas], lo que significa que 
la cantidad de renglones es desconocida (o variable).

In [0]:
# La entrada a la red neuronal
x = tf.placeholder("float", [None, num_entradas])

# Los pesos y los sesgos
w, b = inicializa_pesos(filtro1, filtro2, n1, n2, n3) 

# El valor de dropout que puede variar en el tiempo
dp = tf.placeholder(tf.float32)

# Crea la red neuronal
estimado = cnn_mnist(x, w, b, dp)

Parecería que ya está todo listo. Sin ambargo falta algo muy importante: No hemos explicado
ni cual es el criterio de error (loss) que vamos a utilizar, ni cual va a ser el método de
optimización (aprendizaje) que hemos decidido aplicar.

Primero definamos el costo que queremos minimizar, y ese costo va a estar en función de lo
estimado con lo real, por lo que necesitamos otra entrada de datos para los datos de salida.

Sin ningun lugar a dudas, el costo que mejor describe este problema es el de *softmax*


In [0]:
#  Creamos la variable de datos de salida conocidos
y = tf.placeholder("float", [None, num_salidas])

#  Definimos la función de costo
costo = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits=estimado, labels=y))

Y ahora definimos que función de aprendizaje vamos a utilizar. Existen muchas funciones
de aprendizaje en tensorflow, las cuales se pueden consultar en `tf.train.`. Entre las
existentes podemos ver algunas conocidas del curso como descenso de gradiente simple,
momento, rprop, rmsprop entre otras. Casi todas las funciones de optimización (aprendizaje)
acaban su nombre con `Optimize`.

En este caso vamos a usar un método comocido como el *algoritmo de Adam* el cual 
se puede consultar [aqui](http://arxiv.org/pdf/1412.6980.pdf). El metodo utiliza dos calculos
de momentos diferentes, y por lo visto genera resultados muy interesantes desde el punto 
de vista práctico.

¿Cual es el mejor método? Pues esto es en función de tu problema y de la cantidad de datos que tengas.
Lo mejor es practicar con varios métodos para entender sus ventajas y desventajas.

En todo caso el método de optimización requiere que se le inicialice con una tasa de aprendizaje.

In [0]:
alfa = 0.001
optimizador = tf.train.AdamOptimizer(learning_rate=alfa)
paso_entrenamiento = optimizador.minimize(costo)

## 3. Ejecutar la sesión usando mini-batches

Ahora, ya que la red neuronal está lista vamos a ejecutar la red utilizando el algoritmo de
Adam pero en forma de mini-batches. Con el fin de tener control sobre el problema, vamos a establecer un número máximo de epoch (ciclos de aprendizaje), el tamaño de los mini-batches, y cada cuandos epoch 
quisieramos ver como está evolucionando la red neuronal.

Como entrenar una red neuronal no tiene sentido, si no es porque la queremos usar para reconocer,
no tendría sentido entrenarla y luego perderla y tener que reentrenar en cada ocasión. Recuerda que cuando
se cierra la sesión se borra todo lo que se tenía en memoria. 

Para esto vamos a usar una ops especial llamada `Saver`, que permite guardar en un archivo la red neuronal y 
después utilizarla en otra sesión (en otro script, computadora, ....).


In [11]:
!ls
archivo_modelo = "simple/cnn_simple.ckpt"
saver = tf.train.Saver()

sample_data


Como todo se ejecuta dentro de una sesión, no es posible hacerlo por partes (si usamos el 
`with` que debería ser la única forma en la que iniciaramos una sesión). Por lo tanto procuraré dejar comentado el código.

In [12]:
numero_epochs = 5
tamano_minibatch = 100
display_step = 1
dropout = 0.75

# Muy importante la primera vez que se ejecuta inicializar todas las variables
init = tf.global_variables_initializer()

# La manera correcta de iniciar una sesión y realizar calculos
with tf.Session() as sess:
    sess.run(init)

    # Ciclos de entrenamiento
    for epoch in range(numero_epochs):

        #  Inicializa el costo promedio de todos los minibatches en 0
        avg_cost = 0.
        
        #  Calcula el número de minibatches que se pueden usar 
        total_batch = int(mnist.train.num_examples/tamano_minibatch)

        #  Por cada minibatch
        for i in range(total_batch):
            
            #  Utiliza un generador incluido en mnist que obtiene 
            #  tamano_minibatch ejemplos selecionados aleatoriamente del total
            batch_x, batch_y = mnist.train.next_batch(tamano_minibatch)
            
            #  Ejecuta la ops del paso_entrenamiento para aprender 
            #  y la del costo, con el fin de mostrar el aprendizaje
            _, c = sess.run(
                [paso_entrenamiento, costo], 
                feed_dict={x: batch_x, y: batch_y, dp: dropout}
            )
            
            #  Calcula el costo del minibatch y lo agrega al costo total
            avg_cost += c / total_batch
        
        # Muestra los resultados
        if epoch % display_step == 0:
            print (("Epoch: " + str(epoch)).ljust(20)
                   + ("Costo: " + str(avg_cost)))
    
        #  Guarda la sesión en el archivo rnn2.cptk
        #saver.save(sess, archivo_modelo, global_step=i)
    #Guarda la sesión en el archivo rnn2.cptk
    saver.save(sess, archivo_modelo)
    print("Se acabaron los epochs, saliendo de la sesión de tensorflow.")

Epoch: 0            Costo: 5733.652968902587
Epoch: 1            Costo: 722.7327221402255
Epoch: 2            Costo: 371.6794314679232
Epoch: 3            Costo: 223.32004240604957
Epoch: 4            Costo: 156.46544654068626
Se acabaron los epochs, saliendo de la sesión de tensorflow.


Ahora vamos a revisar que tan bien realizó el aprendizaje cuando se aplica la red adatos que
no se usaron para entrenamiento. Para esto vamos a utilizar dos ops extas: una 
para definir la operaración de datos bien estimados o mal estimados, y otra para
calcular el promedio de datos bien estimados. Para calcular los datos bien estimados vamos a utilizar `tf.cast` que permite ajustar los tipos
al tipo tensor. 

In [0]:
prediction_correcta = tf.equal(
    tf.argmax(estimado, 1), 
    tf.argmax(y, 1)
)

precision = tf.reduce_mean(tf.cast(prediction_correcta, "float"))

Ahora si, vamos a abrir una nueva sesión, vamos a restaurar los valores de la sesión anterior,
y vamos a ejecutar el grafo con el fin de evaluar la ops precision, pero ahora con el
diccionario de alimentación con los datos de prueba.

In [14]:
with tf.Session() as sess:
    sess.run(init)
    saver.restore(sess, archivo_modelo)
    porcentaje_acierto = sess.run(
        precision, 
        feed_dict={
            x: mnist.test.images,
            y: mnist.test.labels,
            dp: dropout
        }
    )
    print("Precisión: {}".format(porcentaje_acierto))


INFO:tensorflow:Restoring parameters from simple/cnn_simple.ckpt
Precisión: 0.9617999792098999


## 4. Contesta las siguientes preguntas

1. ¿Cuanto tiempo tarde en realizar un epoch?

2. Realiza solamente 5 epoch cada vez y prueba con el conjunto de test para comprobar como 
   mejora el reconocimiento.

4. ¿Que pasa si cambias los tamaños de los filtros o el número de imágenes generadas?

5. ¿Que pasa si cambias el tamaño de los minibatches?

**Para contestar las preguntas, agrega cuantas celdas con comentarios y con códgo sean necesarias.** Aprovecha que las libretas de *Jupyter* te permite hacerte una especie de tutorial personalizado.

##1. ¿Cuanto tiempo tarde en realizar un epoch?

In [15]:
import time

numero_epochs = 5
tamano_minibatch = 100
display_step = 1
dropout = 0.75

# Muy importante la primera vez que se ejecuta inicializar todas las variables
init = tf.global_variables_initializer()

# La manera correcta de iniciar una sesión y realizar calculos
with tf.Session() as sess:
    sess.run(init)
    tiempo_inicial=time.time()
    # Ciclos de entrenamiento
    for epoch in range(numero_epochs):

        #  Inicializa el costo promedio de todos los minibatches en 0
        avg_cost = 0.
        
        #  Calcula el número de minibatches que se pueden usar 
        total_batch = int(mnist.train.num_examples/tamano_minibatch)

        #  Por cada minibatch
        for i in range(total_batch):
            
            #  Utiliza un generador incluido en mnist que obtiene 
            #  tamano_minibatch ejemplos selecionados aleatoriamente del total
            batch_x, batch_y = mnist.train.next_batch(tamano_minibatch)
            
            #  Ejecuta la ops del paso_entrenamiento para aprender 
            #  y la del costo, con el fin de mostrar el aprendizaje
            _, c = sess.run(
                [paso_entrenamiento, costo], 
                feed_dict={x: batch_x, y: batch_y, dp: dropout}
            )
            
            #  Calcula el costo del minibatch y lo agrega al costo total
            avg_cost += c / total_batch
        
        # Muestra los resultados
        if epoch % display_step == 0:
            print (("Epoch: " + str(epoch)).ljust(20)
                   + ("Costo: " + str(avg_cost)))
    
        #  Guarda la sesión en el archivo rnn2.cptk
        #saver.save(sess, archivo_modelo, global_step=i)
    tiempo_final = time.time()
    print("Tiempo por epoch: {} s".format((tiempo_final-tiempo_inicial)/numero_epochs))
    #Guarda la sesión en el archivo rnn2.cptk
    #saver.save(sess, archivo_modelo)
    print("Se acabaron los epochs, saliendo de la sesión de tensorflow.")

Epoch: 0            Costo: 4102.982741088859
Epoch: 1            Costo: 593.0987384338808
Epoch: 2            Costo: 309.1606893704154
Epoch: 3            Costo: 189.05839674917135
Epoch: 4            Costo: 139.58575731862678
Tiempo por epoch: 6.1397223472595215 s
Se acabaron los epochs, saliendo de la sesión de tensorflow.


Un Epoch en *Google Colab* tardo 6.13 segundos

##2. Realiza solamente 5 epoch cada vez y prueba con el conjunto de test para comprobar como mejora el reconocimiento.

In [0]:
def ejecutar_cnn(numero_epochs, minibatch=100, display_step=1, dropout=0.75):

    # Muy importante la primera vez que se ejecuta inicializar todas las variables
    init = tf.global_variables_initializer()

    # La manera correcta de iniciar una sesión y realizar calculos
    with tf.Session() as sess:

        sess.run(init)

        # Ciclos de entrenamiento
        for epoch in range(numero_epochs):

            #  Inicializa el costo promedio de todos los minibatches en 0
            avg_cost = 0.

            #  Calcula el número de minibatches que se pueden usar 
            total_batch = int(mnist.train.num_examples/tamano_minibatch)

            #  Por cada minibatch
            for i in range(total_batch):

                #  Utiliza un generador incluido en mnist que obtiene 
                #  tamano_minibatch ejemplos selecionados aleatoriamente del total
                batch_x, batch_y = mnist.train.next_batch(tamano_minibatch)

                #  Ejecuta la ops del paso_entrenamiento para aprender 
                #  y la del costo, con el fin de mostrar el aprendizaje
                _, c = sess.run(
                    [paso_entrenamiento, costo], 
                    feed_dict={x: batch_x, y: batch_y, dp: dropout}
                )

                #  Calcula el costo del minibatch y lo agrega al costo total
                avg_cost += c / total_batch

            # Muestra los resultados
            if epoch % display_step == 0:
                print (("Epoch: " + str(epoch)).ljust(20)
                       + ("Costo: " + str(avg_cost)))

        #  Guarda la sesión en el archivo rnn2.cptk
        saver.save(sess, archivo_modelo)

        print("Se acabaron los epochs, saliendo de la sesión de tensorflow.\n")

    prediction_correcta = tf.equal(
        tf.argmax(estimado, 1), 
        tf.argmax(y, 1)
    )

    precision = tf.reduce_mean(tf.cast(prediction_correcta, "float"))

    with tf.Session() as sess:
        sess.run(init)
        saver.restore(sess, archivo_modelo)
        porcentaje_acierto = sess.run(
            precision, 
            feed_dict={
                x: mnist.test.images,
                y: mnist.test.labels,
                dp: dropout
            }
        )
    print("Precisión: {}\n".format(porcentaje_acierto))

In [20]:
ejecutar_cnn(5)
ejecutar_cnn(10)
ejecutar_cnn(15)
ejecutar_cnn(20)

Epoch: 0            Costo: 5089.298932328653
Epoch: 1            Costo: 619.6070738983157
Epoch: 2            Costo: 333.9867384780541
Epoch: 3            Costo: 201.29757326071908
Epoch: 4            Costo: 138.37772257929498
Se acabaron los epochs, saliendo de la sesión de tensorflow.

INFO:tensorflow:Restoring parameters from simple/cnn_simple.ckpt
Precisión: 0.9629999995231628

Epoch: 0            Costo: 5806.912613858313
Epoch: 1            Costo: 755.919311441509
Epoch: 2            Costo: 410.5052974453844
Epoch: 3            Costo: 248.40129889444887
Epoch: 4            Costo: 167.31866375868972
Epoch: 5            Costo: 123.20226961309255
Epoch: 6            Costo: 98.87169642008782
Epoch: 7            Costo: 75.07772663139482
Epoch: 8            Costo: 60.68232465913568
Epoch: 9            Costo: 48.83546413308921
Se acabaron los epochs, saliendo de la sesión de tensorflow.

INFO:tensorflow:Restoring parameters from simple/cnn_simple.ckpt
Precisión: 0.9678000211715698

Epoch

##3. ¿Que pasa si cambias los tamaños de los filtros o el número de imágenes generadas?

In [22]:
# Aqui es donde podemos jugar
filtro1 = (2, 2)
filtro2 = (2, 2)

# La entrada a la red neuronal
x = tf.placeholder("float", [None, num_entradas])

# Los pesos y los sesgos
w, b = inicializa_pesos(filtro1, filtro2, n1, n2, n3) 

# El valor de dropout que puede variar en el tiempo
dp = tf.placeholder(tf.float32)

# Crea la red neuronal
estimado = cnn_mnist(x, w, b, dp)

#  Creamos la variable de datos de salida conocidos
y = tf.placeholder("float", [None, num_salidas])

#  Definimos la función de costo
costo = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits=estimado, labels=y))

alfa = 0.001
optimizador = tf.train.AdamOptimizer(learning_rate=alfa)
paso_entrenamiento = optimizador.minimize(costo)

archivo_modelo = "simple/cnn_simple.ckpt"
saver = tf.train.Saver()

ejecutar_cnn(10)

# Aqui es donde podemos jugar
filtro1 = (10, 10)
filtro2 = (10, 10)

# La entrada a la red neuronal
x = tf.placeholder("float", [None, num_entradas])

# Los pesos y los sesgos
w, b = inicializa_pesos(filtro1, filtro2, n1, n2, n3) 

# El valor de dropout que puede variar en el tiempo
dp = tf.placeholder(tf.float32)

# Crea la red neuronal
estimado = cnn_mnist(x, w, b, dp)

#  Creamos la variable de datos de salida conocidos
y = tf.placeholder("float", [None, num_salidas])

#  Definimos la función de costo
costo = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits=estimado, labels=y))

alfa = 0.001
optimizador = tf.train.AdamOptimizer(learning_rate=alfa)
paso_entrenamiento = optimizador.minimize(costo)

archivo_modelo = "simple/cnn_simple.ckpt"
saver = tf.train.Saver()

ejecutar_cnn(10)

Epoch: 0            Costo: 1620.3353382457385
Epoch: 1            Costo: 146.80966991597955
Epoch: 2            Costo: 65.07809331893917
Epoch: 3            Costo: 39.899278332320094
Epoch: 4            Costo: 29.09531478345395
Epoch: 5            Costo: 21.600664273608835
Epoch: 6            Costo: 16.941597796245055
Epoch: 7            Costo: 13.561072859872473
Epoch: 8            Costo: 11.011744502891208
Epoch: 9            Costo: 9.138878623165866
Se acabaron los epochs, saliendo de la sesión de tensorflow.

INFO:tensorflow:Restoring parameters from simple/cnn_simple.ckpt
Precisión: 0.9297999739646912

Epoch: 0            Costo: 16386.656576371628
Epoch: 1            Costo: 2408.3034213950423
Epoch: 2            Costo: 1272.6081205671494
Epoch: 3            Costo: 831.4281012006245
Epoch: 4            Costo: 539.3681219807536
Epoch: 5            Costo: 389.8171619762078
Epoch: 6            Costo: 295.18496803961006
Epoch: 7            Costo: 225.0763375422627
Epoch: 8            C

*   Bajando el tamaño de los filtros disminuye bastante la precisión.
*   Aumentando el tamaño de los filtros aumento poco la precisón.



##4. ¿Que pasa si cambias el tamaño de los minibatches?

In [23]:
ejecutar_cnn(10,32)
ejecutar_cnn(10,64)
ejecutar_cnn(10,100)
ejecutar_cnn(10,200)

Epoch: 0            Costo: 17843.56878651012
Epoch: 1            Costo: 2538.3375910880327
Epoch: 2            Costo: 1332.7375781735493
Epoch: 3            Costo: 838.3641643376786
Epoch: 4            Costo: 596.8041534578807
Epoch: 5            Costo: 417.276651184342
Epoch: 6            Costo: 339.87025747212465
Epoch: 7            Costo: 254.4897706642478
Epoch: 8            Costo: 210.71879292813233
Epoch: 9            Costo: 164.45730465448977
Se acabaron los epochs, saliendo de la sesión de tensorflow.

INFO:tensorflow:Restoring parameters from simple/cnn_simple.ckpt
Precisión: 0.9628000259399414

Epoch: 0            Costo: 16075.096336891862
Epoch: 1            Costo: 2391.1978131935803
Epoch: 2            Costo: 1218.014660652333
Epoch: 3            Costo: 767.5609377919546
Epoch: 4            Costo: 535.7367167765447
Epoch: 5            Costo: 385.89434800906656
Epoch: 6            Costo: 277.6418111009217
Epoch: 7            Costo: 209.34528267177666
Epoch: 8            Cost

Conforme iba aumentando el tamaño de los minibatches la precisión fue en aumento.

