## Resumen

### Redes convolucionales


En una capa de una red convolucional, una "neurona" hace una suma ponderada de los píxeles justo encima de ella, en una pequeña región de la imagen solamente. Luego actúa normalmente al agregar un sesgo y alimentar el resultado a través de su función de activación. La gran diferencia es que cada neurona reutiliza los mismos pesos, mientras que en las redes totalmente conectadas vistas anteriormente, cada neurona tiene su propio conjunto de pesos.


Los dos (o más) conjuntos de pesos pueden reescribirse como uno al agregar una dimensión al tensor y esto nos da la forma genérica del tensor de pesos para una capa convolucional. Como la cantidad de canales de entrada y salida son parámetros, podemos comenzar a apilar y encadenar capas convolucionales.


In [2]:
import warnings
warnings.simplefilter(action='ignore', category=FutureWarning)
warnings.filterwarnings("ignore")
import tensorflow as tf
from tensorflow.contrib.learn.python.learn.datasets.mnist import read_data_sets

NUM_ITERS=5000
LOTES=100

tf.set_random_seed(0)

mnist = read_data_sets("MNISTdata", one_hot=True, reshape=False, validation_size=0)

X = tf.placeholder(tf.float32, [None, 28, 28, 1])
Y_ = tf.placeholder(tf.float32, [None, 10])

Extracting MNISTdata\train-images-idx3-ubyte.gz
Extracting MNISTdata\train-labels-idx1-ubyte.gz
Extracting MNISTdata\t10k-images-idx3-ubyte.gz
Extracting MNISTdata\t10k-labels-idx1-ubyte.gz


In [3]:
pkeep = tf.placeholder(tf.float32) 

In [4]:
# Capas

C1 = 4  
C2 = 8 
C3 = 16 

FC4 = 256 

# Los pesos se inicializan con valores aleatorios desde una distribucion normal  estandar
# la salidad de una capa es la entrada para la otra
W1 = tf.Variable(tf.truncated_normal([5, 5, 1, C1], stddev=0.1))
b1 = tf.Variable(tf.truncated_normal([C1], stddev=0.1))

W2 = tf.Variable(tf.truncated_normal([3, 3, C1, C2], stddev=0.1))
b2 = tf.Variable(tf.truncated_normal([C2], stddev=0.1))

W3 = tf.Variable(tf.truncated_normal([3, 3, C2, C3], stddev=0.1))
b3 = tf.Variable(tf.truncated_normal([C3], stddev=0.1))

W4 = tf.Variable(tf.truncated_normal([7*7*C3, FC4], stddev=0.1))
b4 = tf.Variable(tf.truncated_normal([FC4], stddev=0.1))


W5 = tf.Variable(tf.truncated_normal([FC4, 10], stddev=0.1))
b5 = tf.Variable(tf.truncated_normal([10], stddev=0.1))


# Aplanamos las imágenes, se crea un  vector [784]
#  -1 en la definición de shape significa que calculamos automáticamente el tamaño de esta dimensión

XX = tf.reshape(X, [-1, 784])


In [5]:
# Definimos el modelo


paso = 1  
Y1 = tf.nn.relu(tf.nn.conv2d(X, W1, strides=[1, paso, paso, 1], padding='SAME') + b1)

k = 2 
Y2 = tf.nn.relu(tf.nn.conv2d(Y1, W2, strides=[1, paso, paso, 1], padding='SAME') + b2)
Y2 = tf.nn.max_pool(Y2, ksize=[1, k, k, 1], strides=[1, k, k, 1], padding='SAME')

Y3 = tf.nn.relu(tf.nn.conv2d(Y2, W3, strides=[1, paso, paso, 1], padding='SAME') + b3)
Y3 = tf.nn.max_pool(Y3, ksize=[1, k, k, 1], strides=[1, k, k, 1], padding='SAME')

YY = tf.reshape(Y3, shape=[-1, 7 * 7 * C3])

Y4 = tf.nn.relu(tf.matmul(YY, W4) + b4)

Ylogits = tf.matmul(Y4, W5) + b5
Y = tf.nn.softmax(Ylogits)


Utilizamos una función de Tensorflow para softmax.

In [7]:
entropia_cruzada = tf.nn.softmax_cross_entropy_with_logits(logits=Ylogits, labels=Y_)
entropia_cruzada= tf.reduce_mean(entropia_cruzada)*100

                                                          
# prediccion del modelo de entrenamiento
prediccion_correcta = tf.equal(tf.argmax(Y, 1), tf.argmax(Y_, 1))
prediccion = tf.reduce_mean(tf.cast(prediccion_correcta, tf.float32))

# Taza de aprendizaje
paso_entrenamiento = tf.train.AdamOptimizer(0.003).minimize(entropia_cruzada)

In [8]:
# Lancemos el modelo utilizando InteractiveSession:

sess = tf.InteractiveSession()
tf.global_variables_initializer().run()

In [9]:
 for i in range(NUM_ITERS+1):
        # Entrenamiento de lotes  100 imagenes con 100 etiquetas
        lote_X, lote_Y = mnist.train.next_batch(LOTES)
        sess.run(paso_entrenamiento, feed_dict={X: lote_X, Y_:lote_Y, pkeep: 0.75})

In [10]:
prediccion_correcta = tf.equal(tf.argmax(Y,1), tf.argmax(Y_,1))

In [11]:
prediccion = tf.reduce_mean(tf.cast(prediccion_correcta, tf.float32))

Finalmente, calculamos precisión de nuestros datos de  prueba.

In [12]:
print(sess.run(prediccion, feed_dict={X: mnist.test.images, Y_: mnist.test.labels, pkeep: 1.0}))

0.9864
