# Redes neuronales multicapa

### Ejemplo 1-D (unidimensional)

In [1]:
import tensorflow as tf
import numpy as np
session = tf.Session()

In [86]:
data_size = 25
data_1d = np.random.normal(size=data_size) # Array unidimensional de 25 elementos
x_input = tf.placeholder(shape=[data_size], dtype=tf.float32)

Para hacer convolución y max pooling, necesitamos que el tensor sea de dimensión 4

$ Dimensión\ del\ tensor = [n, f, c, col] $

$ n\equiv número\ de\ elementos$

$ c\equiv columnas$

$ f\equiv filas$

$ col\equiv canales\ de\ color$

En nuestro caso, tenemos un array de 25 elementos $\rightarrow$ tenemos una fila y 25 columnas 

In [87]:
def conv_layer_1d(input_1d, my_filter):
    # Añadir elemento a la fila, es decir, añadir una columna
    input_2d = tf.expand_dims(input_1d, 0) # Añadir elemento por delante
    input_3d = tf.expand_dims(input_2d, 0)
    input_4d = tf.expand_dims(input_3d, 3) # Añadir dimensión al final (index 3)
    
    # 'strides' es el desplazamiento entre las convoluciones
    convolution = tf.nn.conv2d(input_4d, filter=my_filter, strides=[1,1,1,1], padding="VALID")
    # Squeeze para aplanar el resultado de la convolución
    output = tf.squeeze(convolution) 
    
    return output

In [88]:
my_filter = tf.Variable(tf.random_normal(shape=[1,5,1,1]))
# 1 batch, 5 filas, 1 columna, 1 canal de color
conv_output = conv_layer_1d(x_input, my_filter)

In [89]:
# Función de activación ReLu
def activation(input_1d):
    return tf.nn.relu(input_1d)

In [90]:
activation_output = activation(conv_output)

In [91]:
# Capa de maxpool (para eliminar posibles valores mediocres)
def max_pool(input_1d, width):
    # Añadir elemento a la fila, es decir, añadir una columna
    input_2d = tf.expand_dims(input_1d, 0) 
    input_3d = tf.expand_dims(input_2d, 0)
    input_4d = tf.expand_dims(input_3d, 3) # Añadir dimensión al final (index 3)
    
    pooling = tf.nn.max_pool(input_4d, ksize=[1,1,width,1], strides=[1,1,1,1], padding="VALID")
    output = tf.squeeze(pooling)
    
    return output

In [92]:
maxpool_output = max_pool(activation_output, width=5)

In [93]:
def fully_connected_layer(input_layer, num_outputs):
    weight_shape = tf.squeeze(tf.stack([tf.shape(input_layer), [num_outputs]])) # Tamaño de los pesos de la capa
    weight = tf.random_normal(shape=weight_shape, stddev=0.1)
    bias = tf.random_normal(shape=[num_outputs])
    
    input_layer_2d = tf.expand_dims(input_layer, 0)
    # y = Ax + b
    full_output = tf.add(tf.matmul(input_layer_2d, weight), bias)
    full_output_1d = tf.squeeze(full_output)
    
    return full_output_1d

# VER GRÁFICO DE LA CLASE ANTERIOR PARA ACLARAR EL ESQUEMA

In [94]:
full_output = fully_connected_layer(maxpool_output, num_outputs=5)

In [95]:
init = tf.global_variables_initializer()
session.run(init)

In [96]:
feed_dict = {x_input: data_1d}

In [97]:
print("Input original: \n")
print(data_1d)

Input original: 

[ 0.47475442  1.1801964  -0.12531582 -1.24064976  0.58022051 -0.99920246
 -0.03415297  0.26158376  0.06842541 -0.9104595   0.53659257 -1.23097123
 -0.03045065 -1.3223118   1.97934682  0.59748781 -1.16009436 -0.73632716
  0.38523188  0.44406455  1.5905312   0.34546277 -1.97939856 -0.97482663
 -0.0549464 ]


In [98]:
print("Filtro: \n")
print(session.run(my_filter))

Filtro: 

[[[[ 0.11531693]]

  [[-0.8757149 ]]

  [[ 0.6169386 ]]

  [[ 0.6700308 ]]

  [[-0.9224233 ]]]]


In [99]:
# Operación de convolución (primera capa)
print("Input: tamaño 25, Operación: convolución con filtro de tamaño 5 + stride de tamaño 1, Resultado: tamaño 21")
print("\n")
print(session.run(conv_output, feed_dict=feed_dict))

Input: tamaño 25, Operación: convolución con filtro de tamaño 5 + stride de tamaño 1, Resultado: tamaño 21


[-2.4225628   0.79088604  0.791972   -1.5317967   1.0330074   0.9617407
 -1.2957984   0.9035564   0.33953807 -0.1349988  -1.5907134  -0.15598434
  3.8460255  -1.6153088  -1.8593924   0.47904548 -0.4209075   0.5987382
  2.6941242  -1.5555696  -1.9427592 ]


In [100]:
# Función de activación
print("Input: tamaño 21, Operación: ReLu al array anterior, Resultado: tamaño 21")
print("\n")
print(session.run(activation_output, feed_dict=feed_dict))

Input: tamaño 21, Operación: ReLu al array anterior, Resultado: tamaño 21


[0.         0.79088604 0.791972   0.         1.0330074  0.9617407
 0.         0.9035564  0.33953807 0.         0.         0.
 3.8460255  0.         0.         0.47904548 0.         0.5987382
 2.6941242  0.         0.        ]


In [102]:
# Operación de Max Pooling
# Coge 5 elementos (del 1º al 5º) y se queda con el más grande. A continuación coge del 2º al 6º y se queda
# con el más grande, y así sucesivamente
print("Input: tamaño 21, Operación: maxpooling con ventana de tamaño 5 + stride de tamaño 1, Resultado: tamaño 17")
print("\n")
print(session.run(maxpool_output, feed_dict=feed_dict))

Input: tamaño 21, Operación: maxpooling con ventana de tamaño 5 + stride de tamaño 1, Resultado: tamaño 17


[1.0330074 1.0330074 1.0330074 1.0330074 1.0330074 0.9617407 0.9035564
 0.9035564 3.8460255 3.8460255 3.8460255 3.8460255 3.8460255 0.5987382
 2.6941242 2.6941242 2.6941242]


In [103]:
# Capa totalmente conectada
print("Input: tamaño 17, Operación: conectar totalmente la entrada con 5 valores de salida, Resultado: tamaño 5")
print("\n")
print(session.run(full_output, feed_dict=feed_dict))

Input: tamaño 17, Operación: conectar totalmente la entrada con 5 valores de salida, Resultado: tamaño 5


[-0.61559033  1.91151     0.75073504  0.23200023 -0.8265862 ]


### Ejemplo 2-D

In [22]:
session = tf.Session()

In [23]:
data_size = [10,10]
input_2d = np.random.normal(size=data_size)
x_input = tf.placeholder(shape=data_size, dtype=tf.float32)

In [24]:
def conv_layer_2d(input_2d, my_filter):
    input_3d = tf.expand_dims(input_2d, 0)
    input_4d = tf.expand_dims(input_3d, 3)
    
    # strides=[1,2,2,1] porque el filtro que utilizamos es 2x2
    convolution = tf.nn.conv2d(input_4d, filter=my_filter, strides=[1,2,2,1], padding="VALID")
    
    return tf.squeeze(convolution)

In [25]:
my_filter = tf.Variable(tf.random_normal(shape=[2,2,1,1]))

conv_output = conv_layer_2d(x_input, my_filter)

In [26]:
def activation(input_2d):
    return tf.nn.relu(input_2d)

In [27]:
activation_output = activation(conv_output)

In [28]:
def max_pool(input_2d, width, height):
    input_3d = tf.expand_dims(input_2d, 0)
    input_4d = tf.expand_dims(input_3d, 3)
    
    pooling = tf.nn.max_pool(input_4d, ksize=[1,height,width,1], strides=[1,1,1,1], padding="VALID")
    
    return tf.squeeze(pooling)

In [29]:
maxpool_output = max_pool(activation_output, width=2, height=2)

In [30]:
def fully_connected_layer(input_layer, num_outputs):
    flat_input = tf.reshape(input_layer, [-1]) #
    weight_shape = tf.squeeze(tf.stack([tf.shape(flat_input), [num_outputs]]))
    weight = tf.Variable(tf.random_normal(shape=weight_shape, stddev=0.1))
    bias = tf.Variable(tf.random_normal(shape=[num_outputs]))
    
    input_layer_2d = tf.expand_dims(flat_input, 0)
    full_output = tf.add(tf.matmul(input_layer_2d, weight), bias)
    
    return tf.squeeze(full_output)

In [31]:
full_output = fully_connected_layer(maxpool_output, num_outputs=5)

In [32]:
init = tf.global_variables_initializer()
session.run(init)

In [33]:
feed_dict = {x_input: input_2d}

In [34]:
print("Datos de entrada: \n")
input_2d

Datos de entrada: 



array([[ 9.88991674e-01,  1.80933260e-01,  1.61575712e-01,
        -3.79833366e-01, -6.12716308e-01, -2.21309280e-02,
        -2.03146196e+00, -2.01470484e-01, -1.31296336e+00,
        -8.75387469e-01],
       [-2.58499477e-01, -5.47234163e-01,  6.19679198e-01,
         1.32421265e-01, -5.15441840e-01,  4.45204515e-01,
         3.01109617e-01, -1.88694355e-01,  1.60073985e+00,
         3.21748362e-01],
       [-9.56300751e-01, -1.64459903e+00, -4.88210204e-01,
         7.30698107e-01,  1.87450857e+00, -2.13216416e+00,
        -2.96728198e-01, -1.62783167e+00,  1.43971939e+00,
         1.10633121e+00],
       [-1.23620459e+00, -6.95405508e-01, -7.42860174e-01,
        -4.90932410e-04, -4.56447702e-01, -8.25685276e-01,
         1.37682696e+00, -1.01459199e+00,  1.08259022e-01,
         4.71319633e-01],
       [ 4.35373495e-02, -1.18378899e+00,  2.21494371e-01,
        -6.64962772e-01,  1.30572246e+00,  1.28546377e+00,
        -1.36770625e+00,  7.78789850e-01,  1.38864136e+00,
        -3.

In [35]:
print("Filtro: \n")
print(session.run(my_filter))

Filtro: 

[[[[ 0.07617287]]

  [[-2.6357615 ]]]


 [[[-0.20767345]]

  [[ 0.5748692 ]]]]


In [36]:
# Operación de convolución (primera capa)
print("Input: tamaño 10x10, Operación: convolución con filtro de tamaño 2x2 + stride de tamaño 2x2, Resultado: tamaño 5x5")
print("\n")
print(session.run(conv_output, feed_dict=feed_dict))

Input: tamaño 10x10, Operación: convolución con filtro de tamaño 2x2 + stride de tamaño 2x2, Resultado: tamaño 5x5


[[-0.66246724  0.96089184  0.37463745  0.20527881  2.0598326 ]
 [ 4.1188865  -1.8091443   5.3827944   3.3987854  -2.5578928 ]
 [ 2.8170557   1.8410192  -2.5656328  -3.099539    0.69842464]
 [-0.30640784 -2.4805412  -4.6413774   0.28260207  5.0919538 ]
 [-5.2860265  -3.2070649   6.9933405   4.524487   -0.7179586 ]]


In [37]:
# Función de activación
print("Input: tamaño 5x5, Operación: ReLu al array anterior, Resultado: tamaño 5x5")
print("\n")
print(session.run(activation_output, feed_dict=feed_dict))

Input: tamaño 5x5, Operación: ReLu al array anterior, Resultado: tamaño 5x5


[[0.         0.96089184 0.37463745 0.20527881 2.0598326 ]
 [4.1188865  0.         5.3827944  3.3987854  0.        ]
 [2.8170557  1.8410192  0.         0.         0.69842464]
 [0.         0.         0.         0.28260207 5.0919538 ]
 [0.         0.         6.9933405  4.524487   0.        ]]


In [38]:
# Operación de Max Pooling
# Coge 5 elementos (del 1º al 5º) y se queda con el más grande. A continuación coge del 2º al 6º y se queda
# con el más grande, y así sucesivamente
print("Input: tamaño 5x5, Operación: maxpooling con ventana de tamaño 2x2 + stride de tamaño 1, Resultado: tamaño 4x4")
print("\n")
print(session.run(maxpool_output, feed_dict=feed_dict))

Input: tamaño 5x5, Operación: maxpooling con ventana de tamaño 2x2 + stride de tamaño 1, Resultado: tamaño 4x4


[[4.1188865  5.3827944  5.3827944  3.3987854 ]
 [4.1188865  5.3827944  5.3827944  3.3987854 ]
 [2.8170557  1.8410192  0.28260207 5.0919538 ]
 [0.         6.9933405  6.9933405  5.0919538 ]]


In [39]:
# Capa totalmente conectada
print("Input: tamaño 4x4, Operación: conectar totalmente la entrada con 5 valores de salida, Resultado: tamaño 5")
print("\n")
print(session.run(full_output, feed_dict=feed_dict))

Input: tamaño 4x4, Operación: conectar totalmente la entrada con 5 valores de salida, Resultado: tamaño 5


[ 3.6681738  -0.02616291 -2.6284447   0.77973706 -0.15612301]
