# <center> <font color="#0080FF">Redes neuronales artificiales - Forward Propagation</font></center>

## Introducción


Construiremos una red neuronal desde 0 y veremos cómo realiza predicciones usando forward propagation. En la práctica todas las librerías de deep learning tienen todo el proceso de entrenamietno y predicción implementado, por lo que hacer esto no es realmente necesario, sin embargo, es útil para entender mejor cómo funcionan.


<h2>Redes neuronales artificiales - Forward Propagation</h2>
<h3>Objectivos<h3>    
<h5> 1. Inicializar una red</h5>
<h5> 2. Computar las sumas ponderadas para cada nodo </h5>
<h5> 3. Computar la activación del nodo </h5>
<h5> 4. Acceda a su aplicación <b> Flask </b> a través de una página web en cualquier lugar mediante un enlace personalizado.</h5>     


## Tabla de contenido

<div class="alert alert-block alert-info" style="margin-top: 20px">

<font size = 3>    

1.  <a href="#item11">Recapitulando</a>
2.  <a href="#item12">Inicializando una red</a>  
3.  <a href="#item13">Computando la suma ponderada en cada nodo</a>  
4.  <a href="#item14">Computar la activación del nodo</a>  
5.  <a href="#item15">Forward Propagation</a>

</font>
    
</div>


<a id="item1"></a>


<a id='item11'></a>


# Recapitulando


En las notas vimos como una red neuronal realiza predicciones a través del proceso de forward propagation. En la figura siguiente se muestra una red neuronal que tiene 2 entradas, una capa oculta con 2 nodos y una capa de salida con un nodo.



<img src="http://cocl.us/neural_network_example" alt="Neural Network Example" width=600px>


Comencemos por inicializar aleatoriamente los pesos y los sesgos en la red. Tenemos 6 pesos y 3 sesgos, uno por cada nodo en la capa oculta así como por cada nodo en la capa de salida.



In [1]:
import numpy as np # import Numpy library to generate 

weights = np.around(np.random.uniform(size=6), decimals=2) # initialize the weights
biases = np.around(np.random.uniform(size=3), decimals=2) # initialize the biases

Imprimamos los pesos y sesgos.


In [2]:
print(weights)
print(biases)

[0.78 0.49 0.11 0.61 0.36 0.35]
[0.13 0.17 0.59]


Ahora que tenemos los pesos y sesgos definidos para la red, computemos la salida para una entrada dada, $x_1$ y $x_2$.



In [3]:
x_1 = 0.5 # entrada 1
x_2 = 0.85 # entrada 2

print('x1 is {} and x2 is {}'.format(x_1, x_2))

x1 is 0.5 and x2 is 0.85


Computemos la suma ponderada de las entradas, $z\_{1, 1}$, en el primer nodo de la capa oculta.



In [4]:
z_11 = x_1 * weights[0] + x_2 * weights[1] + biases[0]

print('La suma ponderada de las entradas en el primer nodo de la capa oculta es {}'.format(z_11))

La suma ponderada de las entradas en el primer nodo de la capa oculta es 0.9365


Repitamos para el segundo nodo de la capa oculta.


In [6]:
z_12 = x_1 * weights[2] + x_2 * weights[3] + biases[1]


Impimimos


In [7]:
print('La suma ponderada de las entrads en el segundo nodo de la capa oculta es {}'.format(np.around(z_12, decimals=4)))

La suma ponderada de las entrads en el segundo nodo de la capa oculta es 0.7435


Asumiendo que la función de activación es una sigmoide, computemos la activación del primer nodo, $a\_{1, 1}$, en la capa oculta.


In [8]:
a_11 = 1.0 / (1.0 + np.exp(-z_11))

print('La activación del primer nodo en la capa oculta es {}'.format(np.around(a_11, decimals=4)))

La activación del primer nodo en la capa oculta es 0.7184


Repitamos para el segundo en la capa oculta.


In [9]:
a_12 = 1.0 / (1.0 + np.exp(-z_12))


Imprimimos:


In [10]:
print('La activación del segundo nodo en la capa oculta es {}'.format(np.around(a_12, decimals=4)))

La activación del segundo nodo en la capa oculta es 0.6778


Estas activaciones servirán como entradas para la capa de salida. Computemos la suma ponderada de estas entradas para el nodo en la capa de salida.



In [11]:
z_2 = a_11 * weights[4] + a_12 * weights[5] + biases[2]


Imprimimos:


In [12]:
print('La suma ponderada de las entradas en el nodo de la capa de salida es {}'.format(np.around(z_2, decimals=4)))

La suma ponderada de las entradas en el nodo de la capa de salida es 1.0858


Computemos la salida de la red como la activación del nodo en la capa de salida.



In [13]:
a_2 = 1.0 / (1.0 + np.exp(-z_2))



Imprimimos la activación del nodo en la capa de salida, que es equivalente a la predicción realizada por la red.



In [14]:
print('La salida de la red para x1=0.5 y x2=0.85 es {}'.format(np.around(a_2, decimals=4)))

La salida de la red para x1=0.5 y x2=0.85 es 0.7476


<hr>


En problemas reales, suelen haber muchas capas ocultas y muchos más nodos en cada capa. Entonces, no podemos continuar realizando predicciones usando este enfoque ineficiente de computar cada suma ponderada en cada nodo y la activación de cada nodo manualmente.



Para escribir un código automático para realizar predicciones generalicemos nuestra red. Una red general toma $n$ entradas, tiene muchas capas ocultas donde cada capa oculta tiene $m$ nodos y una capa de salida que también puede tener más de un nodo.



<img src="http://cocl.us/general_neural_network" alt="Neural Network General" width=600px>


<a id="item2"></a>


<a id='item12'></a>


## Inicializando la red


Comencemos definiendo formalmente la estructura de la red.



In [15]:
n = 2 # número de entradas
num_hidden_layers = 2 # número de capas ocultas
m = [2, 2] # número de nodos en cada capa oculta
num_nodes_output = 1 # número de nodos en la capa de salida

Inicializemos los pesos y sesgos con valores aletorios; para ello utilizaremos NumPy.



In [16]:
import numpy as np

num_nodes_previous = n # número de nodos en la capa previa

network = {} # inicializamos la red como un diccionario vacío

# recorremos cada capa e inicializamos aleatoriamente los pesos y sesgos asociados con cada nodo
# observe que sumamos 1 al número de capas ocultas para incluir la capa de salida
for layer in range(num_hidden_layers + 1): 
    
    # determinamos el nombre de la capa
    if layer == num_hidden_layers:
        layer_name = 'output'
        num_nodes = num_nodes_output
    else:
        layer_name = 'layer_{}'.format(layer + 1)
        num_nodes = m[layer]
    
    # inicializamos pesos y sesgos asociados con cada nodo en la capa actual
    network[layer_name] = {}
    for node in range(num_nodes):
        node_name = 'node_{}'.format(node+1)
        network[layer_name][node_name] = {
            'weights': np.around(np.random.uniform(size=num_nodes_previous), decimals=2),
            'bias': np.around(np.random.uniform(size=1), decimals=2),
        }
    
    num_nodes_previous = num_nodes
    
print(network) # imprimimos la red

{'layer_1': {'node_1': {'weights': array([0.17, 0.51]), 'bias': array([0.5])}, 'node_2': {'weights': array([0.83, 0.51]), 'bias': array([0.28])}}, 'layer_2': {'node_1': {'weights': array([0.31, 0.26]), 'bias': array([0.78])}, 'node_2': {'weights': array([0.3 , 0.21]), 'bias': array([0.43])}}, 'output': {'node_1': {'weights': array([0.2 , 0.92]), 'bias': array([0.91])}}}


Con el código de arriba, somos capaces de inicializar los pesos y sesgos pertenecientes a una red con cualquier número de capas ocultas y cualquier número de nodos en cada capa. Pongamos este código en una función para ser capaces de ejecutar repetidamente este código cada vez que necesitemos construir una red.


In [17]:
def initialize_network(num_inputs, num_hidden_layers, num_nodes_hidden, num_nodes_output):
    
    num_nodes_previous = num_inputs # number of nodes in the previous layer

    network = {}
    
    # loop through each layer and randomly initialize the weights and biases associated with each layer
    for layer in range(num_hidden_layers + 1):
        
        if layer == num_hidden_layers:
            layer_name = 'output' # name last layer in the network output
            num_nodes = num_nodes_output
        else:
            layer_name = 'layer_{}'.format(layer + 1) # otherwise give the layer a number
            num_nodes = num_nodes_hidden[layer] 
        
        # initialize weights and bias for each node
        network[layer_name] = {}
        for node in range(num_nodes):
            node_name = 'node_{}'.format(node+1)
            network[layer_name][node_name] = {
                'weights': np.around(np.random.uniform(size=num_nodes_previous), decimals=2),
                'bias': np.around(np.random.uniform(size=1), decimals=2),
            }
    
        num_nodes_previous = num_nodes

    return network # return the network

####  Utilicemos la función _initialize_network_ function para crear una red que:

1.  tome 5 entradas
2.  tenga 3 capas ocultas
3.  tenga 3 nodos en la primer capa, 2 en la segunda y 3 en la tercera
4.  tenga 1 nodo en la capa de salida

Llamaremos a la red **small_network**.


In [18]:
small_network = initialize_network(5, 3, [3, 2, 3], 1)



<a id="item3"></a>


<a id='item13'></a>


## Computamos la suma ponderada en cada nodo


La suma ponderada en cada nodo es el producto punto de las entradas y los pesos sumados al sesgo. Crearemos una función llamada _compute_weigthed_sum que hace justo eso.


In [19]:
def compute_weighted_sum(inputs, weights, bias):
    return np.sum(inputs * weights) + bias

Generaremos 5 entradas con las que alimentaremos a **small_network**


In [20]:
from random import seed
import numpy as np

np.random.seed(12)
inputs = np.around(np.random.uniform(size=5), decimals=2)

print('Las entradas para la red son {}'.format(inputs))

Las entradas para la red son [0.15 0.74 0.26 0.53 0.01]


Computemos la suma ponderada en el primer nodo de la primer capa oculta


In [21]:
node_weights = small_network['layer_1']['node_1']['weights']
node_bias = small_network['layer_1']['node_1']['bias']

weighted_sum = compute_weighted_sum(inputs, node_weights, node_bias)
print('La suma ponderada en el primer nodo de la primer capa oculta es {}'.format(np.around(weighted_sum[0], decimals=4)))



La suma ponderada en el primer nodo de la primer capa oculta es 1.1092


<a id="item4"></a>


<a id='item14'></a>


## Computar la activación del nodo


Recordemos que la salida de cada nodo es una transformación no lineal de la suma ponderada. Para este mapeo usamos funciones de activación. Aquí utilizaremos la sigmoide. Definiremos una función que toma una suma ponderada como entrada y retorna una transformación no lineal de la misma usando la sigmoide.



In [22]:
def node_activation(weighted_sum):
    return 1.0 / (1.0 + np.exp(-1 * weighted_sum))

Computemos la salida del primer nodo en la primer capa oculta.


In [23]:
node_output  = node_activation(compute_weighted_sum(inputs, node_weights, node_bias))
print('La salida del primer nodo en la capa oculta es {}'.format(np.around(node_output[0], decimals=4)))



La salida del primer nodo en la capa oculta es 0.752


<a id="item5"></a>


<a id='item15'></a>


## Forward Propagation


Ahora hay que poner todo junto. Crearemos una función que le aplica las funciones _computed_weighted_sum y _node_activation a cada nodo de la red y propaga los datos todo el camino hasta la capa de salida y da como salida una predicción para cada nodo en la capa de salida.



El procedimiento es el siguiente:

1. Comenzamos con la capa de entrada como la entrada para la primer capa oculta.
2. Computamos la suma ponderada en los nodos de la capa actual.
3. Computamos la salida de los nodos de la capa actual.
4. Establecemos la salida de la capa actual como la entrada para la capa siguiente.
5. Nos movemos a la siguiente capa en la red.
6. Repetimos los pasos 2-4 hasta computar la salida de la capa de salida.


In [24]:
def forward_propagate(network, inputs):
    
    layer_inputs = list(inputs) # comenzamos con la capa de entrada como entrada a la primera capa oculta
    
    for layer in network:
        
        layer_data = network[layer]
        
        layer_outputs = [] 
        for layer_node in layer_data:
        
            node_data = layer_data[layer_node]
        
            # calcular la suma ponderada y la salida de cada nodo al mismo tiempo
            node_output = node_activation(compute_weighted_sum(layer_inputs, node_data['weights'], node_data['bias']))
            layer_outputs.append(np.around(node_output[0], decimals=4))
            
        if layer != 'output':
            print('The outputs of the nodes in hidden layer number {} is {}'.format(layer.split('_')[1], layer_outputs))
    
        layer_inputs = layer_outputs # se establece la salida de esta capa para que sea la entrada a la siguiente capa

    network_predictions = layer_outputs
    return network_predictions

Computemos la predicción para nuestra small network


In [25]:
predictions = forward_propagate(small_network, inputs)
print('El valor predecido mediante la red para la entrada dada es {}'.format(np.around(predictions[0], decimals=4)))


The outputs of the nodes in hidden layer number 1 is [0.752, 0.774, 0.781]
The outputs of the nodes in hidden layer number 2 is [0.876, 0.902]
The outputs of the nodes in hidden layer number 3 is [0.8035, 0.8636, 0.8817]
El valor predecido mediante la red para la entrada dada es 0.8239


Asi construimos el código para definir una red neuronal. Podemos especificar el número de entradas que la red puede tomar,e l número de capas ocultas, el número de nodos en cada capa oculta y el número de nodos en la capa de salida.


Primero usamos _initialize_network_ para crear nuestra red neuronal y definir sus pesos y sesgos.


In [26]:
my_network = initialize_network(5, 3, [2, 3, 2], 3)

Luego, para una entrada dada,


In [27]:
inputs = np.around(np.random.uniform(size=5), decimals=2)

computanos la predicción de la red


In [28]:
predictions = forward_propagate(my_network, inputs)
print('The predicted values by the network for the given input are {}'.format(predictions))

The outputs of the nodes in hidden layer number 1 is [0.8857, 0.8889]
The outputs of the nodes in hidden layer number 2 is [0.7822, 0.6965, 0.7411]
The outputs of the nodes in hidden layer number 3 is [0.868, 0.881]
The predicted values by the network for the given input are [0.8952, 0.8222, 0.8035]
