# Artificial Neural Networks - Forward Propagation

## Introduction

En este tutorial construiremos una Red Neuronal desde cero y veremos como realizar predicciones usando Forward Propagation. 

<h2>Artificial Red Neuronal - Forward Propagation</h2>
<h3>Objetivos del Notebook<h3>    
<h5> 1. Inicializar la Red</h5>
<h5> 2. Computar la sumatoria ponderada en cada nodo. </h5>
<h5> 3. Computar el nodo de Activacion</h5>
  

---

----

> - ## Intuición Forward Propagation en una Red Neuronal

Primeramente veamos como hace predicciones una red Neuronal a traves de Forward Propagation. 

- Aqui vemos una Red Neuronal que toma 2 inputs, tiene una capa oculta con dos nodos, y una capa de salida output layer con un nodo. 

<img src="http://cocl.us/neural_network_example" alt="Neural Network Example" width=600px>

- Comenzaremos por inicializar aleatoriamente los pesos y los bias en la Red, Tenemos 6 pesos y 3 bias, uno por cada uno de los nodos en la capa oculta asi como tambien para cada nodo en la capa de salida. 

In [3]:
import numpy as np 

# la funcion `np.around` utiliza un algoritmo rápido pero a veces inexacto para redondear tipos de datos de punto flotante. 
weights = np.around(np.random.uniform(size=6), decimals=2) #inicializa los pesos
biases = np.around(np.random.uniform(size=3), decimals=2) # Inicializa los bias o sesgo


Veamos en un print los pesos y bias

In [4]:
print(weights)
print(biases)

[0.14 0.45 0.8  0.24 0.75 0.09]
[0.15 0.26 0.58]


- Ahora que tenemos los pesos y los bias, definidos para la Red, vamos a computar la salida para inputs dados, $x_1$ and $x_2$.

In [5]:
x_1 = 0.5    # Input 1
x_2 = 0.85   # Input 2

print('x1 es {} y x2 es {}'.format(x_1, x_2))

x1 es 0.5 y x2 es 0.85


- Vamos a empezar calculando la sumatoria ponderada de los inputs, $z\_{1, 1}$, en el primer nodo de la capa oculta. 

In [7]:
z_11 = x_1 * weights[0] + x_2 * weights[1] + biases[0]

print('La sumatoria ponderada de los inputs en el primer nodo en la capa oculta es {}'.format(z_11))

La sumatoria ponderada de los inputs en el primer nodo en la capa oculta es 0.6025


- A continuacion, vamos a calcular lo suma ponderada de los inputs, z_1,2, en el segundo nodo de la capa oculta.


In [11]:
z_12 = x_1 * weights[2] + x_2 * weights[3] + biases[1]
print('La suma ponderada de los inputs en el segundo nodo en la capa oculta es {}'.format(np.around(z_12, decimals=4)))

La suma ponderada de los inputs en el segundo nodo en la capa oculta es 0.864


- Luego, asumiendo una funcion de activacion sigmoide, calculamos la activacion de el primer nodo, a_1,1, en la capa oculta

In [13]:
a_11 = 1.0 / (1.0 + np.exp(-z_11))

print('La activacion de el primer nodo en la capa oculta es {}'.format(np.around(a_11, decimals=4)))

La activacion de el primer nodo en la capa oculta es 0.6462


- Tambien calcularemos la activacion en el segundo nodo,$a\_{1, 2}$, en la capa oculta. 

In [15]:
a_12 = 1.0 / (1.0 + np.exp(-z_12))

print('La activacion de el segundo nodo en la capa oculta es {}'.format(np.around(a_12, decimals=4)))

La activacion de el segundo nodo en la capa oculta es 0.7035


- Ahora estas activaciones nos serviran como entradas de la capa de salida. Asi que, calculamos la suma ponderada de estas inputs a el nodo en la capa oculta. 

In [16]:
z_2 = a_11 * weights[4] + a_12 * weights[5] + biases[2]

print('La suma ponderada de las entradas a el nodo en la capa de salida es {}'.format(np.around(z_2, decimals=4)))

La suma ponderada de las entradas a el nodo en la capa de salida es 1.128


- Finalmente, calculamos la salida de la Red como la activacion de el nodo en la capa de salida.

In [17]:
a_2 = 1.0 / (1.0 + np.exp(-z_2))

print('La salida de la Red para x1 = 0.5 and x2 = 0.85 es {}'.format(np.around(a_2, decimals=4)))

La salida de la Red para x1 = 0.5 and x2 = 0.85 es 0.7555


---

---

- Obviamente, una Red Neuronal para un problema de la vida real esta compuesta de muchas capas ocultas y muchos mas nodos en cada capa. Asi que, no podemos continuar haciendo predicciones usando esta muy ineficiente aproximación calculando la sumatoria ponderada en cada nodo y la activacion de cada nodo manualmente. 

- En el sentido de codificar una forma automatica de hacer predicciones, vamos a generalizar nuestra Red Neuronal. Una Red Neuronal tomaría **n** inputs, tendria muchas capas ocultas, cada capa oculta tendria **m** nodos, y tendria una capa de salida. La red que codificaremos tendria la siguiente apariencia: 

<img src="http://cocl.us/general_neural_network" alt="Neural Network General" width=600px>



> - ## Inicializando una Red

Comenzamos por formalmente denifir la estructura de la Red.

In [19]:
n = 2   #Numero de entradas
num_hidden_layers = 2    #Numero de capas ocultas
m = [2, 2]   #Numero de nodos en cada capa oculta 
num_nodes_output = 1   #Numero de nodos en la capa de salida

Ahora que definimos la estructura de la Red, vamos a inicializar los Pesos y los Bias en la Red con numero aleatorios. En el sentido de inicializar los pesos y bias con numero aleatorios, necesitaremos importar la libreria **Numpy**

In [20]:
import numpy as np

num_nodes_previous = n    #Numero de nodos en la capa anterior

network = {}    #inicializamos la red como un diccionario vacio

for layer in range(num_hidden_layers + 1): 
    
    # determine name of layer
    if layer == num_hidden_layers:
        layer_name = 'output'
        num_nodes = num_nodes_output
    else:
        layer_name = 'layer_{}'.format(layer + 1)
        num_nodes = m[layer]
    
    # initialize weights and biases associated with each node in the current layer
    network[layer_name] = {}
    for node in range(num_nodes):
        node_name = 'node_{}'.format(node+1)
        network[layer_name][node_name] = {
            'weights': np.around(np.random.uniform(size=num_nodes_previous), decimals=2),
            'bias': np.around(np.random.uniform(size=1), decimals=2),
        }
    
    num_nodes_previous = num_nodes
    
print(network) # print network

{'layer_1': {'node_1': {'weights': array([0.8 , 0.86]), 'bias': array([0.91])}, 'node_2': {'weights': array([0.57, 0.42]), 'bias': array([0.86])}}, 'layer_2': {'node_1': {'weights': array([0.51, 0.92]), 'bias': array([0.97])}, 'node_2': {'weights': array([0.79, 0.48]), 'bias': array([0.59])}}, 'output': {'node_1': {'weights': array([0.64, 0.26]), 'bias': array([0.99])}}}


- Ahora con el codigo de arriba, somo capaces de inicializar los pesos y los bias de cualquier Red con cualquier numero de capas ocultas y numero de nodos en cada capa. Pero vamos a poner este codigo en una funcion para que asi seamos capaces de ejecutar repetitivamente todo este codigo en el caso de que queramos construir una Red Neuronal. 

In [21]:
def initialize_network(num_inputs, num_hidden_layers, num_nodes_hidden, num_nodes_output):
    
    num_nodes_previous = num_inputs # number of nodes in the previous layer

    network = {}
    
    # loop through each layer and randomly initialize the weights and biases associated with each layer
    for layer in range(num_hidden_layers + 1):
        
        if layer == num_hidden_layers:
            layer_name = 'output' # name last layer in the network output
            num_nodes = num_nodes_output
        else:
            layer_name = 'layer_{}'.format(layer + 1) # otherwise give the layer a number
            num_nodes = num_nodes_hidden[layer] 
        
        # initialize weights and bias for each node
        network[layer_name] = {}
        for node in range(num_nodes):
            node_name = 'node_{}'.format(node+1)
            network[layer_name][node_name] = {
                'weights': np.around(np.random.uniform(size=num_nodes_previous), decimals=2),
                'bias': np.around(np.random.uniform(size=1), decimals=2),
            }
    
        num_nodes_previous = num_nodes

    return network # return the network

#### Ahora vamos a usar la funcion `inicialize_network` para crear una red que: 

1.  Tome 5 inputs
2.  Tenga 3 capas ocultas
3.  tenga 3 nodos en la primera capa, 2 nodos en la segunda capa, y 3 nodos en la tercera capa
4.  tenga 1 nodo en la capa de salida

Llamaremos a la Red **small_network**.

In [22]:
small_network = initialize_network(5, 3, [3, 2, 3], 1)

## Calcular la Suma Ponderada en cada nodo

La suma ponderada en cada nodo es calculada como el producto punto de las entradas y los pesos + los bias. Asi que vamos a crear una funcion llamada `compute_weighted_sum` que haria eso.

In [23]:
def compute_weighted_sum(inputs, weights, bias):
    return np.sum(inputs * weights) + bias

- Generamos 5 entradas que puedan alimentar a **small_network**

In [24]:
from random import seed
import numpy as np

np.random.seed(12)
inputs = np.around(np.random.uniform(size=5), decimals=2)

print('Las entradas a la Red son {}'.format(inputs))

Las entradas a la Red son [0.15 0.74 0.26 0.53 0.01]


- Usamos la funcion *compute_weighted_sum* para calcular la suma ponderada en el primer nodo de la primera capa oculta.

In [26]:
node_weights = small_network['layer_1']['node_1']['weights']
node_bias = small_network['layer_1']['node_1']['bias']

weighted_sum = compute_weighted_sum(inputs, node_weights, node_bias)
print('La suma ponderada en el primer nodo de la capa oculta es {}'.format(np.around(weighted_sum[0], decimals=4)))

La suma ponderada en el primer nodo de la capa oculta es 1.7668


## Calcular el Nodo de Activacion

Recordar que la salida de cada nodo es una transformacion simple no-lineal de la suma ponderada. Usamos la funcion de activacion para este mapeo. Usamos la funcion sigmoide como la funcion de activacion aqui. Asi que vamos a definir una funcion que tome la suma ponderada como entrada y retorne la transformacion no-lineal de la entrada usando la funcion Sigmoide.

In [27]:
def node_activation(weighted_sum):
    return 1.0 / (1.0 + np.exp(-1 * weighted_sum))

#### Usar la funcion _node_activation_ para calcular la salida del primer nodo en la primera capa oculta.

In [29]:
node_output  = node_activation(compute_weighted_sum(inputs, node_weights, node_bias))
print('La salida en el primer nodo en la capa oculta es {}'.format(np.around(node_output[0], decimals=4)))

La salida en el primer nodo en la capa oculta es 0.8541


## Forward Propagation

La pieza final de la construccion de una Red Neuronal que puede realizar predicciones es poner todo junto. Asi que vamos a crear una funcion que aplique las funciones **_compute_weighted_sum_ and _node_activation_** para cada nodo en la Red y propagen todos los datos de forma que las predicciones de las salidas y capa de salida propagen una prediccion por cada nodo en la capa de salida.

- La manera en que vamos a relizar esto es a traves de el siguiente procesimiento: 

1.  Comenzar con una capa de entrada como la entrada a la primera capa oculta.
2.  Calcular la suma ponderada en los nodos de la actual capa.
3.  calcular la salida de los nodos de las actuales capas.
4.  Configurar la salida de la actual capa para ser la entrada a la siguiente capa.
5.  Mover a la siguiente capa en la Red.
6.  Repetir los pasos 2 - 4 hasta que calculemos la salida de la capa de salida.

In [30]:
def forward_propagate(network, inputs):
    
    layer_inputs = list(inputs) # start with the input layer as the input to the first hidden layer
    
    for layer in network:
        
        layer_data = network[layer]
        
        layer_outputs = [] 
        for layer_node in layer_data:
        
            node_data = layer_data[layer_node]
        
            # compute the weighted sum and the output of each node at the same time 
            node_output = node_activation(compute_weighted_sum(layer_inputs, node_data['weights'], node_data['bias']))
            layer_outputs.append(np.around(node_output[0], decimals=4))
            
        if layer != 'output':
            print('The outputs of the nodes in hidden layer number {} is {}'.format(layer.split('_')[1], layer_outputs))
    
        layer_inputs = layer_outputs # set the output of this layer to be the input to next layer

    network_predictions = layer_outputs
    return network_predictions

#### Usar la funcion _forward_propagate_ para calcular la prediccion de nuestra pequeña red.

In [31]:
predictions = forward_propagate(small_network, inputs)
print('The predicted value by the network for the given input is {}'.format(np.around(predictions[0], decimals=4)))

The outputs of the nodes in hidden layer number 1 is [0.8541, 0.861, 0.772]
The outputs of the nodes in hidden layer number 2 is [0.7532, 0.9457]
The outputs of the nodes in hidden layer number 3 is [0.6559, 0.7953, 0.8568]
The predicted value by the network for the given input is 0.7886


- De esta manera construimos el codigo para definir una Red Neuronal. 

Podemos especificar el numero de entradas que una Red Neuronal puede tomar, el numero de capas ocultas como tambien el numero de nodos en cada capa oculta y el numero de nodos en la capa de salida. 

Primeramente usamos *inicialize_network* para crear nuestra Red Neuronal y definir sus pesos y Bias.

In [32]:
my_network = initialize_network(5, 3, [2, 3, 2], 3)

Luego, para euna entrada dada.

In [33]:
inputs = np.around(np.random.uniform(size=5), decimals=2)

Calculamos las predicciones de la Red:

In [34]:
predictions = forward_propagate(my_network, inputs)
print('The predicted values by the network for the given input are {}'.format(predictions))

The outputs of the nodes in hidden layer number 1 is [0.8857, 0.8889]
The outputs of the nodes in hidden layer number 2 is [0.7822, 0.6965, 0.7411]
The outputs of the nodes in hidden layer number 3 is [0.868, 0.881]
The predicted values by the network for the given input are [0.8952, 0.8222, 0.8035]


- Esto concluye este pequeño tutorial de como funciona una Red Neuronal y como construir una Red Neuronal automatizada, cambiando simplemente las capas de entrada, los nodos de cada capa, capas ocultas y capas de salida. 