### Introducción

En este laboratorio, estaremos creando redes neurales desde cero, analizaremos su performance y el uso de formward propagation. Nota: Todas las librerias relacionadas a Deep Learning, ya cuentan con las funciones y procedimientos para la creación de las redes neurales, por tanto, en la practica no sera necesario realizar las redes neurales desde cero.  El enfoque de este laboratorio es ayudarte a comprender el comportamiento de las redes neurales. 

#### Artificial Neural Networks - Forward Propagation
Resumen

De la ultima clase, podemos recapitular como es que las redes neurales funcionan y la importancia de tener una función de propagación. Aqui esta una red neural que contiene dos inputs, contine una "hidden layer" con dos nodos y su respectiva salida. 



Comencemos por inicializar aleatoriamente los pesos y los sesgos en la red. Tenemos 6 pesos y 3 sesgos, uno para cada nodo en la capa oculta y para cada nodo en la capa de salida. 

In [36]:
import numpy as np
weights = np.around(np.random.uniform(size = 6), decimals = 2)
biases = np.around(np.random.uniform(size = 3), decimals = 2)

Veamos el resultado generado

In [37]:
print(weights)
print(biases)

[0.38 0.52 0.01 0.21 0.03 0.57]
[0.28 0.3  0.97]


Ahora que tenemos los pesos y los sesgos definidos para la red, calculemos la salida para una entrada dada, $x_1$ and $x_2$.

In [38]:
x_1 = 0.5
x_2 = 0.85
print("x1: {} y x2: {}".format(x_1,x_2))

x1: 0.5 y x2: 0.85


Comencemos calculando la suma ponderada de las entradas  $z_{1, 1}$, para el primer nodo de la capa oculta.

In [39]:
#z1_1 = x1*w1 + x2*w2 + ... + xn*wn + b
z1_1 = x_1 * weights[0] + x_2 * weights[1] + biases[0]
z1_1

0.912

Ahora, completa la suma de los pesos de los imputs  $z_{1, 2}$, para el segundo nodo de la capa oculta. Asigna el valor a z_12

In [40]:
#z1_2 = x1*w1 + x2*w2 + ... + xn*wn + b
z1_2 = x_1 * weights[2] + x_2 * weights[3] + biases[1]
z1_2

0.4835

Imprime la suma de los pesos para z_12.  R[1.0625]

In [41]:
print(z1_2)

0.4835


Ahora, asumiendo una función de activación sigmoid, calculemos la activación del primer nodo

In [42]:
a1_1 = 1 / (1+np.exp(-z1_1))
print(a1_1)

0.7134092502058658


Calcula también la activación del segundo nodo. $a_{1, 2}$, para la capa oculta y asignalo a a_12. 

In [43]:
a1_2 = 1 / (1+np.exp(-z1_2))
print(a1_2)

0.6185740074950563


Imprime el valor de la función de activacion para el segundo nodo. R[0.7432]

In [44]:
print(a1_2)

0.6185740074950563


Ahora estas activaciones servirán como entradas a la capa de salida. Entonces, calculemos la suma ponderada de estas entradas al nodo en la capa de salida. Asigna el valor a z_2.

In [45]:
z2 = a1_1 * weights[4] + a1_2 * weights[5] + biases[2]
print(z2)

1.3439894617783579


Imprime la suma de los pesos del nodo de salida. R[1.0025]

In [46]:
print(z2)

1.3439894617783579


Finalmente, muestra la salida de la funcion de activacion del nodo de output layer asignado a a_2

In [47]:
a2 = 1 / (1 + np.exp(-z2))
print(a2)

0.7931452414463654


### Siguientes pasos
Obviamente, las redes neuronales para problemas reales se componen de muchas capas ocultas y muchos más nodos en cada capa. Por lo tanto, no podemos continuar haciendo predicciones utilizando este enfoque tan ineficiente de calcular la suma ponderada en cada nodo y la activación de cada nodo manualmente.

Para codificar una forma automática de hacer predicciones, generalicemos nuestra red. Una red general tomaría $n$ entradas, tendría muchas capas ocultas, cada capa oculta tendría $m$ nodos y tendría una capa de salida. 

Inicialización de la red
Definamos la estructura de la red

n = 2 # inputs
num_hidden_layers = 2 # hidden layers
m = [2, 2] # nodes in each hidden layer
num_nodes_output = 1 # nodes in the output layer
Ahora que definimos la estructura de la red, sigamos adelante e iniciemos los pesos y los sesgos en la red a números aleatorios. Para poder inicializar los pesos y los sesgos a números aleatorios, necesitaremos importar la libreria Numpy.

 

import numpy as np 
num_nodes_previous = n 
network = {} # empty network
##### loop through each layer and randomly initialize the weights and biases
​
for layer in range(num_hidden_layers + 1):     
    if layer == num_hidden_layers:     # if output layer 
        layer_name = 'output'
        num_nodes = num_nodes_output
    else:                              # not output layer
        layer_name = 'layer_{}'.format(layer + 1)
        num_nodes = m[layer]
    
    # initialize weights and biases
    network[layer_name] = {}
    for node in range(num_nodes):
        node_name = 'node_{}'.format(node+1)
        network[layer_name][node_name] = {
            'weights': np.around(np.random.uniform(size=num_nodes_previous), decimals=2),
            'bias': np.around(np.random.uniform(size=1), decimals=2),
        }
    
    num_nodes_previous = num_nodes
    
print(network) 
¡Ahora con el código anterior, podemos inicializar los pesos y los sesgos pertenecientes a cualquier red de cualquier número de capas ocultas y número de nodos en cada capa. Trabajemos en una función para que podamos ejecutar repetidamente todo este código siempre que queramos construir una red neuronal.

In [48]:
def initialize_network(num_inputs, num_hidden_layers, num_nodes_hidden, num_nodes_output):
    num_nodes_previous = num_inputs 
    network = {}
    for layer in range(num_hidden_layers + 1):
        
        if layer == num_hidden_layers:
            layer_name = 'output' # output layer 
            num_nodes = num_nodes_output
        else:
            layer_name = 'layer_{}'.format(layer + 1) # layer a number
            num_nodes = num_nodes_hidden[layer] 
        
        # initialize weights and bias 
        network[layer_name] = {}
        for node in range(num_nodes):
            node_name = 'node_{}'.format(node+1)
            network[layer_name][node_name] = {
                'weights': np.around(np.random.uniform(size=num_nodes_previous), decimals=2),
                'bias': np.around(np.random.uniform(size=1), decimals=2),
            }
    
        num_nodes_previous = num_nodes

    return network # return the network

### Usa la función anterior, initialize_network, para crear una red con las siguientes caracteristicas:
5 inputs

3 hidden layers

3 nodos en la primera capa, 2 nodos en la segunda capa y 3 nodos en la tercera capa. 

1 output layer

Almacena la red en la variable small_network.

In [49]:
n = 5 # inputs
num_hidden_layers = 3 # hidden layers
m = [3, 2, 3] # nodes in each hidden layer
num_nodes_output = 1 # nodes in the output layer

small_network = initialize_network(n, num_hidden_layers, m, num_nodes_output)

#### Calcular la suma pondera
La suma ponderada en cada nodo se calcula como el producto escalar de las entradas y los pesos más el sesgo. 

In [50]:
def compute_weighted_sum(inputs, weights, bias):
    return np.sum(inputs * weights) + bias

Generemos 5 entradas que podamos alimentar small_network.

In [51]:
from random import seed
import numpy as np

np.random.seed(12)
inputs = np.around(np.random.uniform(size=5), decimals=2)

print('The inputs to the network are {}'.format(inputs))

The inputs to the network are [0.15 0.74 0.26 0.53 0.01]


Usa la función compute_weighted_sum para obtener las sumas ponderadas para el primer nodo de la primera capa oculta R[1.518]

In [61]:
computed_weight = compute_weighted_sum(inputs, small_network["layer_1"]["node_1"]["weights"], small_network["layer_1"]["node_1"]["bias"])
print(computed_weight)

[1.2788]


### Activación del nodo
Recuerda que la salida de cada nodo es simplemente una transformación no lineal de la suma ponderada. Usamos funciones de activación para este mapeo. Usemos la función Sigmoid como función de activación.

In [62]:
def node_activation(weighted_sum):
    return 1.0 / (1.0 + np.exp(-1 * weighted_sum))

Usa la función node_activation para obtener la salida del primer nodo en la primer capa oculta. R[1.518]

In [63]:
print(node_activation(computed_weight))

[0.78224544]


### Forward Propagation
La construcción de una red neuronal que puede realizar predicciones es juntar todo. Entonces,  hagamos una función que aplique las funciones compute_weighted_sum y node_activation a cada nodo en la red y propague los datos hasta la capa de salida y genere una predicción para cada nodo en la capa de salida.

#### Pseudo-codigo

1. Empezar con capa de inputs
2. Calcular la suma ponderada en los nodos de la capa actual.
3. Calcular la salida de los nodos de la capa actual.
4. Generar la salida de la capa actual para que sea la entrada a la siguiente capa.
5. Siguiente capa de la red.
6. Repita los pasos 2 a 4 hasta que calculemos la salida de la capa de salida.

In [64]:
def forward_propagate(network, inputs):
    
    layer_inputs = list(inputs) 
    for layer in network:
        
        layer_data = network[layer]
        
        layer_outputs = [] 
        for layer_node in layer_data:
        
            node_data = layer_data[layer_node]
            node_output = node_activation(compute_weighted_sum(layer_inputs, node_data['weights'], node_data['bias']))
            layer_outputs.append(np.around(node_output[0], decimals=4))
            
        if layer != 'output':
            print('The outputs of the nodes in hidden layer number {} is {}'.format(layer.split('_')[1], layer_outputs))
    
        layer_inputs = layer_outputs 

    network_predictions = layer_outputs
    return network_predictions

Utiliza forward_propagate para la red small_network

In [65]:
print(forward_propagate(small_network, inputs))

The outputs of the nodes in hidden layer number 1 is [0.7822, 0.6698, 0.8437]
The outputs of the nodes in hidden layer number 2 is [0.8937, 0.7655]
The outputs of the nodes in hidden layer number 3 is [0.8447, 0.7152, 0.7855]
[0.841]
