# Implementación de Redes Neuronales 

El presente cuaderno tiene como finalidad los siguientes objetivos:

- Profundizar el entendimiento del algoritmo de *Back-propagation* para el entrenamiento de Redes Neuronales densas.
- Explorar los mecanismos para evitar el *Overfitting* del algoritmo mediante los métodos **L2**, **L1** y **Dropout**.

## El algoritmo de *Back propagation*

El primer paso es importar las librerías que necesitamos:

In [1]:
from numpy import array, zeros, exp, random, dot, shape, reshape, meshgrid, linspace, transpose

import matplotlib.pyplot as plt # for plotting
import matplotlib
matplotlib.rcParams['figure.dpi'] = 300 # High resolution display

El siguiente paso sería el de obtener las funciones preliminares necesarias para poder implementar el algoritmo:

In [2]:
def net_f_df(z): # Calcula la función de activación f(z) y su derivada f'(z)
    val = 1 / (1 + exp(-z)) # sigmoid
    return ( val, exp(-z)*(val ** 2) ) 

In [3]:
def forward_step(y, w, b):
    """
    Calcula los valores de la siguiente capa (layer) dados:
        y: Vector de la capa anterior a la capa que se va a calacular.
        w: Matriz de pesos (weights) utilizados que conectan las dos capas.
        b: vector de sesgos (bias)
    """
    z = dot(y, w) + b
    return (net_f_df(z)) # Aplica la no-linealidad y retorna el resultado.

El algoritmo de *Back-propagation* afirma que:

$$\frac{\partial E}{\partial y_{i}}=\sum_{j}w_{ij}y_{j}\left(1-y_{j}\right)\frac{\partial E}{\partial y_{j}}$$

Mientras que la actualización de los valores de los pesos, determinado por el algoritmo de *Gradient Descent* sigue la regla:

$$\Delta w_{ij} = -\sum_{k\in\text{dataset}}\alpha y_{i}^{(k)}y_{j}^{(k)}\left(1-y_{j}^{(k)}\right)\frac{\partial E^{(k)}}{\partial y_{j}^{(k)}}$$

In [4]:
def apply_net(y_in):
    """
    Realiza un cálculo en toda la red neuronal con un ejemplo de entrenamiento y_in
    """
    global Weights, Biases, NumLayers 
    global y_layer, df_layer # para almacenar y-valores y df/dz valores
    
    y = y_in # Empezamos con los valores de entrada
    y_layer[0] = y
    
    for j in range(NumLayers): # loop en el número de capas
        # j = 0 corresponde a la primera capa por encima de la capa de entrada
        y, df = forward_step(y, Weights[j], Biases[j]) # Un paso
        df_layer[j] = df # Almacena f'(z) [utilizado posteriormente en el algoritmo de Back propagation]
        y_layer[j+1] = y # Almacena f(z) [también utilizado en el algoritmo]
        return y