<a href="https://colab.research.google.com/github/KarinaRmzG/Neuronal-Networks/blob/main/Ejercicio6_Backpropagation_base.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Retropropagación a un paso

La retropropagación nos brinda un mecanismo para entrenar redes de más de una capa. Su funcionamiento traslada el error en la predicción hacia atŕas usando la derivada parcial de dicho error con respecto de cada uno de los pesos. Es decir,

$$
		\frac{\partial E}{\partial w_{ho}} = \frac{\partial E}{\partial h_o} \frac{\partial h_o}{\partial w_{ho}}  =   \frac{\partial E}{\partial h_o} y_h
$$

En este primer programa implementaremos el algoritmo de retropropagación para determinar los incrementos que debe tener cada capa de la red. En un siguiente ejercicio realizaremos todo el proceso de retropropagación.

In [1]:
# Importamos paquetes
import numpy as np

In [2]:
# Funciones necesarias
#Calcula la derivada de la función sigmoide en un punto 'x'.
def sigmoid_prime(x):
    return sigmoid(x) * (1 - sigmoid(x))

#Calcula la función sigmoide en un punto 'x'.
def sigmoid(x):
    return 1/(1+np.exp(-x))

In [3]:
# Datos de entrada
# - 'x' es el vector de entrada que contiene los datos de entrada.
x = np.array([0.5, 0.1, -0.2])
# - 'target' es el vector de objetivo que contiene los valores a los que se desea llegar.
target = 0.6
# - 'learnrate' es la tasa de aprendizaje que se utiliza para ajustar los parámetros durante el proceso de optimización.
learnrate = 0.5

In [4]:
# Pesos de las conexiones entre capas
weights_input_hidden = np.array([[0.5, -0.6],
                                 [0.1, -0.2],
                                 [0.1, 0.7]])
print(weights_input_hidden)
weights_hidden_output = np.array([0.1, -0.3])
print(weights_hidden_output)

[[ 0.5 -0.6]
 [ 0.1 -0.2]
 [ 0.1  0.7]]
[ 0.1 -0.3]


## Pase frontal

Definimos el comportamiento de la red en el pase frontal.

$$
\hat{y} = f(WX)
$$

In [5]:
## Paso hacia adelante (Forward pass)
# Cálculo de la entrada a la capa oculta
hidden_layer_input = np.dot(x, weights_input_hidden)
print("Entrada: ",hidden_layer_input)
# Cálculo de la salida de la capa oculta utilizando la función sigmoide
hidden_layer_output = sigmoid(hidden_layer_input)
print("Salida de la capa oculta: ",hidden_layer_output)
# Cálculo de la entrada a la capa de salida
output_layer_in = np.dot(hidden_layer_output, weights_hidden_output)
print("Entrada 2: ",output_layer_in)
# Cálculo de la salida de la red utilizando la función sigmoide
output = sigmoid(output_layer_in)
print("Salida de la red: ",output)

Entrada:  [ 0.24 -0.46]
Salida de la capa oculta:  [0.55971365 0.38698582]
Entrada 2:  -0.06012438223148006
Salida de la red:  0.48497343084992534


## Pase hacia atrás

Calcula el cambio que deben de tener los pesos de acuerdo al error. Recordemos que para la capa de salida el término de error que se aplica es:

$$
\delta_o = (y-\hat{y})f'(h)
$$

Y para la capa oculta:

$$
\delta_h = \delta_o w_{h,o} f'(h_h)
$$

este último término de error es diferente para cada neurona con índice $h$ de la capa oculta. Es decir tendremos tantas h como neuronas tenga la capa oculta. Nota que aunque el ejercicio se puede resolver usando vectores e índices, lo implementaremos usando notación matricial.

In [6]:
## Paso hacia atrás (Backwards pass)
# Cálculo del error
error = target - output
print("Error:",error)
# Cálculo del gradiente de error para la capa de salida
del_err_output = error * sigmoid_prime(output_layer_in)
print("Gradiente de error capa de salida: ",del_err_output)

Error: 0.11502656915007464
Gradiente de error capa de salida:  0.028730669543515015


In [7]:
# Cálculo del gradiente de error para la capa oculta
del_err_hidden = del_err_output * np.multiply(weights_hidden_output, sigmoid_prime(hidden_layer_input))
print("Gradiente de error capa oculta: ",del_err_hidden)

Gradiente de error capa oculta:  [ 0.00070802 -0.00204471]


Ya que sabemos los términos de error que aplican en cada capa, procedemos a determinar los incrementos en cada capa.

$$
\Delta w_{h,o} = \Delta w_{h,o} + \delta_o \hat{y}_h
$$

$$\Delta w_{i,h} = \Delta w_{i,h} + \delta_h x_i$$

In [8]:
# Cálculo del cambio en los pesos entre la capa oculta y la capa de salida
delta_w_h_o = learnrate * del_err_output * hidden_layer_output

# Cálculo del cambio en los pesos entre la capa de entrada y la capa oculta
delta_w_i_h = learnrate * (del_err_hidden * x[:, None])

In [9]:
# Impresión de los cambios en los pesos
print('Incremento de los pesos oculta a salida:')
print(delta_w_h_o)

print('Incremento de los pesos de entrada a oculta:')
print(delta_w_i_h)

Incremento de los pesos oculta a salida:
[0.00804047 0.00555918]
Incremento de los pesos de entrada a oculta:
[[ 1.77005547e-04 -5.11178506e-04]
 [ 3.54011093e-05 -1.02235701e-04]
 [-7.08022187e-05  2.04471402e-04]]


##Conclusión
Durante el proceso de retropropagación, se calculan los gradientes de error en cada capa, lo que permite ajustar los pesos de la red para minimizar el error y mejorar la capacidad de la red neuronal para realizar predicciones.