In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import sympy as sp
from sympy import *

In [None]:
def forward(W1, W2, b1, b2, x):
   
    f1 = np.dot(x, W1) + b1
    sigma = 1 / (1 + np.exp(-f1))
    f = np.dot(sigma, W2) + b2

    return f

In [None]:
#Inicializacion de pesos
W1 = np.random.random((5,6))
b1 = np.random.random((5,1))

W2 = np.random.random((1,5))
b2 = np.random.random((1,1))

In [None]:
#Calculo del gradiente numerico

def funcion_objetivo(x, y, W1, W2, b1, b2):
    loss = 0.5 * (np.power(forward(W1, W2, b1, b2, x) - y, 2)) 
    return loss

def numerical_gradient(W1, W2, b1, b2, x, y, epsilon, alfa):
    #Tenemos que calcular el gradiente de la función objetivo en un punto, que equivale a computar las siguientes derivadas parciales respecto a cada elemento de las matrices W y los vectores b.

    der_W1 = (funcion_objetivo(x, y, W1 + epsilon, W2, b1, b2) - funcion_objetivo(x, y, W1 - epsilon, W2, b1, b2)) / (2 * epsilon)
    der_W2 = (funcion_objetivo(x, y, W1, W2 + epsilon, b1, b2) - funcion_objetivo(x, y, W1, W2 - epsilon, b1, b2)) / (2 * epsilon)
    der_b1 = (funcion_objetivo(x, y, W1, W2, b1 + epsilon, b2) - funcion_objetivo(x, y, W1, W2, b1 - epsilon, b2)) / (2 * epsilon)
    der_b2 = (funcion_objetivo(x, y, W1, W2, b1, b2 + epsilon) - funcion_objetivo(x, y, W1, W2, b1, b2 - epsilon)) / (2 * epsilon)  

    #Una vez que calculamos todos estos gradientes, podemos usarlos para actualizar la red. Hacemos esto restando una pequeña cantidad de cada derivada parcial al parámetro correspondiente. Esta cantidad es controlada por un parámetro llamado learning rate o tasa de aprendizaje. Es decir, para nuestro espacio de parámetros θ, calculamos:
    W1_nuevo = W1 - alfa * der_W1
    W2_nuevo = W2 - alfa * der_W2
    b1_nuevo = b1 - alfa * der_b1
    b2_nuevo = b2 - alfa * der_b2

    #guardamos los nuevos parametros en un arreglo llamado gradiente
    gradiente = [W1_nuevo, W2_nuevo, b1_nuevo, b2_nuevo]

    return gradiente

In [None]:
#funcion fit y loop de entrenamiento
#Implementar el método fit() que realiza el ciclo de entrenamiento de la red. En cada iteración, se calcula el valor del gradiente promedio para todas las muestras del dataset y se actualizan los parámetros de la función utilizando esta dirección.

def fit(x, y, learning_rate=0.001, epochs=1000):
    eps = 1e-3
    loss_accum = []
    for iteracion in range(epochs):
        
        W1, W2, b1, b2 = numerical_gradient(W1, W2, b1, b2, x, y, eps, learning_rate)
        loss_accum.append(np.mean(funcion_objetivo(x, y, W1, W2, b1, b2)))

    return loss_accum, W1, W2, b1, b2

In [None]:
def predict(x):
        y = forward(W1, W2, b1, b2, x)
        return y