## Trabajo práctico 2
### Alumnos: Francisco Frusto Alvarado, Ezequiel Kaplan

In [2]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

In [4]:
#Inicializacion de pesos
W1 = np.random.random((5,6))
b1 = np.random.random((5,1))

W2 = np.random.random((1,5))
b2 = np.random.random((1,1))

theta = (W1,b1,W2,b2)


Para implementar la funcion forward, vamos a hacer los cálculos de a pasos, sabiendo:

$\newline f_{\theta}(\mathrm{\mathbf{x}}) = W_{2} \ \sigma (W_{1} \mathrm{\mathbf{x}} + b_{1}) + b{2} $

En una primera instancia calculamos $ z_{1} = W_{1} \mathrm{\mathbf{x}} + b_{1}$ en la que hacemos el producto punto entre $\mathrm{\mathbf{x}}$ y $W_{1}$ y luego le sumamos el vector $b_{1}$. 

En un segundo paso, habiendo creado la funcion sigmoid que calcula: $\sigma(x) = \frac{1}{1 + e^{-x}}$ vamos a aplicarle esta funcion a los elementos de $z_{1}$

En un tercer paso, calculamos el resultado final en el que se hace el producto punto entre $W_{2}$ y el resultado anterior y ademas, se le suma el vector $b_{2}$

In [None]:
def sigmoid(x):
    return 1 / (1 + np.exp(-x))

def forward(theta, x):
    W1, b1, W2, b2 = theta

    z1 = np.dot(W1, x) + b1
    a1 = sigmoid(z1)
    z2 = np.dot(W2, a1) + b2

    return z2

La funcion obejtivo que buscamos minimizar, sabemos que está dada por: 
$\newline L = \frac{1}{2}(f_{\theta_{t}}(\mathrm{\mathbf{x}}_{i}) - y_{i})^2$

Para calcular el gradiente de forma numércia, vamos a usar la estrategia propuesta por la cátedra para calcular las derivadas parciales. 

In [None]:
#Calculo del gradiente numerico

def funcion_objetivo(theta, x, y):
    loss = 0.5 * (forward(theta, x) - y)**2
    return loss

def numerical_gradient(theta, x, y, eps):
    epsilon = eps  # Pequeña cantidad para el cálculo numérico del gradiente
    gradiente = np.zeros_like(theta)

    for i in range(len(theta)):
        theta_plus = theta.copy()
        theta_minus = theta.copy()

        # Aumentar y disminuir un poco el parámetro actual para calcular el gradiente
        theta_plus[i] += epsilon
        theta_minus[i] -= epsilon

        # Calcular las pérdidas para los parámetros aumentados y disminuidos
        loss_plus = funcion_objetivo(theta_plus, x, y)
        loss_minus = funcion_objetivo(theta_minus, x, y)

        # Calcular el gradiente parcial utilizando las derivadas parciales
        gradiente[i] = (loss_plus - loss_minus) / (2 * epsilon)

    return gradiente

In [None]:
#funcion fit y loop de entrenamiento
def fit(theta, x, y, learning_rate=0.001, epochs=1000):
    TOLERANCIA = 0.0001
    eps = 1e-3
    loss_accum = []

    for epoch in range(epochs):
        loss_epoch = 0.0  # Pérdida acumulada en el epoch actual

        for i in range(len(x)):
            # Obtener el vector x y la salida esperada y correspondientes
            x_i = x[i]
            y_i = y[i]

            # Calcular el gradiente numérico para el ejemplo actual
            gradient = numerical_gradient(theta, x_i, y_i, eps)

            # Actualizar los parámetros
            theta -= learning_rate * gradient

            # Calcular la pérdida para el ejemplo actual
            loss_i = funcion_objetivo(theta, x_i, y_i)
            loss_epoch += loss_i

        # Calcular la pérdida promedio para el epoch actual
        loss_avg = loss_epoch / len(x)
        loss_accum.append(loss_avg)

        if abs(theta - loss_avg) < TOLERANCIA:
            break

    return loss_accum



In [None]:
def predict(x):
        y = np.dot(x, theta)
        return y

In [None]:
# Entrenar la red neuronal
loss_accum = fit(theta, x, y, learning_rate=0.001, epochs=1000)

# Obtener predicciones en el conjunto de datos de prueba
y_pred = predict(x)

# Calcular el error cuadrático medio en el conjunto de datos de prueba
mse = ((y_pred - y) ** 2).mean()

# Graficar la función objetivo a lo largo del entrenamiento
plt.plot(loss_accum)
plt.xlabel('Épocas')
plt.ylabel('Función Objetivo')
plt.title('Evolución de la función objetivo durante el entrenamiento')
plt.show()

# Graficar el error cuadrático medio en el conjunto de datos de prueba
plt.scatter(y, y_pred)
plt.xlabel('Valor Real')
plt.ylabel('Predicción')
plt.title('Predicciones vs. Valores Reales en el conjunto de datos de prueba')
plt.show()

print(f'Error cuadrático medio en el conjunto de datos de prueba: {mse}')
