# Regresión Lineal  con Múltiples Variables de Entrada 


En este ejercicio, tu objetivo será implementar el método `forward` de un modelo de Regresión Lineal con una múltiples variables de entrada y _una_ de salida. No debés implementar ningún otro método.

La función se encuentra en la clase `RegresionLineal`.

Luego, ejecuta las pruebas para verificar que implementaste correctamente el modelo.




In [None]:
!pip install -q rnutil
import rnutil

import numpy as np


class RegresionLineal:
    '''
    Esta clase permite entrenar modelos de regresión lineal, cuya función de predicción es:
    y = x . w + b
    Los parámetros son:
    w: un vector de flotantes de la misma dimensionalidad de x, es decir un vector de tamaño dx1
    b (un flotante)
    La entrada x debe ser d dimensional, es decir, un vector de tamanio 1xd (o n de tamanño nxd).
    '''

    def __init__(self,w:np.ndarray,b:float):
        self.w=w
        self.b=b
    
    def __repr__(self):
        return f"{self.__class__.__name__}(w = {self.w}, b = {self.b:.5f})"

    def forward(self,x:np.ndarray):
        '''
        Debés implementar el forward del modelo
        :param x: vector de d dimensiones y n ejemplos con los valores de entrada
        :return: la predicción x*w+b
        '''
        n,d=x.shape
        
        assert (len(self.w) == d)
        
        y=np.zeros(n)

        ### IMPLEMENTAR ####
        # Calcular la salida *y* en base a: 
        # x: valor de entrada
        # self.w: vector de pesos (variable de instancia, por eso el "self.")
        # self.b: sesgo o bias (variable de instancia, por eso el "self.")
        # Ejemplo
        # x = NxD = 5x3
        # w = 3x1
        # np.dot(a,b) : producto escalar
        # a @ b : mult de matrices
        # y = x * w + b
        # for i in range(n):
        #   xi = x[i,:]
        #   # xi : 1x3
        #   y[i] = 

        
        assert (len(y) == n)
        
        return y
    
    def backward(self,x:np.ndarray,y:np.ndarray)->(float,float):
        '''
        Calcula las derivadas de los parámetros del modelo con respecto 
        al error cuadrático medio y al conjunto de datos (x,y)
        No necesitas implementar nada aqui
        :param x: vector de d dimensiones y n ejemplos con los valores de entrada
        :param y: vector 1D con los n valores de salida _verdaderos_ 
        :return derivada del error respecto de w y b
        '''
        d=len(self.w)
        yhat = self.forward(x)
        # calculo de derivadas
        dEdw=np.zeros(d)
        for i in range(d):
            dEdw[i] = 2 * ((yhat - y)*x[:,i]).mean()
        dEdb = 2 * (yhat - y).mean()
        return dEdw,dEdb

    def fit(self,x:np.ndarray,y:np.ndarray,lr:float=0.001,epochs:int=100):
        '''
        No necesitas implementar nada aqui
        Entrena el modelo (ajusta los parámetros) para minimizar el error cuadrático medio
        Mediante descenso de gradiente
        :param x: vector de d dimensiones y n ejemplos con los valores de entrada
        :param y: vector 1D con los n valores de salida _verdaderos_ 
        :param alpha: velocidad de aprendizaje
        :param iterations: cantidad de iteraciones de aprendizaje
        '''
        
        assert (len(x.shape) == 2)
        assert (len(y.shape) == 1)
        assert ( len(y) == len(x))
        n = len(x)

        for i in range(epochs):
            dEdw,dEdb=self.backward(x,y)
            # actualizo los parámetros
            self.w = self.w - lr * dEdw # dEdw es un vector con tantos valores como w
            self.b = self.b - lr * dEdb
            print(f"Epoch {i+1}/{epochs} => Error = {self.error(x,y)}")
        
    def error(self,x:np.ndarray,y:np.ndarray)->float:
        '''
        Error cuadrático medio (MSE) del modelo
        No necesitas implementar nada aqui
        :param x: vector de d dimensiones y n ejemplos con los valores de entrada
        :param y: vector 1D con los n valores de salida _verdaderos_ 
        :return flotante con el error promedio del modelo entre todos los ejemplos
        '''
        
        yhat = self.forward(x)
        d2 = (y-yhat)**2
        return d2.mean()
    

# Ejecuta el siguiente bloque para verificar que la función `forward` está bien implementada. 

Si todos los valores son iguales, la implementación del `forward` debería estar bien realizada.

In [None]:
x=np.array([[1.0,2.0]
            ,[2.0,3.0]
            ,[3.0,4.0]])

w1=np.zeros(2) # [0,0]
rl1=RegresionLineal(w1,0.0)
y=rl1.forward(x)
rnutil.verificar_igualdad(y,np.zeros(3))


w2=np.ones(2)
rl2=RegresionLineal(w2,0.0)
y=rl2.forward(x)
rnutil.verificar_igualdad(y,np.array([3.0,5.0,7.0]))

w3=np.zeros(2)
rl3=RegresionLineal(w3,1.0)
y=rl3.forward(x)
rnutil.verificar_igualdad(y,np.ones(3))


w4=np.ones(2)
rl4=RegresionLineal(w4,1.0)
y=rl4.forward(x)
rnutil.verificar_igualdad(y,np.array([4.0,6.0,8.0]))


# Verifica que el modelo se entrena correctamente.

In [None]:
# Carga del dataset
data=rnutil.load_dataset_numpy("study_regression_2d_small.csv")
#dividir en entradas y salidas
x,y=data[:,0:2],data[:,2]
# tamaño de los datos
# n= cant de ejemplos
# cant de dimensiones
n,d=x.shape

print("Si no implementaste el forward, el entrenamiento no funcionará correctamente.")
# Creación del modelo inicial
print("Inicialización aleatoria del modelo; vuelve a correr esta celda para obtener otros resultados")
w_random=np.random.rand(d)
b_random=np.random.rand()
rl=RegresionLineal(w_random,b_random)

# visualización del modelo inicial
print(f"Modelo inicial: {rl}. Error cuadrático medio: {rl.error(x,y):.4f}")
rnutil.plot_regresion_lineal(rl.w,rl.b,x[:,0],x[:,1],y,"x1 (Horas estudiadas)","x2 (Promedio)","y (Nota)",title="Modelo Inicial")

#Entrenamiento del modelo
rl.fit(x,y,lr=0.001,epochs=100)

# visualiza el modelo y los datos
rnutil.plot_regresion_lineal(rl.w,rl.b,x[:,0],x[:,1],y,"x1 (Horas estudiadas)","x2 (Promedio)","y (Nota)",title="Modelo Final")
print(f"Modelo inicial: {rl}. Error cuadrático medio: {rl.error(x,y):.4f}")


