Optimización usando LASSO
===

En esta técnica, el término de penalización es el valor absoluto de los coeficientes del modelo de regresión.

$$ \sum_{i=1}^N (y_i -  g(x_i))^2 + \alpha \sum_{p=1}^P ||w_p|| $$


$\alpha$ es un hiperparámetro suministrado por el usuario. **Nota:** Para el modelo lineal, la penalización solo aplica para los coeficientes de $x$, no para el intercepto.

In [None]:
#
# A continuación se presenta la implementación de un modelo de
# regresión lineal que usa la función de penalización LASSO para
# estimar los parámetros óptimos. Complete el código presentado
# para que pasen las pruebas definidas en las celdas restantes.
#
import numpy as np
import pandas as pd
import pytest


class LassoRegression:
    def __init__(self, intercept, coef, maxiter, mu, alpha):
        self.intercept_ = intercept
        self.coef_ = np.array(coef)
        self._maxiter = maxiter
        self._mu = mu
        self._alpha = alpha

    def compute_loss(self, x, y):
        pass

    def predict(self, x):
        return None

    def compute_gradient(self, x, y):
        pass

    def fit(self, x, y):
        for iter in range(self._maxiter):
            self.compute_gradient(x, y)
            self.improve()

    def improve(self):
        self.intercept_ = self.intercept_ - self._mu * self._grad_intercept
        self.coef_ = self.coef_ - self._mu * self._grad_coef


x = [
    [0.0, 0.1],
    [0.2, 0.3],
    [0.4, 0.5],
    [0.6, 0.7],
    [0.8, 0.9],
    [1.0, 1.1],
]

# y = 1 x1 + 1.1 x2 + 0.2
y = [
    0.31,
    0.73,
    1.15,
    1.57,
    1.99,
    2.41,
]

In [None]:
#
# Test 1
# =============================================================================
# Implemente la función de pérdida.
#
# Rta/
# True
#

# ---->>> Evaluación ---->>>
lr = LassoRegression(
    intercept=0.1,
    coef=[0.2, 0.3],
    maxiter=10000,
    mu=0.001,
    alpha=100,
)

pytest.approx(lr.compute_loss(x, y), 0.0001) == 57.5544

In [None]:
#
# Test 2
# =============================================================================
# Implemente la función de pronóstico
#
# Rta/
# True
#

# ---->>> Evaluación ---->>>
lr = LassoRegression(
    intercept=0.1,
    coef=[0.2, 0.3],
    maxiter=10000,
    mu=0.001,
    alpha=100,
)

all(
    pytest.approx(a) == b
    for a, b in zip(lr.predict(x), [0.13, 0.23, 0.33, 0.43, 0.53, 0.63])
)

In [None]:
#
# Test 3
# =============================================================================
# Implemente el gradiente
#
# Rta/
# True
# True
#

# ---->>> Evaluación ---->>>
lr = LassoRegression(
    intercept=0.1,
    coef=[0.2, 0.3],
    maxiter=10000,
    mu=0.001,
    alpha=100,
)
lr.compute_gradient(x, y)

print(lr._grad_intercept == pytest.approx(-11.76))
print(all(pytest.approx(a) == b for a, b in zip(lr._grad_coef, [91.88 , 90.704])))

In [None]:
#
# Test 4
# =============================================================================
# Implemente la función fit
#
# Rta/
# True
# True
#

# ---->>> Evaluación ---->>>
lr = LassoRegression(
    intercept=0.1,
    coef=[0.2, 0.3],
    maxiter=1000,
    mu=0.001,
    alpha=100,
)
lr.fit(x, y)
print(pytest.approx(lr.intercept_, 0.001) == 1.356084)
print(all(pytest.approx(a, 0.001) == b for a, b in zip(lr.coef_, [-0.045481 , -0.019872])))