Carguemos el conjunto de datos y dividámoslo en un conjunto de entrenamiento y un conjunto de prueba, de la siguiente manera:

In [1]:
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from numpy import genfromtxt

dataset = genfromtxt('https://raw.githubusercontent.com/m-mehdi/tutorials/main/boston_housing.csv', delimiter=',')
X = dataset[:,:-1]
y = dataset[:,-1]
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.25, random_state=0)

Ahora, podemos entrenar el modelo de regresión lineal y luego imprimir el puntaje del conjunto de entrenamiento y el puntaje del conjunto de prueba:

In [2]:
lr = LinearRegression().fit(X_train, y_train)

print(f"Puntaje de entrenamiento por Regresion Lineal: {lr.score(X_train, y_train):.2f}")
print(f"Puntaje de testeo por Regresion Lineal: {lr.score(X_test, y_test):.2f}")

Puntaje de entrenamiento por Regresion Lineal: 0.95
Puntaje de testeo por Regresion Lineal: 0.61


La comparación del rendimiento del modelo en el conjunto de entrenamiento y el conjunto de prueba revela que el modelo sufre de sobreajuste.

CON L2:

Para evitar el sobreajuste y controlar la complejidad del modelo, usemos la regresión de cresta (regularización L2) y veamos qué tan bien funciona en el conjunto de datos:

In [3]:
from sklearn.linear_model import Ridge
ridge = Ridge(alpha=0.7).fit(X_train, y_train)
print(f"Puntaje de entrenamiento por Regresion Ridge: {ridge.score(X_train, y_train):.2f}")
print(f"Puntaje de testeo por Regresion Ridge: {ridge.score(X_test, y_test):.2f}")

Puntaje de entrenamiento por Regresion Ridge: 0.90
Puntaje de testeo por Regresion Ridge: 0.76


Aunque la puntuación del conjunto de entrenamiento de la regresión de cresta es ligeramente más baja que la puntuación del entrenamiento de regresión lineal, la puntuación del conjunto de prueba de cresta es significativamente más alta que la puntuación del conjunto de prueba de regresión lineal. Estos puntajes confirman que la regresión de crestas reduce la complejidad del modelo, lo que conduce a un modelo menos sobreajustado pero más general.

CON L1

El parámetro alpha especifica una compensación entre el rendimiento del modelo en el conjunto de entrenamiento y su simplicidad. Por lo tanto, aumentar el alpha (su valor predeterminado es 1,0) simplifica el modelo al reducir los coeficientes.

Ahora, apliquemos la regresión de Lasso al conjunto de datos y exploremos los resultados.

In [4]:
from sklearn.linear_model import Lasso
lasso = Lasso(alpha=1.0).fit(X_train, y_train)
print(f"Puntaje de entrenamiento por Regresion Lasso: {lasso.score(X_train, y_train):.2f}")
print(f"Puntaje de testeo por Regresion Lasso: {lasso.score(X_test, y_test):.2f}")

Puntaje de entrenamiento por Regresion Lasso: 0.29
Puntaje de testeo por Regresion Lasso: 0.21


Como se muestra, el lasso tiene un rendimiento bastante decepcionante y es una señal de falta de adecuación. El modelo de lazo no funciona bien porque la mayoría de los coeficientes se han vuelto exactamente cero. Si queremos saber el número exacto de características que se han utilizado en el modelo, podemos utilizar el siguiente código:

In [5]:
print(f"NUmero de funciones: {sum(lasso.coef_ != 0)}")

NUmero de funciones: 4


Esto significa que solo 4 de las 104 funciones del conjunto de entrenamiento se usan en el modelo de regresión de lasso, mientras que el resto se ignora.

Ajustemos alpha para reducir el ajuste insuficiente disminuyendo su valor a 0.01:

In [6]:
lasso = Lasso(alpha=0.01).fit(X_train, y_train)
print("Puntaje de entrenamiento por Regresion Lasso: {:.2f}".format(lasso.score(X_train, y_train)))
print("Puntaje de testeo por Regresion Lasso: {:.2f}".format(lasso.score(X_test, y_test)))

Puntaje de entrenamiento por Regresion Lasso: 0.90
Puntaje de testeo por Regresion Lasso: 0.77


  coef_, l1_reg, l2_reg, X, y, max_iter, tol, rng, random, positive


In [8]:
print(f"Numero de funciones: {sum(lasso.coef_ != 0)}")

Numero de funciones: 32


Volver a ejecutar el código a continuación muestra que al disminuir alpha, el modelo Lasso usa 32 de las 104 funciones:

Aunque podemos reducir alpha aún más, parece que su valor óptimo es 0.01.

 Usando la técnica que vamos a utilizar es la ElasticNet:

In [7]:
from sklearn.linear_model import ElasticNet
elastic_net = ElasticNet(alpha=0.01, l1_ratio=0.01).fit(X_train, y_train)
print(f"Puntaje de entrenamiento para el modelo Elastic Net: {elastic_net.score(X_train, y_train):.2f}")
print(f"Puntaje de testeo para el modelo Elastic Net: {elastic_net.score(X_test, y_test):.2f}")

Puntaje de entrenamiento para el modelo Elastic Net: 0.84
Puntaje de testeo para el modelo Elastic Net: 0.70


  coef_, l1_reg, l2_reg, X, y, max_iter, tol, rng, random, positive
