In [1]:
import pandas as pd
from sklearn import datasets
from sklearn.linear_model import Lasso
import numpy as np
from sklearn.model_selection import GridSearchCV

In [2]:
diabetes = datasets.load_diabetes()
y = diabetes.target
X = diabetes.data

feature_names = ["age", "sex", "bmi", "bp", "s1", "s2", "s3", "s4", "s5", "s6"]

X_train = X[:310]
y_train = y[:310]

X_test = X[310:]
y_test = y[310:]

In [8]:
lasso = Lasso(random_state=0)
alphas = np.logspace(-4, -.5, 30)

Acá se inicializa el estimador Lasso, y se crean distintos "alphas" para el mismo que posteriormente se utilizarán con la finalidad de buscar el óptimo de estos. Es decir que este parámetro controla que tan estricto es la penalización.
Lasso lo que hace es tratar de penalizar los features que menos relevantes son, y así quedarse con solo los que importan directamente con los resultados a predecir.

In [9]:
estimator = GridSearchCV(lasso, dict(alpha=alphas))
estimator.fit(X_train, y_train)

GridSearchCV(estimator=Lasso(random_state=0),
             param_grid={'alpha': array([1.00000000e-04, 1.32035178e-04, 1.74332882e-04, 2.30180731e-04,
       3.03919538e-04, 4.01280703e-04, 5.29831691e-04, 6.99564216e-04,
       9.23670857e-04, 1.21957046e-03, 1.61026203e-03, 2.12611233e-03,
       2.80721620e-03, 3.70651291e-03, 4.89390092e-03, 6.46167079e-03,
       8.53167852e-03, 1.12648169e-02, 1.48735211e-02, 1.96382800e-02,
       2.59294380e-02, 3.42359796e-02, 4.52035366e-02, 5.96845700e-02,
       7.88046282e-02, 1.04049831e-01, 1.37382380e-01, 1.81393069e-01,
       2.39502662e-01, 3.16227766e-01])})

En este punto se inicializa el GridSearchCV, el cual usará el estimador lasso múltiples veces con los distintos parámetros que se le pasan a continuación, con la finalidad de devolver el más optimo.
A menor alpha, mayor penalización a los no relevantes features.

In [24]:
print(estimator.best_estimator_)
print(estimator.best_score_)

Lasso(alpha=0.07880462815669913, random_state=0)
0.46170948106181964


De el estimador podemos extraer el best_estimator, que básicamente son los parámetros que mejor se ajustan al modelo. (en este caso el mejor alpha)
Y el best_score que nos dice el score del mejor estimador

In [25]:
estimator.predict(X_test)

array([199.93864949, 178.15721853, 123.03190244, 212.49049201,
       171.7225727 , 118.00948701, 201.00114035, 170.21721531,
       163.34131121, 183.90933367, 190.88238488, 278.22988324,
       288.52365106, 233.6560703 , 206.83259982, 227.77107101,
       156.62884613, 222.71162783, 187.99029083, 104.47239575,
       169.94555578, 110.98338081, 282.0855266 , 176.77816916,
        80.93962648,  87.75752311, 251.78458672, 163.64725803,
       123.67641457, 157.33359183, 160.41494649, 180.74753017,
       163.06411793, 154.46342209, 145.51419402, 130.61730734,
       188.10792017, 108.33007609, 128.07146849,  90.08085621,
       248.91715304,  86.45376283,  59.61600068, 189.70269521,
       208.04229933, 129.45568293,  95.70956072, 200.75788665,
        56.99031227, 169.76616519, 190.24966488, 120.81802108,
       227.80814   , 157.06636369, 158.42570567, 162.67629743,
       259.95041168, 259.48001858, 204.01293884, 182.123241  ,
        63.63372524, 213.62386558, 111.77752804, 137.49

Y acá, simplemente predecimos con datos desconocidos y de prueba.