In [4]:
"""L1 regularización, también conocida como Lasso, es una técnica utilizada en modelos de machine learning para evitar el sobreajuste, que es cuando un modelo se adapta demasiado a los datos de entrenamiento y no funciona bien con nuevos datos.

Cómo funciona la L1 Regularización:
Penalización: Al entrenar un modelo (como una regresión lineal), además de minimizar el error (la diferencia entre las predicciones y los valores reales), se añade una "penalización" que depende de los coeficientes del modelo. Esta penalización es la suma de los valores absolutos de los coeficientes.

Cero Coeficientes: La magia de la L1 regularización es que puede hacer que algunos de esos coeficientes sean exactamente cero. Esto significa que elimina algunas características (variables) del modelo. Así, el modelo se simplifica y es más fácil de interpretar.

Beneficios:

Menos Complejidad: Al eliminar características innecesarias, el modelo se vuelve más simple y generaliza mejor.
Mejor Rendimiento: Generalmente, se obtienen mejores resultados con datos nuevos.
Un Ejemplo Simple:
Imagina que estás tratando de predecir el precio de casas en función de varias características (como el tamaño, la ubicación, el número de habitaciones, etc.). Si usas L1 regularización, el modelo podría decidir que, por ejemplo, "número de garajes" no es importante y ajustar su coeficiente a cero, mientras que mantiene otros coeficientes."""

'L1 regularización, también conocida como Lasso, es una técnica utilizada en modelos de machine learning para evitar el sobreajuste, que es cuando un modelo se adapta demasiado a los datos de entrenamiento y no funciona bien con nuevos datos.\n\nCómo funciona la L1 Regularización:\nPenalización: Al entrenar un modelo (como una regresión lineal), además de minimizar el error (la diferencia entre las predicciones y los valores reales), se añade una "penalización" que depende de los coeficientes del modelo. Esta penalización es la suma de los valores absolutos de los coeficientes.\n\nCero Coeficientes: La magia de la L1 regularización es que puede hacer que algunos de esos coeficientes sean exactamente cero. Esto significa que elimina algunas características (variables) del modelo. Así, el modelo se simplifica y es más fácil de interpretar.\n\nBeneficios:\n\nMenos Complejidad: Al eliminar características innecesarias, el modelo se vuelve más simple y generaliza mejor.\nMejor Rendimiento: 

In [5]:
from sklearn.datasets import fetch_california_housing

In [7]:
california_housing = fetch_california_housing(as_frame = True)

In [9]:
print(california_housing.DESCR)

.. _california_housing_dataset:

California Housing dataset
--------------------------

**Data Set Characteristics:**

:Number of Instances: 20640

:Number of Attributes: 8 numeric, predictive attributes and the target

:Attribute Information:
    - MedInc        median income in block group
    - HouseAge      median house age in block group
    - AveRooms      average number of rooms per household
    - AveBedrms     average number of bedrooms per household
    - Population    block group population
    - AveOccup      average number of household members
    - Latitude      block group latitude
    - Longitude     block group longitude

:Missing Attribute Values: None

This dataset was obtained from the StatLib repository.
https://www.dcc.fc.up.pt/~ltorgo/Regression/cal_housing.html

The target variable is the median house value for California districts,
expressed in hundreds of thousands of dollars ($100,000).

This dataset was derived from the 1990 U.S. census, using one row per ce

In [10]:
ca_housing = fetch_california_housing()

In [11]:
X = ca_housing.data

In [12]:
y= ca_housing.target

In [13]:
print(X)

[[   8.3252       41.            6.98412698 ...    2.55555556
    37.88       -122.23      ]
 [   8.3014       21.            6.23813708 ...    2.10984183
    37.86       -122.22      ]
 [   7.2574       52.            8.28813559 ...    2.80225989
    37.85       -122.24      ]
 ...
 [   1.7          17.            5.20554273 ...    2.3256351
    39.43       -121.22      ]
 [   1.8672       18.            5.32951289 ...    2.12320917
    39.43       -121.32      ]
 [   2.3886       16.            5.25471698 ...    2.61698113
    39.37       -121.24      ]]


In [14]:
print(y)

[4.526 3.585 3.521 ... 0.923 0.847 0.894]


In [15]:
ca_housing.feature_names

['MedInc',
 'HouseAge',
 'AveRooms',
 'AveBedrms',
 'Population',
 'AveOccup',
 'Latitude',
 'Longitude']

In [16]:
ca_housing.target_names

['MedHouseVal']

In [17]:
from sklearn.model_selection import train_test_split

In [18]:
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.2, random_state=19)

In [19]:
from sklearn.preprocessing import StandardScaler

In [21]:
scaler = StandardScaler()

In [22]:
X_train = scaler.fit_transform(X_train)

In [23]:
X_test = scaler.fit_transform(X_test)

In [26]:
X_train

array([[ 0.43749931, -0.13512884, -0.10916829, ...,  0.0707056 ,
         0.62557109, -1.09480365],
       [-0.80097128,  1.53663489, -0.84679797, ..., -0.05258381,
        -0.71510016,  0.64080725],
       [-0.63695903,  0.97938032, -0.40654137, ...,  0.1578479 ,
        -0.71510016,  0.73083894],
       ...,
       [-0.11486381, -0.05552104,  0.05557924, ..., -0.05343785,
         1.12891082, -1.26986527],
       [ 0.69535255,  0.50173354, -0.42550548, ..., -0.2119467 ,
         0.86077657, -1.30487759],
       [ 0.64094363, -0.61277561,  0.16481911, ...,  0.09015308,
        -0.90326455,  0.84587943]])

In [27]:
from sklearn.linear_model import Lasso

In [28]:
lasso = Lasso()

In [29]:
lasso.fit(X_train, y_train)

In [30]:
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score

In [31]:
y_pred = lasso.predict(X_test)

In [32]:
mean_absolute_error(y_test, y_pred)

0.9119430573559844

In [33]:
mean_squared_error(y_test, y_pred)

1.3264181489134033

In [34]:
r2_score(y_test,y_pred)

-4.109353628090062e-05

In [36]:
param_grid={
    'alpha': [0.0001,0.001,0.01,0.1,1,10,100,1000]
}

In [37]:
from sklearn.model_selection import GridSearchCV

In [38]:
lasso_cv = GridSearchCV(lasso,param_grid, cv=3, n_jobs=-1)

In [39]:
lasso_cv.fit(X_train,y_train)

In [43]:
y_pred2 = lasso_cv.predict(X_test)

In [44]:
mean_absolute_error(y_test,y_pred2)

0.5353500594399226

In [45]:
mean_squared_error(y_test,y_pred2)

0.5211195697368167

In [46]:
r2_score(y_test,y_pred2)

0.60710656378633

In [47]:
lasso_cv.best_estimator_

In [48]:
lasso3 = Lasso(alpha=0.001)

In [49]:
lasso3.fit(X_train,y_train)

In [50]:
lasso3.intercept_

2.0670816194279977

In [51]:
lasso3.coef_

array([ 0.83673788,  0.12126534, -0.26089701,  0.30370697, -0.00173652,
       -0.02849403, -0.8865986 , -0.86020295])

In [52]:
import pandas as pd

In [57]:
feature_names = [ 'MedInc','HouseAge',
 'AveRooms',
 'AveBedrms',
 'Population',
 'AveOccup',
 'Latitude',
 'Longitude']

In [58]:
df = pd.DataFrame({'Feature_Names':feature_names, 'Coef' : lasso3.coef_})

In [59]:
print(len(feature_names))
print(len(lasso3.coef_))


8
8


In [60]:
df

Unnamed: 0,Feature_Names,Coef
0,MedInc,0.836738
1,HouseAge,0.121265
2,AveRooms,-0.260897
3,AveBedrms,0.303707
4,Population,-0.001737
5,AveOccup,-0.028494
6,Latitude,-0.886599
7,Longitude,-0.860203
