## Coding Exercise #0306

### 1. Regularized regressions:

In [1]:
import numpy as np
import pandas as pd
import os
import matplotlib.pyplot as plt
from sklearn.metrics import mean_squared_error
from sklearn.model_selection import train_test_split
from sklearn.linear_model import Ridge, Lasso

#### 1.1. Read in data:

The dataset comes from 1974 MotoTrend US Magazine.

In [2]:
from google.colab import files
uploaded = files.upload()
df = pd.read_csv('data_mtcars.csv', header='infer')
df.head(15)

Saving data_mtcars.csv to data_mtcars.csv


Unnamed: 0,model,mpg,cyl,disp,hp,drat,wt,qsec,vs,am,gear,carb
0,Mazda RX4,21.0,6,160.0,110,3.9,2.62,16.46,0,1,4,4
1,Mazda RX4 Wag,21.0,6,160.0,110,3.9,2.875,17.02,0,1,4,4
2,Datsun 710,22.8,4,108.0,93,3.85,2.32,18.61,1,1,4,1
3,Hornet 4 Drive,21.4,6,258.0,110,3.08,3.215,19.44,1,0,3,1
4,Hornet Sportabout,18.7,8,360.0,175,3.15,3.44,17.02,0,0,3,2
5,Valiant,18.1,6,225.0,105,2.76,3.46,20.22,1,0,3,1
6,Duster 360,14.3,8,360.0,245,3.21,3.57,15.84,0,0,3,4
7,Merc 240D,24.4,4,146.7,62,3.69,3.19,20.0,1,0,4,2
8,Merc 230,22.8,4,140.8,95,3.92,3.15,22.9,1,0,4,2
9,Merc 280,19.2,6,167.6,123,3.92,3.44,18.3,1,0,4,4


In [3]:
# Separate into X and Y.
X=df.drop(columns=['model','mpg'])
Y=df.mpg

In [5]:
# Dividir el conjunto de datos en entrenamiento y prueba.
# train_test_split divide los datos en dos subconjuntos: uno para entrenamiento y otro para prueba.
# X: las variables explicativas (características), Y: la variable de respuesta (target).
# test_size=0.3 significa que el 30% de los datos se utilizarán para prueba, y el 70% restante para entrenamiento.
# random_state=123 asegura que la división de los datos sea reproducible, es decir, los resultados sean consistentes en futuras ejecuciones.

X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.3, random_state=123)

#### 1.2. Ridge regression:

In [6]:
# Se crea un rango de valores de lambda a probar, del 1 al 99.
lambdaRange = range(1, 100)

# Inicialización de las variables que almacenarán el mejor R^2 y el mejor valor de lambda.
bestRsq = 0.0  # Para contener el mejor R^2 obtenido.
bestLambda = 0.0  # Para contener el mejor valor de lambda que produce el mejor R^2.

# Bucle para iterar a través de los valores de lambda en el rango definido.
for aLambda in lambdaRange:
    ridge = Ridge(aLambda)  # Se crea un modelo de regresión Ridge con el valor actual de lambda.
    ridge.fit(X_train, Y_train)  # Se entrena el modelo con el conjunto de entrenamiento.
    rsq = ridge.score(X_test, Y_test)  # Se calcula el R^2 con el conjunto de prueba.

    # Si el R^2 calculado es mejor que el R^2 anterior (mejor modelo), se actualizan las variables.
    if (rsq > bestRsq):
        bestRsq = rsq  # Se actualiza el mejor R^2.
        bestLambda = aLambda  # Se actualiza el mejor valor de lambda.
        print("Lambda = ", bestLambda, " and  R^2 = ", np.round(rsq, 3))  # Se imprime el mejor valor de lambda y el R^2.

# Una vez encontrado el mejor valor de lambda, se entrena el modelo final con dicho valor.
ridge = Ridge(bestLambda)  # Crear el modelo final con el mejor lambda encontrado.
ridge.fit(X, Y)  # Se entrena el modelo final con todos los datos (X, Y).

Lambda =  1  and  R^2 =  0.779
Lambda =  2  and  R^2 =  0.813
Lambda =  3  and  R^2 =  0.822
Lambda =  4  and  R^2 =  0.825
Lambda =  5  and  R^2 =  0.825


In [7]:
# Show the intercept.
ridge.intercept_

28.587763266422776

In [8]:
# Show other parameters.
ridge.coef_

array([-0.51185256, -0.00768344, -0.01533332,  0.61667067, -1.39209019,
       -0.00709397,  0.11850925,  0.94390866,  0.71148287, -0.7038523 ])

NOTE: In Ridge, even when $\lambda$ is large no parameter is exactly 0.

#### 1.3. Lasso regression:

In [9]:
# Se define el rango de valores de lambda a probar, del 1 al 99.
lambdaRange = range(1, 100)

# Inicialización de las variables que almacenarán el mejor R^2 y el mejor valor de lambda.
bestRsq = 0.0  # Para almacenar el mejor R^2 obtenido.
bestLambda = 0.0  # Para almacenar el mejor valor de lambda que da el mejor R^2.

# Bucle para iterar sobre los valores de lambda en el rango definido.
for aLambda in lambdaRange:
    # Se crea un modelo de regresión Lasso con el valor actual de lambda.
    lasso = Lasso(aLambda)

    # Entrenamiento del modelo con el conjunto de entrenamiento (X_train, Y_train).
    lasso.fit(X_train, Y_train)

    # Se calcula el R^2 con el conjunto de prueba (X_test, Y_test).
    rsq = lasso.score(X_test, Y_test)

    # Si el R^2 calculado es mejor que el R^2 anterior, se actualizan las variables.
    if (rsq > bestRsq):
        bestRsq = rsq  # Se actualiza el mejor R^2.
        bestLambda = aLambda  # Se actualiza el mejor valor de lambda.
        # Se imprime el valor de lambda y el R^2 obtenido.
        print("Lambda = ", bestLambda, " and  R^2 = ", np.round(rsq, 3))

# Una vez encontrado el mejor valor de lambda, se entrena el modelo final con ese valor de lambda.
lasso = Lasso(bestLambda)  # Se crea el modelo de regresión Lasso con el mejor lambda.
lasso.fit(X, Y)  # Se entrena el modelo final con todos los datos (X, Y).

Lambda =  1  and  R^2 =  0.735
Lambda =  2  and  R^2 =  0.743
Lambda =  3  and  R^2 =  0.744
Lambda =  4  and  R^2 =  0.744
Lambda =  5  and  R^2 =  0.744
Lambda =  6  and  R^2 =  0.745
Lambda =  7  and  R^2 =  0.745
Lambda =  8  and  R^2 =  0.745
Lambda =  9  and  R^2 =  0.746
Lambda =  10  and  R^2 =  0.746
Lambda =  11  and  R^2 =  0.746
Lambda =  12  and  R^2 =  0.747
Lambda =  13  and  R^2 =  0.747
Lambda =  14  and  R^2 =  0.747
Lambda =  15  and  R^2 =  0.747
Lambda =  16  and  R^2 =  0.747
Lambda =  17  and  R^2 =  0.748
Lambda =  18  and  R^2 =  0.748
Lambda =  19  and  R^2 =  0.748
Lambda =  20  and  R^2 =  0.748
Lambda =  21  and  R^2 =  0.749
Lambda =  22  and  R^2 =  0.749
Lambda =  23  and  R^2 =  0.749
Lambda =  24  and  R^2 =  0.749
Lambda =  25  and  R^2 =  0.749
Lambda =  26  and  R^2 =  0.749
Lambda =  27  and  R^2 =  0.749
Lambda =  28  and  R^2 =  0.75
Lambda =  29  and  R^2 =  0.75
Lambda =  30  and  R^2 =  0.75
Lambda =  31  and  R^2 =  0.75
Lambda =  32  and  R^

In [10]:
# Show the intercept.
lasso.intercept_

29.481705776221872

In [11]:
# Show other parameters.
lasso.coef_

array([-0.       , -0.0335117, -0.0113111,  0.       , -0.       ,
        0.       ,  0.       ,  0.       ,  0.       , -0.       ])

NOTE: Lasso can make some parameters exactly 0 when $\lambda$ is large enough.