# Analisis de Autos Usados

Lucho Feb|2023 <br>
Ton Visage By Frero Delevega


## ¬øQu√© es la Matriz de Lasso?

**Lasso (Least Absolute Shrinkage and Selection Operator)** es una t√©cnica de regularizaci√≥n utilizada en modelos de regresi√≥n lineal. Su objetivo principal es prevenir el sobreajuste (overfitting) y mejorar la interpretabilidad del modelo al reducir algunos coeficientes exactamente a cero.

### ¬øEn qu√© consiste?

Lasso agrega una penalizaci√≥n basada en la **suma de los valores absolutos** de los coeficientes al t√©rmino de p√©rdida del modelo. Matem√°ticamente, la funci√≥n de costo de Lasso es:

\[
\text{Costo}_{Lasso} = \sum_{i=1}^{n}(y_i - \hat{y}_i)^2 + \lambda \sum_{j=1}^{p}|\beta_j|
\]

Donde:

- \( y_i \) es el valor real
- \( \hat{y}_i \) es el valor predicho
- \( \beta_j \) son los coeficientes del modelo
- \( \lambda \) es el par√°metro de regularizaci√≥n
- \( n \) es el n√∫mero de muestras
- \( p \) es el n√∫mero de caracter√≠sticas (features)

### ¬øQu√© es la "matriz de Lasso"?

En un sentido estricto, **no existe una matriz espec√≠fica llamada "matriz de Lasso"**, pero en el proceso de entrenamiento del modelo Lasso se utilizan:

- La **matriz de caracter√≠sticas \(X\)**: que contiene los datos de entrada (tama√±o \(n \times p\))
- El **vector de salida \(y\)**: que contiene las etiquetas o valores objetivo
- Un modelo que encuentra los coeficientes \( \beta \) resolviendo un problema de optimizaci√≥n regularizado

En resumen, cuando se menciona la "matriz de Lasso", se puede estar refiriendo informalmente a la **matriz de dise√±o \(X\)** utilizada durante el entrenamiento del modelo Lasso.

### Ventajas de Lasso

- Realiza **selecci√≥n de variables** autom√°ticamente (al reducir coeficientes a cero).
- Mejora la **interpretabilidad** del modelo.
- Controla el **sobreajuste**, especialmente cuando hay muchas variables.

### Cu√°ndo Usar Lasso

- Cuando se sospecha que muchas variables no aportan informaci√≥n √∫til.
- Cuando se desea un modelo m√°s simple y f√°cil de interpretar.

---

> üí° Nota: Lasso es especialmente √∫til cuando hay m√°s caracter√≠sticas que observaciones o cuando existe multicolinealidad entre las variables.


### Conjunto de Datos de Autos Usados

Este conjunto de datos contiene informaci√≥n sobre autos usados.  
Estos datos pueden ser utilizados para diversos fines, como la predicci√≥n de precios para ejemplificar el uso de la regresi√≥n lineal en el Aprendizaje Autom√°tico (Machine Learning).

#### Las columnas del conjunto de datos son las siguientes:

- **name**: nombre  
- **year**: a√±o  
- **selling_price**: precio de venta  
- **km_driven**: kil√≥metros recorridos  
- **fuel**: tipo de combustible  
- **seller_type**: tipo de vendedor  
- **transmission**: tipo de transmisi√≥n  
- **Owner**: propietario (n√∫mero de due√±os anteriores)

### Import Packages

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.linear_model import Lasso
from sklearn import metrics

### Import Dataset| Data proccesing & Data Collection

In [None]:
df = pd.read_csv(r"")
df_raw = df.copy()
df.head()