## Desafío
Predecir el dióxido de carbono que emite un automóvil a partir de su longitud, anchura y altura.

1. Dividir los datos en conjuntos de entrenamiento y prueba. Usaremos un 20% de nuestros datos para validación.
2. Crear un modelo de regresión lineal múltiple.
3. Hacer predicciones basadas en el modelo con los datos de prueba.
4. Obtener el error absoluto medio, el error cuadrático medio y la raíz del error cuadrático medio.

In [1]:
# Librerías
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error, mean_squared_error, mean_squared_error

In [2]:
# Lectura de datos
df = pd.read_csv('emisiones.csv', sep=';')
df.head()

Unnamed: 0,Marca,Longitud,Anchura,Altura,Maletero,CO2
0,Aero,4.495,1.84,1.54,320,294
1,Ality Auto,4.377,1.806,1.59,439,237
2,Amber,4.355,1.805,1.535,401,228
3,Ape Auto,3.698,1.72,1.484,170,207
4,Apex,4.535,1.77,1.48,624,327


In [3]:
# Características y variable objetivo
X = df[['Longitud', 'Anchura', 'Altura']]
y = df[['CO2']]

In [4]:
# División de datos
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [5]:
# Creamos el modelo
modelo = LinearRegression()

In [6]:
# Entrenamos el modelo
modelo.fit(X_train, y_train)

In [7]:
# Hacemos predicciones con el conjunto de prueba
y_pred = modelo.predict(X_test)

In [8]:
# Obtenemos métricas
mae = mean_absolute_error(y_test, y_pred)
mse = mean_squared_error(y_test, y_pred)
rmse = mean_squared_error(y_test, y_pred, squared=False)



In [9]:
print(f'MAE: {mae}')
print(f'MSE: {mse}')
print(f'RMSE: {rmse}')

MAE: 30.752739725416284
MSE: 2006.874730357288
RMSE: 44.79815543476414
