# Entrenamiento del Modelo - Predicción de Consumo de Nafta

En este notebook se entrena un modelo de Machine Learning para predecir el consumo de nafta (en litros) según distintas variables de uso del vehículo.

## 1️⃣ Importacion 


In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
import joblib

## 2️⃣ Carga y exploracion de los datos 


In [2]:

df = pd.read_csv("./model/consumo_nafta.csv")
df.head(5)

Unnamed: 0,fecha,distancia_km,tiempo_min,trafico,auto_modelo,tipo_trayecto,precio_nafta_por_litro,consumo_por_km,combustible_litros
0,2024-05-01,8.5,56,Pesado,Fiat Cronos 1.3,Ruta,885.48,0.084914,0.72
1,2024-05-02,8.5,21,Leve,VW Gol 1.6,Urbano,909.25,0.111755,0.95
2,2024-05-03,8.5,25,Moderado,Toyota Etios 1.5,Urbano,901.22,0.09454,0.8
3,2024-05-04,15.0,33,Moderado,VW Gol 1.6,Urbano,896.61,0.066963,1.0
4,2024-05-05,8.5,28,Moderado,Toyota Etios 1.5,Ruta,879.62,0.119419,1.02


## 3️⃣ Selección de Variables

In [3]:
cat_columns = ["trafico", "auto_modelo", "tipo_trayecto"]
df_encoded = pd.get_dummies(df, columns=cat_columns, drop_first=True)

features = [
    "distancia_km",
    "tiempo_min",
    "precio_nafta_por_litro",
] + [ col for col in df_encoded.columns if col.startswith(("trafico_", "auto_modelo_", "tipo_trayecto_"))]

target = "combustible_litros"

X = df_encoded[features]
y = df_encoded[target]


## 4️⃣ División en conjunto de entrenamiento y test

In [4]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state= 42)


## 5️⃣ Entrenamiento del Modelo

In [5]:
model = LinearRegression()
model.fit(X_train, y_train)

## 6️⃣ Evaluación del Modelo

In [6]:
score = model.score(X_test, y_test)
print(f"Precisión del modelo (R^2): {score:.2f}")

Precisión del modelo (R^2): 0.65


## 7️⃣ Guardado del Modelo

In [9]:
joblib.dump(model, "./model/modelo_consumo_nafta.pkl")
joblib.dump(features, './model/features.pkl')
joblib.dump(model.score(X_test, y_test), './model/metrics.pkl')

['./model/metrics.pkl']