In [11]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score
import joblib



In [17]:
# Datos de ejemplo (puedes cambiar los valores por tus propios gastos)
data = {
    "Agua": [200, 180, 210, 190, 205],
    "Luz": [500, 520, 510, 495, 505],
    "Gasolina": [1200, 1150, 1230, 1190, 1210],
    "Super": [2500, 2400, 2600, 2550, 2480],
    "Renta": [6000, 6000, 6000, 6000, 6000],
    "Total": [10400, 10250, 10950, 10800, 10400]
}
df = pd.DataFrame(data)

X = df.drop("Total", axis=1)
y = df["Total"]

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)


In [18]:
modelo = LinearRegression()
modelo.fit(X_train, y_train)

print("Coeficientes:", modelo.coef_)
print("Intercepto:", modelo.intercept_)


Coeficientes: [-2.36642221 -1.35149293 -3.0395495   6.78365636  0.        ]
Intercepto: -1762.6506024096507


In [19]:
# Guardar el modelo entrenado en un archivo
bundle = {
    "model": modelo,
    "features": X_train.columns.tolist()  # orden exacto usado al entrenar
}
joblib.dump(bundle, "modelo_gastos.pkl")
print("Guardado en 'modelo_gastos.pkl' con features:", bundle["features"])




Guardado en 'modelo_gastos.pkl' con features: ['Agua', 'Luz', 'Gasolina', 'Super', 'Renta']


In [20]:
# Cargar el modelo desde el archivo
bundle = joblib.load("modelo_gastos.pkl")
modelo_cargado = bundle["model"]
features = bundle["features"]

# NUEVO ejemplo de entrada (puedes cambiar valores)
nuevo = pd.DataFrame({
    "Agua": [210],
    "Gasolina": [1180],
    "Luz": [500],
    "Renta": [6000],
    "Super": [2450]
})

# Alinear columnas al orden del entrenamiento
nuevo = nuevo.reindex(columns=features)

prediccion = modelo_cargado.predict(nuevo)[0]
print("Predicción de gasto total:", prediccion)



Predicción de gasto total: 10097.943949711891


In [22]:
# Alinear X_test al mismo orden por seguridad
X_test_aligned = X_test.reindex(columns=features)

y_pred_test = modelo_cargado.predict(X_test_aligned)

mae = mean_absolute_error(y_test, y_pred_test)
mse = mean_squared_error(y_test, y_pred_test)  # aquí no usamos squared=False
rmse = np.sqrt(mse)  # sacamos raíz cuadrada manualmente
r2 = r2_score(y_test, y_pred_test)

print("MAE :", mae)
print("RMSE:", rmse)
print("R²  :", r2)



MAE : 270.3738868517521
RMSE: 283.6357135570883
R²  : -13.30208320089576
