In [1]:
import pandas as pd

data = pd.read_csv('rl_multiple.csv')

data.head()

Unnamed: 0,Hogar,Nº de integrantes del grupo familiar,Edad del jefe(a) de hogar (años),Gastos en alimentación (miles de pesos)
0,1,4,48,200
1,2,2,26,130
2,3,5,33,190
3,4,3,24,175
4,5,3,24,160


In [2]:
# Variables X e Y

X = data[["Nº de integrantes del grupo familiar", "Edad del jefe(a) de hogar (años)"]] # independentes
y = data["Gastos en alimentación (miles de pesos)"] # dependiente

In [3]:
# Crear el modelo de regresión lineal

from sklearn.linear_model import LinearRegression

model = LinearRegression()
model.fit(X, y)

In [4]:
# Hacer predicciones

data["Predicción"] = model.predict(X)

data.head()

Unnamed: 0,Hogar,Nº de integrantes del grupo familiar,Edad del jefe(a) de hogar (años),Gastos en alimentación (miles de pesos),Predicción
0,1,4,48,200,205.505479
1,2,2,26,130,139.86269
2,3,5,33,190,204.639062
3,4,3,24,175,155.840179
4,5,3,24,160,155.840179


In [5]:
# Obtenemos los valores de b0 (Intercepto) y b1 (Coeficiente de la variable X)

intercepto = model.intercept_

print("Intercepto:", model.intercept_)
print("Coeficientes:", model.coef_)

Intercepto: 69.03715996958961
Coeficientes: [18.56885906  1.29568507]


In [6]:
# y = b0 + b1*x1
# y = 69 + 18.569*4 + 1.3*35 

prediccion_multiple = 69 + 18.569*4 + 1.3*35
prediccion_multiple

188.776

In [7]:
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score 


# Calcular métricas de evaluación
r2 = r2_score(y, data["Predicción"])
mae = mean_absolute_error(y, data["Predicción"])
mse = mean_squared_error(y, data["Predicción"])
rmse = mean_squared_error(y, data["Predicción"], squared=False)

# Mostrar las métricas de evaluación
print("Intercepto:", model.intercept_)
print("Coeficientes:", model.coef_)
print("R^2:", r2)
print("MAE:", mae)
print("MSE:", mse)

Intercepto: 69.03715996958961
Coeficientes: [18.56885906  1.29568507]
R^2: 0.8981360782461346
MAE: 8.304319315463607
MSE: 100.05394297890003


In [8]:
# Utilizando la libreria statsmodel

In [9]:
import statsmodels.api as sm

# Añadir una constante (intercepto) a las variables independientes
X = sm.add_constant(X)

# Ajustar el modelo de regresión lineal
model = sm.OLS(y, X).fit()

# Obtener el R2 ajustado
r2_ajustado = model.rsquared_adj

print("R2 ajustado:", r2_ajustado)


R2 ajustado: 0.8726700978076682


In [10]:
print(model.summary())

                                       OLS Regression Results                                      
Dep. Variable:     Gastos en alimentación (miles de pesos)   R-squared:                       0.898
Model:                                                 OLS   Adj. R-squared:                  0.873
Method:                                      Least Squares   F-statistic:                     35.27
Date:                                     Tue, 06 Aug 2024   Prob (F-statistic):           0.000108
Time:                                             20:36:46   Log-Likelihood:                -40.940
No. Observations:                                       11   AIC:                             87.88
Df Residuals:                                            8   BIC:                             89.07
Df Model:                                                2                                         
Covariance Type:                                 nonrobust                                         


