In [2]:
from dsrp_ml_1.utils import MachineLearningProcessor
from sklearn.linear_model import LinearRegression

In [3]:
ml_processor = MachineLearningProcessor(
    model_type="LinearRegression",
    features=['gdp per capita', 'family', 'life expectancy', 'freedom'],
    score='happiness score'
)

In [4]:
ml_processor.data.head()

Unnamed: 0,country,happiness score,gdp per capita,family,life expectancy,freedom,generosity,lack of corruption
0,Finland,7.769,1.34,1.587,0.986,0.596,0.153,0.393
1,Denmark,7.6,1.383,1.573,0.996,0.592,0.252,0.41
2,Norway,7.554,1.488,1.582,1.028,0.603,0.271,0.341
3,Iceland,7.494,1.38,1.624,1.026,0.591,0.354,0.118
4,Netherlands,7.488,1.396,1.522,0.999,0.557,0.322,0.298


# Entrenar Modelo de Regresión Lineal

In [5]:
ml_processor.train(model_ml=LinearRegression())

1. Separando datos de train y test..
2. Entrenando model LinearRegression
3. Entrenamiento finalizado


In [6]:
ml_processor.predict()

R² score: 0.5961963009874784
MSE: 0.4202479484737957


# Importancia de cada variable (coeficientes del modelo)

In [7]:
import pandas as pd

# Obtener y mostrar los coeficientes del modelo
coefficients = pd.DataFrame({
    'Variable': ml_processor.features,
    'Coeficiente': ml_processor.fitted_model.coef_
})

# Ordenar por magnitud absoluta para ver la importancia
coefficients['Importancia absoluta'] = coefficients['Coeficiente'].abs()
coefficients_sorted = coefficients.sort_values(by='Importancia absoluta', ascending=False)

print(coefficients_sorted[['Variable', 'Coeficiente']])

          Variable  Coeficiente
3          freedom     1.886122
1           family     1.120872
2  life expectancy     1.011735
0   gdp per capita     0.795098


# Guardado de modelo

In [8]:
from dsrp_ml_1.utils import save

save(ml_processor.fitted_model, ml_processor.model_type)

Model guaradado exitosamente


# Conclusión

1) La libertad personal es el predictor más fuerte, con el mayor coeficiente.

2) El apoyo social (family) y la esperanza de vida saludable también tienen un fuerte impacto positivo.

3) El PBI per cápita, aunque importante, tiene menor influencia directa que las variables sociales.