In [0]:
# Importar bibliotecas necesarias
import pandas as pd
import mlflow
import mlflow.sklearn
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score

# Cargamos el conjunto de datos
df = pd.read_csv("https://raw.githubusercontent.com/Fibovin/des_modelos_1/refs/heads/main/Student_Performance.csv")

# Codificamos la variable categórica
df['Extracurricular Activities'] = df['Extracurricular Activities'].map({'Yes': 1, 'No': 0})

# Dividimos el conjunto de datos en características y variable objetivo
X = df.drop(columns=['Performance Index'])
y = df['Performance Index']

# Dividimos el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Configuramos el experimento de MLflow
mlflow.set_experiment("/Users/jf.neiraf1@uniandes.edu.co/Student_Performance_Regresion_lineal")

# Definimos y ejecutamos el experimento con MLflow para la regresión lineal
with mlflow.start_run(run_name="REGRESION LINEAL Experimento_1"):
    # Creamos y entrenamos el modelo de regresión lineal simple
    linear_model = LinearRegression()
    linear_model.fit(X_train, y_train)

    # Realizamos predicciones en el conjunto de prueba
    y_test_pred = linear_model.predict(X_test)

    # Calculamos y registramos las métricas para el conjunto de prueba
    r2_test = r2_score(y_test, y_test_pred)
    mse_test = mean_squared_error(y_test, y_test_pred)
    mae_test = mean_absolute_error(y_test, y_test_pred)
    
    mlflow.log_metric("r2", r2_test)
    mlflow.log_metric("mse", mse_test)
    mlflow.log_metric("mae", mae_test)

    # Registramos el modelo de regresión lineal en MLflow
    mlflow.sklearn.log_model(linear_model, "linear-regression-model")

    # Imprimimos las métricas para verificar
    print("Conjunto de Prueba:")
    print(f"R²: {r2_test}")
    print(f"Mean Squared Error: {mse_test}")
    print(f"Mean Absolute Error: {mae_test}")


2024/11/10 01:40:40 INFO mlflow.tracking.fluent: Experiment with name '/Users/jf.neiraf1@uniandes.edu.co/Student_Performance_Regresion_lineal' does not exist. Creating a new experiment.


Conjunto de Prueba:
R²: 0.9889832909573145
Mean Squared Error: 4.082628398521853
Mean Absolute Error: 1.6111213463123044


## **Tunning del modelo - Regresión lineal simple**

#### **Regularizamos la regresión con un Lasso y Ridge, por lo tanto asignamos como experimento 2 a la regresión ridge y experimento 3 a la regresión lasso**

In [0]:
# Configuramos el experimento de MLflow
mlflow.set_experiment("/Users/jf.neiraf1@uniandes.edu.co/Student_Performance_Regresion_lineal")

# Experimento con Ridge Regression
with mlflow.start_run(run_name="REGRESION RIDGE Experimento_2"):
    # Creamos y entrenamos el modelo Ridge
    ridge_model = Ridge(alpha=1.0)
    ridge_model.fit(X_train, y_train)

    # Realizamos predicciones en el conjunto de prueba
    y_test_pred_ridge = ridge_model.predict(X_test)

    # Calculamos y registramos las métricas para el conjunto de prueba
    r2_test_ridge = r2_score(y_test, y_test_pred_ridge)
    mse_test_ridge = mean_squared_error(y_test, y_test_pred_ridge)
    mae_test_ridge = mean_absolute_error(y_test, y_test_pred_ridge)
    
    mlflow.log_metric("r2", r2_test_ridge)
    mlflow.log_metric("mse", mse_test_ridge)
    mlflow.log_metric("mae", mae_test_ridge)

    # Registramos el modelo Ridge en MLflow
    mlflow.sklearn.log_model(ridge_model, "ridge-regression-model")

    # Imprimimos las métricas para verificar
    print("Conjunto de Prueba - Ridge Regression:")
    print(f"R²: {r2_test_ridge}")
    print(f"Mean Squared Error: {mse_test_ridge}")
    print(f"Mean Absolute Error: {mae_test_ridge}")




Conjunto de Prueba - Ridge Regression:
R²: 0.9889832645273239
Mean Squared Error: 4.082638193083003
Mean Absolute Error: 1.611120582543694


In [0]:
# Configuramos el experimento de MLflow
mlflow.set_experiment("/Users/jf.neiraf1@uniandes.edu.co/Student_Performance_Regresion_lineal")


# Experimento con Lasso Regression (Experimento 3)
with mlflow.start_run(run_name="REGRESION LASSO Experimento_3"):
    # Creamos y entrenamos el modelo Lasso
    lasso_model = Lasso(alpha=0.1)
    lasso_model.fit(X_train, y_train)

    # Realizamos predicciones en el conjunto de prueba
    y_test_pred_lasso = lasso_model.predict(X_test)

    # Calculamos y registramos las métricas para el conjunto de prueba
    r2_test_lasso = r2_score(y_test, y_test_pred_lasso)
    mse_test_lasso = mean_squared_error(y_test, y_test_pred_lasso)
    mae_test_lasso = mean_absolute_error(y_test, y_test_pred_lasso)
    
    mlflow.log_metric("r2", r2_test_lasso)
    mlflow.log_metric("mse", mse_test_lasso)
    mlflow.log_metric("mae", mae_test_lasso)

    # Registramos el modelo Lasso en MLflow
    mlflow.sklearn.log_model(lasso_model, "lasso-regression-model")

    # Imprimimos las métricas para verificar
    print("\nConjunto de Prueba - Lasso Regression:")
    print(f"R²: {r2_test_lasso}")
    print(f"Mean Squared Error: {mse_test_lasso}")
    print(f"Mean Absolute Error: {mae_test_lasso}")




Conjunto de Prueba - Lasso Regression:
R²: 0.9888224228416228
Mean Squared Error: 4.1422437278361635
Mean Absolute Error: 1.6213260861967809
