# Regresión Logística Simple

In [1]:
from src.training       import create_variables,training_model_rl, variables_scaler
from src.data_loader    import create_df
from src.evaluation     import show_confusion_matrix, show_metricas, get_coeficientes, show_auc_roc, show_especificidad, show_coeficientes

from sklearn.preprocessing  import StandardScaler
from sklearn.linear_model   import LogisticRegression


df_model_rl = create_df('clean_data')
X_train, X_test, y_train, y_test = create_variables(df_model_rl,False)

X_train_scaled, X_test_scaled = variables_scaler(X_train, X_test)

model = training_model_rl(X_train_scaled, y_train)
pred = model.predict(X_test_scaled)

In [2]:
metricas, accuracy_final = show_metricas(y_test, pred)
especificidad = show_especificidad(y_test, pred)

print(f"\nAccuracy del Modelo Final Optimizado: {accuracy_final:.4f}")
print(f"\nEspecificidad del Modelo Final Optimizado: {especificidad:.4f}")
print("\nReporte de Clasificación del Modelo Final:")
print(metricas)


Accuracy del Modelo Final Optimizado: 0.7623

Especificidad del Modelo Final Optimizado: 0.7793

Reporte de Clasificación del Modelo Final:
              precision    recall  f1-score   support

           0       0.93      0.78      0.85       222
           1       0.37      0.67      0.48        43

    accuracy                           0.76       265
   macro avg       0.65      0.73      0.66       265
weighted avg       0.84      0.76      0.79       265



In [3]:
gr = show_confusion_matrix(y_test, pred, 'Regresion Logistica Simple')
gr

# Regresión Logística con SMOTEENN

In [4]:
from imblearn.combine   import SMOTEENN
from imblearn.pipeline  import Pipeline as ImPipeline

df_model_rl = create_df('clean_data')
X_train, X_test, y_train, y_test = create_variables(df_model_rl,False)

pipeline = ImPipeline([
    ('scaler', StandardScaler()),
    ('smote_enn',SMOTEENN(random_state=42)),
    ('lr', LogisticRegression(random_state=42))
])

pipeline.fit(X_train, y_train)

pred = pipeline.predict(X_test)

In [5]:
metricas, accuracy_final = show_metricas(y_test, pred)
especificidad = show_especificidad(y_test, pred)

print(f"\nAccuracy del Modelo Final Optimizado: {accuracy_final:.4f}")
print(f"\nEspecificidad del Modelo Final Optimizado: {especificidad:.4f}")
print("\nReporte de Clasificación del Modelo Final:")
print(metricas)


Accuracy del Modelo Final Optimizado: 0.6415

Especificidad del Modelo Final Optimizado: 0.6171

Reporte de Clasificación del Modelo Final:
              precision    recall  f1-score   support

           0       0.93      0.62      0.74       222
           1       0.28      0.77      0.41        43

    accuracy                           0.64       265
   macro avg       0.61      0.69      0.58       265
weighted avg       0.83      0.64      0.69       265



In [6]:
gr = show_confusion_matrix(y_test, pred, 'Regresion Logistica con SMOTEENN')
gr

In [7]:
coeficientes = get_coeficientes(pipeline, X_train)
gr = show_coeficientes(coeficientes)
gr

In [8]:
auc_roc = show_auc_roc(pipeline, X_test, y_test)
auc_roc

# Regresión Logística con SMOTEENN - 15 Variables con mayor coeficiente

In [9]:
#nombres 15 variables
coef = coeficientes['Variable'].head(15)

df_model_rl = create_df('clean_data')
X_train, X_test, y_train, y_test = create_variables(df_model_rl,True,coef)

pipeline = ImPipeline([
    ('scaler', StandardScaler()),
    ('smote_enn',SMOTEENN(random_state=42)),
    ('lr', LogisticRegression(random_state=42))
])

pipeline.fit(X_train, y_train)

pred = pipeline.predict(X_test)

In [10]:
metricas, accuracy_final = show_metricas(y_test, pred)
especificidad = show_especificidad(y_test, pred)

print(f"\nAccuracy del Modelo Final Optimizado: {accuracy_final:.4f}")
print(f"\nEspecificidad del Modelo Final Optimizado: {especificidad:.4f}")
print("\nReporte de Clasificación del Modelo Final:")
print(metricas)


Accuracy del Modelo Final Optimizado: 0.6491

Especificidad del Modelo Final Optimizado: 0.6261

Reporte de Clasificación del Modelo Final:
              precision    recall  f1-score   support

           0       0.93      0.63      0.75       222
           1       0.28      0.77      0.42        43

    accuracy                           0.65       265
   macro avg       0.61      0.70      0.58       265
weighted avg       0.83      0.65      0.70       265



In [11]:
gr = show_confusion_matrix(y_test, pred, 'Regresion Logistica - SMOTEENN - 15 Variables')
gr

In [12]:
auc_roc = show_auc_roc(pipeline, X_test, y_test)
auc_roc