# Random Forest

In [1]:
from src.training       import create_variables,training_model_rf
from src.data_loader    import create_df
from src.evaluation     import show_confusion_matrix, show_metricas, show_feature_importances, show_auc_roc, show_especificidad, get_feature_importances

df_model_rf = create_df('clean_data')
X_train, X_test, y_train, y_test = create_variables(df_model_rf,False)

model = training_model_rf(X_train,y_train)
pred = model.predict(X_test)

In [2]:
metricas, accuracy_final = show_metricas(y_test, pred)
especificidad = show_especificidad(y_test, pred)

print(f"\nAccuracy del Modelo Final Optimizado: {accuracy_final:.4f}")
print(f"\nEspecificidad del Modelo Final Optimizado: {especificidad:.4f}")
print("\nReporte de Clasificación del Modelo Final:")
print(metricas)


Accuracy del Modelo Final Optimizado: 0.8264

Especificidad del Modelo Final Optimizado: 0.8964

Reporte de Clasificación del Modelo Final:
              precision    recall  f1-score   support

           0       0.90      0.90      0.90       222
           1       0.47      0.47      0.47        43

    accuracy                           0.83       265
   macro avg       0.68      0.68      0.68       265
weighted avg       0.83      0.83      0.83       265



In [3]:
gr = show_confusion_matrix(y_test, pred, 'Random Forest')
gr

In [4]:
fi = get_feature_importances(model, X_train)
gr = show_feature_importances(fi)
gr

In [5]:
auc_roc = show_auc_roc(model, X_test, y_test)
auc_roc

# Random Forest con las 15 variables con más peso

In [6]:
df_model_rf = create_df('clean_data')

feature_importances = fi['Feature'].head(15)

X_train, X_test, y_train, y_test = create_variables(df_model_rf,True, feature_importances)

model = training_model_rf(X_train,y_train)
pred = model.predict(X_test)

In [7]:
metricas, accuracy_final = show_metricas(y_test, pred)
especificidad = show_especificidad(y_test, pred)

print(f"\nAccuracy del Modelo Final Optimizado: {accuracy_final:.4f}")
print(f"\nEspecificidad del Modelo Final Optimizado: {especificidad:.4f}")
print("\nReporte de Clasificación del Modelo Final:")
print(metricas)


Accuracy del Modelo Final Optimizado: 0.8453

Especificidad del Modelo Final Optimizado: 0.9054

Reporte de Clasificación del Modelo Final:
              precision    recall  f1-score   support

           0       0.91      0.91      0.91       222
           1       0.52      0.53      0.53        43

    accuracy                           0.85       265
   macro avg       0.72      0.72      0.72       265
weighted avg       0.85      0.85      0.85       265



In [8]:
gr = show_confusion_matrix(y_test, pred, 'Random Forest - 15 Variables')
gr

In [9]:
auc_roc = show_auc_roc(model, X_test, y_test)
auc_roc

# Random Forest - 15 Variables - Umbral Modificado

In [10]:
y_probs = model.predict_proba(X_test)[:, 1]

pred_optimo = ( y_probs >= 0.35 ).astype(int)

In [11]:
metricas, accuracy_final = show_metricas(y_test, pred_optimo)
especificidad = show_especificidad(y_test, pred_optimo)

print(f"\nAccuracy del Modelo Final Optimizado: {accuracy_final:.4f}")
print(f"\nEspecificidad del Modelo Final Optimizado: {especificidad:.4f}")
print("\nReporte de Clasificación del Modelo Final:")
print(metricas)


Accuracy del Modelo Final Optimizado: 0.6528

Especificidad del Modelo Final Optimizado: 0.6396

Reporte de Clasificación del Modelo Final:
              precision    recall  f1-score   support

           0       0.92      0.64      0.76       222
           1       0.28      0.72      0.40        43

    accuracy                           0.65       265
   macro avg       0.60      0.68      0.58       265
weighted avg       0.82      0.65      0.70       265



In [12]:
gr = show_confusion_matrix(y_test, pred, 'Random Forest - 15 Variables - Umbral Modificado')
gr

In [13]:
auc_roc = show_auc_roc(model, X_test, y_test)
auc_roc