# Comparación de modelos

In [4]:
import sys
sys.path.append('../src')

from modelos import split_data, train_svm, train_random_forest, evaluate_model


In [5]:
# Ruta del archivo de datos preprocesados
file_path = '../data/data_scaled.csv'

# Dividir los datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = split_data(file_path)

In [6]:
# Entrenar y evaluar SVM con diferentes kernels
kernels = ['linear', 'poly', 'rbf']
for kernel in kernels:
    print(f"\nEvaluando SVM con kernel: {kernel}")
    svm_model, svm_cv_scores = train_svm(X_train, y_train, kernel=kernel)
    print(f"Validación cruzada (SVM con kernel {kernel}): {svm_cv_scores}")
    evaluate_model(svm_model, X_test, y_test)


Evaluando SVM con kernel: linear
Validación cruzada (SVM con kernel linear): [0.96412214 0.96870229 0.97251908 0.96946565 0.97402597]
Informe de Clasificación:
               precision    recall  f1-score   support

        Alto       0.98      0.99      0.99      1895
        Bajo       0.95      0.87      0.91       159
    Moderado       0.94      0.95      0.95       754

    accuracy                           0.97      2808
   macro avg       0.96      0.94      0.95      2808
weighted avg       0.97      0.97      0.97      2808

Exactitud: 0.9715099715099715
Matriz de Confusión:
 [[1871    0   24]
 [   0  139   20]
 [  29    7  718]]

Evaluando SVM con kernel: poly
Validación cruzada (SVM con kernel poly): [0.9221374  0.91526718 0.93206107 0.93282443 0.92742552]
Informe de Clasificación:
               precision    recall  f1-score   support

        Alto       0.92      0.99      0.95      1895
        Bajo       0.95      0.87      0.90       159
    Moderado       0.95      

In [7]:
# Entrenar y evaluar Random Forest con diferentes configuraciones
rf_configurations = [(100, None), (200, 10), (200, 20)]
for n_estimators, max_depth in rf_configurations:
    print(f"\nEvaluando Random Forest con n_estimators={n_estimators}, max_depth={max_depth}")
    rf_model, rf_cv_scores = train_random_forest(X_train, y_train, n_estimators=n_estimators, max_depth=max_depth)
    print(f"Validación cruzada (Random Forest n_estimators={n_estimators}, max_depth={max_depth}): {rf_cv_scores}")
    evaluate_model(rf_model, X_test, y_test)


Evaluando Random Forest con n_estimators=100, max_depth=None
Validación cruzada (Random Forest n_estimators=100, max_depth=None): [0.99923664 0.99541985 1.         0.99923664 0.99618029]
Informe de Clasificación:
               precision    recall  f1-score   support

        Alto       1.00      1.00      1.00      1895
        Bajo       0.98      0.99      0.98       159
    Moderado       1.00      0.99      1.00       754

    accuracy                           1.00      2808
   macro avg       0.99      0.99      0.99      2808
weighted avg       1.00      1.00      1.00      2808

Exactitud: 0.9975071225071225
Matriz de Confusión:
 [[1895    0    0]
 [   0  157    2]
 [   1    4  749]]

Evaluando Random Forest con n_estimators=200, max_depth=10
Validación cruzada (Random Forest n_estimators=200, max_depth=10): [0.99847328 0.99923664 0.99923664 1.         0.99618029]
Informe de Clasificación:
               precision    recall  f1-score   support

        Alto       1.00      1.