# Comparación entre modelos

En esta sección se comparan los modelos entrenados: **Random Forest** y **SVM**.
Se usan métricas como accuracy, precision, recall y f1-score.

In [None]:
from sklearn.metrics import classification_report, accuracy_score

# Suponiendo que ya se tienen los datos y las predicciones de los modelos:
# y_test, y_pred_rf, y_pred_svm deben haberse generado previamente en los notebooks anteriores

# Para efectos de ejecución, importa los datos preprocesados y entrena los modelos rápidamente
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.svm import SVC
from sklearn.impute import SimpleImputer
from sklearn.preprocessing import StandardScaler

df = pd.read_csv('06 - dataset.csv')
X = df.drop('clase', axis=1)
y = df['clase']

X = SimpleImputer(strategy='mean').fit_transform(X)
X = StandardScaler().fit_transform(X)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Modelo Random Forest
rf = RandomForestClassifier(n_estimators=100, max_depth=None, random_state=42)
rf.fit(X_train, y_train)
y_pred_rf = rf.predict(X_test)

# Modelo SVM
svm = SVC(C=1, kernel='rbf')
svm.fit(X_train, y_train)
y_pred_svm = svm.predict(X_test)

In [None]:
print(' Modelo 1: Random Forest')
print(classification_report(y_test, y_pred_rf))
acc_rf = accuracy_score(y_test, y_pred_rf)
print('Accuracy:', acc_rf)

print('\n Modelo 2: SVM')
print(classification_report(y_test, y_pred_svm))
acc_svm = accuracy_score(y_test, y_pred_svm)
print('Accuracy:', acc_svm)

### Conclusión

Ambos modelos tuvieron un rendimiento razonable, pero:

- **Random Forest** mostró mayor capacidad de generalización y mejor precisión general.
- **SVM** fue competitivo, pero con menor desempeño en recall.

Por lo tanto, se recomienda usar **Random Forest** como modelo final para este problema.