In [1]:
import sys
sys.path.append("../scripts")
sys.path.append("../datasets")


In [2]:
from cargar_dataset import cargar_dataset
from config_datasets import config_datasets
from evaluacion import evaluar_sampler_holdout
from custom_samplers import PCSMOTEWrapper


In [3]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.decomposition import PCA
from sklearn.metrics import (
    f1_score, balanced_accuracy_score,
    matthews_corrcoef, cohen_kappa_score
)
from sklearn.preprocessing import LabelEncoder
from pc_smote import PCSMOTE

def evaluar_pcsmote_grid_search(nombre_dataset, config, percentiles_densidad, percentiles_riesgo, criterios_pureza, modelo_clasificador, nombre_modelo):
    print(f"📂 Cargando dataset: {nombre_dataset}")
    X, y, _ = cargar_dataset(
        path=config["path"],
        clase_minoria=config.get("clase_minoria"),
        col_features=config.get("col_features"),
        col_target=config.get("col_target"),
        sep=config.get("sep", ","),
        header=config.get("header", None),
        binarizar=False,
        tipo=config.get("tipo", "tabular")
    )

    # Codificar etiquetas si son strings
    if y.dtype == object or isinstance(y[0], str):
        y = LabelEncoder().fit_transform(y)

    if config.get("tipo") == "imagen":
        X = X.reshape((X.shape[0], -1)).astype(np.float32)

    # PCA
    X_train, X_test, y_train, y_test = train_test_split(
        X, y, test_size=0.2, stratify=y, random_state=42
    )
    n_components = min(X_train.shape[1], 100)
    pca = PCA(n_components=n_components)
    X_train_pca = pca.fit_transform(X_train)
    X_test_pca = pca.transform(X_test)

    resultados = []

    for pdens in percentiles_densidad:
        for priesgo in percentiles_riesgo:
            for criterio in criterios_pureza:
                print(f"🧪 {nombre_modelo} | {nombre_dataset} | Densidad: {pdens} | Riesgo: {priesgo} | Pureza: {criterio}")

                sampler = PCSMOTE(
                    random_state=42,
                    percentil_densidad=pdens,
                    percentil_dist=priesgo,
                    criterio_pureza=criterio,
                    modo_espacial='3d'
                )

                try:
                    if hasattr(sampler, "fit_resample_multiclass"):
                        X_res, y_res = sampler.fit_resample_multiclass(X_train_pca, y_train)
                    else:
                        X_res, y_res = sampler.fit_resample(X_train_pca, y_train)

                    clf = modelo_clasificador
                    clf.fit(X_res, y_res)
                    y_pred = clf.predict(X_test_pca)

                    f1 = f1_score(y_test, y_pred, average='weighted')
                    balanced_acc = balanced_accuracy_score(y_test, y_pred)
                    mcc = matthews_corrcoef(y_test, y_pred)
                    kappa = cohen_kappa_score(y_test, y_pred)

                    print(f"✅ F1: {f1:.4f} | BA: {balanced_acc:.4f} | MCC: {mcc:.4f} | Kappa: {kappa:.4f}")

                    resultados.append({
                        'dataset': nombre_dataset,
                        'modelo': nombre_modelo,
                        'densidad': pdens,
                        'riesgo': priesgo,
                        'pureza': criterio,
                        'f1_score': f1,
                        'balanced_accuracy': balanced_acc,
                        'mcc': mcc,
                        'cohen_kappa': kappa
                    })

                except Exception as e:
                    print(f"⚠️ Error: {e}")
                    resultados.append({
                        'dataset': nombre_dataset,
                        'modelo': nombre_modelo,
                        'densidad': pdens,
                        'riesgo': priesgo,
                        'pureza': criterio,
                        'f1_score': None,
                        'balanced_accuracy': None,
                        'mcc': None,
                        'cohen_kappa': None,
                        'error': str(e)
                    })

    df = pd.DataFrame(resultados)
    df = df.sort_values(by="f1_score", ascending=False)
    df.to_csv(f"../resultados/pcsmote_grid_{nombre_dataset}_{nombre_modelo}.csv", index=False)
    print(f"📁 Resultados guardados en: ../resultados/pcsmote_grid_{nombre_dataset}_{nombre_modelo}.csv")
    return df


In [4]:
from sklearn.ensemble import RandomForestClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from xgboost import XGBClassifier
from config_datasets import config_datasets

modelos = {
    "RandomForest": RandomForestClassifier(n_estimators=100, random_state=42),
    "LogisticRegression": LogisticRegression(max_iter=1000, random_state=42),
    "SVM": SVC(random_state=42),
    "XGBoost": XGBClassifier(use_label_encoder=False, eval_metric='mlogloss', random_state=42)
}

percentiles_densidad = [25, 50, 75]
percentiles_riesgo = [25, 50, 75]
criterios_pureza = ["entropia", "proporcion"]

for nombre_dataset, config in config_datasets.items():
    if nombre_dataset == "eurosat":
        continue

    for nombre_modelo, modelo in modelos.items():
        print(f"\n=== Ejecutando grid para {nombre_dataset} con modelo {nombre_modelo} ===")
        evaluar_pcsmote_grid_search(nombre_dataset, config, percentiles_densidad, percentiles_riesgo, criterios_pureza, modelo, nombre_modelo)




=== Ejecutando grid para ecoli con modelo RandomForest ===
📂 Cargando dataset: ecoli
🧪 RandomForest | ecoli | Densidad: 25 | Riesgo: 25 | Pureza: entropia
📌 Total muestras minoritarias: 61
📌 Total muestras mayoritarias: 207
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 240
📌 Total muestras minoritarias: 16
📌 Total muestras mayoritarias: 252
📌 Total muestras minoritarias: 4
📌 Total muestras mayoritarias: 264
⚠️ Muy pocas muestras minoritarias (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 41
📌 Total muestras mayoritarias: 227
✅ F1: 0.8974 | BA: 0.9318 | MCC: 0.8668 | Kappa: 0.8601
🧪 RandomForest | ecoli 

Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.8548 | BA: 0.8918 | MCC: 0.8084 | Kappa: 0.8016
🧪 XGBoost | ecoli | Densidad: 25 | Riesgo: 25 | Pureza: proporcion
📌 Total muestras minoritarias: 61
📌 Total muestras mayoritarias: 207
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 240
📌 Total muestras minoritarias: 16
📌 Total muestras mayoritarias: 252
⚠️ Muy pocas muestras luego del filtrado (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 4
📌 Total muestras mayoritarias: 264
⚠️ Muy pocas muestras minoritarias (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 41
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.8577 | BA: 0.8870 | MCC: 0.8049 | Kappa: 0.7999
🧪 XGBoost | ecoli | Densidad: 25 | Riesgo: 50 | Pureza: entropia
📌 Total muestras minoritarias: 61
📌 Total muestras mayoritarias: 207
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 240
📌 Total muestras minoritarias: 16
📌 Total muestras mayoritarias: 252
📌 Total muestras minoritarias: 4
📌 Total muestras mayoritarias: 264
⚠️ Muy pocas muestras minoritarias (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 41
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.8653 | BA: 0.9156 | MCC: 0.8303 | Kappa: 0.8217
🧪 XGBoost | ecoli | Densidad: 25 | Riesgo: 50 | Pureza: proporcion
📌 Total muestras minoritarias: 61
📌 Total muestras mayoritarias: 207
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 240
📌 Total muestras minoritarias: 16
📌 Total muestras mayoritarias: 252
⚠️ Muy pocas muestras luego del filtrado (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 4
📌 Total muestras mayoritarias: 264
⚠️ Muy pocas muestras minoritarias (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 41
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.9206 | BA: 0.9334 | MCC: 0.8821 | Kappa: 0.8802
🧪 XGBoost | ecoli | Densidad: 25 | Riesgo: 75 | Pureza: entropia
📌 Total muestras minoritarias: 61
📌 Total muestras mayoritarias: 207
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 240
📌 Total muestras minoritarias: 16
📌 Total muestras mayoritarias: 252
📌 Total muestras minoritarias: 4
📌 Total muestras mayoritarias: 264
⚠️ Muy pocas muestras minoritarias (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 41
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.8662 | BA: 0.8975 | MCC: 0.8257 | Kappa: 0.8203
🧪 XGBoost | ecoli | Densidad: 25 | Riesgo: 75 | Pureza: proporcion
📌 Total muestras minoritarias: 61
📌 Total muestras mayoritarias: 207
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 240
📌 Total muestras minoritarias: 16
📌 Total muestras mayoritarias: 252
⚠️ Muy pocas muestras luego del filtrado (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 4
📌 Total muestras mayoritarias: 264
⚠️ Muy pocas muestras minoritarias (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 41
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.8838 | BA: 0.8992 | MCC: 0.8407 | Kappa: 0.8396
🧪 XGBoost | ecoli | Densidad: 50 | Riesgo: 25 | Pureza: entropia
📌 Total muestras minoritarias: 61
📌 Total muestras mayoritarias: 207
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 240
📌 Total muestras minoritarias: 16
📌 Total muestras mayoritarias: 252
📌 Total muestras minoritarias: 4
📌 Total muestras mayoritarias: 264
⚠️ Muy pocas muestras minoritarias (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 41
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.8548 | BA: 0.8918 | MCC: 0.8084 | Kappa: 0.8016
🧪 XGBoost | ecoli | Densidad: 50 | Riesgo: 25 | Pureza: proporcion
📌 Total muestras minoritarias: 61
📌 Total muestras mayoritarias: 207
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 240
📌 Total muestras minoritarias: 16
📌 Total muestras mayoritarias: 252
⚠️ Muy pocas muestras luego del filtrado (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 4
📌 Total muestras mayoritarias: 264
⚠️ Muy pocas muestras minoritarias (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 41
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.8577 | BA: 0.8870 | MCC: 0.8049 | Kappa: 0.7999
🧪 XGBoost | ecoli | Densidad: 50 | Riesgo: 50 | Pureza: entropia
📌 Total muestras minoritarias: 61
📌 Total muestras mayoritarias: 207
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 240
📌 Total muestras minoritarias: 16
📌 Total muestras mayoritarias: 252
📌 Total muestras minoritarias: 4
📌 Total muestras mayoritarias: 264
⚠️ Muy pocas muestras minoritarias (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 41
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.8653 | BA: 0.9156 | MCC: 0.8303 | Kappa: 0.8217
🧪 XGBoost | ecoli | Densidad: 50 | Riesgo: 50 | Pureza: proporcion
📌 Total muestras minoritarias: 61
📌 Total muestras mayoritarias: 207
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 240
📌 Total muestras minoritarias: 16
📌 Total muestras mayoritarias: 252
⚠️ Muy pocas muestras luego del filtrado (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 4
📌 Total muestras mayoritarias: 264
⚠️ Muy pocas muestras minoritarias (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 41
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.9206 | BA: 0.9334 | MCC: 0.8821 | Kappa: 0.8802
🧪 XGBoost | ecoli | Densidad: 50 | Riesgo: 75 | Pureza: entropia
📌 Total muestras minoritarias: 61
📌 Total muestras mayoritarias: 207
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 240
📌 Total muestras minoritarias: 16
📌 Total muestras mayoritarias: 252
📌 Total muestras minoritarias: 4
📌 Total muestras mayoritarias: 264
⚠️ Muy pocas muestras minoritarias (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 41
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.8662 | BA: 0.8975 | MCC: 0.8257 | Kappa: 0.8203
🧪 XGBoost | ecoli | Densidad: 50 | Riesgo: 75 | Pureza: proporcion
📌 Total muestras minoritarias: 61
📌 Total muestras mayoritarias: 207
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 240
📌 Total muestras minoritarias: 16
📌 Total muestras mayoritarias: 252
⚠️ Muy pocas muestras luego del filtrado (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 4
📌 Total muestras mayoritarias: 264
⚠️ Muy pocas muestras minoritarias (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 41
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.8838 | BA: 0.8992 | MCC: 0.8407 | Kappa: 0.8396
🧪 XGBoost | ecoli | Densidad: 75 | Riesgo: 25 | Pureza: entropia
📌 Total muestras minoritarias: 61
📌 Total muestras mayoritarias: 207
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 240
📌 Total muestras minoritarias: 16
📌 Total muestras mayoritarias: 252
📌 Total muestras minoritarias: 4
📌 Total muestras mayoritarias: 264
⚠️ Muy pocas muestras minoritarias (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 41
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.8548 | BA: 0.8918 | MCC: 0.8084 | Kappa: 0.8016
🧪 XGBoost | ecoli | Densidad: 75 | Riesgo: 25 | Pureza: proporcion
📌 Total muestras minoritarias: 61
📌 Total muestras mayoritarias: 207
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 240
📌 Total muestras minoritarias: 16
📌 Total muestras mayoritarias: 252
⚠️ Muy pocas muestras luego del filtrado (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 4
📌 Total muestras mayoritarias: 264
⚠️ Muy pocas muestras minoritarias (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 41
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.8577 | BA: 0.8870 | MCC: 0.8049 | Kappa: 0.7999
🧪 XGBoost | ecoli | Densidad: 75 | Riesgo: 50 | Pureza: entropia
📌 Total muestras minoritarias: 61
📌 Total muestras mayoritarias: 207
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 240
📌 Total muestras minoritarias: 16
📌 Total muestras mayoritarias: 252
📌 Total muestras minoritarias: 4
📌 Total muestras mayoritarias: 264
⚠️ Muy pocas muestras minoritarias (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 41
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.8653 | BA: 0.9156 | MCC: 0.8303 | Kappa: 0.8217
🧪 XGBoost | ecoli | Densidad: 75 | Riesgo: 50 | Pureza: proporcion
📌 Total muestras minoritarias: 61
📌 Total muestras mayoritarias: 207
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 240
📌 Total muestras minoritarias: 16
📌 Total muestras mayoritarias: 252
⚠️ Muy pocas muestras luego del filtrado (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 4
📌 Total muestras mayoritarias: 264
⚠️ Muy pocas muestras minoritarias (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 41
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.9206 | BA: 0.9334 | MCC: 0.8821 | Kappa: 0.8802
🧪 XGBoost | ecoli | Densidad: 75 | Riesgo: 75 | Pureza: entropia
📌 Total muestras minoritarias: 61
📌 Total muestras mayoritarias: 207
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 240
📌 Total muestras minoritarias: 16
📌 Total muestras mayoritarias: 252
📌 Total muestras minoritarias: 4
📌 Total muestras mayoritarias: 264
⚠️ Muy pocas muestras minoritarias (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 41
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.8662 | BA: 0.8975 | MCC: 0.8257 | Kappa: 0.8203
🧪 XGBoost | ecoli | Densidad: 75 | Riesgo: 75 | Pureza: proporcion
📌 Total muestras minoritarias: 61
📌 Total muestras mayoritarias: 207
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 2
📌 Total muestras mayoritarias: 266
⚠️ Muy pocas muestras minoritarias (2). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 240
📌 Total muestras minoritarias: 16
📌 Total muestras mayoritarias: 252
⚠️ Muy pocas muestras luego del filtrado (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 4
📌 Total muestras mayoritarias: 264
⚠️ Muy pocas muestras minoritarias (4). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 41
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.8838 | BA: 0.8992 | MCC: 0.8407 | Kappa: 0.8396
📁 Resultados guardados en: ../resultados/pcsmote_grid_ecoli_XGBoost.csv

=== Ejecutando grid para wdbc con modelo RandomForest ===
📂 Cargando dataset: wdbc
🧪 RandomForest | wdbc | Densidad: 25 | Riesgo: 25 | Pureza: entropia
📌 Total muestras minoritarias: 170
📌 Total muestras mayoritarias: 285
✅ F1: 0.9474 | BA: 0.9435 | MCC: 0.8869 | Kappa: 0.8869
🧪 RandomForest | wdbc | Densidad: 25 | Riesgo: 25 | Pureza: proporcion
📌 Total muestras minoritarias: 170
📌 Total muestras mayoritarias: 285
✅ F1: 0.9478 | BA: 0.9534 | MCC: 0.8915 | Kappa: 0.8891
🧪 RandomForest | wdbc | Densidad: 25 | Riesgo: 50 | Pureza: entropia
📌 Total muestras minoritarias: 170
📌 Total muestras mayoritarias: 285
✅ F1: 0.9737 | BA: 0.9742 | MCC: 0.9439 | Kappa: 0.9437
🧪 RandomForest | wdbc | Densidad: 25 | Riesgo: 50 | Pureza: proporcion
📌 Total muestras minoritarias: 170
📌 Total muestras mayoritarias: 285
✅ F1: 0.9652 | BA: 0.9722 | MCC: 0.9286 | Kappa: 0.9261
🧪 Ra

STOP: TOTAL NO. OF ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(


✅ F1: 0.5870 | BA: 0.4037 | MCC: 0.3670 | Kappa: 0.3597
🧪 LogisticRegression | heart | Densidad: 25 | Riesgo: 25 | Pureza: proporcion
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.
✅ F1: 0.5980 | BA: 0.3356 | MCC: 0.3944 | Kappa: 0.3907
🧪 LogisticRegression | heart | Densidad: 25 | Riesgo: 50 | Pureza: entropia
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 10
📌 Total muestra

STOP: TOTAL NO. OF ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(


✅ F1: 0.5870 | BA: 0.4037 | MCC: 0.3670 | Kappa: 0.3597
🧪 LogisticRegression | heart | Densidad: 50 | Riesgo: 25 | Pureza: proporcion
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.
✅ F1: 0.5980 | BA: 0.3356 | MCC: 0.3944 | Kappa: 0.3907
🧪 LogisticRegression | heart | Densidad: 50 | Riesgo: 50 | Pureza: entropia
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 10
📌 Total muestra

STOP: TOTAL NO. OF ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(


✅ F1: 0.5870 | BA: 0.4037 | MCC: 0.3670 | Kappa: 0.3597
🧪 LogisticRegression | heart | Densidad: 75 | Riesgo: 25 | Pureza: proporcion
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.
✅ F1: 0.5980 | BA: 0.3356 | MCC: 0.3944 | Kappa: 0.3907
🧪 LogisticRegression | heart | Densidad: 75 | Riesgo: 50 | Pureza: entropia
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 10
📌 Total muestra

Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.5874 | BA: 0.3859 | MCC: 0.3772 | Kappa: 0.3758
🧪 XGBoost | heart | Densidad: 25 | Riesgo: 25 | Pureza: proporcion
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.5827 | BA: 0.3340 | MCC: 0.3784 | Kappa: 0.3733
🧪 XGBoost | heart | Densidad: 25 | Riesgo: 50 | Pureza: entropia
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.5381 | BA: 0.4021 | MCC: 0.3092 | Kappa: 0.3062
🧪 XGBoost | heart | Densidad: 25 | Riesgo: 50 | Pureza: proporcion
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.4882 | BA: 0.2280 | MCC: 0.2247 | Kappa: 0.2232
🧪 XGBoost | heart | Densidad: 25 | Riesgo: 75 | Pureza: entropia
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.4962 | BA: 0.2456 | MCC: 0.2360 | Kappa: 0.2337
🧪 XGBoost | heart | Densidad: 25 | Riesgo: 75 | Pureza: proporcion
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.5041 | BA: 0.2566 | MCC: 0.2454 | Kappa: 0.2429
🧪 XGBoost | heart | Densidad: 50 | Riesgo: 25 | Pureza: entropia
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.5874 | BA: 0.3859 | MCC: 0.3772 | Kappa: 0.3758
🧪 XGBoost | heart | Densidad: 50 | Riesgo: 25 | Pureza: proporcion
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.5827 | BA: 0.3340 | MCC: 0.3784 | Kappa: 0.3733
🧪 XGBoost | heart | Densidad: 50 | Riesgo: 50 | Pureza: entropia
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.5381 | BA: 0.4021 | MCC: 0.3092 | Kappa: 0.3062
🧪 XGBoost | heart | Densidad: 50 | Riesgo: 50 | Pureza: proporcion
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.4882 | BA: 0.2280 | MCC: 0.2247 | Kappa: 0.2232
🧪 XGBoost | heart | Densidad: 50 | Riesgo: 75 | Pureza: entropia
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.4962 | BA: 0.2456 | MCC: 0.2360 | Kappa: 0.2337
🧪 XGBoost | heart | Densidad: 50 | Riesgo: 75 | Pureza: proporcion
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.5041 | BA: 0.2566 | MCC: 0.2454 | Kappa: 0.2429
🧪 XGBoost | heart | Densidad: 75 | Riesgo: 25 | Pureza: entropia
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.5874 | BA: 0.3859 | MCC: 0.3772 | Kappa: 0.3758
🧪 XGBoost | heart | Densidad: 75 | Riesgo: 25 | Pureza: proporcion
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.5827 | BA: 0.3340 | MCC: 0.3784 | Kappa: 0.3733
🧪 XGBoost | heart | Densidad: 75 | Riesgo: 50 | Pureza: entropia
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.5381 | BA: 0.4021 | MCC: 0.3092 | Kappa: 0.3062
🧪 XGBoost | heart | Densidad: 75 | Riesgo: 50 | Pureza: proporcion
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.4882 | BA: 0.2280 | MCC: 0.2247 | Kappa: 0.2232
🧪 XGBoost | heart | Densidad: 75 | Riesgo: 75 | Pureza: entropia
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.4962 | BA: 0.2456 | MCC: 0.2360 | Kappa: 0.2337
🧪 XGBoost | heart | Densidad: 75 | Riesgo: 75 | Pureza: proporcion
📌 Total muestras minoritarias: 43
📌 Total muestras mayoritarias: 194
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
📌 Total muestras minoritarias: 28
📌 Total muestras mayoritarias: 209
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.
📌 Total muestras minoritarias: 10
📌 Total muestras mayoritarias: 227
⚠️ Muy pocas muestras luego del filtrado (0). Se requieren al menos 6. Devolviendo dataset original.


Parameters: { "use_label_encoder" } are not used.

  bst.update(dtrain, iteration=i, fobj=obj)


✅ F1: 0.5041 | BA: 0.2566 | MCC: 0.2454 | Kappa: 0.2429
📁 Resultados guardados en: ../resultados/pcsmote_grid_heart_XGBoost.csv


In [5]:
import pandas as pd

datasets = ['ecoli', 'wdbc', 'glass', 'heart']
resumen = []

for d in datasets:
    df = pd.read_csv(f'../resultados/pcsmote_grid_{d}.csv')

    # Ignorar filas con errores o f1_score faltante
    df_valid = df.dropna(subset=["f1_score"])

    if df_valid.empty:
        print(f"⚠️ No hay resultados válidos para {d}")
        continue

    mejor = df_valid.sort_values(by="f1_score", ascending=False).iloc[0].copy()
    mejor['dataset'] = d
    resumen.append(mejor)

resumen_df = pd.DataFrame(resumen)

# Reordenar columnas si es necesario
cols = ['dataset', 'densidad', 'riesgo', 'pureza', 'f1_score']
for metric in ['balanced_accuracy', 'mcc', 'cohen_kappa']:
    if metric in resumen_df.columns:
        cols.append(metric)

resumen_df = resumen_df[cols]
resumen_df.to_csv("../resultados/resumen_mejores_pcsmote.csv", index=False)
print("✅ Resumen guardado en ../resultados/resumen_mejores_pcsmote.csv")


✅ Resumen guardado en ../resultados/resumen_mejores_pcsmote.csv
