In [1]:

# Importación de librerías necesarias
import os
import datetime
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sn
from collections import Counter
from tqdm import tqdm
from sklearn.metrics import confusion_matrix, classification_report
from imblearn.over_sampling import SMOTE, RandomOverSampler, ADASYN, BorderlineSMOTE
from imblearn.under_sampling import RandomUnderSampler, TomekLinks, EditedNearestNeighbours, OneSidedSelection
from imblearn.combine import SMOTEENN, SMOTETomek
import tensorflow as tf
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Input, Dense
from tensorflow.keras.optimizers import Adam






# Definir directorios y configuraciones iniciales
bases = ['Salinas']

# Proceso iterativo sobre cada base de datos
for Base in bases:
    directorio = f"../../Datasets/"
    print("Inicio del proceso para la base de datos:", Base)

    # Métodos de balanceo de clases
    balance_methods = [ "ROS", "SMOTE"]
    sampling_strategies = {
        "ROS": RandomOverSampler(),
        "SMOTE": SMOTE(n_jobs=7),
    }

    # Procesamiento para cada método de balanceo
    for method in balance_methods:
        print(f"Procesando {method}")
        try:
            # Intenta cargar el archivo procesado previamente
            data_path = f"{directorio}txt/sampled_train/{Base}_{method}.txt"
            print(data_path)
            data = np.loadtxt(data_path)
            print(f"{method} ya procesado.")
        except FileNotFoundError:
            print("Archivo no encontrado")
            # Si no existe, procesa y crea el archivo
            original_data_path = f"{directorio}/txt/train/{Base}.txt"
            data = np.loadtxt(original_data_path)
            features = data[:, :-1]
            labels = data[:, -1]

            # Aplicar método de balanceo
            if isinstance(sampling_strategies[method], tuple):
                # Para métodos compuestos como SMOTE-TL
                for strategy in sampling_strategies[method]:
                    features, labels = strategy.fit_resample(features, labels)
            else:
                features, labels = sampling_strategies[method].fit_resample(features, labels)
            ##############            
            fmt = ['%0.15f']* features.shape[1] + ['%d']  # Formato flotante para características, entero para etiquetas
            np.savetxt(data_path, np.column_stack((features, labels)), fmt=fmt)
            print(f"Datos procesados y guardados para {method}")





Inicio del proceso para la base de datos: Salinas
Procesando ROS
../../Datasets/txt/sampled_train/Salinas_ROS.txt
Archivo no encontrado
Datos procesados y guardados para ROS
Procesando SMOTE
../../Datasets/txt/sampled_train/Salinas_SMOTE.txt
Archivo no encontrado




Datos procesados y guardados para SMOTE
