# normaliza as saídas da simulação

In [1]:
import os
import pandas as pd
from sklearn.preprocessing import MinMaxScaler

def normalize_dataset(file_path, output_path):
    """
    Normaliza um dataset utilizando Min-Max Scaling e salva o resultado.

    Args:
        file_path (str): Caminho do arquivo de entrada.
        output_path (str): Caminho para salvar o arquivo normalizado.
    """
    try:
        # Ler o dataset
        data = pd.read_csv(file_path, delimiter=',', skipinitialspace=True)

        # Inicializar o MinMaxScaler
        scaler = MinMaxScaler()

        # Aplicar normalização apenas nas colunas numéricas
        numeric_columns = data.select_dtypes(include=['number']).columns
        data[numeric_columns] = scaler.fit_transform(data[numeric_columns])

        # Salvar o arquivo normalizado
        os.makedirs(os.path.dirname(output_path), exist_ok=True)
        data.to_csv(output_path, index=False, sep=',')

        print(f"Normalização concluída: {output_path}")
    except Exception as e:
        print(f"Erro ao processar {file_path}: {e}")

def process_all_datasets(input_dir, exclude_dir):
    """
    Processa todos os datasets em subpastas e aplica Min-Max Scaling, exceto no diretório especificado.

    Args:
        input_dir (str): Diretório raiz contendo os datasets.
        exclude_dir (str): Diretório a ser excluído do processamento.
    """
    for root, _, files in os.walk(input_dir):
        if os.path.commonpath([root, exclude_dir]) == exclude_dir:
            continue

        for file in files:
            if file.endswith('.txt'):
                input_path = os.path.join(root, file)
                output_path = os.path.join(root, file)  # Sobrescreve o arquivo original
                normalize_dataset(input_path, output_path)

# Diretório raiz contendo os datasets
input_directory = r"C:\Users\CALEO\OneDrive - Hexagon\Documents\GitHub\Software_effort_estimation\proposal\abordagem2\saida\3-simulacao"

# Diretório a ser excluído da normalização
exclude_directory = r"C:\Users\CALEO\OneDrive - Hexagon\Documents\GitHub\Software_effort_estimation\proposal\abordagem2\saida\3-simulacao\1-tratamento"

# Processar todos os arquivos, exceto os do diretório excluído
process_all_datasets(input_directory, exclude_directory)


Normalização concluída: C:\Users\CALEO\OneDrive - Hexagon\Documents\GitHub\Software_effort_estimation\proposal\abordagem2\saida\3-simulacao\GAN-25\tratamento_china.txt
Normalização concluída: C:\Users\CALEO\OneDrive - Hexagon\Documents\GitHub\Software_effort_estimation\proposal\abordagem2\saida\3-simulacao\GAN-25\tratamento_cocomo81.txt
Normalização concluída: C:\Users\CALEO\OneDrive - Hexagon\Documents\GitHub\Software_effort_estimation\proposal\abordagem2\saida\3-simulacao\GAN-25\tratamento_desharnais.txt
Normalização concluída: C:\Users\CALEO\OneDrive - Hexagon\Documents\GitHub\Software_effort_estimation\proposal\abordagem2\saida\3-simulacao\GAN-25\tratamento_maxwell.txt
Normalização concluída: C:\Users\CALEO\OneDrive - Hexagon\Documents\GitHub\Software_effort_estimation\proposal\abordagem2\saida\3-simulacao\GAN-50\tratamento_china.txt
Normalização concluída: C:\Users\CALEO\OneDrive - Hexagon\Documents\GitHub\Software_effort_estimation\proposal\abordagem2\saida\3-simulacao\GAN-50\tra