In [31]:
import pandas as pd
import uuid
import os

# Função para gerar um UUID a partir de um valor inteiro
def generate_uuid(value):
    # Gera um UUID determinístico baseado no valor (usando uuid5 para consistência)
    return str(uuid.uuid5(uuid.NAMESPACE_DNS, str(value)))

# Caminhos para diretórios de entrada e saída
input_directory = 'csv'  # Substitua pelo caminho onde estão seus CSVs
output_directory = 'csv_2'  # Onde os arquivos processados serão salvos

# Garante que o diretório de saída existe
os.makedirs(output_directory, exist_ok=True)

# Especifique as colunas que deseja converter para UUID
columns_to_convert = ['state_id', 'country_id', 'account_id', 'customer_id', 'id']

# Colunas que possuem valores como strings com ".0" no final
columns_with_decimal_strings = ['pix_requested_at', 'pix_completed_at', 'transaction_requested_at', 'transaction_completed_at']

# Processa cada arquivo CSV no diretório
for filename in os.listdir(input_directory):
    if filename.endswith('.csv'):
        file_path = os.path.join(input_directory, filename)
        
        # Carrega o CSV
        df = pd.read_csv(file_path)

        # Corrige as colunas que têm ".0" no final, removendo o ".0" e convertendo para inteiros grandes
        for column in columns_with_decimal_strings:
            if column in df.columns:
                # Remove o ".0" apenas dos valores válidos e converte para Int64, mantendo NaN
                df[column] = df[column].apply(lambda x: int(str(x).replace('.0', '')) if pd.notna(x) else x).astype('Int64')
                print(f'Coluna "{column}" corrigida para Int64 no arquivo {filename}.')
            else:
                print(f'Coluna "{column}" não encontrada em {filename}. Pulando...')

        # Itera sobre as colunas e aplica a função de UUID onde necessário
        for column in columns_to_convert:
            if column in df.columns:  # Verifica se a coluna existe no arquivo
                df[column] = df[column].apply(generate_uuid)  # Substitui valores inteiros por UUIDs
                print(f'Coluna "{column}" convertida para UUID no arquivo {filename}.')
            else:
                print(f'Coluna "{column}" não encontrada em {filename}. Pulando...')

        # Salva o CSV atualizado no diretório de saída
        output_file_path = os.path.join(output_directory, f'uuid_{filename}')
        df.to_csv(output_file_path, index=False)
        print(f'Arquivo processado: {filename} -> {output_file_path}')



Coluna "pix_requested_at" não encontrada em accounts.csv. Pulando...
Coluna "pix_completed_at" não encontrada em accounts.csv. Pulando...
Coluna "transaction_requested_at" não encontrada em accounts.csv. Pulando...
Coluna "transaction_completed_at" não encontrada em accounts.csv. Pulando...
Coluna "state_id" não encontrada em accounts.csv. Pulando...
Coluna "country_id" não encontrada em accounts.csv. Pulando...
Coluna "account_id" convertida para UUID no arquivo accounts.csv.
Coluna "customer_id" convertida para UUID no arquivo accounts.csv.
Coluna "id" não encontrada em accounts.csv. Pulando...
Arquivo processado: accounts.csv -> csv_2\uuid_accounts.csv
Coluna "pix_requested_at" não encontrada em city.csv. Pulando...
Coluna "pix_completed_at" não encontrada em city.csv. Pulando...
Coluna "transaction_requested_at" não encontrada em city.csv. Pulando...
Coluna "transaction_completed_at" não encontrada em city.csv. Pulando...
Coluna "state_id" convertida para UUID no arquivo city.csv.
