In [1]:
import pandas as pd
import unicodedata

def remove_accents(input_str):
    """
    Remove acentos de uma string.
    """
    if isinstance(input_str, str):
        nfkd_form = unicodedata.normalize('NFKD', input_str)
        return "".join([c for c in nfkd_form if not unicodedata.combining(c)])
    return input_str

def clean_text(text):
    """
    Limpa e padroniza o texto, removendo acentos e espaços em branco.
    """
    text = remove_accents(text)
    if isinstance(text, str):
        text = text.strip()
    return text

# Carregar os datasets
try:
    cfops_df = pd.read_csv('cfops.csv', sep=';')
    regras_df = pd.read_csv('regras.csv', sep=';')

    # Limpar a coluna 'Regra' em cfops_df
    if 'Regra' in cfops_df.columns:
        cfops_df['Regra'] = cfops_df['Regra'].apply(clean_text)

    # Limpar e renomear a coluna 'Regra CFOP' em regras_df
    if 'Regra CFOP' in regras_df.columns:
        regras_df['Regra CFOP'] = regras_df['Regra CFOP'].apply(clean_text)
        regras_df.rename(columns={'Regra CFOP': 'Regra'}, inplace=True)

    # Salvar os dataframes limpos
    cfops_df.to_csv('cfops_cleaned.csv', sep=';', index=False)
    regras_df.to_csv('regras_cleaned.csv', sep=';', index=False)

    print("Arquivos 'cfops_cleaned.csv' e 'regras_cleaned.csv' gerados com sucesso!")

except FileNotFoundError:
    print("Erro: Verifique se os arquivos 'cfops.csv' e 'regras.csv' estão no mesmo diretório que o script.")
except Exception as e:
    print(f"Ocorreu um erro inesperado: {e}")

Arquivos 'cfops_cleaned.csv' e 'regras_cleaned.csv' gerados com sucesso!
