In [31]:
import pandas as pd
import os
import logging
from treatment_files import process_and_convert_to_excel

In [30]:
def verificar_arquivo_csv():
    base_dir = "arquivos_extraidos"
    
    # Vamos tentar abrir o primeiro CSV encontrado
    for root, dirs, files in os.walk(base_dir):
        for file in files:
            if file.endswith(".csv"):
                csv_path = os.path.join(root, file)
                logging.info(f"Tentando abrir o arquivo CSV: {csv_path}")
                try:
                    df = pd.read_csv(csv_path, encoding='latin1')
                    logging.info(f"Arquivo {file} aberto com sucesso!")
                    logging.info(f"Primeiras linhas: {df.head()}")
                except Exception as e:
                    logging.error(f"Erro ao abrir o arquivo {csv_path}: {e}")

verificar_arquivo_csv()

In [32]:
import os
import pandas as pd
import logging

def process_and_convert_to_excel(extract_dir):
    """
    Processa os arquivos CSV encontrados na pasta extraída, remove caracteres especiais (exceto na coluna de data),
    e os converte para arquivos Excel.
    """
    # Verifica se o diretório existe
    if not os.path.exists(extract_dir):
        logging.error(f"A pasta {extract_dir} não existe.")
        return

    # Itera pelas subpastas e arquivos
    for root, dirs, files in os.walk(extract_dir):
        for file in files:
            if file.endswith(".csv"):  # Verifica se o arquivo é CSV
                csv_file_path = os.path.join(root, file)
                logging.info(f"Processando o arquivo CSV: {csv_file_path}")
                
                try:
                    # Lê o arquivo CSV
                    df = pd.read_csv(csv_file_path, encoding='latin1')  # Altere o encoding se necessário
                    logging.info(f"Primeiras linhas do arquivo {file}:")
                    logging.info(df.head())
                    
                    # Remove caracteres especiais em todas as colunas, exceto na coluna de data
                    for column in df.columns:
                        if column != "data":  # Supondo que a coluna 'data' seja a coluna de data
                            df[column] = df[column].astype(str).str.replace(r'[^\w\s]', '', regex=True)
                    
                    # Cria o caminho para salvar o arquivo Excel
                    excel_file_path = os.path.splitext(csv_file_path)[0] + ".xlsx"
                    
                    # Converte para Excel e salva
                    df.to_excel(excel_file_path, index=False)
                    logging.info(f"Arquivo processado e salvo em Excel: {excel_file_path}")
                
                except Exception as e:
                    logging.error(f"Erro ao processar o arquivo {csv_file_path}: {e}")
