In [8]:
import pandas as pd
import os
import csv

def convert_scientific_to_int(df, column_name):
    # Verifica se a coluna existe no DataFrame
    if column_name in df.columns:
        try:
            # Converte a coluna para string e substitui vírgulas por pontos
            df[column_name] = df[column_name].astype(str).str.replace(',', '.').astype(float).astype(int)
        except ValueError:
            print(f"Não foi possível converter a coluna {column_name} para inteiro.")
    return df

def split_and_save(df, lines_per_file, arquivo):
    # Converte a coluna 'CPF/CNPJ' de notação científica para inteiros
    df = convert_scientific_to_int(df, 'CPF/CNPJ')

    # Remove duplicados com base na coluna 'CPF/CNPJ'
    df = df.drop_duplicates(subset='CPF/CNPJ')

    # Cria a pasta com o nome da variável `arquivo`
    output_dir = os.path.join(os.getcwd(), arquivo)
    os.makedirs(output_dir, exist_ok=True)

    total_rows = len(df)
    num_parts = (total_rows + lines_per_file - 1) // lines_per_file  # Calcula o número de partes

    for i in range(num_parts):
        start_row = i * lines_per_file
        end_row = min(start_row + lines_per_file, total_rows)
        part_df = df.iloc[start_row:end_row]
        
        # Salvando em CSV
        csv_filename = os.path.join(output_dir, f"{arquivo}_parte_{i+1}.csv")
        part_df.to_csv(csv_filename, index=False)

    print(f"{num_parts} arquivo(s) CSV criados na pasta '{output_dir}'.")

# Exemplo de uso
if __name__ == "__main__":
    df1 = pd.read_excel('Base_OPEA_TEN.xlsx')
    df2 = pd.read_excel('Base_EcoAgro_TEN (1).xlsx')
    data = [("Base XP - Opea", df1), ("Base XP - Ecoagro", df2)]  # Lista de tuplas com nome da pasta e DataFrame

    for arquivo, df in data:
        lines_per_file = 500  # Número máximo de linhas por arquivo
        split_and_save(df, lines_per_file, arquivo)


23 arquivo(s) CSV criados na pasta '/home/david/Documentos/GitHub/quebra_linhas_ten/Base XP - Opea'.
24 arquivo(s) CSV criados na pasta '/home/david/Documentos/GitHub/quebra_linhas_ten/Base XP - Ecoagro'.
