In [2]:
import os
import glob

def merge_txt_files(input_paths, output_path):
    """
    Mescla múltiplos arquivos .txt mantendo o formato de uma sequência por linha.
    
    Args:
        input_paths (list): Lista com os caminhos dos arquivos de entrada
        output_path (str): Caminho para o arquivo de saída
    """
    # Conjunto para armazenar sequências únicas
    unique_sequences = set()
    
    # Ler cada arquivo e adicionar as sequências ao conjunto
    for file_path in input_paths:
        try:
            with open(file_path, 'r') as file:
                # Ler linha por linha, remover espaços em branco extras
                for line in file:
                    sequence = line.strip()
                    if sequence:  # Ignorar linhas vazias
                        unique_sequences.add(sequence)
        except Exception as e:
            print(f"Erro ao ler o arquivo {file_path}: {e}")
    
    # Escrever as sequências únicas no arquivo de saída
    try:
        with open(output_path, 'w') as output_file:
            for sequence in sorted(unique_sequences):
                output_file.write(f"{sequence}\n")
        print(f"Arquivo mesclado salvo em: {output_path}")
        print(f"Total de sequências únicas: {len(unique_sequences)}")
    except Exception as e:
        print(f"Erro ao escrever o arquivo de saída: {e}")

# Exemplo de uso
if __name__ == "__main__":
    # Lista com caminhos dos arquivos para mesclar
    files_to_merge = [
        "naoBLent.txt",
        "naoBRetro.txt",
        "naoBVirus.txt"
    ]
    
    # Caminho para o arquivo de saída
    output_file = "naoB.txt"
    
    # Executar a mesclagem
    merge_txt_files(files_to_merge, output_file)

Arquivo mesclado salvo em: naoB.txt
Total de sequências únicas: 182648
