In [1]:
import os
import shutil
import glob

# --- CONFIGURAÇÕES ---
# Nome da pasta que você baixou do GitHub (onde estão as partes)
INPUT_DIR = "bert_upload_github" 
# Nome da pasta onde o modelo pronto ficará
OUTPUT_DIR = "bert_final"

def join_files(filename_base, source_dir, dest_dir):
    """Reconstroi arquivos particionados."""
    # Procura por todas as partes (ex: pytorch_model.bin.part*)
    pattern = os.path.join(source_dir, f"{filename_base}.part*")
    parts = sorted(glob.glob(pattern))
    
    output_path = os.path.join(dest_dir, filename_base)
    
    if not parts:
        # Se não tem partes, verifica se o arquivo existe inteiro (caso dos arquivos pequenos)
        original_file = os.path.join(source_dir, filename_base)
        if os.path.exists(original_file):
            shutil.copy2(original_file, output_path)
            print(f"[Copiado] {filename_base}")
        return

    print(f"[Reconstruindo] {filename_base}...")
    with open(output_path, 'wb') as outfile:
        for part in parts:
            with open(part, 'rb') as infile:
                outfile.write(infile.read())
            print(f"  -> Uniu: {os.path.basename(part)}")

def main():
    if not os.path.exists(INPUT_DIR):
        print(f"Erro: Pasta de entrada '{INPUT_DIR}' não encontrada.")
        return

    if os.path.exists(OUTPUT_DIR):
        shutil.rmtree(OUTPUT_DIR)
    os.makedirs(OUTPUT_DIR)

    # Identificar quais são os arquivos originais baseados nos nomes das partes
    # ou arquivos soltos
    processed_files = set()
    
    files_in_dir = os.listdir(INPUT_DIR)
    
    for file in files_in_dir:
        # Remove a extensão .partXXX para pegar o nome base
        if ".part" in file:
            base_name = file.split(".part")[0]
        else:
            base_name = file
            
        if base_name not in processed_files:
            join_files(base_name, INPUT_DIR, OUTPUT_DIR)
            processed_files.add(base_name)

    print(f"\nSucesso! O modelo está em '{OUTPUT_DIR}'.")
    print("Use o comando abaixo para carregar:")
    print(f"model = AutoModel.from_pretrained('./{OUTPUT_DIR}')")

if __name__ == "__main__":
    main()

[Copiado] config.json
[Reconstruindo] model.safetensors...
  -> Uniu: model.safetensors.part001
  -> Uniu: model.safetensors.part002
  -> Uniu: model.safetensors.part003
  -> Uniu: model.safetensors.part004
  -> Uniu: model.safetensors.part005
  -> Uniu: model.safetensors.part006
  -> Uniu: model.safetensors.part007
  -> Uniu: model.safetensors.part008
  -> Uniu: model.safetensors.part009
  -> Uniu: model.safetensors.part010
  -> Uniu: model.safetensors.part011
  -> Uniu: model.safetensors.part012
  -> Uniu: model.safetensors.part013
  -> Uniu: model.safetensors.part014
  -> Uniu: model.safetensors.part015
  -> Uniu: model.safetensors.part016
  -> Uniu: model.safetensors.part017
  -> Uniu: model.safetensors.part018
  -> Uniu: model.safetensors.part019
  -> Uniu: model.safetensors.part020
  -> Uniu: model.safetensors.part021
[Copiado] special_tokens_map.json
[Copiado] tokenizer.json
[Copiado] tokenizer_config.json
[Copiado] vocab.txt

Sucesso! O modelo está em 'bert_final'.
Use o comand