In [3]:
import os
from docling.document_converter import DocumentConverter as dc

def convert_pdfs_to_markdown(input_dir, output_dir=None):
    """
    Converte todos os PDFs de input_dir em arquivos .md.
    Se output_dir for informado, salva lá; caso contrário, no cwd.
    """
    converter = dc()
    if output_dir:
        os.makedirs(output_dir, exist_ok=True)

    for entry in os.scandir(input_dir):
        if entry.is_file() and entry.name.lower().endswith('.pdf'):
            source_path = entry.path

            result = converter.convert(source_path)
            markdown = result.document.export_to_markdown()

            base_name = os.path.splitext(entry.name)[0]
            output_filename = base_name + '.md'
            if output_dir:
                output_path = os.path.join(output_dir, output_filename)
            else:
                output_path = output_filename

            with open(output_path, 'w', encoding='utf-8') as f:
                f.write(markdown)

            print(f'✔ Convertido: "{source_path}" → "{output_path}"')

if __name__ == '__main__':
    pasta_de_pdfs = 'LIDOS'
    pasta_de_saida = 'SAIDA'
    pasta_de_saida = None

    convert_pdfs_to_markdown(pasta_de_pdfs, pasta_de_saida)


✔ Convertido: "LIDOS\out-só_veio_a_introdução.pdf" → "out-só_veio_a_introdução.md"
✔ Convertido: "LIDOS\SlidesIDV_muito_bom_BETS.pdf" → "SlidesIDV_muito_bom_BETS.md"
✔ Convertido: "LIDOS\TOMADA_DE_DECISÃO_EM_AMBIENTE_DE_RISCO_UMA_AVALIAÇÃO_SOB_A.pdf" → "TOMADA_DE_DECISÃO_EM_AMBIENTE_DE_RISCO_UMA_AVALIAÇÃO_SOB_A.md"
✔ Convertido: "LIDOS\V3802101.pdf" → "V3802101.md"
