pip install PDFNetPython3

pip install --upgrade pip

In [2]:
# Import Libraries
import os
import sys
from PDFNetPython3.PDFNetPython import PDFDoc, Optimizer, SDFDoc, PDFNet

In [3]:
def get_size_format(b, factor=1024, suffix="B"):
    """
    Scale bytes to its proper byte format
    e.g:
        1253656 => '1.20MB'
        1253656678 => '1.17GB'
    """
    for unit in ["", "K", "M", "G", "T", "P", "E", "Z"]:
        if b < factor:
            return f"{b:.2f}{unit}{suffix}"
        b /= factor
    return f"{b:.2f}Y{suffix}"

In [4]:
def compress_file(input_file: str, output_file: str):
    """Compress PDF file"""
    if not output_file:
        output_file = input_file
    initial_size = os.path.getsize(input_file)
    try:
        # Initialize the library
        PDFNet.Initialize("demo:1652721067096:7b89dd1603000000008ca8f036d3c1112cd0debd5cca3f78321ecf6f88")
        doc = PDFDoc(input_file)
        # Optimize PDF with the default settings
        doc.InitSecurityHandler()
        # Reduce PDF size by removing redundant information and compressing data streams
        Optimizer.Optimize(doc)
        doc.Save(output_file, SDFDoc.e_linearized)
        doc.Close()
    except Exception as e:
        print("Error compress_file=", e)
        doc.Close()
        return False
    compressed_size = os.path.getsize(output_file)
    ratio = 1 - (compressed_size / initial_size)
    summary = {
        "Input File": input_file, "Initial Size": get_size_format(initial_size),
        #"Output File": output_file, f"Compressed Size": get_size_format(compressed_size),
        "Compression Ratio": "{0:.3%}.".format(ratio)
    }
    # Printing Summary
    print("--------------------- Resumo da compressão ------------------------")
    print("\n".join("{}:{}".format(i, j) for i, j in summary.items()))
    print("-------------------------------------------------------------------")
    print("")
    return True

if __name__ == "__main__":
    
    endereco_dos_arquivos = "C:\\Users\\Rafael Bruno\\Documents\\Formação Pedagógica\\PDFs das Disciplinas\\Didática\\Abordagens didáticas na prática docente\\"
    # Endereço da pasta com os arquivos pdf a serem comprimidos
    
    # ---------------------------------------------------------------------------------------------
    
    arquivos = os.listdir(endereco_dos_arquivos)
    
    for arquivo in arquivos:
        if(arquivo.endswith('.pdf')):
            print(arquivo)
            compress_file(endereco_dos_arquivos + arquivo, endereco_dos_arquivos + arquivo)



In [5]:
input_folder = "C:\\Users\\Rafael Bruno\\Documents\\Formação Pedagógica\\PDFs das Disciplinas\\"

for root, dirs, files in os.walk(input_folder):
        for file in files:
            if file.endswith(".pdf"):
                pdf_path = os.path.join(root, file)
                #output_path = os.path.join(output_folder, file)

                # Otimiza o arquivo PDF
                #optimize_pdf(pdf_path, output_path)
                compress_file(pdf_path, pdf_path)
                #print(f"Arquivo otimizado: {pdf_path}")

print("Otimização concluída!")

--------------------- Resumo da compressão ------------------------
Input File:C:\Users\Rafael Bruno\Documents\Formação Pedagógica\PDFs das Disciplinas\Didática\Abordagens didáticas na prática docente\Abordagens didáticas na prática docente.pdf
Initial Size:5.20MB
Compression Ratio:0.000%.
-------------------------------------------------------------------

--------------------- Resumo da compressão ------------------------
Input File:C:\Users\Rafael Bruno\Documents\Formação Pedagógica\PDFs das Disciplinas\Didática\Ação Pedagógica e Transposição Didática\Ação Pedagógica e Transposição Didática.pdf
Initial Size:5.55MB
Compression Ratio:29.384%.
-------------------------------------------------------------------

--------------------- Resumo da compressão ------------------------
Input File:C:\Users\Rafael Bruno\Documents\Formação Pedagógica\PDFs das Disciplinas\Didática\Conceito de Didática e Sua Origem\Conceito de Didática e Sua Origem.pdf
Initial Size:3.90MB
Compression Ratio:27.019%.

KeyboardInterrupt: 