Lectura de los archivos .tif

In [None]:

# pip install --upgrade pip

Collecting pip
  Downloading pip-25.3-py3-none-any.whl.metadata (4.7 kB)
Downloading pip-25.3-py3-none-any.whl (1.8 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.8/1.8 MB[0m [31m8.7 MB/s[0m  [33m0:00:00[0m36m-:--:--[0m
[?25hInstalling collected packages: pip
  Attempting uninstall: pip
    Found existing installation: pip 25.2
    Uninstalling pip-25.2:
      Successfully uninstalled pip-25.2
Successfully installed pip-25.3
Note: you may need to restart the kernel to use updated packages.


In [5]:
from pathlib import Path
import img2pdf
import re

In [6]:
# ---------- Helpers ----------

def natural_key(path: Path):
    """
    Orden 'natural' para que:
    Pag 1.tif, Pag 2.tif, ... Pag 10.tif
    NO quede como 1,10,2 sino 1,2,3,...,10
    """
    s = path.name
    return [
        int(text) if text.isdigit() else text.lower()
        for text in re.split(r'(\d+)', s)
    ]


def extract_first_number(name: str):
    """Extrae el primer número que aparezca en el nombre del archivo."""
    m = re.search(r'\d+', name)
    return int(m.group()) if m else None


def convert_folder_to_pdf(folder_path: str):
    folder = Path(folder_path)

    print("=" * 80)
    print(f"Carpeta objetivo: {folder_path}")

    if not folder.exists():
        print(f"[ERROR] La carpeta NO existe: {folder.resolve()}")
        return

    print(f"[OK] La carpeta existe: {folder.resolve()}")

    # Buscar todos los .tif (también en subcarpetas, por si acaso)
    tif_files = sorted(folder.rglob("*.tif"), key=natural_key)
    n = len(tif_files)

    if n == 0:
        print(f"[AVISO] No se encontraron archivos .tif en {folder}")
        return

    print(f"[INFO] Archivos .tif encontrados: {n}")

    first_file = tif_files[0]
    last_file = tif_files[-1]

    first_num = extract_first_number(first_file.name)
    last_num = extract_first_number(last_file.name)

    print(f"[INFO] Primer archivo (ordenado): {first_file.name}")
    print(f"[INFO] Último archivo (ordenado): {last_file.name}")

    if first_num is not None and last_num is not None:
        print(f"[INFO] Numeración detectada: {first_num} -> {last_num}")
    else:
        print("[INFO] No se pudo detectar numeración clara en los nombres.")

    # Nombre del PDF = nombre de la carpeta
    output_pdf = folder / f"{folder.name}.pdf"
    print(f"[INFO] PDF de salida: {output_pdf}")

    # Convertir todos los .tif a un solo PDF (streaming, sin cargar todo en memoria)
    with open(output_pdf, "wb") as f:
        f.write(img2pdf.convert([str(p) for p in tif_files]))

    print(f"[OK] PDF generado correctamente: {output_pdf}")
    print("=" * 80)
    print()

In [9]:
def convert_caratula():
    convert_folder_to_pdf("/Users/sultan/Downloads/01 CARATULA")


def convert_proyecto():
    convert_folder_to_pdf("/Users/sultan/Downloads/02 PROYECTO")


def convert_discusion_en_comision():
    convert_folder_to_pdf("/Users/sultan/Downloads/03 DISCUSION EN COMISION")


def convert_dictamen():
    convert_folder_to_pdf("/Users/sultan/Downloads/04 DICTAMEN")


def convert_debate_1():
    convert_folder_to_pdf("/Users/sultan/Downloads/05 DEBATE 1")


def convert_informe_redaccion_final():
    convert_folder_to_pdf("/Users/sultan/Downloads/06 INFORME DE REDACCION FINAL")


def convert_debate_7():
    convert_folder_to_pdf("/Users/sultan/Downloads/07 DEBATE 2")


def convert_decreto_ley():
    convert_folder_to_pdf("/Users/sultan/Downloads/08 DECRETO LEY")


# Opcional: ejecutar todas de una vez si corres el script directamente
if __name__ == "__main__":
    convert_caratula()
    convert_proyecto()
    convert_discusion_en_comision()
    convert_dictamen()
    convert_debate_1()
    convert_informe_redaccion_final()
    convert_debate_7()
    convert_decreto_ley()

Carpeta objetivo: /Users/sultan/Downloads/01 CARATULA
[OK] La carpeta existe: /Users/sultan/Downloads/01 CARATULA
[INFO] Archivos .tif encontrados: 6
[INFO] Primer archivo (ordenado): Pag. 1.tif
[INFO] Último archivo (ordenado): Pag. 6.tif
[INFO] Numeración detectada: 1 -> 6
[INFO] PDF de salida: /Users/sultan/Downloads/01 CARATULA/01 CARATULA.pdf
[OK] PDF generado correctamente: /Users/sultan/Downloads/01 CARATULA/01 CARATULA.pdf

Carpeta objetivo: /Users/sultan/Downloads/02 PROYECTO
[OK] La carpeta existe: /Users/sultan/Downloads/02 PROYECTO
[INFO] Archivos .tif encontrados: 116
[INFO] Primer archivo (ordenado): Pag. 7.tif
[INFO] Último archivo (ordenado): Pag. 122.tif
[INFO] Numeración detectada: 7 -> 122
[INFO] PDF de salida: /Users/sultan/Downloads/02 PROYECTO/02 PROYECTO.pdf
[OK] PDF generado correctamente: /Users/sultan/Downloads/02 PROYECTO/02 PROYECTO.pdf

Carpeta objetivo: /Users/sultan/Downloads/03 DISCUSION EN COMISION
[OK] La carpeta existe: /Users/sultan/Downloads/03 DISC

In [10]:
def convert_debate_7():
    convert_folder_to_pdf("/Users/sultan/Downloads/07 DEBATE 2")

In [11]:
if __name__ == "__main__":
    convert_debate_7()


Carpeta objetivo: /Users/sultan/Downloads/07 DEBATE 2
[OK] La carpeta existe: /Users/sultan/Downloads/07 DEBATE 2
[INFO] Archivos .tif encontrados: 45
[INFO] Primer archivo (ordenado): Pag. 984.tif
[INFO] Último archivo (ordenado): Pag. 1028.tif
[INFO] Numeración detectada: 984 -> 1028
[INFO] PDF de salida: /Users/sultan/Downloads/07 DEBATE 2/07 DEBATE 2.pdf
[OK] PDF generado correctamente: /Users/sultan/Downloads/07 DEBATE 2/07 DEBATE 2.pdf

