In [1]:
import zipfile
import os
import shutil

def descomprimir_varios_zip(ruta_origen, ruta_temporal, ruta_destino_final):
    # Crear carpetas si no existen
    os.makedirs(ruta_temporal, exist_ok=True)
    os.makedirs(ruta_destino_final, exist_ok=True)

    # Recorrer todos los archivos en la carpeta origen
    for archivo in os.listdir(ruta_origen):
        ruta_zip = os.path.join(ruta_origen, archivo)

        # Verificar si es un archivo ZIP
        if zipfile.is_zipfile(ruta_zip):
            print(f"\nProcesando archivo: {archivo}")

            # Crear subcarpeta única para cada archivo descomprimido
            subcarpeta_temporal = os.path.join(ruta_temporal, os.path.splitext(archivo)[0])
            os.makedirs(subcarpeta_temporal, exist_ok=True)

            # Descomprimir en la subcarpeta temporal
            with zipfile.ZipFile(ruta_zip, 'r') as archivo_zip:
                archivo_zip.extractall(subcarpeta_temporal)
                print(f"Descomprimido en: {subcarpeta_temporal}")

            # Mover los archivos al destino final
            for nombre in os.listdir(subcarpeta_temporal):
                origen = os.path.join(subcarpeta_temporal, nombre)
                destino = os.path.join(ruta_destino_final, nombre)

                if os.path.exists(destino):
                    print(f"Advertencia: ya existe {nombre} en destino. Se sobreescribirá.")

                shutil.move(origen, destino)

            print(f"Archivos de {archivo} movidos a: {ruta_destino_final}")
        else:
            print(f"Archivo ignorado (no es ZIP): {archivo}")

# Rutas personalizadas
ruta_carpeta_zip = r"D:\Personal\Facturas\Facturas electronicas"
ruta_temporal = r"D:\Personal\Facturas\TemporalZip"
ruta_destino = r"D:\Personal\Facturas\FacturasDescomprimidas"

descomprimir_varios_zip(ruta_carpeta_zip, ruta_temporal, ruta_destino)



Procesando archivo: 0800242106021244205100300126.zip
Descomprimido en: D:\Personal\Facturas\TemporalZip\0800242106021244205100300126
Archivos de 0800242106021244205100300126.zip movidos a: D:\Personal\Facturas\FacturasDescomprimidas

Procesando archivo: 0800242106021244206100309407.zip
Descomprimido en: D:\Personal\Facturas\TemporalZip\0800242106021244206100309407
Archivos de 0800242106021244206100309407.zip movidos a: D:\Personal\Facturas\FacturasDescomprimidas

Procesando archivo: 0800242106021244206100314279.zip
Descomprimido en: D:\Personal\Facturas\TemporalZip\0800242106021244206100314279
Archivos de 0800242106021244206100314279.zip movidos a: D:\Personal\Facturas\FacturasDescomprimidas

Procesando archivo: 800128735_RFRV46743.zip
Descomprimido en: D:\Personal\Facturas\TemporalZip\800128735_RFRV46743
Archivos de 800128735_RFRV46743.zip movidos a: D:\Personal\Facturas\FacturasDescomprimidas

Procesando archivo: 800128735_RFRV46744.zip
Descomprimido en: D:\Personal\Facturas\Tempora

In [6]:
import os
import fitz  # PyMuPDF
import re

def extraer_ultimo_valor_y_sumar(ruta_carpeta):
    total = 0.0
    patron_valor = re.compile(r'(?<!\d)(\d{1,3}(?:\.\d{3})*|\d+)(?:,\d{2})?')  # valores con puntos y comas

    for archivo in os.listdir(ruta_carpeta):
        if archivo.lower().endswith('.pdf'):
            ruta_pdf = os.path.join(ruta_carpeta, archivo)
            try:
                doc = fitz.open(ruta_pdf)
                texto = ""
                for pagina in doc:
                    texto += pagina.get_text()
                doc.close()

                # Buscar todos los valores numéricos
                valores_encontrados = patron_valor.findall(texto)

                if valores_encontrados:
                    ultimo_valor = valores_encontrados[-1]
                    valor_limpio = ultimo_valor.replace('.', '').replace(',', '.')
                    total += float(valor_limpio)
                    print(f"{archivo}: último valor encontrado = {valor_limpio}")
                else:
                    print(f"{archivo}: no se encontraron valores numéricos.")
            except Exception as e:
                print(f"Error procesando {archivo}: {e}")

    print(f"\n💰 Total sumado (último valor de cada PDF): {total:,.2f}")

# Ruta donde están los archivos PDF
ruta_pdf = r"D:\Personal\Facturas\FacturasDescomprimidas"

extraer_ultimo_valor_y_sumar(ruta_pdf)

800128735_RFRV46743.pdf: último valor encontrado = 1
800128735_RFRV46744.pdf: último valor encontrado = 1
8002369371_01_FD24817275_10777202.pdf: último valor encontrado = 0
ad080022505702724671220240608104718721.pdf: último valor encontrado = 06202
ad081100783202724409320240216202307899.pdf: último valor encontrado = 38600
ad081100783202724634720240608022136322.pdf: último valor encontrado = 06202
ad081100783202724846520241021192903667.pdf: último valor encontrado = 10202
ad08605031590102405086626.pdf: último valor encontrado = 204
ad090130074102724200020240816232012546.pdf: último valor encontrado = 202
ad090130074102724246020241202212347792.pdf: último valor encontrado = 202
ad090130074102724269720240822201104712.pdf: último valor encontrado = 202
ad090130074102724302720240911202018971.pdf: último valor encontrado = 202
ad090130074102724343220240826201330093.pdf: último valor encontrado = 202
ad090130074102724402820241109211135627.pdf: último valor encontrado = 202
ad0901300741027244