In [16]:
import os
from pathlib import Path
from typing import List
from pdf2image import convert_from_path

def charger_documents(dossier_path: str):
    """Charge tous les fichiers PDF d'un dossier et retourne leurs chemins avec forward slashes"""
    pdf_paths = []
    
    # Convertir le chemin d'entrée pour utiliser des forward slashes
    dossier_path = dossier_path.replace('\\', '/')
    
    for fichier in os.listdir(dossier_path):
        if fichier.lower().endswith('.pdf'):
            # Construire le chemin avec des forward slashes
            chemin_pdf = f"{dossier_path}/{fichier}"
            pdf_paths.append(chemin_pdf)
    
    return pdf_paths

def convertir_pdf_en_images(pdf_paths, output_dir=None):
    """Convertit des PDF en images pour faciliter l'OCR"""
    if output_dir:
        os.makedirs(output_dir, exist_ok=True)
    
    images_paths = []
    
    # IMPORTANT: pdf_paths est une LISTE de chemins, ne pas itérer sur les caractères
    for pdf_path in pdf_paths:
        try:
            # Utiliser le chemin complet, pas les caractères individuels
            print(f"Conversion du PDF: {pdf_path}")
            
            # Conversion du PDF en images
            images = convert_from_path(pdf_path)
            
            # Traitement des images...
            base_name = os.path.basename(pdf_path).split('.')[0]
            
            for i, image in enumerate(images):
                if output_dir:
                    image_path = os.path.join(output_dir, f"{base_name}_page{i+1}.jpg")
                    image.save(image_path, "JPEG")
                    images_paths.append(image_path)
                else:
                    # Si pas de dossier de sortie
                    image_path = f"{base_name}_page{i+1}"
                    images_paths.append(image_path)
                    
        except Exception as e:
            print(f"Erreur lors de la conversion du PDF {pdf_path}: {str(e)}")
    
    return images_paths

In [17]:
pdf_paths = "C:/Users/HP/Desktop/Octroi-Credit/demandes_clients/decouvert/alirich_Ali_DECOUVERT"
charger_documents(pdf_paths)

['C:/Users/HP/Desktop/Octroi-Credit/demandes_clients/decouvert/alirich_Ali_DECOUVERT/bulletin_salaire_1.pdf',
 'C:/Users/HP/Desktop/Octroi-Credit/demandes_clients/decouvert/alirich_Ali_DECOUVERT/DECOUVERT-250519-FA1C_recapitulatif.pdf',
 'C:/Users/HP/Desktop/Octroi-Credit/demandes_clients/decouvert/alirich_Ali_DECOUVERT/justificatif_domicile.pdf',
 'C:/Users/HP/Desktop/Octroi-Credit/demandes_clients/decouvert/alirich_Ali_DECOUVERT/piece_identite.pdf',
 'C:/Users/HP/Desktop/Octroi-Credit/demandes_clients/decouvert/alirich_Ali_DECOUVERT/releve_bancaire_1.pdf']

In [18]:
convertir_pdf_en_images(pdf_paths)

Erreur lors de la conversion du PDF C: Unable to get page count.
I/O Error: Couldn't open file 'C': No error.

Erreur lors de la conversion du PDF :: Unable to get page count.
I/O Error: Couldn't open file ':': No error.

Erreur lors de la conversion du PDF /: Unable to get page count.
I/O Error: Couldn't open file '/': No error.

Erreur lors de la conversion du PDF U: Unable to get page count.
I/O Error: Couldn't open file 'U': No error.

Erreur lors de la conversion du PDF s: Unable to get page count.
I/O Error: Couldn't open file 's': No error.

Erreur lors de la conversion du PDF e: Unable to get page count.
I/O Error: Couldn't open file 'e': No error.

Erreur lors de la conversion du PDF r: Unable to get page count.
I/O Error: Couldn't open file 'r': No error.

Erreur lors de la conversion du PDF s: Unable to get page count.
I/O Error: Couldn't open file 's': No error.

Erreur lors de la conversion du PDF /: Unable to get page count.
I/O Error: Couldn't open file '/': No error.

E

[]