In [29]:
import pdfplumber
import re  # Importation de l'expression régulière
import sys
import os

# Supprimer complètement les erreurs
sys.stderr = open(os.devnull, 'w')

# Fonction pour extraire la Belegnummer avec pdfplumber
def extract_belegnummer(file_path):
    belegnummer = ""
    
    # Ouvrir le fichier PDF avec pdfplumber
    with pdfplumber.open(file_path) as pdf:
        # Parcourir chaque page
        for page in pdf.pages:
            text = page.extract_text()
            
            # Recherche de la Belegnummer dans le texte extrait
            if "Beleg-Nr." in text:
                belegnummer = extract_data(text, "Beleg-Nr.")
    
    # Filtrer la valeur pour ne garder que les chiffres
    belegnummer = clean_value(belegnummer)
    
    return belegnummer

# Fonction pour extraire la Lieferschein avec pdfplumber
def extract_lieferschein(file_path):
    lieferschein = ""
    
    # Ouvrir le fichier PDF avec pdfplumber
    with pdfplumber.open(file_path) as pdf:
        # Parcourir chaque page
        for page in pdf.pages:
            text = page.extract_text()
            
            # Recherche de la Lieferschein dans le texte extrait
            if "Lieferschein" in text:
                lieferschein = extract_data(text, "Lieferschein")
    
    # Filtrer la valeur pour ne garder que les chiffres
    lieferschein = clean_value(lieferschein)
    
    return lieferschein

# Fonction pour extraire la donnée après une étiquette donnée
def extract_data(text, label):
    start_index = text.find(label)
    if start_index == -1:
        return None
    start_index += len(label)
    end_index = text.find("\n", start_index)
    return text[start_index:end_index].strip()

# Fonction pour nettoyer les valeurs extraites en ne conservant que les chiffres
def clean_value(value):
    # Utilisation de l'expression régulière pour ne garder que les chiffres
    if value:
        cleaned_value = re.sub(r'\D', '', value)  # Remplacer tout ce qui n'est pas un chiffre par ""
        return cleaned_value[:9]  # Limiter à 9 chiffres pour la Belegnummer
    return ""

# Fonction pour afficher les résultats extraits et les comparer
def compare_files(lieferschein_file, rechnung_file):
    # Extraction des données des deux fichiers
    belegnummer_lieferschein = extract_belegnummer(lieferschein_file)
    lieferschein_rechnung = extract_lieferschein(rechnung_file)

    # Affichage des résultats extraits avant la comparaison
    print(f"--- Résultats extraits ---")
    print(f"Lieferschein Belegnummer : {belegnummer_lieferschein}")
    print(f"Rechnung Lieferschein extrait : {lieferschein_rechnung}")
    print("------------------------")

    # Comparaison des Belegnummer
    if belegnummer_lieferschein == lieferschein_rechnung:
        print("Les numéros de Lieferschein correspondent.")
    else:
        print("Les numéros de Lieferschein ne correspondent pas.")

# Remplacer par les chemins réels des fichiers
lieferschein_file = "C:/Users/user/Desktop/Benz/+ 2025-02-20_1305_Lieferung_0801806732_Lieferung 0801806732.PDF"
rechnung_file = "C:/Users/user/Desktop/Benz/+ 2025-02-24_0706_Rechnung_0091808622_Rechnung 0091808622.PDF"

compare_files(lieferschein_file, rechnung_file)


--- Résultats extraits ---
Lieferschein Belegnummer : 801806732
Rechnung Lieferschein extrait : 801806732
------------------------
Les numéros de Lieferschein correspondent.
