In [None]:
import os
from PIL import Image, ImageEnhance

def preprocess_images_for_ocr(dossier_entree, dossier_sortie,
                              facteur_luminosite=1.2,
                              facteur_contraste=1.5,
                              facteur_saturation=1.0,
                              format_sortie='PNG'):
    """
    Prétraite les images pour l'OCR : gris, contraste, luminosité, saturation (optionnel),
    et sauvegarde dans un format sans perte (par défaut PNG).
    """
    for racine, _, fichiers in os.walk(dossier_entree):
        for fichier in fichiers:
            if fichier.lower().endswith(('.png', '.jpg', '.jpeg', '.bmp', '.tiff')):
                chemin_entree = os.path.join(racine, fichier)

                # Crée les dossiers de sortie correspondants
                chemin_relatif = os.path.relpath(racine, dossier_entree)
                dossier_cible = os.path.join(dossier_sortie, chemin_relatif)
                os.makedirs(dossier_cible, exist_ok=True)

                try:
                    with Image.open(chemin_entree) as img:
                        # Conversion en niveaux de gris pour meilleur OCR
                        img = img.convert('L')

                        # Amélioration de la luminosité
                        img = ImageEnhance.Brightness(img).enhance(facteur_luminosite)

                        # Amélioration du contraste
                        img = ImageEnhance.Contrast(img).enhance(facteur_contraste)

                        # Si on veut utiliser la saturation, on travaille en couleur, ici on l’ignore volontairement

                        # Nom du fichier de sortie
                        nom_fichier_sans_ext = os.path.splitext(fichier)[0]
                        nom_sortie = f"{nom_fichier_sans_ext}.{format_sortie.lower()}"
                        chemin_sortie = os.path.join(dossier_cible, nom_sortie)

                        # Sauvegarde (sans perte pour PNG, TIFF)
                        img.save(chemin_sortie, format=format_sortie)
                        print(f"✔️ OCR prêt : {chemin_entree} → {chemin_sortie}")
                except Exception as e:
                    print(f"❌ Erreur avec {chemin_entree} : {e}")

# Exemple d’utilisation
dossier_entree = r"C:\2. Stage\4. Cahiers"
dossier_sortie = r"C:\2. Stage\8. Cahiers gray_contraste"
preprocess_images_for_ocr(dossier_entree, dossier_sortie,
                          facteur_luminosite=1.2,
                          facteur_contraste=1.5,
                          facteur_saturation=1.0,  
                          format_sortie='PNG')    

✔️ OCR prêt : C:\2. Stage\4. Cahiers\16b_100\16b_100_0001.jpg → C:\2. Stage\8. Cahiers gray_contraste\16b_100\16b_100_0001.png
✔️ OCR prêt : C:\2. Stage\4. Cahiers\16b_100\16b_100_0002.jpg → C:\2. Stage\8. Cahiers gray_contraste\16b_100\16b_100_0002.png
✔️ OCR prêt : C:\2. Stage\4. Cahiers\16b_100\16b_100_0003.jpg → C:\2. Stage\8. Cahiers gray_contraste\16b_100\16b_100_0003.png
✔️ OCR prêt : C:\2. Stage\4. Cahiers\16b_100\16b_100_0004.jpg → C:\2. Stage\8. Cahiers gray_contraste\16b_100\16b_100_0004.png
✔️ OCR prêt : C:\2. Stage\4. Cahiers\16b_101\16b_101_0001.jpg → C:\2. Stage\8. Cahiers gray_contraste\16b_101\16b_101_0001.png
✔️ OCR prêt : C:\2. Stage\4. Cahiers\16b_101\16b_101_0002.jpg → C:\2. Stage\8. Cahiers gray_contraste\16b_101\16b_101_0002.png
✔️ OCR prêt : C:\2. Stage\4. Cahiers\16b_101\16b_101_0003.jpg → C:\2. Stage\8. Cahiers gray_contraste\16b_101\16b_101_0003.png
✔️ OCR prêt : C:\2. Stage\4. Cahiers\16b_101\16b_101_0004.jpg → C:\2. Stage\8. Cahiers gray_contraste\16b_101\1

: 