# Application de methodes de traitement automatique d'image √† un fonds photographique d'archives historique

## Du pixel aux images - 32M7138

*Printemps 2025 - Universit√© de Gen√®ve*

*Rapha√´l Rollinet (raphael.rollinet@unine.ch)*

## Introduction

Ce pr√©sent rapport est effectu√© dans le cadre du cours "Du pixel aux images : introduction au traitement des images 2D" traite de m√©thodes utilisant de l'intelligence artificielle que cela soit avec des mod√®les de deep learning ou un LLM multimodal appliqu√©e au traitement de l'image.  Cette d√©marche de recherche me permet d'explorer ces m√©thodes, en l'applicant √† mon domaine de sp√©cialisation, soit le patrimoine, plus exactement l'archivistique. Le domaine des archives suisse s'est r√©cemment dot√© d'un livre blanc sur l'apprentissage automatique dans les archives notamment sur l'indexation en profondeur au service de l'acc√®s aux archives. Mon travail vise √† explorer diff√©rente m√©thode et √† analyser les r√©sultats obtenus afin d'en faire la critique du point de vue d'un archiviste. L'objet de la recherche est un fonds d'archives anciennes auquel j'appliquerai des m√©thodes de d√©tection d'objet. Le r√©sultat de ces d√©tections sera extrait sous forme de fichier CSV comprenant le nom de l'image et le r√©sultat de la d√©tection sous forme de mot-cl√©. L'objectif est de pouvoir utiliser ces m√©thodes pour indexer automatiquement le contenu d'un fonds d'images afin d'enrichir la description et donc l'acc√®s documentaire de ces photographies.

### Fonds d'images de la commune de Milvignes

Les mod√®les de d√©tections et classifications des images sera appliqu√©s √† un fonds d'images provenant de l'inventaire des archives de la commune de Milvignes, membre du service intercommunal d'archives de Neuch√¢tel, la plateforme de diffusion des inventaires est g√©r√©e par docuteam SA, entreprise de gestion d'archives qui m'a employ√© de 2016 √† 2021. Les images num√©ris√©es par mes soins en format de conservation (TIFF) et archiv√©es √©lectroniquement dans un repository de pr√©servation num√©rique et √©galement disponible  disponible en t√©l√©chargement librement dans un format d√©grad√© de diffusion (JPEG).


Les images sont disponibles ici : https://milvignes.docuteam.cloud/fr/units/1-archives-communales-de-milvignes-1326-2013/gallery



## Probl√©matique

Ayant longuement travaill√© dans le domaine des archives, la th√©matique d'appliquer les m√©thodes vues dans le cadre de ce cours sur un fonds d'archives est un sujet int√©ressant dans son potentiel d'application sur un fonds d'archives d'images. Dans les institutions patrimoniales, les images sont un support courant, ma probl√©matique sera donc appliqu√©e √† un fonds ancien d'images num√©ris√©es de la commune de Milvignes (NE). Mon questionnement porte sur l'application de cette m√©thode utilisant des mod√®les de deep learning entrain√© sur des images relativement r√©centes, mais ici appliqu√© √† un fonds d'images anciennes (~1900).

### Question de recherche

- "Quel est le potentiel de la d√©tection d'objet dans le traitement, particuli√®rement pour la description de fonds d'images en archives ?"

## M√©thodologie

Le code utilis√© est adapt√© en parti du code vu en cours, il vise √† effectuer une d√©tection d'objet sur des images, tout en r√©pondant √† des contraintes m√©tiers qui sont par exemple un besoin d'automatiser le traitement √† partir d'un workflow. Mais √©galement en termes de rendu, un archiviste aura besoin d'extraire les d√©tections sous format CSV afin qu'elles soient int√©gr√©es aux notices d'un syst√®me d'information archivistique par exemple sous la forme d'une indexation. Le code permet √† n'importe quel archiviste avec des notions informatiques minimales de l'ex√©cuter.

### M√©thode de d√©tection d'objet

La m√©thode utilis√©e dans le cadre de ce projet sont un m√©langes de m√©thodes de deep learning pour le traitement d'image. Pour √™tre exactes les m√©thodes fonctionnent en mode inf√©rence uniquement, et exploitent des poids fig√©s issus de l‚Äôentra√Ænement supervis√© de grands corpus d‚Äôimages. Leurs sp√©cifications sont les suivantes :

#### D√©tection d‚Äôobjets par SSD MobileNet v2 (TensorFlow Hub) :
Le mod√®le utilise une architecture Single Shot MultiBox Detector (SSD) avec un backbone MobileNetV2 optimis√© pour les environnements √† faibles ressources. SSD g√©n√®re un ensemble de bo√Ætes candidates (anchors) √† diff√©rentes √©chelles et positions dans l‚Äôimage, puis pr√©dit pour chacune une probabilit√© de pr√©sence d‚Äôobjet et une r√©gression de bo√Æte englobante. Le mod√®le a √©t√© pr√©alablement entra√Æn√© sur COCO dataset, ce qui permet une d√©tection multi-classes directement en inf√©rence.

#### Classification d‚Äôimage par ViT (Vision Transformer) :
Le mod√®le ViT Base (patch16-224) repose sur une adaptation des transformeurs √† la vision par un d√©coupage de l‚Äôimage en patchs de 16x16, qui sont ensuite lin√©aris√©s et projet√©s en embeddings. Ces vecteurs sont enrichis par des encodages positionnels et trait√©s par plusieurs couches transformeurs (self-attention). Le mod√®le pr√©dit une seule classe globale pour l‚Äôimage en sortie du token [CLS]. Il est pr√©-entra√Æn√© sur ImageNet-21k puis fine-tun√© sur ImageNet-1k.

#### LLM Llama 4
...

In [None]:
#Monter Google Drive
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
#Installation des librairies (si n√©cessaire)
!pip install opencv-python
!pip install tensorflow_hub
!pip install -q transformers

Collecting opencv-python
  Downloading opencv_python-4.11.0.86-cp37-abi3-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (20 kB)
Downloading opencv_python-4.11.0.86-cp37-abi3-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (63.0 MB)
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m63.0/63.0 MB[0m [31m20.5 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: opencv-python
Successfully installed opencv-python-4.11.0.86
Collecting tensorflow_hub
  Downloading tensorflow_hub-0.16.1-py2.py3-none-any.whl.metadata (1.3 kB)
Collecting tf-keras>=2.14.1 (from tensorflow_hub)
  Downloading tf_keras-2.19.0-py3-none-any.whl.metadata (1.8 kB)
Collecting tensorflow<2.20,>=2.19 (from tf-keras>=2.14.1->tensorflow_hub)
  Downloading tensorflow-2.19.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (4.1 kB)
Collecting astunparse>=1.6.0 (from tensorflow<2.20,>=2.19->tf-ke

In [None]:
# Importation des librairies Python
import os
import numpy as np
import tensorflow as tf
import cv2
import matplotlib.pyplot as plt
import tensorflow_hub as hub
import pandas as pd
from PIL import Image
from transformers import ViTImageProcessor, ViTForImageClassification



In [None]:
# Charger les mod√®les (d√©tection + classification)

# Mod√®le de d√©tection SSD MobileNet V2
detector = hub.load("https://tfhub.dev/tensorflow/ssd_mobilenet_v2/fpnlite_320x320/1")

# Mod√®le ViT pour classification d'image
processor = ViTImageProcessor.from_pretrained('google/vit-base-patch16-224')
vit_model = ViTForImageClassification.from_pretrained('google/vit-base-patch16-224')

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


preprocessor_config.json:   0%|          | 0.00/160 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/69.7k [00:00<?, ?B/s]

Xet Storage is enabled for this repo, but the 'hf_xet' package is not installed. Falling back to regular HTTP download. For better performance, install the package with: `pip install huggingface_hub[hf_xet]` or `pip install hf_xet`


model.safetensors:   0%|          | 0.00/346M [00:00<?, ?B/s]

In [None]:
# Liste des noms de classes (80 classes COCO)
classe = np.array([
    'background', 'person', 'bicycle', 'car', 'motorcycle', 'airplane',
    'bus', 'train', 'truck', 'boat', 'traffic light', 'fire hydrant',
    'stop sign', 'parking meter', 'bench', 'bird', 'cat', 'dog', 'horse',
    'sheep', 'cow', 'elephant', 'bear', 'zebra', 'giraffe', 'backpack',
    'umbrella', 'handbag', 'tie', 'suitcase', 'frisbee', 'skis',
    'snowboard', 'sports ball', 'kite', 'baseball bat', 'baseball glove',
    'skateboard', 'surfboard', 'tennis racket', 'bottle', 'wine glass',
    'cup', 'fork', 'knife', 'spoon', 'bowl', 'banana', 'apple',
    'sandwich', 'orange', 'broccoli', 'carrot', 'hot dog', 'pizza',
    'donut', 'cake', 'chair', 'couch', 'potted plant', 'bed',
    'dining table', 'toilet', 'tv', 'laptop', 'mouse', 'remote',
    'keyboard', 'cell phone', 'microwave', 'oven', 'toaster', 'sink',
    'refrigerator', 'book', 'clock', 'vase', 'scissors', 'teddy bear',
    'hair drier', 'toothbrush'
])
classes = np.concatenate([classe, np.repeat('none', 100)])


In [None]:

# [Alternative]

# Liste des noms de classes adapt√©e au 19e-20e si√®cle en Suisse, incluant les moyens de transport
classe = np.array([
    'background', 'person', 'horse', 'bird', 'cat', 'dog', 'sheep',
    'cow', 'bench', 'backpack', 'umbrella', 'handbag', 'bottle',
    'wine glass', 'cup', 'fork', 'knife', 'spoon', 'bowl', 'chair',
    'couch', 'bed', 'dining table', 'book', 'clock', 'vase', 'scissors',
    'train', 'boat', 'carriage'  # Ajout des moyens de transport pertinents
])

# Ajout de 'none' pour atteindre la longueur souhait√©e
classes = np.concatenate([classe, np.repeat('none', 88)])



In [None]:
#  √Ä adapter : Mettre le dossier Images dans Google Drive
folder_path = "/content/drive/MyDrive/Colab_Notebooks/images"  # Adapter le chemin selon l'utilisateur

In [None]:
# Liste pour stocker les r√©sultats
results = []

In [None]:
# Cr√©ation d'une fonction de detection et classification pour le traitement de l'image
## Traite une image avec SSD MobileNet (d√©tection) et ViT (classification).
## Sauvegarde l'image annot√©e et stocke les r√©sultats dans la liste globale 'results'.

def process_image_with_detection_and_classification(image_path):

    # Lire l'image
    image = cv2.imread(image_path)
    if image is None:
        print(f"Erreur : impossible de lire {image_path}")
        return

    # Convertir en RGB pour affichage et mod√®les
    image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
    input_tensor = tf.convert_to_tensor(image_rgb)[tf.newaxis, ...]

    # D√©tection d'objets
    detections = detector(input_tensor)
    boxes = detections['detection_boxes'][0].numpy()
    scores = detections['detection_scores'][0].numpy()
    detected_classes = detections['detection_classes'][0].numpy().astype(np.uint8)

    # Pr√©parer les annotations et objets d√©tect√©s
    object_labels = []
    height, width, _ = image.shape
    for i in range(len(scores)):
        if scores[i] < 0.3:
            continue
        label = classes[detected_classes[i]]
        object_labels.append(label)

        # Bo√Æte englobante
        box = boxes[i] * np.array([height, width, height, width])
        box = box.astype(np.int32)
        cv2.rectangle(image_rgb, (box[1], box[0]), (box[3], box[2]), (0, 255, 0), 2)
        cv2.putText(image_rgb, label, (box[1], box[0]-10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)

    # Classification avec ViT
    pil_image = Image.fromarray(image_rgb)
    inputs = processor(images=pil_image, return_tensors="pt")
    outputs = vit_model(**inputs)
    logits = outputs.logits
    predicted_class_idx = logits.argmax(-1).item()
    predicted_label = vit_model.config.id2label[predicted_class_idx]

    # Sauvegarde de l‚Äôimage annot√©e dans /Resultat/detection
    result_folder = os.path.join(folder_path, "Resultat")
    detection_folder = os.path.join(result_folder, "detection")
    os.makedirs(detection_folder, exist_ok=True)

    save_path = os.path.join(detection_folder, os.path.basename(image_path))
    cv2.imwrite(save_path, cv2.cvtColor(image_rgb, cv2.COLOR_RGB2BGR))

    # Affichage pour visualisation
    plt.figure(figsize=(8, 6))
    plt.imshow(image_rgb)
    plt.axis('off')
    plt.title(f"{os.path.basename(image_path)}\n‚Üí ViT : {predicted_label}")
    plt.show()

    # Stockage des r√©sultats pour export CSV
    results.append({
        "image": os.path.basename(image_path),
        "detected_objects": ", ".join(object_labels),
        "vit_prediction": predicted_label
    })



In [None]:
# Appliquer √† toutes les images pr√©sentes dans le dossiers "images"
supported_formats = ('.jpg', '.jpeg', '.png', '.bmp')
image_files = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.lower().endswith(supported_formats)]

print(f"{len(image_files)} images trouv√©es.")

for image_path in image_files:
    process_image_with_detection_and_classification(image_path)



In [None]:
# Cr√©er un sous-dossier "R√©sultat" dans le dossier Drive d'origine
result_folder = os.path.join(folder_path, "Resultat")
os.makedirs(result_folder, exist_ok=True)

# D√©finir le chemin de sortie du CSV dans ce dossier
csv_output_path = os.path.join(result_folder, "resultats_detection_classification.csv")

# Export du DataFrame en CSV
df_results = pd.DataFrame(results)
df_results.to_csv(csv_output_path, index=False, encoding='utf-8')

print(f"CSV enregistr√© ici : {csv_output_path}")


## R√©sultat

Les r√©sultats appliqu√©s √† un fonds d'images anciennes sont mitig√©s. Le code a parfaitement fonctionn√© et le traitement de d√©tection et classification a parfaitement √©t√© appliqu√© sur le fonds d'images. Cependant les images utilis√©es mettent en √©vidence certaines limitations de cette m√©thode.

La premi√®re provient probablement des images elles-m√™mes, il s'agit de JPEG utilis√© pour la diffusion sur le web avec une faible r√©solution. Les mod√®les se basant sur les pixels de l'image pour d√©tecter les objets, cela influence le r√©sultat final.

Deuxi√®mement les mod√®les utilis√©s ont √©t√© entrain√©s sur des images r√©centes, cela peut-√™tre observ√© notamment avec les classes "COCO". Le mod√®le fonctionnant par inf√©rence peu importe l'image, il y a un taux d'erreur plus important sur des images anciennes. Cela peut √™tre partiellement pali√© en enlevant des classes. Neanmoins cela r√©ste un biais inh√©rant √† ces mod√®les.

# Traitement par LLM

In [None]:
# -- √âtape 1 : Installer et importer les biblioth√®ques n√©cessaires --
!pip install openai pillow --quiet

[?25l   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m0.0/662.0 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[91m‚ï∏[0m[90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m491.5/662.0 kB[0m [31m14.4 MB/s[0m eta [36m0:00:01[0m[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m662.0/662.0 kB[0m [31m11.4 MB/s[0m eta [36m0:00:00[0m
[?25h[?25l   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m0.0/351.8 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m351.8/351.8 kB[0m [31m24.3 MB/s[0m eta [36

In [None]:
import base64
import os
import time
import pandas as pd
from tqdm import tqdm
from openai import OpenAI
from PIL import Image, UnidentifiedImageError

In [None]:
# --- √âtape 2 : Configuration OpenRouter ---
client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="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"  # Remplace par ta cl√© OpenRouter
)

In [None]:
# --- √âtape 3 : Fonctions utilitaires ---
def encode_image_to_base64(image_path):
    with open(image_path, "rb") as img_file:
        return base64.b64encode(img_file.read()).decode("utf-8")

def is_image_valid(image_path):
    try:
        Image.open(image_path).verify()
        return True
    except (UnidentifiedImageError, IOError):
        return False

def query_llama_vision(image_path):
    base64_image = encode_image_to_base64(image_path)

    response = client.chat.completions.create(
        model="meta-llama/llama-4-maverick:free",
        messages=[
            {
                "role": "user",
                "content": [
                    {
                        "type": "image_url",
                        "image_url": {"url": f"data:image/jpeg;base64,{base64_image}"}
                    },
                    {
                        "type": "text",
                        "text": "You are an expert in photographic archive indexing. Your task is to perform a descriptive indexing of 3-5 keywords in English for each image. Base your analysis solely on the visual content of the image; do not make any assumptions or include additional information. Start your response with the image name, followed by the indexing keywords. Example format: ImageName: keyword1, keyword2, keyword3. Now, analyze the provided image and generate the indexing keywords."
                    }
                ]
            }
        ],
        max_tokens=400
    )
    return response.choices[0].message.content.strip()

def query_llama_vision_with_retry(image_path, retries=3, delay=2):
    for attempt in range(retries):
        try:
            if not is_image_valid(image_path):
                return "[ERROR] Unreadable or corrupted image"
            return query_llama_vision(image_path)
        except Exception as e:
            if attempt < retries - 1:
                print(f"‚ö†Ô∏è Attempt {attempt+1} failed: {e}. Retrying in {delay} sec...")
                time.sleep(delay)
            else:
                return f"[ERROR] {str(e)}"

In [None]:
# --- √âtape 4 : Param√®tres de chemin ---
folder_path = "/content/drive/MyDrive/Colab_Notebooks/images"
result_folder = "/content/drive/MyDrive/Colab_Notebooks/images/Resultat"
os.makedirs(result_folder, exist_ok=True)

In [None]:
# --- √âtape 5 : Liste des fichiers image ---
image_filenames = sorted([
    f for f in os.listdir(folder_path)
    if f.lower().endswith(('.jpg', '.jpeg', '.png'))
])

In [None]:
# --- √âtape 6 : G√©n√©ration des descriptions avec rendu ---
results_llm = []
for filename in tqdm(image_filenames, desc="üîé Interrogation de LLaMA 4 Vision"):
    image_path = os.path.join(folder_path, filename)
    llm_description = query_llama_vision_with_retry(image_path)
    results_llm.append({
        "filename": filename,
        "llm_description": llm_description
    })
    time.sleep(2)  # Respect des limites d'OpenRouter


üîé Interrogation de LLaMA 3 Vision:   0%|          | 0/18 [00:00<?, ?it/s]

‚ö†Ô∏è Attempt 1 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...
‚ö†Ô∏è Attempt 2 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...


üîé Interrogation de LLaMA 3 Vision:   6%|‚ñå         | 1/18 [00:06<01:54,  6.72s/it]

‚ö†Ô∏è Attempt 1 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...
‚ö†Ô∏è Attempt 2 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...


üîé Interrogation de LLaMA 3 Vision:  11%|‚ñà         | 2/18 [00:13<01:47,  6.73s/it]

‚ö†Ô∏è Attempt 1 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...
‚ö†Ô∏è Attempt 2 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...


üîé Interrogation de LLaMA 3 Vision:  17%|‚ñà‚ñã        | 3/18 [00:20<01:41,  6.80s/it]

‚ö†Ô∏è Attempt 1 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...
‚ö†Ô∏è Attempt 2 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...


üîé Interrogation de LLaMA 3 Vision:  22%|‚ñà‚ñà‚ñè       | 4/18 [00:27<01:34,  6.77s/it]

‚ö†Ô∏è Attempt 1 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...
‚ö†Ô∏è Attempt 2 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...


üîé Interrogation de LLaMA 3 Vision:  28%|‚ñà‚ñà‚ñä       | 5/18 [00:33<01:27,  6.76s/it]

‚ö†Ô∏è Attempt 1 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...
‚ö†Ô∏è Attempt 2 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...


üîé Interrogation de LLaMA 3 Vision:  33%|‚ñà‚ñà‚ñà‚ñé      | 6/18 [00:40<01:21,  6.78s/it]

‚ö†Ô∏è Attempt 1 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...
‚ö†Ô∏è Attempt 2 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...


üîé Interrogation de LLaMA 3 Vision:  39%|‚ñà‚ñà‚ñà‚ñâ      | 7/18 [00:47<01:14,  6.77s/it]

‚ö†Ô∏è Attempt 1 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...
‚ö†Ô∏è Attempt 2 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...


üîé Interrogation de LLaMA 3 Vision:  44%|‚ñà‚ñà‚ñà‚ñà‚ñç     | 8/18 [00:54<01:07,  6.77s/it]

‚ö†Ô∏è Attempt 1 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...
‚ö†Ô∏è Attempt 2 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...


üîé Interrogation de LLaMA 3 Vision:  50%|‚ñà‚ñà‚ñà‚ñà‚ñà     | 9/18 [01:00<01:00,  6.75s/it]

‚ö†Ô∏è Attempt 1 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...
‚ö†Ô∏è Attempt 2 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...


üîé Interrogation de LLaMA 3 Vision:  56%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñå    | 10/18 [01:07<00:53,  6.73s/it]

‚ö†Ô∏è Attempt 1 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...
‚ö†Ô∏è Attempt 2 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...


üîé Interrogation de LLaMA 3 Vision:  61%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà    | 11/18 [01:14<00:47,  6.73s/it]

‚ö†Ô∏è Attempt 1 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...
‚ö†Ô∏è Attempt 2 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...


üîé Interrogation de LLaMA 3 Vision:  67%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñã   | 12/18 [01:20<00:40,  6.72s/it]

‚ö†Ô∏è Attempt 1 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...
‚ö†Ô∏è Attempt 2 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...


üîé Interrogation de LLaMA 3 Vision:  72%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñè  | 13/18 [01:27<00:33,  6.70s/it]

‚ö†Ô∏è Attempt 1 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...
‚ö†Ô∏è Attempt 2 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...


üîé Interrogation de LLaMA 3 Vision:  78%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñä  | 14/18 [01:34<00:26,  6.72s/it]

‚ö†Ô∏è Attempt 1 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...
‚ö†Ô∏è Attempt 2 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...


üîé Interrogation de LLaMA 3 Vision:  83%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñé | 15/18 [01:41<00:20,  6.72s/it]

‚ö†Ô∏è Attempt 1 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...
‚ö†Ô∏è Attempt 2 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...


üîé Interrogation de LLaMA 3 Vision:  89%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñâ | 16/18 [01:47<00:13,  6.75s/it]

‚ö†Ô∏è Attempt 1 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...
‚ö†Ô∏è Attempt 2 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...


üîé Interrogation de LLaMA 3 Vision:  94%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñç| 17/18 [01:54<00:06,  6.76s/it]

‚ö†Ô∏è Attempt 1 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...
‚ö†Ô∏è Attempt 2 failed: 'NoneType' object is not subscriptable. Retrying in 2 sec...


üîé Interrogation de LLaMA 3 Vision: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 18/18 [02:01<00:00,  6.75s/it]


In [None]:
# Convertir results_llm en DataFrame
df_results = pd.DataFrame(results_llm)

# Afficher le DataFrame
display(df_results)

Unnamed: 0,filename,llm_description
0,m-a-v-2019-16852-diligence-postale-colombier-r...,[ERROR] 'NoneType' object is not subscriptable
1,m-a-v-2019-16852-groupe-de-vendangeurs-et-vend...,[ERROR] 'NoneType' object is not subscriptable
2,m-a-v-2019-16868-001-allee-bourbakis-1899.jpeg,[ERROR] 'NoneType' object is not subscriptable
3,m-a-v-2019-16868-002-allee-du-port-1899.jpeg,[ERROR] 'NoneType' object is not subscriptable
4,m-a-v-2019-16868-003-gare-regionale-1899.jpeg,[ERROR] 'NoneType' object is not subscriptable
5,m-a-v-2019-16868-004-rue-basse-1899.jpeg,[ERROR] 'NoneType' object is not subscriptable
6,m-a-v-2019-16868-005-gare-regionale-1899.jpeg,[ERROR] 'NoneType' object is not subscriptable
7,m-a-v-2019-16868-006-anciens-abattoirs-1899.jpeg,[ERROR] 'NoneType' object is not subscriptable
8,m-a-v-2019-16868-007-escaliers-de-l-eglise-189...,[ERROR] 'NoneType' object is not subscriptable
9,m-a-v-2019-16868-008-anciens-abattoirs-1899.jpeg,[ERROR] 'NoneType' object is not subscriptable


In [None]:
# --- √âtape 7 : Sauvegarde dans un CSV ---
csv_output_path = os.path.join(result_folder, "r√©sultats_llm_llama32.csv")
pd.DataFrame(results_llm).to_csv(csv_output_path, index=False, encoding="utf-8")
print(f"‚úÖ R√©sultats enregistr√©s dans : {csv_output_path}")

‚úÖ R√©sultats enregistr√©s dans : /content/drive/MyDrive/Colab_Notebooks/images/Resultat/r√©sultats_llm_llama32.csv


## Mise en perspectives et conclusion

En conclusion, le fonctionnement du code permettant un traitment par lot, rend la m√©thode int√©ressante sur des fonds d'images en archives. De plus le rendu en CSV permet des imports, permettant d'utiliser ces classifications comme methode d'indexation automatique.

## Bibliographie