# Gérer des images + extraire les informations

## Du pixel aux images - 32M7138

*Printemps 2025 - Université de Genève*

*Adrien Jeanrenaud (adrien.jeanrenaud@unige.ch)*

<div class="alert alert-block alert-info">
<b>Manipulations des images partie 1</b> : jusque là nous avons manipulé les images une par. Dès aujourd'hui, nous allons voir comment manipuler les images en quatité, leur appliquer des transformations et extraire des informations:
</div>

## **Plan du cours**

> **Importer des images**
> * Rappel sur les chemins
> * Une fonction pour importer un dossier
> * Une fonction pour importer seulement des images

> **Extraire des informations**
> * Comment stocker les informations ?
> * Extraire des informations de base
> * Extraire des informations à l'aide d'un algorithme de détection d'objets

> **Visualiser simplement ses données**
> * Vérifier l'extraction des informations
> * Visualiser à partir d'un tableau de données

In [None]:
# @title
# Uniquement pour Google Colab

from google.colab import drive
drive.mount('/content/drive')

## 1. Importer des images

Pour importer des images, il faut revenir aux cours précédents et se rappeler comment naviguer sur notre machine et cibler un dossier. Ensuite, il nous faut stocker les images dans une varaible. Le but final est de créer une fonction utilisable en tous temps.

### Rappel sur les chemins

La librairie "os" permet de naviguer sur notre machine et cibler un dossier avec des images.

In [None]:
import os

In [None]:
# chercher le chemin à son dossier d'images

path = "/content/drive/MyDrive/cours/cours 2025/images"

In [None]:
os.path.isdir(path)

In [None]:
# fichiers et dossiers au bout du chemin

dossier_images = os.listdir(path)
print(dossier_images)

In [None]:
dossier_images[0]

In [None]:
file = os.path.join(path, dossier_images[0])
file

In [None]:
os.path.isfile(file)

### Une fonction pour importer un dossier

Pour importer des images et les stocker il faut principalement:
* scanner un dossier à l'aide d'une boucle
* lire les images une à une
* une liste vide pour stocker les images

In [None]:
# Créer une boucle

dossier = os.listdir(path)
for files in dossier:
    print(files)

In [None]:
# Pour lire les images

import cv2
import matplotlib.pyplot as plt

In [None]:
# Lire les images

dossier = os.listdir(path)
for files in dossier:
    image_dossier = os.path.join(path, files) # on joint notre fichier à notre chemin
    image = cv2.imread(image_dossier) # on utilise la fonction pour lire les images
    print(image)

In [None]:
# Lire et enregistrer les images

liste_images = [] # on crée une liste pour y enregister nos images
dossier = os.listdir(path)
for files in dossier:
    image_dossier = os.path.join(path, files)
    image = cv2.imread(image_dossier)
    liste_images.append(image) # après avoir lu nos images, on les enregistre

print("Nombre d'images : ", len(liste_images))

In [None]:
liste_images[0]

In [None]:
plt.imshow(liste_images[0])
plt.show()

In [None]:
# Créons une fonction simple pour importer les images d'un dossier

def importer_images(chemin):

    liste_images = []
    dossier = os.listdir(path)
    for files in dossier:
        image_dossier = os.path.join(path, files)
        image = cv2.imread(image_dossier)
        liste_images.append(image)
    return liste_images

In [None]:
# Utilisons la fonction

mes_images = importer_images(chemin=path)

In [None]:
len(mes_images)

### Une fonction pour importer seulement des images

Pour importer uniquement les images d'un dossier, il faut ajouter des conditions à notre fonction.

In [None]:
# Créer une boucle avec une condition

dossier = os.listdir(path)
for files in dossier:
    if files.endswith('.jpg'):
        print(files)

In [None]:
# Créer une boucle avec plusieurs conditions

ext = [".jpeg", ".png", ".jpg"] # choisir les extensions qui définissent nos images
dossier = os.listdir(path)
for files in dossier:
    if files.endswith(tuple(ext)): # ici le code change un peu pour intégrer les extensions
        print(files)

**Profitons-en pour changer l'ordre des canaux de couleurs**

In [None]:
def importer_images(path):

    liste_images = []
    ext = [".jpeg", ".png", ".jpg"]
    dossier = os.listdir(path)
    for files in dossier:
        if files.endswith(tuple(ext)):
            image_dossier = os.path.join(path, files)
            image = cv2.imread(image_dossier)
            image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
            liste_images.append(image)
    return liste_images

In [None]:
# Utilisons la fonction

mes_images = importer_images(path=path)

In [None]:
len(mes_images)

In [None]:
plt.imshow(mes_images[0])
plt.show()

**Profitons-en pour garder le nom des images**

In [None]:
def importer_images(path):

    filenames = []
    liste_images = []
    ext = [".jpeg", ".png", ".jpg"]
    dossier = os.listdir(path)
    for files in dossier:
        if files.endswith(tuple(ext)):
            image_dossier = os.path.join(path, files)
            image = cv2.imread(image_dossier)
            image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
            filenames.append(image_dossier)
            liste_images.append(image)
    return liste_images, filenames

In [None]:
# Utilisons la fonction

mes_images, files2 = importer_images(path=path)

In [None]:
len(mes_images)

In [None]:
files2

## 2. Extraire des informations

Lorsqu'on importe un dossier avec des images, il peut être utile d'en extraire des informations. Ces informations nous permettent de décrire nos données tout en rendant notre fonction plus robuste.

### Rappel sur les informations

Les informations sont d'une part extraites et d'autres part stockées.

#### Les dictionnaires

In [None]:
# Rappel sur les dictionnaires

# un dictionnaire se définit par des {}
# la clé se définit sur la gauche, entre " "
# entre la clé et la valeur, il y a :
# la valeur se définit sur la droit, selon le type (str, int, float, ...)
# entre chaque ligne, il y a une ,

eleve = {
    "nom" : "Adrien",
    "prenom" : "Jeanrenaud"
}

In [None]:
# L'objet

print(eleve)

In [None]:
# Pour accéder aux éléments, par les clés

print(eleve["nom"])

In [None]:
eleves = {
    "nom" : ["Adrien", "Jean", "Michel"],
    "prenom" : ["Jeanrenaud", "Martin", "Dupont"]
}

In [None]:
print(eleves)

In [None]:
print(eleves["nom"])

In [None]:
print(eleves["nom"][0])

In [None]:
#itérer dans le dictionnaire

for key, value in eleves.items():
    print(f"{key}: {value}")

In [None]:
# passer d'un dictionnaire à un tableur

import pandas as pd

In [None]:
df = pd.DataFrame.from_dict(eleves, orient ='index')
df

### Extraires des informations de base

Nous pouvons reprendre la fonction précédente et ajouter du code pour extraire et enregistrer les informations

In [None]:
plt.imshow(mes_images[0])
plt.show()

In [None]:
mes_images[0].shape

In [None]:
mes_images[0].size

In [None]:
# Où récupérer les informations ?

ext = [".jpeg", ".png", ".jpg"] # choisir les extensions qui définissent nos images
dossier = os.listdir(path)
for files in dossier:
    if files.endswith(tuple(ext)):
        image_dossier = os.path.join(path, files)
        file, ext = os.path.splitext(files)
        image = cv2.imread(image_dossier)
        print(image.shape, file, ext)

In [None]:
# Tout enregistrer dans un dictionnaire

liste_dic = [] # comme lorsque nous voulions enregistrer nos images, il faut une liste pour enregistrer le dictionnaire
ext = [".jpeg", ".png", ".jpg"] # choisir les extensions qui définissent nos images
dossier = os.listdir(path)
for files in dossier[:5]:
    if files.endswith(tuple(ext)):
        image_dossier = os.path.join(path, files)
        file, ext = os.path.splitext(files)
        image = cv2.imread(image_dossier)
        dic = {
            "nom": file,
            "ext": ext,
            "hauteur": image.shape[0],
            "largeur": image.shape[1],
            "canaux": image.shape[2],
            "taille": image.size
        }
        liste_dic.append(dic)
print(liste_dic)

In [None]:
# passer à un tableur

df = pd.DataFrame.from_dict(liste_dic)
df

In [None]:
df.to_csv('infos.csv')

### Extraire des informations à l'aide d'un algorithme de détection d'objets

Sur la base du cours précédent, nous savons maintenant comment appliquer un algorithme pour extraire des informations contenues dans l'image à l'aide d'algorithmes

In [None]:
# https://huggingface.co/facebook/detr-resnet-50

from PIL import Image, ImageDraw

file = os.path.join(path, dossier_images[0])
image = Image.open(file)
plt.imshow(image)
plt.show()

In [None]:
from transformers import DetrImageProcessor, DetrForObjectDetection
import torch

In [None]:
processor = DetrImageProcessor.from_pretrained("facebook/detr-resnet-50", revision="no_timm")
model = DetrForObjectDetection.from_pretrained("facebook/detr-resnet-50", revision="no_timm")

In [None]:
inputs = processor(images=image, return_tensors="pt")
outputs = model(**inputs)
target_sizes = torch.tensor([image.size[::-1]])
results = processor.post_process_object_detection(outputs, target_sizes=target_sizes, threshold=0.7)[0]


In [None]:
for score, label, box in zip(results["scores"], results["labels"], results["boxes"]):
    box = [round(i, 2) for i in box.tolist()]
    print(
            f"Detected {model.config.id2label[label.item()]} with confidence "
            f"{round(score.item(), 3)} at location {box}"
    )

In [None]:
input_folder = path
data = []

processor = DetrImageProcessor.from_pretrained("facebook/detr-resnet-50", revision="no_timm")
model = DetrForObjectDetection.from_pretrained("facebook/detr-resnet-50", revision="no_timm")

for filename in os.listdir(input_folder):
    if filename.lower().endswith((".png", ".jpg", ".jpeg")):
        image_path = os.path.join(input_folder, filename)
        image = Image.open(image_path).convert("RGB")

        inputs = processor(images=image, return_tensors="pt")
        with torch.no_grad():
            outputs = model(**inputs)

        target_sizes = torch.tensor([image.size[::-1]])
        results = processor.post_process_object_detection(outputs, target_sizes=target_sizes, threshold=0.7)[0]

        for score, label, box in zip(results["scores"], results["labels"], results["boxes"]):
            box = box.tolist()  # On convertit en liste Python normale
            box = list(map(int, box))  # On convertit chaque coordonnée en int
            data.append({
                "filename": filename,
                "label": model.config.id2label[label.item()],
                "score": round(score.item(), 3),
                "box_xmin": box[0],
                "box_ymin": box[1],
                "box_xmax": box[2],
                "box_ymax": box[3]
            })

In [None]:
data

In [None]:
df = pd.DataFrame(data)
df

In [None]:
df.to_csv("detection_results.csv")

### Visualiser simplement ses données
#### Vérifier l'extraction des informations

À partir du dossier et du CSV créer, nous pouvons dans un premier temps vérifier et comptabiliser l'extraction des données.

In [None]:
# importer un csv

csv = 'detection_results.csv'
df2 = pd.read_csv(csv, index_col=[0])
df2

In [None]:
# choisir un dossier

path

In [None]:
os.path.isdir(path)

In [None]:
# Choisir une ligne (par exemple l'index 0)
row = df.iloc[0]
row

In [None]:
# Charger l'image
image_path = os.path.join(path, row["filename"])
image = cv2.imread(image_path)
image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
plt.imshow(image_rgb)
plt.show()

In [None]:
# Récupérer les coordonnées de la box
xmin, ymin, xmax, ymax = row["box_xmin"], row["box_ymin"], row["box_xmax"], row["box_ymax"]
xmin, ymin, xmax, ymax = int(xmin), int(ymin), int(xmax), int(ymax)

# Dessiner la bounding box sur l'image (directement sur image_rgb)
cv2.rectangle(image_rgb, (xmin, ymin), (xmax, ymax), color=(255, 0, 0), thickness=2)

# Mettre le texte (label + score)
text = f"{row['label']} ({row['score']})"
cv2.putText(image_rgb, text, (xmin, max(ymin - 10, 0)), cv2.FONT_HERSHEY_SIMPLEX, 0.6, (0, 255, 0), 2)

# Afficher avec matplotlib
plt.figure(figsize=(10, 10))
plt.imshow(image_rgb)
plt.axis('off')
plt.title(f"Detection: {text}")
plt.show()

In [None]:
# Extraire la sous-image (crop de la bounding box)
cropped = image[ymin:ymax, xmin:xmax]

# Convertir pour matplotlib (BGR -> RGB)
cropped_rgb = cv2.cvtColor(cropped, cv2.COLOR_BGR2RGB)

# Afficher l'extraction
plt.figure(figsize=(5, 5))
plt.imshow(cropped_rgb)
plt.axis('off')
plt.title(f"{row['label']} ({row['score']})")
plt.show()

In [None]:
# Générer le nouveau nom de fichier
output_folder = "/content/drive/MyDrive/cours/cours 2025/detections"
os.makedirs(output_folder, exist_ok=True)

base_filename = os.path.splitext(row["filename"])[0]
label_clean = row["label"].replace(" ", "_")  # remplacer les espaces dans les labels
new_filename = f"{base_filename}_{label_clean}.jpg"
output_path = os.path.join(output_folder, new_filename)
cv2.imwrite(output_path, cropped)

print(new_filename, output_path)

In [None]:
# découper les détection sur tout le dossier

import pandas as pd
import cv2
import os
import matplotlib.pyplot as plt

# Chemins
csv_path = "detection_results.csv"
images_folder = path
output_folder = "/content/drive/MyDrive/cours/cours 2025/detections"

# Créer le dossier de sortie s'il n'existe pas
os.makedirs(output_folder, exist_ok=True)

# Charger la dataframe
df = pd.read_csv(csv_path)

# Boucler sur toutes les lignes du CSV
for idx, row in df.iterrows():
    # Charger l'image
    image_path = os.path.join(images_folder, row["filename"])
    image = cv2.imread(image_path)

    # Vérification : l'image est bien chargée
    if image is None:
        print(f"⚠️ Image {image_path} introuvable. Ligne {idx}.")
        continue

    # Récupérer les coordonnées de la box
    xmin, ymin, xmax, ymax = row["box_xmin"], row["box_ymin"], row["box_xmax"], row["box_ymax"]
    xmin, ymin, xmax, ymax = int(xmin), int(ymin), int(xmax), int(ymax)

    # Sécurité sur les dimensions (parfois les box débordent un peu)
    h, w, _ = image.shape
    xmin, ymin = max(0, xmin), max(0, ymin)
    xmax, ymax = min(w, xmax), min(h, ymax)

    # Extraire la sous-image
    cropped = image[ymin:ymax, xmin:xmax]

    # Vérifier que le crop n'est pas vide
    if cropped.size == 0:
        print(f"Box vide pour {row['filename']} ({row['label']}). Ligne {idx}.")
        continue

    # Convertir pour matplotlib (BGR -> RGB)
    cropped_rgb = cv2.cvtColor(cropped, cv2.COLOR_BGR2RGB)

    # Afficher l'image extraite
    plt.figure(figsize=(4, 4))
    plt.imshow(cropped_rgb)
    plt.axis('off')
    plt.title(f"{row['label']} ({row['score']})")
    plt.show()

    # Nettoyer les labels pour le filename
    base_filename = os.path.splitext(row["filename"])[0]
    label_clean = row["label"].replace(" ", "_").replace("/", "-")
    new_filename = f"{base_filename}_{label_clean}.jpg"
    output_path = os.path.join(output_folder, new_filename)

    # Sauvegarder l'image extraite
    cv2.imwrite(output_path, cropped)
    print(f"Image sauvegardée : {output_path}")


#### Visualiser à partir d'un tableau de données

In [None]:
# Charger la dataframe
csv_path = "detection_results.csv"
df = pd.read_csv(csv_path)

In [None]:
# Calcul de la surface de chaque box
plt.figure(figsize=(8, 8))
df["label"].value_counts().plot.pie(autopct="%1.1f%%", startangle=140)
plt.title("Répartition des objets détectés")
plt.ylabel("")
plt.show()

In [None]:
import seaborn as sns

plt.figure(figsize=(12, 6))
sns.boxplot(x="label", y="score", data=df)
plt.xticks(rotation=90)
plt.title("Score de détection par objet détecté")
plt.xlabel("Objet détecté")
plt.ylabel("Score de détection")
plt.tight_layout()
plt.show()