# Gérer des images + récolte

## Du pixel aux images - 32M7138

*Printemps 2025 - Université de Genève*

*Adrien Jeanrenaud (adrien.jeanrenaud@unige.ch)*

<div class="alert alert-block alert-info">
<b>Manipulations des images partie 1</b> : jusque là nous avons manipulé les images une par. Dès aujourd'hui, nous allons voir comment manipuler les images en quatité, leur appliquer des transformations et extraire des informations:
</div>

## **Plan du cours**

> **Importer des images**
> * Rappel sur les chemins
> * Une fonction pour importer un dossier
> * Une fonction pour importer seulement des images

> **Extraire des informations**
> * Comment stocker les informations ?
> * Extraire des informations de base
> * Extraire des informations à l'aide d'un algorithme de détection d'objets

> **Visualiser simplement ses données**
> * Vérifier l'extraction des informations
> * Visualiser à partir d'un tableau de données

In [1]:
# Uniquement pour Google Colab

from google.colab import drive
drive.mount('/content/drive')

ModuleNotFoundError: No module named 'google.colab'

## 1. Importer des images

Pour importer des images, il faut revenir aux cours précédents et se rappeler comment naviguer sur notre machine et cibler un dossier. Ensuite, il nous faut stocker les images dans une varaible. Le but final est de créer une fonction utilisable en tous temps.

### Rappel sur les chemins

La librairie "os" permet de naviguer sur notre machine et cibler un dossier avec des images.

In [None]:
import os

In [None]:
# chercher le chemin à son dossier d'images

path = "images"

In [None]:
os.path.isdir(path)

In [None]:
# fichiers et dossiers au bout du chemin

dossier_images = os.listdir(path)
print(dossier_images)

In [None]:
dossier_images[0]

In [None]:
file = os.path.join(path, dossier_images[0])
file

In [None]:
os.path.isfile(file)

### Une fonction pour importer un dossier

Pour importer des images et les stocker il faut principalement:
* scanner un dossier à l'aide d'une boucle
* lire les images une à une
* une liste vide pour stocker les images

In [None]:
# Créer une boucle

dossier = os.listdir(path)
for files in dossier:
    print(files)

In [None]:
# Pour lire les images

import cv2
import matplotlib.pyplot as plt

In [None]:
# Lire les images

dossier = os.listdir(path)
for files in dossier:
    image_dossier = os.path.join(path, files) # on joint notre fichier à notre chemin
    image = cv2.imread(image_dossier) # on utilise la fonction pour lire les images
    print(image)

In [None]:
# Lire et enregistrer les images

liste_images = [] # on crée une liste pour y enregister nos images
dossier = os.listdir(path)
for files in dossier:
    image_dossier = os.path.join(path, files)
    image = cv2.imread(image_dossier)
    liste_images.append(image) # après avoir lu nos images, on les enregistre
        
print("Nombre d'images : ", len(liste_images))

In [None]:
liste_images[0]

In [None]:
plt.imshow(liste_images[0])
plt.show()

In [None]:
# Créons une fonction simple pour importer les images d'un dossier

def importer_images(path):
    
    liste_images = []
    dossier = os.listdir(path)
    for files in dossier:
        image_dossier = os.path.join(path, files)
        image = cv2.imread(image_dossier)
        liste_images.append(image)
    return liste_images

In [None]:
# Utilisons la fonction

mes_images = importer_images(path="images")

In [None]:
len(mes_images)

### Une fonction pour importer seulement des images

Pour importer uniquement les images d'un dossier, il faut ajouter des conditions à notre fonction.

In [None]:
# Créer une boucle avec une condition

dossier = os.listdir(path)
for files in dossier:
    if files.endswith('.jpg'):
        print(files)

In [None]:
# Créer une boucle avec plusieurs conditions

ext = [".jpeg", ".png", ".jpg"] # choisir les extensions qui définissent nos images
dossier = os.listdir(path)
for files in dossier:
    if files.endswith(tuple(ext)): # ici le code change un peu pour intégrer les extensions
        print(files)

**Profitons-en pour changer l'ordre des canaux de couleurs**

In [None]:
def importer_images(path):

    liste_images = []
    ext = [".jpeg", ".png", ".jpg"]
    dossier = os.listdir(path)
    for files in dossier:
        if files.endswith(tuple(ext)):
            image_dossier = os.path.join(path, files)
            image = cv2.imread(image_dossier)
            image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
            liste_images.append(image)
    return liste_images

In [None]:
# Utilisons la fonction

mes_images = importer_images(path=path)

In [None]:
len(mes_images)

In [None]:
plt.imshow(mes_images[0])
plt.show()

**Profitons-en pour garder le nom des images**

In [None]:
def importer_images(path):

    filenames = []
    liste_images = []
    ext = [".jpeg", ".png", ".jpg"]
    dossier = os.listdir(path)
    for files in dossier:
        if files.endswith(tuple(ext)):
            image_dossier = os.path.join(path, files)
            image = cv2.imread(image_dossier)
            image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
            filenames.append(image_dossier)
            liste_images.append(image)
    return liste_images, filenames

In [None]:
# Utilisons la fonction

mes_images, files2 = importer_images(path=path)

In [None]:
len(mes_images)

In [None]:
files2

## 2. Extraire des informations

Lorsqu'on importe un dossier avec des images, il peut être utile d'en extraire des informations. Ces informations nous permettent de décrire nos données tout en rendant notre fonction plus robuste.

### Rappel sur les informations

Les informations sont d'une part extraites et d'autres part stockées.

#### Les dictionnaires

In [None]:
# Rappel sur les dictionnaires

# un dictionnaire se définit par des {}
# la clé se définit sur la gauche, entre " "
# entre la clé et la valeur, il y a :
# la valeur se définit sur la droit, selon le type (str, int, float, ...)
# entre chaque ligne, il y a une ,

eleve = { 
    "nom" : "Adrien", 
    "prenom" : "Jeanrenaud"
}

In [None]:
# L'objet

print(eleve)

In [None]:
# Pour accéder aux éléments, par les clés

print(eleve["nom"])

In [None]:
eleves = { 
    "nom" : ["Adrien", "Jean", "Michel"], 
    "prenom" : ["Jeanrenaud", "Martin", "Dupont"]
}

In [None]:
print(eleves)

In [None]:
print(eleves["nom"])

In [None]:
print(eleves["nom"][0])

In [None]:
#itérer dans le dictionnaire

for key, value in eleves.items():
    print(f"{key}: {value}")

In [None]:
# passer d'un dictionnaire à un tableur

import pandas as pd

In [None]:
df = pd.DataFrame.from_dict(eleves, orient ='index')
df

### Extraires des informations de base

Nous pouvons reprendre la fonction précédente et ajouter du code pour extraire et enregistrer les informations

In [None]:
# Où récupérer les informations ?

ext = [".jpeg", ".png", ".jpg"] # choisir les extensions qui définissent nos images
dossier = os.listdir(path)
for files in dossier:
    if files.endswith(tuple(ext)):
        image_dossier = os.path.join(path, files)
        file, ext = os.path.splitext(files)
        image = cv2.imread(image_dossier)
        print(image.shape, file, ext)

In [None]:
# Tout enregistrer dans un dictionnaire

liste_dic = [] # comme lorsque nous voulions enregistrer nos images, il faut une liste pour enregistrer le dictionnaire 
ext = [".jpeg", ".png", ".jpg"] # choisir les extensions qui définissent nos images
dossier = os.listdir(path)
for files in dossier[:5]:
    if files.endswith(tuple(ext)):
        image_dossier = os.path.join(path, files)
        file, ext = os.path.splitext(files)
        image = cv2.imread(image_dossier)
        dic = {
            "nom": file,
            "ext": ext,
            "hauteur": image.shape[0],
            "largeur": image.shape[1],
            "canaux": image.shape[2],
            "taille": image.size
        }
        liste_dic.append(dic)
print(liste_dic)

In [None]:
# passer à un tableur

df = pd.DataFrame.from_dict(liste_dic)
df

In [None]:
df.to_csv('infos.csv')

### Extraire des informations à l'aide d'un algorithme de détection d'objets

Sur la base du cours précédent, nous savons maintenant comment appliquer un algorithme pour extraire des informations contenues dans l'image à l'aide d'algorithmes

### Visualiser simplement ses données
#### Vérifier l'extraction des informations

À partir du dossier et du CSV créer, nous pouvons dans un premier temps vérifier et comptabiliser l'extraction des données.

In [None]:
# importer un csv

csv = 'infos.csv'
df2 = pd.read_csv(csv, index_col=[0])
df2

In [None]:
# choisir un dossier

path

In [None]:
os.path.isdir(path)

#### Visualiser à partir d'un tableau de données