# Comment la machine voit-elle l'image?

## Du pixel aux images - 32M7138

*Printemps 2024 - Université de Genève*

*Adrien Jeanrenaud (adrien.jeanrenaud@unige.ch)*

<div class="alert alert-block alert-info">
<b>L'image dans la machine</b> : l'image prend la forme d'une grille de pixels sur notre machine. 
    <br>Cette grille de pixels s'appelle une matrice. Pour pouvoir la visualiser il faut écire quelques lignes de code. 
    <br>Après avoir vu les bases de Python, nous pouvons désormais utiliser le langage pour, dans un premier temps, comprendre qu'est-ce qu'une image sur notre machine. Pour ce faire, le plan du cours est:
</div>

## **Plan du cours**

> **Importer et voir une image sur notre machine**
> * Indiquer à la machine où est l'image
> * Est-ce bien un chemin ?
> * Importer une image
> * Visualiser avec Python (matplotlib)
> * Quelques ajustements

> **Matrice = image**
> * Une matrice c'est quoi ?
> * La matrice à 1 dimensions: une liste, un tuple, déjà une image
> * La matrice à 2 dimensions: valeurs de gris
> * La matrice à 3 dimensions: les couleurs
> * Les informations de base

> **Les principaux référentiels de couleurs**
> * Red Blue Green : RGB
> * Hue Saturation Value : HSV
> * Mais encore

## **1. Import et voir une image sur notre machine**
### Indiquer à la machine où est l'image

Pour pouvoir visualiser une image avec Pyhton, il faut d'abord donner le chemin de l'image en entrée. Il y a deux manières d'écrire un chemin:
- Chemin absolu
- Chemin relatif

#### Chemin absolu
Le chemin absolu se définit par rapport au dossier "racine" de votre machine (cf. Terminal). C'est-à-dire qu'il part du "premier dossier", ce qu'on appel la racine. Ensuite, le chemin va de dossier en dossier pour arriver là où se trouve le fichier recherché.

**Si vous ne savez pas comme le chemin se nomme, ne vous inquiétez pas: "os" est là pour ça!**

In [None]:
# importer la librairie

import os

In [None]:
# savoir dans quel dossier nous sommes

os.getcwd()

#### Chemin relatif


Le chemin relatif, comme son nom l'indique, est relatif à l'endroit depuis lequel je me trouve (le code). Dans quelle partie de ma machine, dans quelle suite de dossier et quel dossier suis-je actuellement ?

**Maintenant, vous savez dans quel dossier vous êtes. Mais comment naviguer?**

In [None]:
# Pour sortir d'un dossier utiliser les ..

path = ".."

In [None]:
os.listdir(path)

In [None]:
# Pour sortir d'un dossier et aller dans un autre

path = "../data"

In [None]:
os.listdir(path)

**On vient de voir la commande "os.listdir()". Cela va nous permettre de lister ce que nous avons dans notre dossier, dont une image!**

In [None]:
# Alors trouvons une image

os.listdir()

In [None]:
# En bash ça fonctionne aussi

%ls

In [None]:
# Mieux encore!

%ls -la

**Maintenant qu'on connait notre chemin et notre fichier on peut faire un chemin à notre fichier!**

In [None]:
%pwd

In [None]:
# On peut tout écrire d'un coup, en chemin relatif ou absolu

image = "images/japanPoster.jpg"

In [None]:
# On peut aussi joindre le chemin et le fichier avec "os"

chemin = "iamges/"
image = "japanPoster.jpg"
chemin_image = os.path.join(chemin, image)
print(chemin_image)

### Est-ce bien un chemin ?

La mauvaise définition du chemin d'une image est une source d'erreur fréquente. Heureusement il existe des moyens de vérifier 

In [None]:
# d'abord vérifier le chemin au dossier

os.path.isdir(os.getcwd())

In [None]:
# Ensuite vérifier le fichier

chemin_image = "cours4-machine_image.ipynb"
os.path.isfile(chemin_image)

### Importer une image

Enfin on va pouvoir importer une image!

In [None]:
# on définit le chemin

path = "images/japanPoster.jpg"

In [None]:
# on vérifie le chemin

os.path.isfile(path)

In [None]:
# Ensuite on peut importer avec "cv2.imread()"

import cv2

?cv2.imread

In [None]:
# une autre librairie
from PIL import Image

?Image.open

In [None]:
# on définit notre objet image

image = cv2.imread(path)

In [None]:
# Pour l'instant ça nous parle peu, on verra ce que cela signifie dans un instant

image

### Visualiser avec matplotlib

Notre variable "image" peut se visualiser directement dans notre Notebook grâce à la librairie "matplotlib"

In [None]:
# importer la librairie

import matplotlib.pyplot as plt

In [None]:
# simplement

plt.imshow(image)
plt.show()

<div class="alert alert-block alert-danger">
<b>Oups, on a un petit problème de couleurs non?</b>.
</div>

### Quelques ajustement

La librairie "cv2" importe les couleurs des images avec un ordre différent duquel nous les visualisons. Pas de problème ça se modifie simplement.

In [None]:
# Il suffit de changer l'ordre à nouveaux
# On passe du BlueGreenRed au RedBlueGreen, mais nous verrons ce que ça veut dire dans un instant

image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
plt.imshow(image)
plt.show()

In [None]:
# avec PIL, pas besoin de conversion

image2 = Image.open(path)
plt.imshow(image2)
plt.show()

<div class="alert alert-block alert-warning">
<b>Exercice</b>: à partir du code ci-dessous, téléchargez une image d'après sont lien (URL) et visualisez là.</div>

In [None]:
# Code pour télécharger une image

import requests #librairie pour le scraping

DownURL = "" # choix de l'URL
img_data = requests.get(DownURL).content # télécharger
with open('image_name.jpg', 'wb') as handler: # définir le fichier et son chemin
    handler.write(img_data) # enregistrer l'image

In [None]:
# A vous de jouer maintenant

## 2. **La matrice = l'image**

### Une matrice c'est quoi ?

Une image numérique prend la forme d'une **matrice** : une matrice est un tableau de points caractérisé par des **dimensions** (par exemple, la largeur et la hauteur). Chaque point, chaque case comporte une **valeur** qui représente de l'information. 

D'une manière générale, une image matricielle est représenté par une grille dont la hauteur et la largeur indiquent le nombre de pixels et la taille de l'image, alors que chaque point renvoie à une valeur de couleur (valeurs de gris pour les images en 2D et couleurs pour les images 3D)

<img src="https://logodix.com/logo/2067282.png" title="array_1"/>

### La matrice à 1 dimensions: une liste, un tuple, déjà une image

Une matrice à 1D prend la forme d'une liste. Par rapport à une image, c'est comme si notre image (avec une hauteur et une largeur) était réduite à sa largeur. 

Dans certains cas, il est possible qu'une image en 2D soit réduite à 1D afin d'avoir un objet (une liste à 1D) plus manipulable sans toutefois perdre de l'information (par rapport à l'image 2D)

In [None]:
# Une matrice à 1D
# La fonction np.array() permet de créer un tableau de valeurs (array)
# une image est un array

import numpy as np

a = np.array([0,1,2,3,4,5,6,7,8,9])
print(a)

### La matrice à 2 dimensions: valeurs de gris

Une image, comme nous la voyons, se caractérise par une hauteur et une largeur, donc par deux dimensions. Ces deux dimensions forment spatialement l'image et chaque point contenu dans cette grille à une valeur. Cette valeur, dans une image 2D, se réfère à une valeur de gris comprise entre 0 et 255.

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Fmiro.medium.com%2Fmax%2F1386%2F1*bV7S0zACdidh11ikjYpLpQ.png&f=1&nofb=1&ipt=fdde33a6c1082d8f4d5e278d4eb9295103a87ed0ae39e89bce8081c15e12ff6f&ipo=images" title="array_2"/>

Les valeurs de gris vont de 0 à 255, c'est à dire que l'information est représentée par 256 valeurs différentes. Les valeurs de gris dépendent de la manière dont elles sont encodées ; plus généralement, il y a 256 valeurs de 0 (noir) à 255 (blanc).

In [None]:
# Une matrice à 2D
# La fonction np.array() permet de créer un tableau (array) en 2D, pour cela il suffit de suivre la logique:
# la première paire de [] forme la matrice et 
# à l'intérieur chaque [] forme une ligne dans la matrice, et
# à l'inétrieur de ces [] chaque valeur est un point qui dans une image est une valeur de gris

b = np.array([[0,1,2],[3,4,5],[6,7,8],[9,10,11]])
print(b)

In [None]:
# Nous pouvons faire un teste pour visualiser notre matrice et ses valeurs de gris

plt.imshow(b, cmap="gray", vmin=0, vmax=255) # l'option cmpa="gray" permet de visualiser les valeurs de gris en spéficiant les bornes (entre 0 et 255)
plt.show()

**Les valeurs choisises sont toutes très proches de 0, on ne voit pas très bien les variations: essayons à nouveau!**

In [None]:
# Un nouvel array à 2D

b2 = np.array([[0,112,2],[3,224,5],[136,7,8],[119,101,110]])
print(b2)

In [None]:
# Visualiser notre matrice et ses valeurs de gris

plt.imshow(b2, cmap="gray", vmin=0, vmax=255)
plt.show()

<div class="alert alert-block alert-warning">
<b>Exercice</b>: créez et visualiser une image montrant toutes les valeurs de gris, en générant les couleurs à l'aide d'une boucle "for", vu la semaine passée.</div>

In [None]:
# aide
# le code pour créer l'arry ressemble à ça:

dimensions = (x, y) #choix des dimensions

# Convert the list to a NumPy array with the specified dimensions
result_array = np.array(colors).reshape(dimensions)

### La matrice à 3 dimensions: les couleurs

Contrairement à ce que nous voyons sur notre écran, une image de couleurs se déploie numériquement sur trois dimensions. 

Alors que les deux premières dimensions sont la hauteur et la largeur, la troisième dimension et celle des valeurs de couleurs. Tout comme pour une image en 2D, chaque valeur du tableau est encodée entre 0 et 255, mais c'est l'addition des valeurs des trois matrices qui donne les couleurs et ses nuances.

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Fbrohrer.github.io%2Fimages%2Fimage_processing%2Frgb_arrays.png&f=1&nofb=1&ipt=d2b56511f6feae071ef2f5d795df4c23076cdc90d482450f89337c061f06cd43&ipo=images" title="array_3"/>

In [None]:
# Une matrice à 3D
# La fonction np.array() permet de créer un tableau (array) en 3D, pour cela il suffit de suivre la logique:
# la première paire de [] forme la matrice et 
# à l'intérieur chaque [] forme une ligne dans la matrice, et
# à l'intérieur de ces [] chaque [] forme un triplet de valeurs qui s'étend dans la troisième dimension

c = np.array([[[123,111,222],
               [200,24,5],
               [60,70,80]],
              [[90,100,11],
               [120,13,140],
               [15,160,170]]])
print(c)

In [None]:
# Nous pouvons visualiser notre matrice et ses couleurs
# Vous pouvez jouer avec les valeurs de votre matrice afin de voir intuitivement comment se forment les couleurs

plt.imshow(c)
plt.show()

### Les informations de base

Il existe quelques fonction de base en Python afin de comprendre quel type d'objet nous avons.

In [None]:
# Est-ce une image ?

type(image)

In [None]:
# Est-ce une image ?

type(b)

In [None]:
# Quelles dimensions

image.shape

In [None]:
# Quelles dimensions

a.shape

In [None]:
# Quels dimensions

b2.shape

In [None]:
# Quel taille

a.size

In [None]:
# Quel taille

b.size

In [None]:
# Quel taille

image.size

<div class="alert alert-block alert-warning">
<b>Exercice</b>: 
    <br>Importez une image couleur, visualisez là et imprimer (print) en même temps ses dimensions et sa taille. 
    <br>Dans un second temps, transformez cette même image couleur en valeurs de gris et faites là même chose que précèdemment.</div>

In [None]:
# partie 1



In [None]:
# partie 2
# gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)




## **Les principaux référentiels de couleurs**

Il existe différentes manière d'encoder les couleurs d'une image numérique, mais la manière la plus courante consiste à faire l'addition de trois couleurs - rouge, vert, bleu - pour obtenir toutes les autres couleurs. Ainsi, nous parlons d'images en RGB (Red, Green, Blue). 

L'encodage des couleurs est la source du problème dans l'importation des images avec OpenCV (voir ci-dessus). En effet, nous visualisons nos images avec une suite RGB alors qu'OpenCV importe les images avec une suite BGR.

### Red Blue Green : RGB


<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Fcdncontribute.geeksforgeeks.org%2Fwp-content%2Fuploads%2FPixel.jpg&f=1&nofb=1&ipt=7cb426810b518f590b1c3e809c55876ab2c8530ec4a3559fd40abebb754ff8fb&ipo=images" title="array_color"/>

Il s'agit simplement d'addtioner les couleurs pour arriver au blanc, et de les soustraires pour arriver au noir.

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Fthumbs.dreamstime.com%2Fb%2Fadditive-color-mixing-scheme-rgb-colors-theory-151820794.jpg&f=1&nofb=1&ipt=1a310be6ef33188c84014c51bb23af2cd39de0b1a2e1b82c39a3217087c52752&ipo=images" title="array_color2"/>

In [None]:
# Reprenons notre matrice ci-dessus et mettons y les triplets des couleurs de base

c2 = np.array([[[255,0,0],
               [0,255,0],
               [0,0,255]],
              [[255,0,255],
               [0,255,255],
               [255,255,0]]])
print(c2)

plt.imshow(c2)
plt.show()

In [None]:
# on peut voir chaque matrice séparément grace à l'indexation
# les zones claires indiques la présence de la couleur

plt.figure(figsize=(15,10))
print(c2)
plt.subplot(131); plt.imshow(c2[:,:,0], cmap="gray"); plt.title("Red")
plt.subplot(132); plt.imshow(c2[:,:,1], cmap="gray"); plt.title("Green")
plt.subplot(133); plt.imshow(c2[:,:,2], cmap="gray"); plt.title("Blue")

In [None]:
# Visualiser le canal rouge
# Faire une copie de l'image et mettre les deux autres cannaux à 0 (en noir)

red = c2.copy()
red[:,:,1] = red[:,:,2] = 0
plt.imshow(red)
plt.show()

In [None]:
# Visualiser le canal vert
# Faire une copie de l'image et mettre les deux autres cannaux à 0 (en noir)

green = c2.copy()
green[:,:,0] = green[:,:,2] = 0 
plt.imshow(green)
plt.show()

In [None]:
# Visualiser le canal bleu
# Faire une copie de l'image et mettre les deux autres cannaux à 0 (en noir)

blue = c2.copy()
blue[:,:,0] = blue[:,:,1] = 0 
plt.imshow(blue)
plt.show()

**Faisons la même chose avec notre image!**

In [None]:
print(image.shape)

plt.imshow(image)
plt.show()

In [None]:
# on peut voir chaque matrice séparément grace à l'indexation

plt.figure(figsize=(15,10))
print(image)
plt.subplot(131); plt.imshow(image[:,:,0], cmap="gray"); plt.title("Red")
plt.subplot(132); plt.imshow(image[:,:,1], cmap="gray"); plt.title("Green")
plt.subplot(133); plt.imshow(image[:,:,2], cmap="gray"); plt.title("Blue")

In [None]:
# Visualiser le canal rouge
# Faire une copie de l'image et mettre les deux autres cannaux à 0 (en noir)

red = image.copy()
red[:,:,1] = red[:,:,2] = 0
plt.imshow(red)
plt.show()

In [None]:
# Visualiser le canal vert
# Faire une copie de l'image et mettre les deux autres cannaux à 0 (en noir)

green = image.copy()
green[:,:,0] = green[:,:,2] = 0 
plt.imshow(green)
plt.show()

In [None]:
# Visualiser le canal bleu
# Faire une copie de l'image et mettre les deux autres cannaux à 0 (en noir)

blue = image.copy()
blue[:,:,0] = blue[:,:,1] = 0 
plt.imshow(blue)
plt.show()

### Hue Saturation Value : HSV

L'espace HSV, en français TSV, comprend Hue (Teinte), Saturation et Valeur. L'intérêt de cet espace de couleur est que la couleur est encodée sur un canal uniquement (Teinte). La saturation correspond à l'intensité de la couleur, plus elle sera faible plus la couleur sera fade. La valeur correspond à la brillance, plus elle sera faible plus la couleur sera sombre.

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Fres.cloudinary.com%2Fpracticaldev%2Fimage%2Ffetch%2Fs--bY6KnFCr--%2Fc_limit%252Cf_auto%252Cfl_progressive%252Cq_auto%252Cw_880%2Fhttps%3A%2F%2Fthepracticaldev.s3.amazonaws.com%2Fi%2F3tffy0gdkf1471xg6mhi.jpeg&f=1&nofb=1&ipt=49377950004c804b3e40029c9dd8f89711a2b84bd72d38afdf5711be5d62e40b&ipo=images" title="array_hsv"/>

In [None]:
# Modifier puis visualiser en HSV

hsv = cv2.cvtColor(image, cv2.COLOR_RGB2HSV)
plt.imshow(hsv, cmap='hsv')
plt.show()

**Ce n'est pas très parlant, non?**

In [None]:
# voyons chaque canal

plt.figure(figsize=(15,10))
plt.subplot(131); plt.imshow(hsv[:,:,0], cmap="gray"); plt.title("Hue");
plt.subplot(132); plt.imshow(hsv[:,:,1], cmap="gray"); plt.title("Saturation")
plt.subplot(133); plt.imshow(hsv[:,:,2], cmap="gray"); plt.title("Value")

In [None]:
plt.figure(figsize=(15,10))
plt.subplot(131); plt.imshow(hsv[:,:,0], cmap="hsv"); plt.title("Hue");
plt.subplot(132); plt.imshow(image); plt.title("Image de base")

### Mais encore

Il existe différentes manières de décrire et d'encoder les couleurs dans les images.

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/1/19/SubtractiveColor.svg/1920px-SubtractiveColor.svg.png" title="cmy"/>
<img src="https://external-content.duckduckgo.com/iu/?u=http%3A%2F%2F4.bp.blogspot.com%2F_lNzlqVMcIj8%2FS883k71zk3I%2FAAAAAAAABvw%2F2sDaMacB4E8%2Fs1600%2FBasic%2BGamut%2Bgraphic%2BLab.jpg&f=1&nofb=1&ipt=05d18ee527a7b2c647f0a549f02f28e26a221b3990f7b6c646b3e6094f8ca0e7&ipo=images" title="clab"/>

Pour aller plus loin: https://en.wikipedia.org/wiki/List_of_color_spaces_and_their_uses

<div class="alert alert-block alert-warning">
<b>Exercice</b>: le but est de mettre au point une châine de traitement afin de télécharger une image et avoir ses informations. Vous pouvez tout écrire dans une cellule ou définir plusieurs fonctions. Il faut respecter les points suivant:
<ul>
  <li>La chaîne de traitement prend en entrée le lien (URL) de l'image et le chemin (avec nom du fichier) pour enregistrer l'image</li>
  <li>Il faut mettre des messages (en utilisant la fonction print) entre les étapes importantes</li>
  <li>A la fin, il faut donner les informations sur les dimensions de l'image</li>
</ul></div>