# Partie 1 : des convolutions !

In [None]:
# @title Installation
!pip3 uninstall --yes torch torchaudio torchvision torchtext torchdata
!pip3 install torch torchaudio torchvision torchtext torchdata
! git clone https://github.com/Molugan/Vision_ponts.git
%cd /content/Vision_ponts

In [None]:
# Commencons par charger les librairies necessaires
import torch
import sys
from tools.tools import load_image
import numpy as np
from PIL import Image

## Exercice 1
La fonction load_image vous permet de charger une image depuis un fichier et d'en faire un tensor torch. Par exemple vous pouvez charger la photo d'isha avec:

In [None]:
x = load_image('isha.jpg')

Regardons alors la taille de x

In [None]:
print(x.size())

Pour afficher l'image, vous pouvez utiliser la commande suivante:

In [None]:
Image.fromarray(x.numpy().astype(np.uint8))

Remarquez que la commande marche aussi si vous ne considérez qu'un seul des cannaux de l'image:

In [None]:
Image.fromarray(x[:, :, 0].numpy().astype(np.uint8))

## Exercice 2
Le tenseur à le format suivant : Hauteur x Largeur x 3. Une image a en effet 3 cannaux : Rouge, Vert et Bleu.

Vous pouvez accedez à chaque cannal de façon individuelle avec x[:, :, index_cannal].

Utilisez la fonction save_image pour sauvegarder séparement les cannaux R, V, B de l'image x.

In [None]:
# Votre code ici !

## Exercice 3
Les couleurs c'est bien jolis mais ce n'est pas pratique pour faire des manipulations.

Definissez une fonction qui étant donné un vecteur image en fait une image en niveau de gris en moyennant les cannaux Rouges, Vert, Bleu

L'image de sortie doit avoir le format suivant Hauteur x Largeur

In [None]:
def rgb_to_grey(x):
    # Votre code ici
    return

In [None]:
# Testez votre code ici
x = load_image('isha.jpg')
x = rgb_to_grey(x)
Image.fromarray(x.numpy().astype(np.uint8))

## Exercice 4

Appliquons des filtres à des images: le plus souvent on appelle "filtre" une convolution. Pytorch possède un module codant les convolutions, il s'agit de nn.Conv2d.

Par exemple la fonction suivante calcul le gradient selon l'axe x (grad_x)

In [None]:
def build_conv_grad_x():

    output = torch.nn.Conv2d(1,         # Nombre de cannaux dans l'image d'entrée, nous travaillons avec des images en noir et blanc donc 1
                             1,         # Nombre de cannaux dans l'image de sortie
                             3,         # Taille du noyau de comvolution
                             padding=1) # Nombre de lignes zéros à ajouter à l'image lors de la convolution

    # Le noyau de convolution est de taille trois, cela veut dire que la convolution est effectuée par une matrice 3x3
    core = torch.tensor([[0, 0, 0],
                         [-1, 0, 1],
                         [0, 0, 0]], dtype=torch.float)
    output.weight.data.copy_(core)
    return output

La fonction ci dessous applique un filtre à une image noir et blanc au format Hauteur x Largeur

In [None]:
def applique_filtre(x, filtre):

    H, L = x.size()

    # Les modules torch.nn.Conv2d ne prennent en entrée que des batches au format
    # Nombres d'images x Nombre de cannals par image x Hauteur d'une image x Largeur d'une image
    # La méthode torch.tensor.view permet de faire ça: une image H x L c'est aussi
    # un batch ne contenant qu'une image avec un seul cannal
    x = x.view(1, 1, H, L)

    # Appliquer le filtre
    x = filtre(x)

    # Remettre x au format H, L
    x = x.view(H, L)

    # Retourner le résultat
    return x

Utilisez les deux fonctions ci-dessus pour tester grad_x et utilisez PIL pour visualiser le résultat.
Vous remarquerez que le gradient peut être négatif: puisque seule la valeur du gradient nous intéresse et non sa direction, utilisez la méthode torch.abs pour ne garder que la valeur absolue de grad_x

In [None]:
# Votre code ici

## Exercice 5

De la même manière, définissez et testez:

- une convolution pour extraire le gradient selon l'axe y

- une convolution pour extraitre la somme des gradients selon les axes x et y

- un filtre moyen: chaque pixel est remplacé par la moyenne de ses voisins sur un carré de taille 3x3

- un gros filtre moyen: chaque pixel est remplacé par la moyenne de ses voisins sur un carré de taille 9x9 (Attention au padding !!!!)

In [None]:
def build_conv_grad_y():
    r"""
    Construit une convolution calculant un gradient selon l'axe y
    """
    # Votre code ici
    return

In [None]:
def build_conv_grad_sum_xy():
    r"""
    Construit une convolution calculant la somme des gradients selon les axes x et y
    """
    return

In [None]:
def build_conv_mean_3x3():
    r"""
    Construit une convolution calculant la moyenne locale sur un noyau carré de taille 3x3
    """
    return

In [None]:
def build_conv_mean_9x9():
    r"""
    Construit une convolution calculant la moyenne locale sur un noyau carré de taille 9x9
    """
    return

## Exercice 6:

Vous allez à présent programmer un détecteur de bord.

Appliquez votre filtre build_conv_grad_sum_xy à une image I pour estimer son gradient grad_I.

Construisez alors une image J valant 0 sur tous les points où abs(grad_I) < 100 et 1 ailleurs.

Faites variez ce seuil pour en regarder les effets

In [None]:
def extraction_des_bords(x):
    r"""
    Extrait les bords de l'image d'entrée x.
    """
    # Votre code ici
    return

## Exercice 7 (BONUS)
Regardons à présent ce qui se passe lorsque l'on combine des filtres.

Regardez les effets des fonctions suivantes

In [None]:
def mean_3x3_combo(x, n_combo):
    mean_3x3 = build_conv_mean_3x3()
    for _ in range(n_combo):
        x = applique_filtre(x, mean_3x3)
    return x


def diff_mean_combo(x):
    mean_3x3 = build_conv_mean_3x3()
    return 2 * torch.abs(x - applique_filtre(x, mean_3x3))

In [None]:
# Votre code ici !

Définissez la convoliution à laquelle correspond diff_mean_combo() :

In [None]:
def diff_mean_combo_2():
    r"""
    Construit la convolution équivalente à la fonction diff_mean_combo.
    """
    return

Définissez la convoliution à laquelle correspond mean_3x3_combo(x, 2) :

In [None]:
def mean_3x3_combo_x2():
    r"""
    Construit la convolution équivalente à la fonction mean_3x3_combo.
    """
    return