In [None]:
import numpy as np
from skimage import io
import plotly.express as px
import plotly.graph_objs as go
from copy import copy
from tqdm import tqdm
import time as t

Soit une image bicolore de taille $n=w\times h$. On la représente par la suite $(x_i)_{1\leq i\leq n}\in\{0, 1\}^n$, de sorte que la vraie couleur du pixel $i$ est blanc si $x_i=1$ et noir si $x_i=0$. On ne dispose que d'une version bruitée de cette image, représentée en nuances de gris par la suite $(y_i)_{1\leq i\leq n}\in\{0, \dots, 255\}^n$.

On suppose que pour tout $i\in\{1, \dots, n\}$, $y_i$ et $x_i$ sont des réalisations des variables aléatoires $Y_i$ et $X_i$, et que le bruit est gaussien, c'est-à-dire $Y_i|X_i\sim\mathcal{N}(\mu(X_i), \tau^2)$. Pour retrouver la vraie image $x=(x_i)$, on choisit de modéliser la probabilité d'une configuration $\tilde{x}=(\tilde{x}_i)$ par une loi d'Ising : $\mathbb{P}(X=\tilde{x})=\frac{1}{Z(\alpha, \beta)}\exp\left(\alpha\sum_{i=1}^nx_i+\beta\sum_{(i, j)\in\mathcal{V}}\mathbf{1}\{x_i=x_j\}\right)$, où $\mathcal{V}$ est l'ensemble des couples de pixels voisins, i.e. ayant un côté adjacent sur l'image, et $Z(\alpha, \beta)$ une constante de normalisation.

Dans la première question, on supposera $\alpha$, $\beta$ et $\tau$ connus et fixés. Par la suite, on les considèrera comme des réalisations de variables aléatoires $A$, $B$ et $T$.

Le but du problème est de retrouver la vraie représentation $x$ de l'image, qui est la plus probable dans le modèle. Mais on ne peut pas calculer directement la probabilité d'une configuration. En effet, cela suppose de connaître la constante de normalisation $Z(\alpha, \beta)$. Or, elle est impossible à calculer en pratique. Considérons l'exemple d'une image de taille $128\times128$ pixels. On a donc $n=16 384$, et $2^{16384}$ configurations possibles. Pour chacune de ces configurations, on doit calculer une somme à $16384$ termes, et une autre à $4\times 2+4\times126\times3+127^2\times4=66036$ termes. On peut penser qu'il est possible d'économiser des opérations, mais la présence des voisins empêche de telles simplifications.

Pour contourner ce problème, on passe par les densités conditionnelles, bien plus faciles et rapides à calculer. Dans toute la suite, on note $f_Z$ une densité de la variable aléatoire $Z$ par rapport à la mesure de Lebesgue, ou la mesure de comptage. Pour tout $i\in\{1, \dots, n\}$ et $x_i\in\{0, 1\}$, on a $f_{X_i}(x_i)\propto\exp\left(\alpha x_i+\beta\sum_{j\in\mathcal{V}_i}\mathbf{1}\{x_i=x_j\}\right)$, avec $\mathcal{V}_i=\{j\in\{1, \dots, n\}, (i, j)\in\mathcal{V}\}$ l'ensemble des voisins de $i$. Ici la constante de normalisation est très facile à calculer puisqu'elle n'est composée que de deux termes. On en déduit la densité jointe de $(X_i, Y_i)$, donnée par $f_{(X_i, Y_i)}(x_i, y_i)=f_{X_i}(x_i)\times\frac{1}{\sqrt{2\pi\tau^2}}\exp\left(-\frac{(y_i-\mu(x_i))^2}{2\tau^2}\right)$. Cela nous permet enfin de trouver la densité conditionnelle de $X_i|(Y_i, X_{-i})$, avec $X_{-i}=(X_1, \dots, X_{i-1}, X_{i+1}, \dots, X_n)$. Elle s'exprime $f_{X_i|Y_i=y_i}(x_i)\propto\exp\left(\alpha x_i+\beta\sum_{j\in\mathcal{V}_i}\mathbf{1}\{x_i=x_j\}-\frac{(y_i-\mu(x_i))^2}{2\tau^2}\right)$.

On va utiliser le principe de l'échantillonneur de Gibbs.

**Initialisation :**
On pose $j=1$. On initialise $X^{(0)}=(X_1^{(0)}, \dots, X_n^{(0)})$ à partir de l'image bruitée $Y$.

**Itération :**
On tire une nouvelle valeur $X^{(j)}=(X_1^{(j)}, \dots, X_n^{(j)})$ en utilisant les lois conditionnelles $X_i^{(j)}|(Y_1, X_{-i}^{(j-1)})$. On passe $j$ à $j+1$.

**Convergence :**
On itère jusqu'à convergence vers une représentation $x$.

*Remarque : dans l'étape d'itération, on peut tirer les $(X_i)$ dans un ordre fixé et prédéterminé, ou choisir aléatoirement un entier $i$.*

# Question 1.

Dans cette question, $\alpha$, $\beta$ et $\tau$ sont connus et fixés.

## 1 - Chargement des images

On utilise le module ```plotly``` pour afficher les images

In [None]:
img = np.arange(25).reshape((5,  5))
fig = px.imshow(img, color_continuous_scale='gray')
fig.show()

In [None]:
# Lecture et affichage de l'image à débruiter
#img_ = io.imread('https://images.fineartamerica.com/images/artworkimages/mediumlarge/3/op-art-black-and-white-infinity-whirl-tom-hill.jpg')
img_ = io.imread('example.jpg')

img = np.zeros(img_.shape[:2])
for i in range(len(img)):
    for j in range(len(img[0])):
        img[i][j] = np.mean(img_[i][j])

In [None]:
fig = px.imshow(img, color_continuous_scale='gray')
fig.show()

En zoomant sur le centre de l'image, on s'aperçoit qu'elle a été bruitée, que les pixels censés être blancs sont en teintes de gris.

## 2 - Prérequis pour le Gibbs sampler

In [None]:
# Taille de l'image
w, h = img.shape

Les $(y_i)\in\{0,\dots,  255\}^n$ sont les niveaux de gris des pixels de l'image bruitée.

In [None]:
y = np.reshape(img, (w*h))
y

On a besoin d'une fonction pour trouver les voisins du pixel $i$. Pour faciliter l'opération, on commence par trouver les coordonnées du point $i$ sur l'image.
Supposons que l'image a une taille de $w\times h$ pixels.
La case $i$ a pour coordonnées $(i\% w, i//w)$ (on commence la numérotation des cases à $0$).

In [None]:
def coordonnees(i):
    return((i%w, i//w))

def voisins(i):
    x, y = coordonnees(i)
    if x == 0:
        if y == 0:
            lvois = [i+1, i+w]
        elif y == h-1:
            lvois = [i-w, i+1]
        else:
            lvois = [i-w, i+1, i+w]
    elif x == w-1:
        if y == 0:
            lvois = [i-1, i+w]
        elif y == h-1:
            lvois = [i-w, i-1]
        else:
            lvois = [i-w, i-1, i+w]
    else:
        if y == 0:
            lvois = [i-1, i+1, i+w]
        elif y == h-1:
            lvois = [i-w, i+1, i-1]
        else:
            lvois = [i-w, i+1, i+w, i-1]
    return(lvois)

Dans notre modèle de bruit gaussien, on suppose que les niveaux de gris $(y_i)$ ont été tirés selon une loi normale de moyenne $0$ si le vrai pixel est noir, et $255$ si le vrai pixel est blanc. La vraie couleur du pixel $i$ est donnée par $x_i\in\{0, 1\}$. Par convention, le pixel est noir si $x_i=0$ et blanc si $x_i=1$.

On a donc, avec les notations données au début du notebook, $\mu(x_i)=255\times\mathbf{1}\{x_i=1\}=255x_i$

In [None]:
def mu(k):
    return(255*k)

On définit ensuite une densité de la loi de $X_i$ sachant $X_{-i}$ et les $Y_i$.

In [None]:
def pxi(x, y, i, alpha, beta, tau):
    '''returns P(x_i = 1 |x_{-i}, y_i)'''
    b0 = beta*sum([int(x[j] == 0) for j in voisins(i)])
    b1 = beta*sum([int(x[j] == 1) for j in voisins(i)])
    
    n0 = (y[i]**2)/(2*tau**2)
    n1 = ((y[i]-255)**2)/(2*tau**2)
    
    a0 = b0 - n0
    a1 = alpha + b1 - n1
    
    e0 = np.exp(a0)
    e1 = np.exp(a1)
    
    return(e1/(e1+e0))

## 3 - Gibbs sampler

### a) Implémentation

In [None]:
def sampler(alpha, beta, tau, y0 = y, max_it = 100):
    '''Gibbs sampler.
    
    Input:
        :alpha, beta, tau : float, paramètres du modèle.
        :y0 : array, image initiale bruitée.
        :max_it : int, itérations du sampler.
        
    Output:
        :X : matrix, X[i] est la configuration de l'image à l'itération i.
        :x : array, X[-1], configuration de l'image après la dernière itération.
    '''
    x = np.array([float(yi>128) for yi in y0])
    X = np.zeros((max_it+1, w*h))
    X[0] = x

    for j in tqdm(range(max_it)):
        for i in range(len(x)):
            i = np.random.randint(0, w*h)
            s = np.random.random()
            x[i] = int(pxi(x, y, i, alpha, beta, tau) > s)
        X[j+1] = x
    
    return(X, x)

In [None]:
X, x = sampler(-1/3, 2/3, 1, max_it=12)

In [None]:
fig = px.imshow(X[3].reshape((w, h)), color_continuous_scale='gray')
fig.show()

### b) Détermination du *burn-in*

In [None]:
def make_X3(X):
    '''
    Input:
        X: array, obtenu avec le sampler
        
    Output:
        X3: array, contient les images de X, avec les pixels qui changent entre deux images successives colorés en rouge.
        change: array, nombre de pixels changés à chaque itération.
    '''
    it, wh = X.shape
    X3 = np.zeros((it-1, wh, 3))
    change = np.zeros(it-1)
    for i in tqdm(range(it-1)):
        for j in range(wh):
            if X[i+1][j] == X[i][j]:
                X3[i][j] = [255*X[i][j]]*3
            else:
                X3[i][j] = [255., 0., 0.]
                change[i] += 1
    return(X3, change)

In [None]:
X3, change = make_X3(X)

In [None]:
# Les pixels shiftés lors de l'itération apparaissent en rouge.
fig = px.imshow(X3[1].reshape((w, h, 3)))
fig.show()

In [None]:
# plot du nombre de pixels shiftés à chaque itération
fig = px.line(change, markers=True)
fig.show()

## 4 - Tests et applications

### a) Bruitage de l'image

In [None]:
def generate_noise(x, tau=1):
    '''A partir d'une configuration de base x, génère une image bruitée y.
    Bruit gaussien de variance tau'''
    n = len(x)
    y = np.zeros(n)
    for i in range(n):
        if x[i] == 0:
            y[i] = np.abs(np.random.normal(0, tau))
        else:
            y[i] = 255 - np.abs(np.random.normal(0, tau))
    return(y)

In [None]:
y_noisy = generate_noise(y,tau=70)
y_noisy

In [None]:
fig = px.imshow(y_noisy.reshape((w, h)), color_continuous_scale='gray')
fig.show()

### b) Débruitage

In [None]:
X, x = sampler(-1/3, 2/3, 20, y0=y_noisy,max_it=12)

In [None]:
fig = px.imshow(X[2].reshape((w, h)), color_continuous_scale='gray')
fig.show()

In [None]:
X3, change = make_X3(X)

In [None]:
# plot du nombre de pixels shiftés à chaque itération
fig = px.line(change, markers=True)
fig.show()

# Question 2.

On suppose cette fois-ci $\tau$ inconnu. On suppose que $\tau^2$ est une réalisation d'une variable aléatoire $T$ de loi *a priori* inverse-Gamma, de paramètres notés $(\sigma, \lambda)\in(\mathbb{R}_+^*)^2$. On a donc $f_T(\tau^2)=\frac{\lambda^{\sigma}}{\Gamma(\sigma)}\frac{1}{(\tau^2)^{\sigma+1}}\exp\left(-\frac{\lambda}{\tau^2}\right)$.

Par ailleurs, la densité *a posteriori* s'écrit $f_{T|(X, Y)=(x, y)}(\tau^2)\propto\left(\frac{1}{\sqrt{2\pi\tau^2}^n}\exp\left(-\sum_{i=1}^n\frac{(y_i-\mu(x_i))^2}{2\tau^2} \right)\right)\left(\frac{\lambda^{\sigma}}{\Gamma(\sigma)}\frac{1}{(\tau^2)^{\sigma+1}}\exp\left(-\frac{\lambda}{\tau^2}\right)\right)$. En imposant que le modèle soit conjugué, on peut mettre la densité *a posteriori* sous une forme qui donne directement les paramètres *a posteriori* $(\widehat{\sigma}, \widehat{\lambda})$. On obtient $f_{T|(X, Y)=(x, y)}(\tau^2)\propto\frac{1}{(\tau^2)^{n+\sigma+1}}\exp\left(-\frac{1}{\tau^2}\left(\lambda+\frac{1}{2}\sum_{i=1}^n(y_i-\mu(x_i))^2\right)\right)$. On constate que $\widehat{\sigma} = n + \sigma$ et $\widehat{\lambda} = \lambda + \frac{1}{2}\sum_{i=1}^n(y_i-\mu(x_i))^2$.

Dans l'échantillonneur de Gibbs, on va sampler $T|(Y, X) \sim IG(\widehat{\sigma}, \widehat{\lambda})$. Mais on ne connaît pas encore $(\sigma, \lambda)$. On veut que l'espérance de $T|(X, Y)$, donnée par $\mathbb{E}[T|(X, Y)=(x, y)] = \frac{\lambda+ \frac{1}{2}\sum_{i=1}^n(y_i-\mu(x_i))^2}{n+\sigma-1}$, soit égale à l'estimateur du maximum de vraisemblance de $\tau^2$, que l'on peut facilement calculer : $\widehat{\tau}^2_{EMV} = \frac{1}{n}\sum_{j=1}^n(y_j-\mu(x_j))^2)$.

En fixant $\lambda=0$, on obtient $\sigma=1-\frac{n}{2}$, i.e. $\widehat{\sigma} = 1+\frac{n}{2}$ et $\widehat{\lambda} = \frac{1}{2}\sum_{i=1}^n(y_i-\mu(x_i))^2$.

In [None]:
y_clean = np.array([float(y[i]>128) for i in range(len(y))])
y_noisy = generate_noise(255*y_clean, tau=50)

In [None]:
fig = px.imshow(y_noisy.reshape((w, h)), color_continuous_scale='gray')
fig.show()

In [None]:
from scipy.stats import invgamma

def sampler_without_tau(alpha, beta, y0, max_it = 100):
    '''Gibbs sampler.
    
    Input:
        :alpha, beta : float, paramètres du modèle.
        :y0 : array, image initiale bruitée.
        :max_it : int, itérations du sampler.
        
    Output:
        :X : matrix, X[i] est la configuration de l'image à l'itération i.
        :x : array, X[-1], configuration de l'image après la dernière itération.
    '''
    x = np.array([float(y0[i]>128) for i in range(len(y0))])
    X = np.zeros((max_it+1, w*h))
    X[0] = x
    n = len(x)
    a_p, b_p = -n/2, 0
    a = n+1

    for j in tqdm(range(max_it)):
        
        b = 0.5*np.sum([(y0[k] - mu(x[k]))**2 for k in range(n)])
        tau2 = invgamma.rvs(a+a_p, loc=0, scale = b)
        print(f" Tau estimé : {np.sqrt(tau2)}")
        
        for i in range(len(x)):
            i = np.random.randint(0, w*h)
            s = np.random.random()
            x[i] = int(pxi(x, y0,i, alpha, beta, np.sqrt(tau2)) > s)

        X[j+1] = x
        
    return(X, x)

In [None]:
X, x = sampler_without_tau(-1/3, 2/3, y0=y_noisy, max_it=12)

In [None]:
fig = px.imshow(255*y_clean.reshape((w, h)), color_continuous_scale='gray', title="Image clean")
fig.show()

fig = px.imshow(y_noisy.reshape((w, h)), color_continuous_scale='gray', title="Image noisy (simulée)")
fig.show()


error_rate = []

for i in range(1,len(X)):
    diff = np.abs(y_clean - X[i])
    err = sum(diff)/len(diff)
    error_rate.append(err)
    print(f"Taux d'erreur : {err} %")
    fig = px.imshow(X[i].reshape((w, h)), color_continuous_scale='gray', title=f"Après l'itération n°{i}")
    fig.show()

fig = px.line(error_rate, markers=True)
fig.update_layout(
    title="Mesure du taux d'erreur",
    xaxis_title="Itérations",
    yaxis_title="Taux d'erreur"
)
fig.show()

## Test avec une image différente :

In [None]:
# Lecture et affichage de l'image à débruiter
img_ = image.imread('cow.jpg')

img = np.zeros(img_.shape[:2])
for i in range(len(img)):
    for j in range(len(img[0])):
        img[i][j] = np.mean(img_[i][j])

w, h = img.shape

y = np.reshape(img, (w*h))
y_clean = np.array([float(y[i]>.5) for i in range(len(y))])
y_noisy = generate_noise(255*y_clean,tau=60)
fig = px.imshow(y_noisy.reshape((w, h)), color_continuous_scale='gray')
fig.show()

In [None]:
y = y_noisy
X, x = sampler_without_tau(-1/3, 2/3,y0=y,max_it=5)

fig = px.imshow(255*y_clean.reshape((w, h)), color_continuous_scale='gray', title="Image clean")
fig.show()

fig = px.imshow(y_noisy.reshape((w, h)), color_continuous_scale='gray', title="Image noisy")
fig.show()


error_rate = []

for i in range(1,len(X)):
  diff = np.abs(y_clean - X[i])
  err = sum(diff)/len(diff)
  error_rate.append(err)
  print(f"Taux d'erreur : {err} %")
  fig = px.imshow(X[i].reshape((w, h)), color_continuous_scale='gray', title=f"Après l'itération n°{i}")
  fig.show()

fig = px.line(error_rate, markers=True)
fig.update_layout(
    title="Mesure du taux d'erreur",
    xaxis_title="Itérations",
    yaxis_title="Taux d'erreur"
)
fig.show()

# Question 3