# Classification statistique supervisée

Ce notebook illustre le scénario le plus simple de classification supervisée, sur une image en niveaux de gris. Pour l'image de pièces ci-dessous, le but est de décider correctement pour chaque pixel s'il appartient à une pièce (foreground) ou au fond (background).


In [1]:
%matplotlib notebook
%config InlineBackend.figure_formats = {'png', 'retina'} # makes nicer graphics
from skimage import data, filters, io
import matplotlib.pyplot as plt
import matplotlib.cm as cm
import numpy as np
import scipy.stats as stats
import math


Chargeons une image (fournie dans le système de librairies python), affichons l'image et son histogramme

In [2]:
image = data.coins()
plt.figure(figsize=(11,5))
plt.subplot(1,2,1)
plt.imshow(image, cmap = cm.Greys_r)
plt.subplot(1,2,2)
plt.hist(image.flatten(),256,fc='k')
plt.xlabel('niveau de gris')
plt.ylabel('nombre de pixels')
plt.show()

<IPython.core.display.Javascript object>

## Partie apprentissage (I) : prenons deux petites images, l'une extraite du fond et l'autre extraite d'une pièce
    

In [3]:

coins_background = io.imread("coins_background.jpg")
coins_foreground = io.imread("coins_foreground.jpg")

plt.figure(figsize=(10,5))


plt.hist(coins_background.flatten(),bins=256,range=(0,255),alpha=0.3)
plt.xlabel('niveau de gris')
plt.ylabel('nombre de pixels')
#plt.subplot(1,2,1)
plt.hist(coins_foreground.flatten(),bins=256,range=(0,255),alpha=0.3)
#plt.xlabel('niveau de gris')
#plt.ylabel('nombre de pixels')
plt.show()



<IPython.core.display.Javascript object>

## Partie apprentissage (II) : modélisation de la distribution de probabilité des niveaux de gris pour chacune de ces deux classes.

Pour cela, on calcule la moyenne et la variance de chacun et des deux échantillons et on les utilise comme paramètres de deux lois normales modélisant la distribution de probabilité des niveaux de gris pour chaque classe.

In [4]:
mean_background = coins_background.flatten().mean()
mean_foreground = coins_foreground.flatten().mean()
variance_background = coins_background.flatten().var()
variance_foreground = coins_foreground.flatten().var()
fig=plt.figure(figsize=(10,5))
ax=fig.add_subplot(111)

ax.hist(coins_foreground.flatten(),bins=256,range=(0,255),alpha=0.3,normed=True)
ax.hist(coins_background.flatten(),bins=256,range=(0,255),alpha=0.3,normed=True)

x = np.linspace(0,255,255)
ax.plot(x,stats.norm.pdf(x,mean_background,math.sqrt(variance_background)),label='background')
ax.plot(x,stats.norm.pdf(x,mean_foreground,math.sqrt(variance_foreground)),label='foreground')

plt.xlabel('niveau de gris')
plt.legend()
plt.show()



<IPython.core.display.Javascript object>

## Classifions chacun des pixels de l'image selon le critère du maximum de vraimsemblance

In [5]:
image_classification = image


for gray_level in np.nditer(image_classification,  op_flags=['readwrite']): 
    likelihood_foreground = stats.norm.pdf(gray_level,mean_foreground,math.sqrt(variance_foreground))
    likelihood_background = stats.norm.pdf(gray_level,mean_background,math.sqrt(variance_background))
    
    proba_foreground=likelihood_foreground*0.5/(likelihood_foreground+likelihood_background)
    proba_background=likelihood_background*0.5/(likelihood_foreground+likelihood_background)
    
    #l_ratio= likelihood_foreground / likelihood_background
    
    #if likelihood_foreground > likelihood_background:
    #if l_ratio>250000:
    #    gray_level[...]=255
    #else:
    #    gray_level[...]=0
    gray_level[...]=255*proba_foreground
        
plt.figure(figsize=(10,5))
im=plt.imshow(image_classification, cmap = cm.Greys_r)
cbar=plt.colorbar(im,ticks=[0,255])
#im.cbar.set_yticklabels(['0', '1']) 

plt.show()

<IPython.core.display.Javascript object>

Conclusion : ça ne marche pas bien pour la partie supérieure de l'image. La zone utilisée pour l'apprentissage de la distribution du fond était peut-être trop claire. Il est aussi possible que les modèles gaussiens n'étaient pas très fidèles à la réalité.'