***
# ToolBook - Tri par comptage
***

## Sommaire


* <a href="#Définition-du-tri-par-comptage">Définition du tri par comptage</a>
* <a href="#Exemple-d'utilisation">Exemple d'utilisation</a>
* <a href="#Implémentation-du-tri-par-comptage">Implémentation du tri par comptage</a>
* <a href="#Complexité-algorithmique-du-tri-par-comptage">Complexité algorithmique du tri par comptage</a>
* <a href="#La-bibliothèque-Pillow">La bibliothèque Pillow</a>
* <a href="#Quelques-fonctions-usuelles-pour-manipuler-les-images">Quelques fonctions usuelles pour manipuler les images</a>


## Prérecquis


Vous devez avoir préalablement visualisé le toolbook et les mimos suivants :

- [Module 9 : Notions et dénombrement]()
- [Module 11 : Notations pour l'analyse asymptotique]()
- [Toolbook - Algorithmes de tri.ipynb]()

***


## Définition du tri par comptage

Le tri par comptage (counting sort en anglais) est appelé aussi tri caisier ou tri par dénombrement. 
<br>
Ce tri n'est applicable que dans le cas où la liste à trier est composée de valeurs entières comprises entre deux bornes connues. Cette contrainte réduit énormément son champ d'application. Toutefois, quand il est utilisé il est d'une efficacité redoutable. En effet, cette efficacité est dûe au fait que ce tri est le seul qui ne nécessite aucune comparaison entre les différents éléments de la liste à trier.

Le principe repose sur la construction de l'histogramme des données, puis le balayage de celui-ci de façon croissante, afin de reconstruire les données triées.

Supposons dans ce qui suit qu'on ait que des valeurs entières positives.
<br>
Le principe du tri par comptage est le suivant :
- Rechercher dans l’ensemble d’éléments le plus grand élément v.
- Construire un tableau de taille v+1 avec des indices allant de 0 à v et initialiser les valeurs de ce tableau à 0.
- Parcourir l’ensemble des valeurs à classer, pour chaque valeur x, incrémenter la case d'indice x.
- Parcourir le tableau et construire l’ensemble des éléments triés en créant pour chaque case du tableau, autant de valeurs d'indice qu'indique son contenu.


## Exemple d'utilisation

Si j'ai une liste L de plusieurs notes comprises entre 0 et 10 à ranger par ordre croissant, le tri par comptage sera certainement le meilleur tri à utiliser.

Le principe est simple :
 
- Erape 1 : Calcul de l'histogramme  <br>
    On crée d'abord une liste histogramme de 11 zéros qui nous servira pour compter.  <br>
    On parcourt la liste à trier L et on prend le premier élément i de notre liste L. On rajoute alors 1 à l'indice i de notre liste histogramme qui nous sert à compter.  <br>
    On recommence ainsi pour tous les éléments de la liste.
- Etape 2 : Déduire la liste triée à partir de l'histogramme  <br>
    A la fin, on parcourt tous les éléments de la liste histogramme pour créer notre liste triée L_triée.   <br>
    A chaque fois qu'il y a une valeur non nulle dans la liste histogramme: on ajoute la valeurs de l'indice de cette liste histogramme à notre L_triée et on l'ajoute autant de fois que la valeur de cette case.
     
<table>
  <tr>
    <td style="background-color: Azure">L = [ </td>
    <td style="background-color: Azure">3 , </td>
    <td style="background-color: Azure">6 , </td>
    <td style="background-color: Azure">8 , </td>
    <td style="background-color: Azure">2 , </td>
    <td style="background-color: Azure">8 , </td>
    <td style="background-color: Azure">3 , </td>
    <td style="background-color: Azure">1 , </td>
    <td style="background-color: Azure">8 , </td>
    <td style="background-color: Azure">10 , </td>
    <td style="background-color: Azure">7 , </td>
    <td style="background-color: Azure">4 , </td>
    <td style="background-color: Azure">5 , </td>
    <td style="background-color: Azure">9 , </td>
    <td style="background-color: Azure">0 , </td>
    <td style="background-color: Azure">8 , </td>
    <td style="background-color: Azure">7 , </td>
    <td style="background-color: Azure">4 , </td>
    <td style="background-color: Azure">6 , </td>
    <td style="background-color: Azure">8 , </td>
    <td style="background-color: Azure">7 ]</td>
  </tr>
</table>
  <br>
    <br>

<table border>
  <tr align="center">
      <td >  </td>
          <td> </td>
    <th style="background-color: LightCyan">hist[0]  </th>
    <td> </td>
    <th style="background-color: LightCyan">hist[1]  </th>
    <td> </td>
    <th style="background-color: LightCyan">hist[2]  </th>
    <td> </td>
    <th style="background-color: LightCyan">hist[3]  </th>
    <td> </td>
    <th style="background-color: LightCyan">hist[4]  </th>
    <td> </td>
    <th style="background-color: LightCyan">hist[5]  </th>
    <td> </td>
    <th style="background-color: LightCyan">hist[6]  </th>
    <td> </td>
    <th style="background-color: LightCyan">hist[7]  </th>
    <td> </td>
    <th style="background-color: LightCyan">hist[8]  </th>
    <td> </td>
    <th style="background-color: LightCyan">hist[9]  </th>
    <td> </td>
    <th style="background-color: LightCyan">hist[10]  </th>
  </tr>
  <tr align="center">
            <td >  </td>
          <td> </td>
    <td  align="center" style="background-color: LightCyan">1</td>
    <td> </td>
      <td  align="center"  style="background-color: LightCyan">1</td>
    <td> </td>
      <td  align="center"  style="background-color: LightCyan">1</td>
    <td> </td>
      <td  align="center"  style="background-color: LightCyan">2</td>
    <td> </td>
      <td  align="center"  style="background-color: LightCyan">2</td>
    <td> </td>
      <td  align="center"  style="background-color: LightCyan">1</td>
    <td> </td>
      <td  align="center"  style="background-color: LightCyan">2</td>
    <td> </td>
      <td align="center" style="background-color: LightCyan">3</td>
    <td> </td>
      <td  align="center"  style="background-color: LightCyan">5</td>
    <td> </td>
      <td  align="center"  style="background-color: LightCyan">1</td>
    <td> </td>
      <td  align="center"  style="background-color: LightCyan">1</td>
  </tr>
      <tr>
             <td> </td>
             <td> </td>
             <td> </td>
             <td> </td>
             <td> </td>
             <td> </td>
             <td> </td>
             <td> </td>
             <td> </td>
                       <td> </td>
             <td> </td>
             <td> </td>
             <td> </td>
             <td> </td>
             <td> </td>
             <td> </td>
             <td> </td>
             <td> </td>
                 <td> </td>
             <td> </td>
                       <td> </td>
             <td> </td>
        </tr>
  <tr align="center">
          <td class="text-center" style="background-color: LightCyan">L_triée = </td>
    <td> </td>
    <td class="text-center" style="background-color: LightCyan">0</td>
    <td> </td>
      <td class="text-center" style="background-color: LightCyan">1</td>
    <td> </td>
      <td class="text-center" style="background-color: LightCyan">2</td>
    <td> </td>
      <td class="text-center" style="background-color: LightCyan">3 , 3</td>
    <td> </td>
      <td class="text-center" style="background-color: LightCyan">4 , 4</td>
    <td> </td>
      <td class="text-center" style="background-color: LightCyan">5</td>
    <td> </td>
      <td class="text-center" style="background-color: LightCyan">6 , 6</td>
    <td> </td>
      <td text-align= "center"; style="background-color: LightCyan">7 , 7 , 7</td>
    <td> </td>
      <td class="text-center" style="background-color: LightCyan">8 , 8 , 8 , 8 , 8</td>
    <td> </td>
      <td class="text-center" style="background-color: LightCyan">9</td>
    <td> </td>
      <td class="text-center" style="background-color: LightCyan">10</td>
  </tr>
</table>

  <br>
    <br>
<table>
  <tr>
    <td  style="background-color: Azure">L_triée = [ </td>
    <td style="background-color: Azure">0 , </td>
    <td style="background-color: Azure">1 , </td>
    <td style="background-color: Azure">2 , </td>
    <td style="background-color: Azure">3 , </td>
    <td style="background-color: Azure">3 , </td>
    <td style="background-color: Azure">4 , </td>
    <td style="background-color: Azure">4 , </td>
    <td style="background-color: Azure">5 , </td>
    <td style="background-color: Azure">6 , </td>
    <td style="background-color: Azure">6 , </td>
    <td style="background-color: Azure">7 , </td>
    <td style="background-color: Azure">7 , </td>
    <td style="background-color: Azure">7 , </td>
    <td style="background-color: Azure">8 , </td>
    <td style="background-color: Azure">8 , </td>
    <td style="background-color: Azure">8 , </td>
    <td style="background-color: Azure">8 , </td>
    <td style="background-color: Azure">8 , </td>
    <td style="background-color: Azure">9 , </td>
    <td style="background-color: Azure">10 ]</td>
  </tr>
</table>

## Implémentation du tri par comptage

L'algorihtme pseudo code du tri comptage pour trier une liste L est donné comme suit:

    k=max(L)
    count = tableau de k+1 zéros 
    Pour chaque x de L : 
        count[x] += 1 

    T=[]
    Pour chaque i allant de 0 jusqu'à k+1 :
        Pour chaque j allant de 0 jusqu'à count[i]:
            T+=[i]

## Complexité algorithmique du tri par comptage

 Afin de claculer la complexité pour ce tri, considérons un ensemble de n éléments. 
- En tout premier, on parcourt une fois la liste pour trouver le plus grand élément v. Soit une complexité en O(n).
- Ensuite, on construit un tableau à m=v+1 éléments et on initialise ce tableau à 0. Soit une complexité en O(m). L’espace mémoire alloué pour créer un tel tableau est également proportionnel à m.
- Ensuite, on parcourt l’ensemble des éléments en incrémentant la case correspondante du tableau, soit une complexité pour le parcours en O(n).
- Enfin, on parcours les différentes cases du tableau et on reconstruit l’ensemble des éléments en le classant, soit une complexité pour le parcours en O(m).

Au final, on a une complexité en nombre d’opérations qui est en O(m+n). On remarque donc que la complexité est linéaire, elle dépend également de l’intervalle de valeur m que prend les entiers à classer. Le tri sera d’autant plus efficace que l’intervalle de valeurs sera réduit. En effet, prenons le cas extrême d’une dizaine de valeurs entières à classer dont le max est 1000. Le tri est très simple, mais l’application du tri par comptage sur ce type de tri entraînera la création d’un tableau de 1000 valeurs, ce qui bien trop important pour ne classer que 10 valeurs.

Au final, on peut dire que le tri sera d’autant plus efficace que l’intervalle sera réduit et que le nombre de valeurs à classer sera élevé. En gros, plus le rapport n/m est grand, plus le tri est avantageux. En effet, si n est très grand, aucun tri ne pourra rivaliser en vitesse de classement avec le tri par comptage, si m est très petit, l’efficacité sera encore plus grande puisque l’espace mémoire nécessaire sera moins important. L’idéal serait également qu’il n’y ait pas trop de trous dans l’ensemble, c’est à dire que la plupart des valeurs de l’intervalle se retrouvent dans l’ensemble à trier. En effet, même si une valeur n’apparaît pas, elle requiert une case dans le tableau intermédiaire, ce qui correspond à de l’allocation mémoire inutile.

En conclusion, le tri par comptage est l’un des tris les plus efficaces, mais son utilisation est malheureusement soumise à certaines régles qui limitent fortement ses domaines d’application.
