# <center> TP 6 :  Algorithmes de tri - Correction
    
L'organisation de de TP est la suivante :

* Dans un premier temps, programmer quelques fonctions utilisées dans le programme de tri ou dans le programme principal.

* Dans un second temps, programmer les algorithmes de tri. Chaque algorithme a la forme d'une fonction au nom prédéfini. 
    
Pour chaque algorithme, des **tests unitaires** sont proposés, ils doivent s'exécuter correctement.

L'objectif est de comparer expérimentalement les temps d'exécution des différents tris implémentés. 

Pour chaque algorithme de tri implanté, comparer son temps d'exécution avec celui de l'algorithme de tri par défaut de python et celui des autres algorithmes de tri déjà implémentés en modifiant le dictionnaire `algorithmes` et en exécutant les cellules de code correspondantes (dans la partie *Mesure du temps d'exécution*).

## Fonctions utiles

### Échange des valeurs d'un tableau

Définir une fonction `swap_tab()` qui prend en paramètres un tableau et deux indices de position et intervertit les valeurs contenues dans les cases dont les deux indices de position ont été passés en paramètre.

In [1]:
##################
#   Correction   #
##################

def swap_tab(tab, i, j):
    """
        Échange le contenu des cases i et j dans le tableau tab
    """
    buf = tab[i]
    tab[i] = tab[j]
    tab[j] = buf

In [2]:
def test_swap_tab():
    tab = [8, 5, 6, 2, 3, 1, 4, 9, 7]
    swap_tab(tab, 0, 1)
    assert tab == [5, 8, 6, 2, 3, 1, 4, 9, 7]
    swap_tab(tab, 4, 6)
    assert tab == [5, 8, 6, 2, 4, 1, 3, 9, 7]
    swap_tab(tab, 5, 5)
    assert tab == [5, 8, 6, 2, 4, 1, 3, 9, 7]
    swap_tab(tab, 7, 8)
    assert tab == [5, 8, 6, 2, 4, 1, 3, 7, 9]
    print("Test de la fonction swap_tab : ok")

test_swap_tab()

Test de la fonction swap_tab : ok


### Génération d'un tableau de taille donnée initialisé

Définir une fonction `tab_init()` qui prend en paramètres une taille et une valeur d'initialisation et retourne un tableau de la taille donnée dont chaque case contient la valeur d'initialisation.

In [3]:
##################
#   Correction   #
##################

def tab_init(taille, val):
    """
        Retourne un tableau contenant taille cases initialisées à val.
    """
    tab = []
    i = 0
    while i < taille:
        tab.append(val)
        i += 1
    return tab

In [4]:
def test_tab_init():
    assert tab_init(3, 0) == [0, 0, 0]
    assert tab_init(0, 3) == []
    assert tab_init(5, 10) == [10, 10, 10, 10, 10]
    assert tab_init(10, 5) == [5, 5, 5, 5, 5, 5, 5, 5, 5, 5]
    assert tab_init(3, "abc") == ["abc", "abc", "abc"]
    print("Test de la fonction tab_init : ok")

test_tab_init()

Test de la fonction tab_init : ok


### Génération d'un tableau d'entiers aléatoires

Définir une fonction `tab_alea()` qui prend en paramètres un entier `taille` et retourne un tableau de taille `taille` contenant des entiers aléatoires entre 0 et `taille//2`.

In [5]:
##################
#   Correction   #
##################

from random import randint

def tab_alea(taille):
    """
        Retourne un tableau de taille cases initialisées aléatoirement 
        avec des entiers compris entre 0 et taille // 2 
    """
    tab = []
    i = 0
    while i < taille:
        tab.append(randint(0, taille // 2))
        i += 1
    return tab

In [6]:
# Exemple d'appel de la fonction tab_alea

print(tab_alea(5))
print(tab_alea(5))
print(tab_alea(10))
print(tab_alea(10))

[0, 1, 2, 1, 0]
[1, 1, 0, 2, 1]
[1, 4, 1, 2, 2, 1, 1, 5, 3, 2]
[4, 3, 3, 1, 2, 5, 2, 1, 0, 5]


### Calcul de la moyenne des valeurs d'un tableau

Définir une fonction `moyenne()` qui prend en paramètre un tableau d'entiers et retourne la moyenne des valeurs de ce tableau.

In [7]:
##################
#   Correction   #
##################

def moyenne(tab):
    """
        Retourne la moyenne des éléments du tableau tab.
    """
    somme = 0
    i = 0
    while i < len(tab):
        somme += tab[i]
        i += 1
    return somme / len(tab)

**Rappel** : Pour comparer deux flottants `a` et `b`, il faut utiliser la fonction `isclose(a,b)` de la bibliothèque `math`. 

In [9]:
from math import isclose

def test_moyenne():
    assert isclose(moyenne([0, 0, 0]), 0)
    assert isclose(moyenne([14, 14, 14, 14]), 14)
    assert isclose(moyenne([0.1, 0.2]), 0.15)
    assert isclose(moyenne([1, 2, 3, 4, 5, 6]), 21/6)
    print("Test de la fonction moyenne : ok")
    
test_moyenne()


Test de la fonction moyenne : ok


## Algorithmes de tri

### Tri par sélection

Définir une fonction `tri_selection()` qui prend en paramètre un tableau d'entiers et le trie. La fonction implémente l'algorithme du tri par sélection du minimum.

**Remarque :** utiliser la fonction `swap_tab()` pour modifier le contenu du tableau à trier.

In [10]:
##################
#   Correction   #
##################


def tri_selection(tab):
    """
        Trie le tableau passé en paramètre à l'aide du tri par sélection.
    """
    
    # définit la position au-delà de laquelle le tableau n'est
    # pas encore trié
    pos_debut_non_trie = 0
    while pos_debut_non_trie < len(tab) - 1:
        # recherche de la position du minimum à partir de pos_debut_non_trie
        i = pos_debut_non_trie
        pos_min = i
        while i < len(tab):
            if tab[i] < tab[pos_min]:
                pos_min = i
            i += 1
        # on place la valeur min à sa place à la fin de la partie déjà triée
        # en l'intervertissant avec la valeur de la première case non triée
        swap_tab(tab, pos_debut_non_trie, pos_min)
        # on décale la position de debut de tableau non trié
        pos_debut_non_trie += 1

In [11]:
def test_tri_selection():
    tab = [8, 5, 6, 2, 3, 1, 4, 9, 7]
    tri_selection(tab)
    assert tab == [1, 2, 3, 4, 5, 6, 7, 8, 9]
    
    tab = [7, 7, 2, 3, 8, -2, 0, 0, -3]
    tri_selection(tab)
    assert tab == [-3, -2, 0, 0, 2, 3, 7, 7, 8]

    tab = []
    tri_selection(tab)
    assert tab == []
    
    tab = [1]
    tri_selection(tab)
    assert tab == [1]
    
    tab = [-5, -1, 9]
    tri_selection(tab)
    assert tab == [-5, -1, 9]

    print("Test de la fonction tri_selection : ok")

test_tri_selection()

Test de la fonction tri_selection : ok


### Tri par insertion

Définir une fonction `tri_insertion()` qui prend en paramètre un tableau d'entiers et le trie. La fonction implémente l'algorithme du tri par insertion.

In [12]:
##################
#   Correction   #
##################


def tri_insertion(tab):
    """
        Trie le tableau passé en paramètre à l'aide du tri par insertion.
    """
    i = 1
    while i < len(tab):
        # On insère tab[i] au bon endroit dans le tableau tab entre les indices 0 et i
        j = i-1
        nb = tab[i]
        while j >= 0 and tab[j] > nb:
            tab[j+1] = tab[j]
            j -= 1
        tab[j+1] = nb
        i += 1

In [13]:
def test_tri_insertion():
    tab = [8, 5, 6, 2, 3, 1, 4, 9, 7]
    tri_insertion(tab)
    assert tab == [1, 2, 3, 4, 5, 6, 7, 8, 9]
    
    tab = [7, 7, 2, 3, 8, -2, 0, 0, -3]
    tri_insertion(tab)
    assert tab == [-3, -2, 0, 0, 2, 3, 7, 7, 8]

    tab = []
    tri_insertion(tab)
    assert tab == []
    
    tab = [1]
    tri_insertion(tab)
    assert tab == [1]
    
    tab = [-5, -1, 9]
    tri_insertion(tab)
    assert tab == [-5, -1, 9]

    print("Test de la fonction tri_insertion : ok")

test_tri_insertion()

Test de la fonction tri_insertion : ok


### Tri à bulles

Définir une fonction `tri_bulle()` qui prend en paramètre un tableau d'entiers et le trie. La fonction implémente l'algorithme du tri à bulles.

**Remarque :** utiliser la fonction `swap_tab()` pour modifier le contenu du tableau à trier.

In [14]:
##################
#   Correction   #
##################

def tri_bulle(tab):
    """
        Trie le tableau passé en paramètre à l'aide du tri à bulles.
    """

    # définit la longueur du tableau qui reste non triée
    longueur_non_triee = len(tab)
    while longueur_non_triee > 1:
        i = 0
        # on fait remonter les valeurs les plus grandes
        while i < longueur_non_triee - 1:
            if tab[i] > tab[i + 1]:
                swap_tab(tab, i, i + 1)
            i += 1
        longueur_non_triee -= 1

In [15]:
def test_tri_bulle():
    tab = [8, 5, 6, 2, 3, 1, 4, 9, 7]
    tri_bulle(tab)
    assert tab == [1, 2, 3, 4, 5, 6, 7, 8, 9]
    
    tab = [7, 7, 2, 3, 8, -2, 0, 0, -3]
    tri_bulle(tab)
    assert tab == [-3, -2, 0, 0, 2, 3, 7, 7, 8]

    tab = []
    tri_bulle(tab)
    assert tab == []
    
    tab = [1]
    tri_bulle(tab)
    assert tab == [1]
    
    tab = [-5, -1, 9]
    tri_bulle(tab)
    assert tab == [-5, -1, 9]

    print("Test de la fonction tri_bulle : ok")

test_tri_bulle()

Test de la fonction tri_bulle : ok


### Tri par comptage

Définir une fonction `tri_comptage()` qui prend en paramètre un tableau d'entiers et le trie. La fonction implémente l'algorithme du tri par comptage.

**Remarque :** utiliser la fonction `tab_init()` pour initialiser le tableau de comptage.

In [16]:
##################
#   Correction   #
##################


def tri_comptage(tab):
    """
        Trie le tableau passé en paramètre à l'aide du tri par comptage.
    """

    if len(tab) == 0:
        return tab
    
    # recherche de la valeur min et max du tableau
    min = tab[0]
    max = tab[0]
    pos_non_trie = 0
    while pos_non_trie < len(tab):
        if tab[pos_non_trie] < min:
            min = tab[pos_non_trie]
        elif tab[pos_non_trie] > max:
            max = tab[pos_non_trie]
        pos_non_trie += 1
        
    # definition du tableau de comptage
    comptage = tab_init(max - min + 1, 0)
    # comptage occurences de chaque valeur dans le tableau
    # a trier
    pos_non_trie = 0
    while pos_non_trie < len(tab):
        comptage[tab[pos_non_trie] - min] += 1
        pos_non_trie += 1
        
    # re-écriture du tableau trié
    pos_comptage = 0
    pos_non_trie = 0
    while pos_comptage < len(comptage):
        i = 0
        while i < comptage[pos_comptage]:
            tab[pos_non_trie] = min + pos_comptage
            pos_non_trie += 1
            i += 1
        pos_comptage += 1

In [17]:
# remplacer l'instruction 
# tri_comptage(tab)
# par tab=tri_comptage(tab)
# si un nouveau tableau a été créé dans tri_comptage

def test_tri_comptage():
    tab = [8, 5, 6, 2, 3, 1, 4, 9, 7]
    tri_comptage(tab)
    assert tab == [1, 2, 3, 4, 5, 6, 7, 8, 9]
    
    tab = [7, 7, 2, 3, 8, -2, 0, 0, -3]
    tri_comptage(tab)
    assert tab == [-3, -2, 0, 0, 2, 3, 7, 7, 8]

    tab = []
    tri_comptage(tab)
    assert tab == []
    
    tab = [1]
    tri_comptage(tab)
    assert tab == [1]
    
    tab = [-5, -1, 9]
    tri_comptage(tab)
    assert tab == [-5, -1, 9]

    print("Test de la fonction tri_comptage : ok")

test_tri_comptage()

Test de la fonction tri_comptage : ok


## Mesure du temps d'exécution

Pour chaque algorithme, on souhaite estimer la complexité en temps de calcul. Pour cela, on évalue le temps que met chaque algorithme à trier des tableaux de valeurs aléatoires. On fait varier la taille du problème en faisant varier la taille du tableau (*i.e.*, le nombre d'éléments à trier). Pour chaque taille de tableau, on effectue 20 tirages de tableaux aléatoires et on calcule la moyenne des temps de tri sur les 20 exécutions.

Les tailles des tableaux sont fixées à [0, 10, 50, 100, 150, 200, 500, 750,1000, 1250, 1500, 1750, 2000].

**Remarque :** Le dictionnaire `algorithmes` contient le nom de tous les algorithmes de tri à comparer. La valeur booléenne associée à chaque tri indique s'il faut le prendre en compte dans la comparaison. Les algorithmes n'étant pas implémentés au début (sauf pour le tri rapide qui est le tri par défaut de python), les valeurs associées sont à `False`. Une fois écrite la fonction de tri associée à un algorithme, mettre la valeur `True` dans le dictionnaire `algorithmes` pour prendre en compte cet algorithme dans la comparaison.

In [18]:
from matplotlib.pyplot import plot, show, legend, xlabel, ylabel
from time import time

In [None]:
# Algorithmes de tri à comparer
algorithmes = {
    "selection": False,
    "insertion": False,
    "bulle": False,
    "comptage": False,
    "rapide": True
}

algorithmes = {
    "selection": True,
    "insertion": True,
    "bulle": True,
    "comptage": True,
    "rapide": True
}

# Nombre de tirages pour une taille donnée
nombre_tirages = 20

tailles_tableau = [
    0, 10, 50, 100, 150, 200, 500, 750, 1000, 1250, 1500, 1750, 2000
]

# Dictionnaire contenant pour chaque tri un tableau
# contenant les temps moyens pour les différentes tailles de tailles_tableau
temps_moyen = {}

i = 0
liste_algos = list(algorithmes)
while i < len(liste_algos):
    n_algo = liste_algos[i]
    if algorithmes[n_algo]:  # Si l'algorithme est à True
        temps_moyen[n_algo] = tab_init(len(tailles_tableau), 0)
    i += 1

taille = 0
# Pour chaque taille de tableau à tester
while taille < len(tailles_tableau):

    # Pour chaque tirage
    tirage = 0
    while tirage < nombre_tirages:
        tab_ref = tab_alea(tailles_tableau[taille])

        # -----------------------------------------------------
        # -----------------       tri selection
        # -----------------------------------------------------
        if algorithmes["selection"]:
            tab = tab_ref.copy()
            t_debut = time()
            tri_selection(tab)
            t_fin=time()
            temps_moyen["selection"][taille] += 1000*(t_fin - t_debut)

        # -----------------------------------------------------
        # -----------------       tri insertion
        # -----------------------------------------------------
        if algorithmes["insertion"]:
            tab = tab_ref.copy()
            t_debut = time()
            tri_insertion(tab)
            t_fin=time()
            temps_moyen["insertion"][taille] += 1000*(t_fin - t_debut)

        # -----------------------------------------------------
        # -----------------       tri bulle
        # -----------------------------------------------------
        if algorithmes["bulle"]:
            tab = tab_ref.copy()
            t_debut = time()
            tri_bulle(tab)
            t_fin=time()
            temps_moyen["bulle"][taille] += 1000*(t_fin - t_debut)

        # -----------------------------------------------------
        # -----------------       tri comptage
        # -----------------------------------------------------
        if algorithmes["comptage"]:
            tab = tab_ref.copy()
            t_debut = time()
            tri_comptage(tab)
            t_fin=time()
            temps_moyen["comptage"][taille] += 1000*(t_fin - t_debut)

        # -----------------------------------------------------
        # -----------------       tri quicksort de python
        # -----------------------------------------------------
        if algorithmes["rapide"]:
            tab = tab_ref.copy()
            t_debut = time()
            tab.sort()
            t_fin=time()
            temps_moyen["rapide"][taille] += 1000*(t_fin - t_debut)

        tirage += 1

    # On divise le temps mesuré pour chaque algorithme par nombre_tirages pour avoir une moyenne
    algoCompares = list(temps_moyen)
    i = 0
    while i < len(algoCompares):
        temps_moyen[algoCompares[i]][taille] /= nombre_tirages
        i += 1

    taille += 1

In [None]:
%matplotlib inline

# Figure affichant les temps d'exécution en fonction de la taille du tableau

if algorithmes["selection"]:
    plot(tailles_tableau, temps_moyen["selection"], "r", label="tri par sélection")

if algorithmes["insertion"]:
    plot(tailles_tableau, temps_moyen["insertion"], "g", label="tri par insertion")

if algorithmes["bulle"]:    
    plot(tailles_tableau, temps_moyen["bulle"], "b", label="tri à bulles")

if algorithmes["comptage"]:
    plot(tailles_tableau, temps_moyen["comptage"], "c", label="tri par comptage")

if algorithmes["rapide"]:
    plot(tailles_tableau, temps_moyen["rapide"], "m", label="tri rapide")
    
xlabel("Taille du tableau")
ylabel("Temps en millisecondes pour trier")
legend();

#### Questions :

1. Quel est l'algorithme de tri le plus rapide ?
2. Parmi ceux implémentés, lequel est le plus rapide ?
3. Existe-t-il des cas où cet algorithme ne serait pas plus rapide que les autres ?

**CORRECTION :**


**Queston 1 :** L'algorithme le plus rapide est le tri rapide (tri par défaut de python).

**Question 2 :** L'algorithme le plus rapide parmi ceux implémentés est le tri par comptage.

**Question 3 :** L'algorithme de comptage peut ne pas être le plus rapide (parmi ceux implémentés) si les valeurs du tableau sont comprises dans un intervalle très grand, notamment par rapport au nombre de valeurs.
Par exemple, l'algorithme de comptage n'est pas efficace pour trier des tableaux de taille 100 contenant des valeurs entre 1 et 1 000 000.


## Création d'un package de tri

1. Créer un package `Tri`. Ce package doit contenir les modules suivants :
    * module `utils` contenant les définitions des fonctions utilitaires,
    * module `tris` contenant les définitions des fonctions de tri,
    * module `test_utils` contenant les tests unitaires des fonctions utilitaires,
    * module `test_tris` contenant les tests unitaires des fonctions de tri.
2. Vérifier que tous les tests unitaires du package `Tri` s'exécutent sans erreur.

3. Créer un notebook affichant les courbes de mesure de temps d'exécution des algorithmes de tri (comme dans l'exercice 3) en utilisant le package `Tri`.

**CORRECTION :**


<a href="package_tri_corrige.zip">Archive contenant la correction</a> de la création du package de tri.