# Les algorithmes de tri

## Écriture et tests de deux algorithmes de tri

Les algorithmes de tri sont un grand classique dans l’apprentissage de l'algorithmique. Ils permettent de découvrir la notion de complexité algorithmique, mais surtout, sont accessibles sans connaissances compliquées. (Ils n'utilisent que de simples boucles for et while, des instructions if, et des méthodes des listes que vous connaissez)

L'objectif du jour est donc de créer deux fonctions qui prendront en paramètre une liste, et renverront cette liste triée. Il existe de nombreux algorithmes de tri, nous allons essayer d'en couvrir un maximum. Chaque groupe aura donc deux algorithmes à travailler.

**Attention :** Pensez bien à travailler avec une copie de la liste ! (voir utilisation de la méthode copy() des listes)

In [1]:
def tri_par_selection(liste_a_trier):
    """
    Fonction qui trie une liste par ordre croissant
    :param liste_a_trier: (list) Une liste de nombre à trier
    :return: (list) la liste triée
    """
    for i in range(len(liste_a_trier)):
      # Trouver le min
        min = i
        for j in range(i+1, len(liste_a_trier)):
            if liste_a_trier[min] > liste_a_trier[j]:
                min = j

        tmp = liste_a_trier[i]
        liste_a_trier[i] = liste_a_trier[min]
        liste_a_trier[min] = tmp
    return liste_a_trier
    
def tri_a_bulle(liste_a_trier):
    """
    Fonction qui trie une liste par ordre croissant
    :param liste_a_trier: (list) Une liste de nombre à trier
    :return: (list) la liste triée
    """
    n = len(liste_a_trier)
    # Traverser tous les éléments du tableau
    for i in range(n):
        for j in range(0, n-i-1):
            # échanger si l'élément trouvé est plus grand que le suivant
            if liste_a_trier[j] > liste_a_trier[j+1] :
                liste_a_trier[j], liste_a_trier[j+1] = liste_a_trier[j+1], liste_a_trier[j]# remplacer pass par le code de votre fonction
    return(liste_a_trier)

Pour tester vos fonctions, vous pouvez exécuter la cellule suivante :

In [2]:
from random import randint, seed

def test_tri(liste):
    """
    Fonction qui teste vos fonctions tri et tri2.
    """
    test_liste = liste[:]
    test_liste.sort()
    print("Votre fonction tri renvoie :")
    print(tri_par_selection(liste))
    if test_liste == tri_par_selection(liste):
        print("\033[92m" + "Votre fonction tri fonctionne !" + "\033[0m")
    else:
        print("\033[91m" + "votre fonction tri ne fonctionne pas" + "\033[0m")
    
    print("----------")
    
    print("Votre fonction tri2 renvoie :")
    print(tri_a_bulle(liste))
    if test_liste == tri_a_bulle(liste):
        print("\033[92m" + "Votre fonction tri2 fonctionne !" + "\033[0m")
    else:
        print("\033[91m" + "votre fonction tri2 ne fonctionne pas" + "\033[0m")
    


liste = [0, -6, 78, 76, 1, 9, 15, 999, 1234, 3, -777, 123, 6, 6]
test_tri(liste)


Votre fonction tri renvoie :
[-777, -6, 0, 1, 3, 6, 6, 9, 15, 76, 78, 123, 999, 1234]
[92mVotre fonction tri fonctionne ![0m
----------
Votre fonction tri2 renvoie :
[-777, -6, 0, 1, 3, 6, 6, 9, 15, 76, 78, 123, 999, 1234]
[92mVotre fonction tri2 fonctionne ![0m


## Comparaison entre les algorithmes

Pour tester quel algorithme est le plus rapide, et dans quelles situations, nous allons les utiliser sur 3 listes qui représentent 3 cas courants. Le premier est une liste triée, par ordre décroissant. La deuxième, une liste déjà triée, et la 3ème, une liste aléatoire.

In [3]:
seed(1234567890) # Création de la seed (Permet de générer toujours les mêmes nombres aléatoires à chaque execution)
liste1 = [5000 - i for i in range(5000)] # Liste classée par ordre décroissant
liste2 = [i*3 for i in range(5000)] # Liste déjà triée
liste3 = [randint(0, 10000) for _ in range(5000)] # Liste aléatoire

À l'aide du module time, mesurez combien de temps met l'ordinateur pour trier la liste 1 avec votre fonction tri().
Répétez plusieurs fois la mesure. Qu'observez-vous ?

In [4]:
# Écrire ici le code permettant de mesurer le temps d'exécution de votre fonction tri()
import time
"""
start = time.time()
print("This time is being calculated")
tri_a_bulle(liste1)
execution = time.time() - start
print("Execution Time: ", execution)"""

'\nstart = time.time()\nprint("This time is being calculated")\ntri_a_bulle(liste1)\nexecution = time.time() - start\nprint("Execution Time: ", execution)'

L'ordinateur ayant beaucoup de tâches en arrière plan, le temps d'éxécution peut varier en fonction de celles-ci. Par exemple, si l'antivirus lance un scan pendant l'exécution de notre code, celui-ci peut être ralenti.

Afin de limiter l'influence des programmes extérieur sur la mesure du temps de notre programme, il est possible de répéter 100x la mesure, et calculer le temps d'exécution moyen.

In [5]:
# Écrire ici le code permettant calculer le temps moyen d'exécution de la fonction tri()
# après 100 essais avec la liste1
timer_start = time.perf_counter()
for i in range(1,100):
    tri_par_selection(liste1)
timer_end = time.perf_counter()
execution = timer_end - timer_start
print("Execution Time: ", execution)

Execution Time:  90.93900148499961


Maintenant, réalisez à nouveau cette mesure du temps moyen, mais sur les listes "liste2" et "liste3"

Observez-vous des différences significatives dans ces temps d'exécution ?

In [9]:
# Écrire ici le code permettant calculer le temps moyen d'exécution de la fonction tri()
# après 100 essais avec la liste2 puis la liste3
timer_start = time.perf_counter()
for i in range(1,100):
    tri_par_selection(liste2)
timer_end = time.perf_counter()
execution = timer_end - timer_start
print("Execution Time: ", execution)

Execution Time:  90.99667296900043


In [12]:
timer_start = time.perf_counter()
for i in range(1,100):
    tri_par_selection(liste3)
timer_end = time.perf_counter()
execution = timer_end - timer_start
print("Execution Time: ", execut
ion)

Execution Time:  78.97420202800004


Maintenant, effectuez ces mesures pour la fonction tri2().

Un algorithme est-il plus rapide que l'autre ? Est-il plus rapide dans toutes les situations ?

In [13]:
timer_start = time.perf_counter()
for i in range(1,100):
    tri_a_bulle(liste1)
timer_end = time.perf_counter()
execution = timer_end - timer_start
print("Execution Time: ", execution)

Execution Time:  103.49940065800001


In [10]:
timer_start = time.perf_counter()
for i in range(1,100):
    tri_a_bulle(liste2)
timer_end = time.perf_counter()
execution = timer_end - timer_start
print("Execution Time: ", execution)

Execution Time:  122.07504734799932


In [11]:
timer_start = time.perf_counter()
for i in range(1,100):
    tri_a_bulle(liste3)
timer_end = time.perf_counter()
execution = timer_end - timer_start
print("Execution Time: ", execution)

Execution Time:  120.40251094900032


In [None]:
#Tri fusion (avec récursivité)
liste = [-5, -7, 7, 2, -2, 12, 13, 14]
# Puis divise liste en deux et ainsi de suite jusqu'à avoir 1 élément par liste
liste = [-5, -7, 7, 2], [-2, 12, 13, 14]
#...
liste = [-5, -7], [7, 2], [-2, 12], [13, 14]
#...
liste = [-5], [-7], [7], [2], [-2], [12], [13], [14]
#Puis fusion des listes pour trier
liste = [-7, -5], [2, 7], [-2, 12], [13, 14]
liste = [-7, -5, 2, 7], [-2, 12, 13, 14]
liste = [-7, -5, -2, 2, 7, 12, 13, 14]


In [12]:
from random import randint


def tri_fusion(liste_a_trier):
    if len(liste_a_trier) == 1:
        return liste_a_trier
    pivot = len(liste_a_trier) //2 #division entière (pas de float) donc si liste impaire, un nombre est mis à part dans une liste unique qui sera ensuite fusionné
    liste_gauche = liste_a_trier[:pivot]
    liste_droite = liste_a_trier[pivot:]
    print(liste_gauche)
    print(liste_droite)
    gauche = tri_fusion(liste_gauche) #récursivité: liste s'appelle elle-même
    droite = tri_fusion(liste_droite)
    return fusion(gauche, droite)

def fusion(liste_gauche, liste_droite):
    resultat = []
    taille_gauche = len(liste_gauche)
    taille_droite = len(liste_droite)
    i = j = 0 #ou affecter nombre à variables en plusieurs lignes i=0 et j =0

    while i < taille_gauche and j < taille_droite:
        if liste_gauche[i] < liste_droite[j]:
            resultat.append(liste_gauche[i])
            i += 1
        else:
            resultat.append(liste_droite[j])
            j += 1
    if i == taille_gauche:
        reste = taille_droite - j
        for _ in range(reste):
            resultat.append(liste_droite[j])
            j += 1
    elif j == taille_droite:
        reste = taille_gauche - i
        for _ in range(reste):
            resultat.append(liste_gauche[i])
            i += 1
    return resultat

liste_test = [randint(0,100) for _ in range (10)]
print(liste_test)
print(tri_fusion(liste_test))


[71, 95, 80, 8, 42, 73, 28, 29, 44, 67]
[71, 95, 80, 8, 42]
[73, 28, 29, 44, 67]
[71, 95]
[80, 8, 42]
[71]
[95]
[80]
[8, 42]
[8]
[42]
[73, 28]
[29, 44, 67]
[73]
[28]
[29]
[44, 67]
[44]
[67]
[8, 28, 29, 42, 44, 67, 71, 73, 80, 95]
