Problématique 12 : Programmation - Trier une liste - Corrigé
=================================

Avertissement technique
----------------------

Nous avons déjà vu que manipuler des listes peut être problématique en Python *(c'est le problème des variables "mémophages")*. Nous utiliserons quelques fois la fonction ``copy.deepcopy`` afin de faire des copies de nos listes pour les garder intactes tout au long de nos programmes.

Solutions non optimisées
-----------------------

Nous n'avons pas cherché à optimiser les solutions en préférant proposer des codes faciles à comprendre. Il y a une règle de base en programmation : d'abord faire un programme qui résout un problème avant de chercher à faire un programme performant *(il vaut marcher bien et lentement que vite et mal)*. 

Une fonction pour effectuer tous nos tests
---------------------------------------

Les fonctions ``tester`` et ``un_test`` vérifient le bon fonctionnement d'une fonction ``fonc_tri`` sur différents types de listes. Notons qu'avec Pyhon comparer des chaînes de caractères se demande via la même syntaxe que celle utiliser pour comparer des entiers : par exemple, ``"python" > "c"`` renverra ``True``. La compraison se fait ici comme dans un dictionnaire "papier" *(pour ceux qui savent pas ce qu'est un dictionnaire en papier, se rendre sur Wikipédia)*.

Notez bien les différents cas testés.

1. Deux cas particuliers importants : des listes avec des répétitions, et des listes déjà ordonnées, et d'autres ordonnées mais en sens inverse.
1. Des listes créées au hasard pour éventuellement débusquer un problème auquel nous n'aurions pas pensé.

In [2]:
import copy
import random


def un_test(fonc_tri, liste_test):
    liste_test_copiee = copy.deepcopy(liste_test)
    liste_test_triee  = fonc_tri(liste_test_copiee)

    liste_test_triee_par_python = sorted(liste_test)

    if liste_test_triee != liste_test_triee_par_python:
        print(
            "Fonction mise en défaut sur la liste suivante :\n{0}".format(liste_test),
            "",
            "Liste triée par la fonction :\n{0}".format(liste_test_triee),
            sep = "\n"
        )
        
        return False
        
    else:
        return True


def tester(fonc_tri):
    tests_reussis = True
    
    # Tests à la main
    for liste_test in [
        [2, 2, 2, 2, 2, 2, 2, 2, 2, 2], 
        [2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2], 
        [1, 1, 2, 3, 4, 4, 5, 6, 6, 6],
        [1, 1, 2, 3, 4, 4, 5, 6, 6, 6, 6],
        # La liste suivante est fabriquable via
        # ``[i for i in range(11)]``.
        [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
        # La liste suivante est fabriquable via
        # ``list(reversed(sorted([i for i in range(11)])))``.
        [10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0],
        [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

    ]:
    
        tests_reussis = un_test(fonc_tri, liste_test)
       
        if not tests_reussis:
            break

    # Tests au hasard si tout a fonctionné avant.
    if tests_reussis:
        for i in range(10**2):
            taille = random.randint(50, 10**3)

            # Liste d'entiers
            liste_test = [j for j in range(taille)]
            random.shuffle(liste_test)

            tests_reussis = un_test(fonc_tri, liste_test)

            if not tests_reussis:
                break

            # Liste de chaînes de caractères (voir les codes ASCII)
            liste_test = [chr(random.randint(97, 122)) for j in range(taille)]
            
            tests_reussis = un_test(fonc_tri, liste_test)

            if not tests_reussis:
                break

    if tests_reussis:
        print("Tests réussis !")

Tris de type "par sélection"
----------------------------

### Une version possible

Dans le code qui suit, à chaque itération ``minimum`` sera le minimum de la liste des éléments non encore rangés *(les "livres" à droite dans la bibliothèque M. LAB)*. Nous utilisons la fonction Python ``min`` pour obtenir ce minimum directement *(ceci était autorisé)*. Nous donnons juste après une version de ``tri_lab_bc`` qui ne fait pas appel à ``min`` mais à une fonction *"maison"* pour le plaisir de tout programmer à la main.


Dans le code suivant, nous utilisons aussi la méthode ``pop`` qui permet de récupérer et extraire un élément d'une liste. Ceci nous permet de modéliser l'action consistant à *"retirer"* les livres non rangés de la bibliothèque.


De plus, nous travaillons avec deux listes pour simplifier le code à savoir une liste des élements rangés à gauche, et une autre de ceux à trier qui restent à droite : ceci modélise la vision que nous avons lors du tri de la bibliothèque avec une partie bien rangée à gauche et une autre qui ne l'est pas à droite.

In [4]:
import copy

def tri_lab_bc(une_liste):
    une_liste_copie = copy.deepcopy(une_liste)
    
    liste_triee = []
    
    while(une_liste_copie != []):
        minimum    = min(une_liste_copie)
        pos_du_min = une_liste_copie.index(minimum)

        # ``une_liste_copie`` va avoir un élément de moins
        # correspondant à celui que nous sommes en train
        # de ranger.
        elt_min = une_liste_copie.pop(pos_du_min)

        liste_triee.append(elt_min)
    
    return liste_triee


# ------------- #
# -- TESTONS -- #
# ------------- #

tester(tri_lab_bc)

Tests réussis !


Voici une version n'utilisant pas la fonction **min** proposée par Python.

In [5]:
def trouve_min(une_liste):
    # Cette fonction renvoie le plus petit élément avec sa position.
    taille = len(une_liste)
    
    # Ce 1er test n'est pas obligatoire. Essayez de voir pourquoi 
    # dans la suite du code.
    if taille == 1:
        return une_liste[0], 0
    
    minimum    = une_liste[0]
    pos_du_min = 0
    
    for i in range(1, taille):
        elt_teste = une_liste[i]
        
        if elt_teste < minimum:
            minimum    = elt_teste
            pos_du_min = i

    return minimum, pos_du_min

    
def tri_lab_bc_manuel(une_liste):
    une_liste_copie = copy.deepcopy(une_liste)
    
    liste_triee = []
    
    while(une_liste_copie != []):
        minimum, pos_du_min = trouve_min(une_liste_copie)

        elt_min = une_liste_copie.pop(pos_du_min)

        liste_triee.append(elt_min)
    
    return liste_triee


# ------------- #
# -- TESTONS -- #
# ------------- #

tester(tri_lab_bc_manuel)

Tests réussis !


### Le vrai tri par sélection

Voici l'algorithme du tri par sélection pour une liste ``LISTE`` dont les éléments sont numérotés de $1$ à $n$ donc ``LISTE[1]`` sera le premier élément. Notez que l'on travaille sur une seule liste en raisonnant sur les indices sans avoir à fabriquer de nouvelles listes. Ceci est beaucoup mieux en terme de performance et de gestion de la mémoire !

    Pour i allant de 1 à n - 1:
        pos_du_min = i
        
        Pour j allant de i + 1 à n:
            Si LISTE[j] < LISTE[pos_du_min]:
                pos_du_min = j
        
        Si pos_du_min ≠ i:
            Échanger LISTE[i] et LISTE[pos_du_min]


Je vous laisse le soin de programmer cet algorithme.


**Remarque:** vous trouverez une solution possible dans [cette page](http://lwh.free.fr/pages/algo/tri/tri_selection.html) avec en plus des versions dans d'autres langages de programmation.

Pour les plus rapides - Deux autres types de tris... voire plus
------------------------------------------------------------

### Tris de type "par insertion"

#### Une version possible

Bien réfléchir à la différence avec le tri de type "par sélection". Ici nous rangeons au fur et à mesure que nous avançons tandis qu'avec le précédent tri nous parcourions sans arrêt les éléments non encore rangés pour y trouver le minimum à bien placer.


De nouveau nous travaillons avec deux listes pour simplifier le code. Avec ce choix, on peut penser à une autre situation concrète où deux personnes rangent une bibliothèque, l'une sortant un à un les livres à ranger, et l'autre les rangeant en direct au fur et à mesure en remplissant la bibliothèque. 

In [12]:
def decale_un_elt(une_liste, pos, elt_decale):
    # Ajout d'un nouvel élément tout à droite.
    if pos == len(une_liste):
        une_liste.append(elt_decale)

    # Simple insertion à la bonne position.
    else:
        une_liste[pos] = elt_decale
        
    return une_liste


def tri_insertion(une_liste):
    une_liste_copie = copy.deepcopy(une_liste)
    
    liste_triee = []

    while(une_liste_copie != []):
        elt_a_ranger = une_liste_copie.pop(0)
        
        taille = len(liste_triee) 

        bonne_pos = taille

        # Décalons...
        while(bonne_pos > 0):
            elt_en_cours = liste_triee[bonne_pos - 1]
            
            # Pas besoin d'aller plus à gauche dans la liste des éléments triés.
            if elt_en_cours <= elt_a_ranger:
                break

            # On décale vers la droite.
            liste_triee = decale_un_elt(liste_triee, bonne_pos, elt_en_cours)
            
            # On passe au précédent à gauche
            bonne_pos -= 1

        # Plaçons au bon endroit l'élement à ranger du moment.
        liste_triee = decale_un_elt(liste_triee, bonne_pos, elt_a_ranger)

    # Travail fini.
    return liste_triee


# ------------- #
# -- TESTONS -- #
# ------------- #

tester(tri_insertion)

Tests réussis !


#### Le vrai tri par insertion

Voici l'algorithme du tri par insertion pour une liste ``LISTE`` dont les éléments sont numérotés de $1$ à $n$ donc ``LISTE[1]`` sera le premier élément. Notez que l'on travaille juste sur les indices en modifiant la liste au coup par coup sans avoir à fabriquer de nouvelles listes ce qui est beaucoup mieux en treme de performance et de gestion de la mémoire !

    Pour i allant de 1 à n - 1:
        x = LISTE[i]
        j = i
        
        Tant que j > 0 et LISTE[j - 1] > x:
            LISTE[j] = LISTE[j - 1]
            j = j - 1
        
        LISTE[j] = x


Je vous laisse le soin de programmer cet algorithme.


**Remarque:** vous trouverez une solution possible dans [cette page](http://lwh.free.fr/pages/algo/tri/tri_insertion.html) avec en plus des versions dans d'autres langages de programmation. 

### Tris de type "par fusion"

#### Une version récursive possible

Le tri semble plus simple à faire de façon récursive. Nous donnons juste après une version non récursive.

In [13]:
def tri_fusion_recu(une_liste):
    # Il n'y a rien à trier car soit la list est vide, soit elle est de taille 1.
    if len(une_liste) <= 1:
        return une_liste

    # On crée les deux sous-listes dont l'une peut être vide.
    taille         = len(une_liste)
    presque_milieu = taille // 2  # Quotient entier d'une division euclidienne !
    
    sous_liste_gauche = une_liste[:presque_milieu]
    sous_liste_droite = une_liste[presque_milieu:]
    
    sous_liste_gauche = tri_fusion_recu(sous_liste_gauche)
    sous_liste_droite = tri_fusion_recu(sous_liste_droite)
    
    # Fusion des deux sous-listes bien ordonnées maintenant.
    liste_triee = []
    
    while(sous_liste_gauche != [] and sous_liste_droite != []):
        elt_gauche = sous_liste_gauche[0]
        elt_droite = sous_liste_droite[0]
        
        if elt_gauche == elt_droite:
            liste_triee += [elt_gauche, elt_droite]
            
            # On retire les éléments qui viennent d'être rangés.
            sous_liste_gauche.pop(0)
            sous_liste_droite.pop(0)

        elif elt_gauche < elt_droite:
            liste_triee.append(elt_gauche)
            
            # On retire l'élément qui vient d'être rangé.
            sous_liste_gauche.pop(0)

        else:
            liste_triee.append(elt_droite)
            
            # On retire l'élément qui vient d'être rangé.
            sous_liste_droite.pop(0)
     
    # Ajout des éléments éventuellement restants
    # de l'un, et seulement de l'un des deux côtés.
    if sous_liste_gauche != []:
        liste_triee += sous_liste_gauche
        
    elif sous_liste_droite != []:
        liste_triee += sous_liste_droite
    
    # Travail fini.
    return liste_triee


# ------------- #
# -- TESTONS -- #
# ------------- #

tester(tri_fusion_recu)

Tests réussis !


#### Une version non récursive possible

Pour voir comment "dérécursifier" le programme précédent, imaginons que nous soyons seuls à ranger les CDs, et que nous souhaitions tout de même garder la même technique de rangement. Comment allons-nous procéder ? Voici une méthode possible.

1. On aligne tous les CDs par groupe de deux. Il se peut que nous ayons à la fin un éventuel CD isolé. Ceci n'est pas gênant.

1. On range chaque groupe de deux CDs.

1. On fait des nouveaux groupes de quatre par fusion de groupes voisins de deux CDs, avec à la fin un éventuel groupe de moins de quatre CDs à fusionner.

1. On répète le processus de fusion à chaque fois avec des groupes deux fois plus grands de CDs avec à la fin un éventuel groupe plus petit que les autres.


Ceci vous aidera à comprendre le code non récursif suivant qui travaille avec les indices.

In [14]:
def tri_fusion_non_recu(une_liste):
    une_liste_copie = copy.deepcopy(une_liste)
    
    taille = len(une_liste_copie)

    # Rangement des groupes de deux consécutifs.
    for i in range(0, taille - 1, 2):
        if une_liste_copie[i + 1] < une_liste_copie[i]:
            une_liste_copie[i], une_liste_copie[i + 1] = une_liste_copie[i + 1], une_liste_copie[i]

    # Fusions successives.
    taille_groupe = 2
    
    while(taille_groupe < taille):
        liste_triee = []
        
        for pos_gauche in range(0, taille, taille_groupe * 2):
            pos_droite = pos_gauche + taille_groupe

            pos_gauche_max = pos_gauche + taille_groupe
            pos_droite_max = min(pos_gauche + 2*taille_groupe, taille)

            while(
                pos_gauche < pos_gauche_max
                and
                pos_droite < pos_droite_max
            ):
                elt_gauche = une_liste_copie[pos_gauche]
                elt_droite = une_liste_copie[pos_droite]
            
                if elt_gauche == elt_droite:
                    liste_triee += [elt_gauche, elt_droite]

                    pos_gauche += 1
                    pos_droite += 1

                elif elt_gauche < elt_droite:
                    liste_triee.append(elt_gauche)

                    pos_gauche += 1

                else:
                    liste_triee.append(elt_droite)
                    
                    pos_droite += 1

            # Ajout des éléments éventuellement restants
            if pos_gauche < pos_gauche_max:
                liste_triee += une_liste_copie[pos_gauche: pos_gauche_max]

            elif pos_droite < pos_droite_max:
                liste_triee += une_liste_copie[pos_droite: pos_droite_max]

        # On continue avec des groupes deux fois plus grands.
        une_liste_copie = copy.deepcopy(liste_triee)

        taille_groupe *= 2
    
    # Travail fini.
    return liste_triee


# ------------- #
# -- TESTONS -- #
# ------------- #

tester(tri_fusion_non_recu)

Tests réussis !


#### Le vrai tri par fusion

Voici l'algorithme du tri par fusion pour une liste ``LISTE`` dont les éléments sont numérotés de $1$ à $n$ donc ``LISTE[1]`` sera le premier élément.

    Si LISTE est vide:
        Renvoyer LISTE
    
    Sinon:
        LISTE_GAUCHE = partie gauche de LISTE qui a été "coupée en deux"
        LISTE_DROITE = partie droite restante de LISTE qui a été "coupée en deux"

        Trier LISTE_GAUCHE via un tri fusion.
        Trier LISTE_DROITE via un tri fusion.
        
        Renvoyer la fusion ordonnée de LISTE_GAUCHE et LISTE_DROITE


Le premier code proposé comme solution est une traduction possible de l'algorithme du vrai tri par fusion. Pour la seconde version, il y a matière à débat *(notez que la version non récursive construit moins de listes supplémentaires que la première)*.


**Remarque:** vous trouverez dans [cette page](http://lwh.free.fr/pages/algo/tri/tri_fusion.html) des versions du tri par fusion dans d'autres langages de programmation.

### Provenance des images dans l'énoncé

Wikipédia tout simplement.