<a href="https://colab.research.google.com/github/othoni-hub/NSI/blob/main/MEEF_NSI_Tris.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **UCO M1-MEEF NSI**

**TP Algorithmes de tris - Approches de la complexité**

**Olivier THÖNI** - UCO-IFUCOME (groupes "Mathématiques" et "NSI")

<img src="https://drive.google.com/uc?id=12Wo3LubGGT4qOvYFAuLP4CyCuwjKNVuk" width="230" height="150" align = "right"/>

*document à l'usage exclusif des personnes un jour actrices (enseignant·es, étudiant·es) du master MEEF NSI de l'UCO*


---


Ce Notebook est à rapprocher de la leçon d'oral L08.

## **0. Outils généraux**


### **0.a/ Générer une liste d'entiers classée aléatoirement**

Soit N un entier on cherche à générer une liste des entiers de 1 à N, classés aléatoirement.

* **Idée algorithmique :**

On génère une liste aléatoire de flottants tous entre 0 et 1, et pour chacun, on détermine le nombre d'éléments de la liste qui lui sont supérieurs.

In [None]:
def liste_aleatoire(N) :
    ''' Cette fonction reçoit en entrée un entier N
    et renvoie une liste L des entiers de 1 à N, dans un ordre aléatoire'''

    import numpy.random as rd
    U = rd.random(N)
    #print(U)
    L = [sum(U >= U[i]) for i in range(N)]
    return L


In [None]:
liste_aleatoire(5)

[3, 2, 1, 5, 4]

###**0.b/ Tester si une liste est classée**

* **Idée algorithmique**

Pour vérifier si une liste est classée en ordre croissant, on teste, si chaque terme est inférieur (ou égal si la liste à classer peut comporter des doublons) au suivant.

In [None]:
def classee(Liste):
    '''Cette fonction reçoit une liste 
    et retourne vrai si la liste est rangée dans l'ordre croissant'''

    test = True
    k = 0
    while test == True and k < len(Liste) - 1:
        if Liste[k] > Liste[k+1]:
            test = False
        k = k+1
    return test




**tests :**

In [None]:
L = [1,2,3,4,5]
classee(L)

True

In [None]:
L = [1,3,2,4,5]
classee(L)

False

## **1. Le tri du singe ("*Bogo Sort*")**



### **1.a/ Idée algorithmique**

L'idée algorithmique est simple 
* on donne un ordre au hasard à la liste jusqu'à obtenir une liste classée...


### **1.b/ Programmation**

In [None]:
def bogo_sort(N):
    '''Cette fonction reçoit l'entier N, longueur d'une liste d'entiers,
    exécute la fonction "liste_aleatoire" jusqu'à ce que le résultat soit une liste rangée dans l'ordre croissant
    et renvoie le nombre d'itérations'''

    L = liste_aleatoire(N)
    #print(L)
    k = 1
    while not(classee(L)):
        L = liste_aleatoire(N)
        #print(L)
        k = k+1
    return k

**test**

In [None]:
N = 5
print('Bogo Sort sur une liste de ' + str(N) +' valeurs :')
print("Nombre d'itérations nécessaires : " + str(bogo_sort(N)))


Bogo Sort sur une liste de 5 valeurs :
Nombre d'itérations nécessaires : 206


### **1.c/ Terminaison et complexité**

#### **1.c/*(i)* Terminaison**

La 1<sup>ère</sup> vertu que l'on attend de l'exécution d'un algorithme est qu'il se termine un jour... Car l'éternité, c'est long, surtout vers la fin !!!

On étudie alors les structures répétitives, et on observe ce qui assure qu'elles vont se terminer :
* s'il s'agit d'une **boucle bornée**, aucun souci, on n'y passe qu'un nombre fini de fois.

* s'il s'agit d'une **boucle non bornée**, on cherche le **"variant de boucle"** : la quantité qui intervient dans le test de sortie de la boucle, et qui doit, à chaque étape, progresser vers la sortie.

**exemple :** "*Tant que k > 1...*" : si k ne diminue pas à chaque étape, il y a un risque que la boucle ne s'arrête jamais...

* s'il s'agit d'une **fonction récursive**, il en est de même : elle contient ce qu'il faut exécuter pour faire cesser les appels récursifs, et ce qui permettra que cette condition soit atteinte, c'est le même principe que le variant de boucle.

Dans le cas du **bogo-sort**, on ne pourra pas prouver la terminaison de ce programme autrement que par des arguments probabilistes : le risque que le hasard ne sorte jamais la liste classée tend vers 0.

Les mathématiciens disent qu'ils sont "*presque sûrs*" que cela arrivera, ce qui signifie qu'ils sont sûrs que cela arrivera, mais qu'ils ne savent pas dire quand (on ne peut pas "*majorer*" le nombre d'itérations nécessaires).
Mais comme la probabilité dont il est question plus haut est décroissante et est une valeur positive, elle forme une suite de valeurs convergente (en maths, cela s'appelle le "*théorème de la limite monotone*")

*Prenons un exemple : si l'on joue à "Pile" ou "Face", la probabilité pour que le 1<sup>er</sup> "Pile" sorte au bout de 5 lancers de la pièce est de : $p_5 = \frac{1}{2} \times\frac{1}{2} \times\frac{1}{2} \times\frac{1}{2} \times\frac{1}{2} = \left ( \frac{1}{2} \right )^5 = 0.03125$.*

*La probabilité que cela demande 6 lancers est encore deux fois plus petite : $p_6 =  \left ( \frac{1}{2} \right )^6 $.*

*On ne sait pas dire quand le premier "Pile" arrivera, on ne peut même pas assurer qu'il faudra moins de 10000 coups, mais on est sûr que ça arrivera...*


#### **1.c/*(ii)* 1<sup>ère</sup> mesure de la complexité**

La complexité est l'instrument de mesure du temps d'exécution du programme, et de la place en mémoire qu'il occupera.

Le nombre d'itérations est un bon indicateur de la complexité en temps.
Ici, on peut aussi ajouter un compteur dans la fonction "classee()", qui s'incrémente après chaque comparaison. Il faut alors le passer en paramètre et le retourner en fin de fonction.

**On exprime la complexité en donnant un ordre de grandeur, qui dépend, pour un tri, du nombre de données N à trier.**



**Résultat théorique :** 

Il y a 5! (5x4x3x2x1) = 120 façons de ranger 5 nombres. En moyenne, il faudra donc 120 itérations pour que le hasard sorte une liste classée, mais cette moyenne est très instable !

Le test de chaque liste, pour savoir si elle est rangée ou non va demander au plus 4 comparaisons.
Plus généralement, s'il y a N valeurs à classer, il faudra en moyenne $N!$ essais avant que le hasard ne sorte une liste déjà rangée, et il faudra (N-1) comparaisons pour tester une liste.
N-1 et N, quand N est grand, sont du même ordre de grandeur.

Ainsi, en tout, ***l'algorithme "*Bogo-Sort*" aura une complexité en ${N \times N!}$.**

**On écrira que la complexité est en $\mathcal{O} (N\times N!)$, ce que l'on lit en "La complexité est un "Grand-O" de N".**


**Régles de calcul sur les $\mathcal{O} (...)$ :**

Plutôt que de compter exhaustivement le nombre d'itérations nécessaires, on fait, grâce aux **"Grand-O"** des arrondis à chaque étape.

Ainsi , si $\alpha$ et $\beta$ sont des nombres réels non nul, 
* un $\mathcal{O} (N^\alpha)$ + un $\mathcal{O} (N^\alpha)$ reste un $\mathcal{O} (N^\alpha)$.
* un $\mathcal{O} (N^\alpha)$ + un $\mathcal{O} (N^\beta)$ donne un $\mathcal{O} (N^\alpha)$ dès lors que $\alpha > \beta$.
* un $\mathcal{O} (N^\alpha)$ multiplié par un réel reste un $\mathcal{O} (N^\alpha)$.
* un $\mathcal{O} (N^\alpha)$ multiplié par un $\mathcal{O} (N^\beta)$ donne un $\mathcal{O} (N^{\alpha + \beta})$.
* le logarithme d'un $\mathcal{O} (N^\alpha)$ (comprendre "le logarithme d'une quantité dont l'ordre de grandeur est $N^\alpha$") donne un $\mathcal{O} (ln(N^\alpha))$, c'est-à-dire un $\alpha \mathcal{O} (ln(N))$, , en vertu des propriétés de la fonction logarithme, c'est-à-dire en définitive un $\mathcal{O} (ln(N))$.
* l'exponentielle d'un $\mathcal{O} (N^\alpha)$ donne un $\mathcal{O} (e^{(N^\alpha)})$, c'est-à-dire un $ \mathcal{O} (e^{\alpha \times N})$, ou encore $\mathcal{O} (e^\alpha \times e^{N})$, en vertu des propriétés de la fonction exponentielle, c'est-à-dire finalement un $\mathcal{O} (e^{N})$.
* etc.


**Croissances comparées des ordres de grandeurs**

<img src="https://drive.google.com/uc?id=11cyRPEoJe34la4sOCua6EfwjKw3cLnC4" width="600" height="420" />



### **1.d/ Relevé du nombre d'itérations pour un nombre variable N de valeurs**

Nous allons effectuer un relevé du nombre d'itérations pour le Bogo Sort, selon le nombre N de valeurs à trier.

Nous générerons un fichier csv, que nous irons traiter dans un tableur, pour récupérer l'équation d'une courbe de tendance.

In [None]:
liste_N = list(range(3,9))*4
liste_nb_iter = [bogo_sort(N) for N in liste_N]
liste_nb_iter

[1,
 80,
 85,
 1992,
 9311,
 59975,
 2,
 10,
 41,
 697,
 7169,
 39964,
 11,
 23,
 134,
 487,
 3626,
 50904,
 8,
 26,
 90,
 1235,
 8292,
 157703]

* **écriture des résultats dans un fichier *.csv***

In [None]:
import csv

with open('SauvegardeTable1.csv', 'w', newline='') as csvfile:
    writer = csv.writer(csvfile, delimiter=';')
    writer.writerow(liste_N)
    writer.writerow(liste_nb_iter)

from google.colab import files
files.download("SauvegardeTable1.csv")

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

* **affichage de la courbe de tendance dans le tableur**

Le bloc de commmande ci-dessus télécharge le fichier csv obtenu.
On l'ouvre dans un tableur, on généère un nuage de points avec les deux lignes du tableau, puis on demande une **"courbe de tendances"** dont on fait affficher l'équation.



<img src="https://drive.google.com/uc?id=188jpwbDg-phZsf9Z4qNmKWDssjB1oAVh" width="800" height="300" />

On voit qu'une complexité exponentielle est dépassée ($N!$ est du même ordre de grandeur que l'exponentielle).

**La pareille dans Google Sheet**

* Ouvrir le fichier téléchargé dans Excel et l'enregistrer en **.xlsx**.

* L'importer dans **Google Drive**, et l'ouvrir ave **Google Sheet**.
* **Insérer** le **nuage de  points**, double-cliquer sur un des points du nuage pour faire afficher l'**éditeur de graphiques**, puis dans le choix **"Série"**, demander la **courbe de tendance**.

<img src="https://drive.google.com/uc?id=15EKXLe9X4b62IgG4WPoo5BSxy18Ep3E0" width="800" height="300" />


## **2. Le tri par sélection**

### **2.a/ Principe algorithmique**
* On parcourt la liste non triée à la recherche du plus grand élément, 
* on le permute avec le dernier,
* on recommence avec la liste privée du dernier élément, qui devient la nouvelle liste non triée, 
* jusqu'à ce que la liste non triée ne contienne plus qu'un élément.

On dit que ce type de tri se déroule "en place" car on n'a pas besoin de recopier la liste.

### **2.b/ Correction de l'algorithme : notion d'invariant de boucle**




#### **2.b/*(i)* : De quoi s'agit-il ?**

Après la terminaison, la 2<sup>nde</sup> vertu que l'on attend d'une fonction ou d'un algorithme est qu'ils founissent le résultat pour lequel ils ont été spécifiés, c'est ce que l'on appelle la **correction**.

Établir la correction d'un algorithme, c'est s'assurer que, quelles que soient les données qu'on lui fournira en entrée, il produira bien le résultat qu'on attend de lui.

Pour un algorithme de tri, il faut qu'on s'assure... qu'il trie...

L'outil utilisé pour prouver la correction est l'**invariant de boucle**. On désigne sous cette appellation une **propriété qui, si elle était vraie avant la boucle, reste vraie à la sortie**.

C'est le principe mathématique de **récurrence**.

Pour établir selon le **principe de récurrence** une propriété que nous nommerons  $(\mathcal{P}_n)$ quel que soit l'entier n, 
* 1. **initialisation :**
On vérifie que la propriété $(\mathcal{P}_0)$ est vraie, c'est-à-dire dans l'état initial $n=0$,
* 2. **hérédité :**
puis on établit que, si cette propriété est vraie après $k$ itérations, c'est-à-dire que $(\mathcal{P}_k)$ est vraie, alors, elle est vraie aussi après $k+1$ itérations, c'est-à-dire que $(\mathcal{P}_{k+1})$ est vraie.

#### **2.c/*(ii)* Démonstration de la correction de l'algorithme de tri par sélection**

Il s'agit de démontrer que, quel que soit la liste fournie en entrée $L$, de longueur $N$, on a bien en sortie la même liste, mais triée.

Considérons la propriété : $(\mathcal{P}_n)$ : **"*Quel que soit l'entier $n$ compris entre 0 et $N$, après $n$ itérations, la sous-liste de $n$ éléments placés à droite de la liste :  $L[N - n - 1,N-1]$ est triée.*"**

* La propriété est initialisée : en effet, après 0 itération, la liste L contient *a priori* 0 élément trié en fin de liste. $(\mathcal{P}_0)$ est donc vraie.
* Supposons maintenant que $k$ itérations aient été effectuées, et que la liste contienne aux $k$ dernières places, les $k$ plus grandes valeurs de la liste, bien triées, c'est-à-dire que la propriété $(\mathcal{P}_k)$ est supposée vraie, 
 
 alors, on va ensuite chercher le plus grand élément de l'autre sous-liste, qui est lui-même plus petit que le plus petit élément de la sous-liste triée à droite, et on va le mettre à gauche de la sous-liste triée. La sous-liste de droite contiendra bien alors les $k+1$ plus grandes valeurs de la liste $L$, triées dans l'ordre coissant. Ainsi, $(\mathcal{P}_{k+1})$ est vraie.
  
  Ceci établit l'hérédité et permet de conclure, selon le principe de récurrence, que, quel que soit l'entier $n$ compris entre 0 et $N$, après l'itération n°$n$, la liste $L$ contient à sa droite ses $n$ plus grands éléments, bien triés dans l'ordre croissant.


### **2.c/ Programmation**

On s'interdit d'utiliser les boîtes noires telles la fonction "max" permettant de déterminer la valeur maximale d'une liste, car cela masquerait toute problématique de complexité...

In [None]:
def cherche_max(L) :
    '''Cette fonction reçoit en entrée une liste et retourne sa valeur maximale et son rang'''
    maxi = L[0]
    rang_maxi = 0
    for k in range(1,len(L)) :
        if L[k] > maxi :
            maxi = L[k]
            rang_maxi = k
    return maxi,rang_maxi

In [None]:
#test
L = liste_aleatoire(5)
maxi, rang_maxi = cherche_max(L)
print(L)
print('rang de la valeur maximale : ' + str(rang_maxi))


[5, 3, 1, 2, 4]
rang de la valeur maximale : 0


In [None]:
def tri_selection(L) :
    '''Cette fonction reçoit une liste et retourne le nombre d'itérations pour que cette liste soit rangée dans l'ordre croissant'''
    longueur = len(L)
    k = 1
    while longueur > 1:
        maxi, rang_maxi = cherche_max(L[0:longueur])
        L[rang_maxi], L[longueur-1] = L[longueur-1], L[rang_maxi] # permutation
        print(L)
        longueur = longueur - 1
        k = k+1
    return k

In [None]:
L = liste_aleatoire(5)
print(L)
k = tri_selection(L)
k

[4, 3, 1, 2, 5]
[4, 3, 1, 2, 5]
[2, 3, 1, 4, 5]
[2, 1, 3, 4, 5]
[1, 2, 3, 4, 5]


5

### **2.d/ Terminaison et complexité**

La longueur de la liste restant à trier (**variant de la boucle**) va en décroissant, jusqu'à valoir 1 (où la sous-liste à trier ne contiendra plus alors qu'un élément, et sera donc, de fait, triée). Donc l'algorithme se termine.

* La fonction de recherche du maximum d'une liste de longueur $n$, demande $n$ itérations.
* Cette fonction va être parcourue d'abord sur la liste de longueur $N$, puis sur une liste de longueur $N-1$, puis $N-2$, etc. jusqu'à une liste de longueur 1.
Elle sera donc parcourue $1+2+...+(N-1)+N$ fois, ce que l'on note en mathématiques :  
$$\sum_{n=0}^{N}n$$
et qui vaut, selon Gauss, $\frac{n (n+1)}{2} = \frac{1}{2}  ( n^2 + n) = \mathcal{O}(n^2)$

La complexité en temps de l'algorithme de tri par sélection est donc de l'ordre $\mathcal{O}(n^2)$.



## **3. Tri par insertion**

### **3.a/ Principe algorithmique**
* On prend le premier élément de la partie liste non triée,  
* on cherche sa place dans la partie de liste triée,
* on l'insère à cet endroit en décalant ceux d'après d'un cran vers la droite,
* jusqu'à ce que la liste non triée soit vide.

Il s'agit, à l'instar du tri par sélection, d'un tri "en place" également, mais on pourrait, pour plus de lisibilité peut-être, séparer la liste triée du restant non trié.

### **3.b/ Correction**

Quel est l'invariant de boucle ?

Prouver alors la correction de l'algorithme de tri par insertion.

### **3.c/ Programme**

In [None]:
def cherche_place(L,valeur) :
    '''cette fonction reçoit une sous-liste triée, et une valeur
    Elle renvoie la place d'insertion de la valeur dans la liste'''
    place = 0
    for k in range(len(L)) :
        if L[k] < valeur :
            place = k+1
    return place

**test**

In [None]:
sous_liste_triee = [1]
valeur = 2
place = cherche_place(sous_liste_triee,valeur)
place

1

In [None]:
L = [1,2,5,4,7,3,6]
sous_liste_triee = [1,2,5] 
valeur = 4
place = cherche_place(sous_liste_triee,valeur)
place

2

In [None]:
def insere(L, valeur):
    '''Cette fonction reçoit une liste triée, une valeur à insérer, cherche la place d'insertion
    et retourne la liste triée avec la valeur à sa place.'''
    place = cherche_place(L,valeur)
    print('rang : ' + str(place))
    debut = L[:place]
    debut.append(valeur)
    fin = L[place:]
    L = debut+fin
    return L


**test**

In [None]:
sous_liste_triee = insere(sous_liste_triee , valeur)
sous_liste_triee

rang : 2


[1, 2, 4, 5]

In [None]:
lon = len(sous_liste_triee)
sous_liste_non_triee = L[lon :]
sous_liste_non_triee


[7, 3, 6]

In [None]:
L = sous_liste_triee + sous_liste_non_triee
L

[1, 2, 4, 5, 7, 3, 6]

In [None]:
def tri_insertion(L):
    '''Cette fonction reçoit une liste L en désordre et renvoie la liste triée en ordre croissant'''
    longueur = len(L)
    
    sous_liste_triee = [L[0]]
    sous_liste_non_triee = L[1:] #recopie superficielle
    for k in range(1,longueur) :
        valeur = L[k]
        print("valeur à classer : " + str(valeur))
        sous_liste_triee = insere(sous_liste_triee , valeur)
        lon = len(sous_liste_triee)
        sous_liste_non_triee = L[lon :]
        L = sous_liste_triee + sous_liste_non_triee
        print(L)



In [None]:
L = [1,2,5,4,7,3,6]
tri_insertion(L)

valeur à classer : 2
rang : 1
[1, 2, 5, 4, 7, 3, 6]
valeur à classer : 5
rang : 2
[1, 2, 5, 4, 7, 3, 6]
valeur à classer : 4
rang : 2
[1, 2, 4, 5, 7, 3, 6]
valeur à classer : 7
rang : 4
[1, 2, 4, 5, 7, 3, 6]
valeur à classer : 3
rang : 2
[1, 2, 3, 4, 5, 7, 6]
valeur à classer : 6
rang : 5
[1, 2, 3, 4, 5, 6, 7]


### **3.d/ Terminaison et complexité**



#### **3.d/*(i)* Preuve et calcul**

Justifier la terminaison de l'algorithme de tri pas insertion et donner un ordre de grandeur de sa complexité.

#### **3.d/*(ii)* Mesure expérimentale de la complexité**

Faisons d'abord un peu de ménage dans nos fonctions...

Nous allons utiliser le temps d'exécution comme instrument de mesure de la complexité en temps... assez logique, en fait...

Pour cela, introduisons un chrono dans notre fonction 'tri_insertion'


In [None]:
import time
from math import floor

def liste_aleatoire(N) :
    ''' Cette fonction reçoit en entrée un entier N
    et renvoie une liste L des entiers de 1 à N, dans un ordre aléatoire'''

    import numpy.random as rd
    U = rd.random(N)
    #print(U)
    L = [sum(U >= U[i]) for i in range(N)]
    return L

def cherche_place(L,valeur) :
    '''cette fonction reçoit une sous-liste triée, et une valeur
    Elle renvoie la place d'insertion de la valeur dans la liste'''
    place = 0
    for k in range(len(L)) :
        if L[k] < valeur :
            place = k+1
    return place

def insere(L, valeur):
    '''Cette fonction reçoit une liste triée, une valeur à insérer, cherche la place d'insertion
    et retourne la liste triée avec la valeur à sa place.'''
    place = cherche_place(L,valeur)
    debut = L[:place]
    debut.append(valeur)
    fin = L[place:]
    L = debut+fin
    return L

def tri_insertion(L):
    '''Cette fonction reçoit une liste L en désordre, trie la liste en ordre croissant par le tri par insertion
    et renvoie le temps d'exécution'''
    t = time.time()

    longueur = len(L)
    
    sous_liste_triee = [L[0]]
    sous_liste_non_triee = L[1:] #recopie superficielle
    for k in range(1,longueur) :
        valeur = L[k]
        sous_liste_triee = insere(sous_liste_triee , valeur)
        lon = len(sous_liste_triee)
        sous_liste_non_triee = L[lon :]
        L = sous_liste_triee + sous_liste_non_triee

    t = floor((time.time() - t)*1000000)
    return t


In [None]:
L = liste_aleatoire(100)
print(str(tri_insertion(L)) + " µs")


704 µs


In [None]:
liste_N = list(range(1,100))
liste_temps = []
for N in liste_N :
    L = liste_aleatoire(N)
    temps_exec = tri_insertion(L)
    liste_temps.append(temps_exec)


In [None]:
import csv

with open('SauvegardeTable2.csv', 'w', newline='') as csvfile:
    writer = csv.writer(csvfile, delimiter=';')
    writer.writerow(liste_N)
    writer.writerow(liste_temps)

from google.colab import files
files.download("SauvegardeTable2.csv")

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

**Courbe de tendances du tri par insertion, selon la taille de la liste à trier**

Cela confirme le comportement en $\mathcal{O}(N^2)$

<img src="https://drive.google.com/uc?id=1qY8e77Uy8zn-0q5Ca-czEBQ5DMqBOcOC" width="450" height="300" />

(NB : l'indice R² est un indicateur de la qualité de l'approximation du nuage de points par sa courbe de tendances : plus il est proche de 1, meilleure est l'approximation)



# **4. L'algorithme de tri de Terminale : le tri fusion (méthode "Diviser pour régner")**

## **4.a/ Principe algorithmique**
Le **tri fusion** est l'occasion d'amener un algorithme récursif. 
Il comprend deux phases :    
* tout d'abord on **divise** la liste en deux listes (de taille deux fois plus petites évidemment), jusqu'à ce que les listes obtenues soient de longueur 1, auquel cas, elle sont *a fortiori* triées.
* puis, on **fusionne** les listes, c'est-à-dire qu'on les **inter-classe**, (on parle aussi d'**"intercalation"**) et de proche en proche, on remonte ainsi, de fusion en fusion, à la liste initiale triée.

**exemple :**

<img src="https://upload.wikimedia.org/wikipedia/commons/6/60/Mergesort_algorithm_diagram.png" width="350" height="360" />
(source image Wikipedia)


## **4.b/ Fonctions récursives**

**illustration ici :** http://lwh.free.fr/pages/algo/tri/tri_fusion.html

In [None]:
def fusion(L1,L2):
    '''Cette fonction reçoit deux listes triées et 
    renvoie la liste obtenue en les fusionnant par inter-classement'''
    #index
    i1,i2 = 0,0
    n1,n2 = len(L1),len(L2)
    L=[]
    while i1 < n1 and i2 < n2 : # Tant qu'on n'a pas vidé l'une des deux listes,
                                # on ajoute à la liste fusionnée le plus petit 
                                # des deux premiers éléments de chaque liste
                                # non encore entrés dans la fusion 
        if L1[i1] < L2[i2]: 
            L.append(L1[i1]) 
            i1 = i1 + 1
        else:
            L.append(L2[i2])
            i2 = i2 + 1
    # Quand l'une des deux listes à fusionner est finie, on complète la liste finale
    # avec ce qu'il reste de l'autre
    if i1 == n1:
        L.extend(L2[i2:])
    else:
        L.extend(L1[i1:])
    print(L)
    return L
     



**test**

In [None]:
L1 = [1,3,4,7,8]
L2 = [2,5,6,9,10,11,12]
L = fusion(L1,L2)
L

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]


[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]

In [None]:
def tri_fusion(L):
    print(L)
    if len(L) <= 1:
        return L
    # On coupe la liste en deux parts de même longueur (+ ou - 1)
    milieu = len(L) // 2
    gauche = L[:milieu] # sous-liste de gauche
    droite = L[milieu:] # sous-liste de droite

    gauche = tri_fusion(gauche) # appel récursif du tri fusion sur la sous-liste de gauche
    droite = tri_fusion(droite) # appel récursif du tri fusion sur la sous-liste de droite

    L = fusion(gauche, droite)
    return L


**test**

In [None]:
L = liste_aleatoire(16)
L

[3, 16, 6, 14, 2, 4, 11, 9, 1, 10, 7, 15, 13, 5, 12, 8]

In [None]:
tri_fusion(L)

[3, 16, 6, 14, 2, 4, 11, 9, 1, 10, 7, 15, 13, 5, 12, 8]
[3, 16, 6, 14, 2, 4, 11, 9]
[3, 16, 6, 14]
[3, 16]
[3]
[16]
[3, 16]
[6, 14]
[6]
[14]
[6, 14]
[3, 6, 14, 16]
[2, 4, 11, 9]
[2, 4]
[2]
[4]
[2, 4]
[11, 9]
[11]
[9]
[9, 11]
[2, 4, 9, 11]
[2, 3, 4, 6, 9, 11, 14, 16]
[1, 10, 7, 15, 13, 5, 12, 8]
[1, 10, 7, 15]
[1, 10]
[1]
[10]
[1, 10]
[7, 15]
[7]
[15]
[7, 15]
[1, 7, 10, 15]
[13, 5, 12, 8]
[13, 5]
[13]
[5]
[5, 13]
[12, 8]
[12]
[8]
[8, 12]
[5, 8, 12, 13]
[1, 5, 7, 8, 10, 12, 13, 15]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16]


[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16]

**Visualisation dans PythonTutor**

In [None]:
!pip install metakernel

from metakernel import register_ipython_magics
register_ipython_magics()

Collecting metakernel
  Downloading metakernel-0.28.1-py2.py3-none-any.whl (217 kB)
[?25l[K     |█▌                              | 10 kB 18.5 MB/s eta 0:00:01[K     |███                             | 20 kB 19.2 MB/s eta 0:00:01[K     |████▌                           | 30 kB 22.4 MB/s eta 0:00:01[K     |██████                          | 40 kB 25.1 MB/s eta 0:00:01[K     |███████▌                        | 51 kB 27.0 MB/s eta 0:00:01[K     |█████████                       | 61 kB 28.5 MB/s eta 0:00:01[K     |██████████▋                     | 71 kB 27.5 MB/s eta 0:00:01[K     |████████████                    | 81 kB 29.1 MB/s eta 0:00:01[K     |█████████████▋                  | 92 kB 27.9 MB/s eta 0:00:01[K     |███████████████                 | 102 kB 26.4 MB/s eta 0:00:01[K     |████████████████▋               | 112 kB 26.4 MB/s eta 0:00:01[K     |██████████████████              | 122 kB 26.4 MB/s eta 0:00:01[K     |███████████████████▋            | 133 kB 26.4

In [None]:
%%tutor # lancement de PythonTutor

def fusion(L1,L2):
    '''Cette fonction reçoit deux listes triées et 
    renvoie la liste obtenue en les fusionnant par inter-classement'''
    #index
    i1,i2 = 0,0
    n1,n2 = len(L1),len(L2)
    L=[]
    while i1 < n1 and i2 < n2 : # Tant qu'on n'a pas vidé l'une des deux listes,
                                # on ajoute à la liste fusionnée le plus petit 
                                # des deux premiers éléments de chaque liste
                                # non encore entrés dans la fusion 
        if L1[i1] < L2[i2]: 
            L.append(L1[i1]) 
            i1 = i1 + 1
        else:
            L.append(L2[i2])
            i2 = i2 + 1
    # Quand l'une des deux listes à fusionner est finie, on complète la liste finale
    # avec ce qu'il reste de l'autre
    if i1 == n1:
        L.extend(L2[i2:])
    else:
        L.extend(L1[i1:])
    return L
     

 
def tri_fusion(L):
    if len(L) <= 1:
        return L
    # On coupe la liste en deux parts de même longueur (+ ou - 1)
    milieu = len(L) // 2
    gauche = L[:milieu] # sous-liste de gauche
    droite = L[milieu:] # sous-liste de droite

    gauche = tri_fusion(gauche) # appel récursif du tri fusion sur la sous-liste de gauche
    droite = tri_fusion(droite) # appel récursif du tri fusion sur la sous-liste de droite

    L = fusion(gauche, droite)
    return L



#L = [ 2, 6, 3, 4, 5, 1]
L =[3,1,4,5,2]
tri_fusion(L)

In [None]:
def liste_aleatoire(N) :
    ''' Cette fonction reçoit en entrée un entier N
    et renvoie une liste L des entiers de 1 à N, dans un ordre aléatoire'''

    import numpy.random as rd
    U = rd.random(N)
    #print(U)
    L = [sum(U >= U[i]) for i in range(N)]
    return L


def fusion(L1,L2):
    '''Cette fonction reçoit deux listes triées et 
    renvoie la liste obtenue en les fusionnant par inter-classement'''
    #index
    i1,i2 = 0,0
    n1,n2 = len(L1),len(L2)
    L=[]
    while i1 < n1 and i2 < n2 : # Tant qu'on n'a pas vidé l'une des deux listes,
                                # on ajoute à la liste fusionnée le plus petit 
                                # des deux premiers éléments de chaque liste
                                # non encore entrés dans la fusion 
        if L1[i1] < L2[i2]: 
            L.append(L1[i1]) 
            i1 = i1 + 1
        else:
            L.append(L2[i2])
            i2 = i2 + 1
    # Quand l'une des deux listes à fusionner est finie, on complète la liste finale
    # avec ce qu'il reste de l'autre
    if i1 == n1:
        L.extend(L2[i2:])
    else:
        L.extend(L1[i1:])
    return L
     

 
def tri_fusion(L):
    if len(L) <= 1:
        return L
    # On coupe la liste en deux parts de même longueur (+ ou - 1)
    milieu = len(L) // 2
    gauche = L[:milieu] # sous-liste de gauche
    droite = L[milieu:] # sous-liste de droite

    gauche = tri_fusion(gauche) # appel récursif du tri fusion sur la sous-liste de gauche
    droite = tri_fusion(droite) # appel récursif du tri fusion sur la sous-liste de droite

    L = fusion(gauche, droite)
    return L



In [None]:
import time
from math import floor
liste_exp = range(1,13)
liste_N = [2**n for n in liste_exp]
liste_temps = []
for N in liste_N :
    L = liste_aleatoire(N)
    t = time.time()
    tri_fusion(L)
    temps_exec = floor((time.time() - t)*100000)
    liste_temps.append(temps_exec)


In [None]:
import csv

with open('SauvegardeTable3.csv', 'w', newline='') as csvfile:
    writer = csv.writer(csvfile, delimiter=';')
    writer.writerow(liste_N)
    writer.writerow(liste_temps)

from google.colab import files
files.download("SauvegardeTable3.csv")

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

## **4.c/ Complexité**
La phase de division est d'ordre  $\mathcal{O}(log_2 (N))$ : chaque étage a des listes deux fois plus petites que l'étage précédent, on cherche donc le nombre $p$ tel que $2^p$ soit immédiatement supérieur à N, c'est ce qu'on appelle le $log_2(N)$.

Mais $log_2(N) = \frac{ln(n)}{ln(2)}$, et donc, par la règle du produit d'un "grand-O" par un réel, la phase de division est en $\mathcal{O}(ln (N))$.

La phase de fusion est, de manière assez évidente, d'ordre $N$.

Ainsi, l'algorithme de tri fusion complet a pour ordre de grandeur $\mathcal{O}(n \times ln (N))$.