<img style='margin-right:0' src="http://dinfo.ca/logoDptInfo.jpg" width=300>

# Tris de données (Introduction)
---

In [None]:
from IPython.display import YouTubeVideo
YouTubeVideo('WaNLJf8xzC4', width=840,height=475,cc_lang_pref='fr')

# Algorithmes classiques de tri

## Algorithmes courants de tri

![](https://i.imgur.com/fq0A8hx.gif)


## Tri à bulles (bubble sort) ou tri par propagation

![](https://upload.wikimedia.org/wikipedia/commons/5/54/Sorting_bubblesort_anim.gif)
#### Description (wikipédia)

> Il consiste à comparer répétitivement les éléments consécutifs d'un tableau, et à les permuter lorsqu'ils sont mal triés. Il doit son nom au fait qu'il déplace rapidement les plus grands éléments en fin de tableau, comme des bulles d'air qui remonteraient rapidement à la surface d'un liquide.

Le tri à bulles est souvent enseigné en tant qu'exemple algorithmique, car son principe est simple. Mais c'est le plus lent des algorithmes de tri communément enseignés, et il n'est donc guère utilisé en pratique.

In [None]:
def bubbleSort(valeurs):
    taille = len(valeurs)
    for i in range(taille):
        for j in range(0, taille-i-1): 
            if valeurs[j] > valeurs[j+1] :
                tempo = valeurs[j+1]
                valeurs[j+1] = valeurs[j]
                valeurs[j] = tempo
# essai
valeurs = [2,3,1,5,8,6,10,9]
bubbleSort(valeurs)   # tri sur place
print( valeurs )

## Tri par insertion (insertion sort)

<img src="https://upload.wikimedia.org/wikipedia/commons/4/42/Insertion_sort.gif" style="width:579px;height:302px;">

![](https://upload.wikimedia.org/wikipedia/commons/0/0f/Insertion-sort-example-300px.gif)

#### Description (wikipédia)

> Le tri par insertion est un algorithme de tri classique. La plupart des personnes l'utilisent naturellement pour trier des cartes à jouer1.

En général, le tri par insertion est beaucoup plus lent que d'autres algorithmes comme le tri rapide (ou quicksort) et le tri fusion pour traiter de grandes séquences.

Le tri par insertion est cependant considéré comme le tri le plus efficace sur des entrées de petite taille. Il est aussi très rapide lorsque les données sont déjà presque triées. 

In [None]:
def insertionSort(valeurs): 
    for i in range(1, len(valeurs)): 
        cle = valeurs[i] 
        j = i-1
        while j >=0 and cle < valeurs[j] : 
            valeurs[j+1] = valeurs[j] 
            j -= 1
        valeurs[j+1] = cle
# essai
valeurs = [2,3,1,5,8,6,10,9]
insertionSort(valeurs)   # tri sur place
print( valeurs )        

## Tri fusion (merge sort)

![](https://upload.wikimedia.org/wikipedia/commons/c/cc/Merge-sort-example-300px.gif)

![](https://turkishcoders.files.wordpress.com/2017/02/merge_sort__double_storage_.gif?w=200&zoom=2)


#### Description (wikipédia)

Diviser la liste en deux, trier chaque sous-liste et fusionner les deux listes triées.  (Chaque sous-ligne reprend ce processus).



In [None]:
def fusionner(moitieGauche,moitieDroite):
    fusion = []
    while len(moitieGauche) != 0 and len(moitieDroite) != 0:
        if moitieGauche[0] < moitieDroite[0]:
            fusion.append(moitieGauche[0])
            moitieGauche.remove(moitieGauche[0])
        else:
            fusion.append(moitieDroite[0])
            moitieDroite.remove(moitieDroite[0])
    if len(moitieGauche) == 0:
        fusion = fusion + moitieDroite
    else:
        fusion = fusion + moitieGauche
    return fusion

def mergeSort(valeurs):
    if len(valeurs) <= 1:
        return valeurs
    milieu = len(valeurs) // 2
    listeGauche = valeurs[:milieu]
    listeDroite = valeurs[milieu:]

    listeGauche = mergeSort(listeGauche)
    listeDroite = mergeSort(listeDroite)
    return list(fusionner(listeGauche, listeDroite))

# essai
valeurs = [2,3,1,5,8,6,10,9]
valeurs = mergeSort(valeurs)
print( valeurs ) 

## Quicksort

![](https://upload.wikimedia.org/wikipedia/commons/f/fe/Quicksort.gif)

#### Description (wikipédia)

> La méthode consiste à placer un élément du tableau (appelé pivot) à sa place définitive, en permutant tous les éléments de telle sorte que tous ceux qui sont inférieurs au pivot soient à sa gauche et que tous ceux qui sont supérieurs au pivot soient à sa droite.

Cette opération s'appelle le partitionnement. Pour chacun des sous-tableaux, on définit un nouveau pivot et on répète l'opération de partitionnement.



In [1]:
def quickSort(valeurs):
    valeursInf = []
    valeursIdent = []
    valeursSup = []
    if len(valeurs) > 1:
        pivot = valeurs[0]
        for uneValeur in valeurs:
            if uneValeur < pivot:
                valeursInf.append(uneValeur)
            if uneValeur == pivot:
                valeursIdent.append(uneValeur)
            if uneValeur > pivot:
                valeursSup.append(uneValeur)
        return quickSort(valeursInf)+valeursIdent+quickSort(valeursSup) 
    else:  
        return valeurs

# essai
valeurs = [2,3,1,5,8,6,10,9]
valeurs = quickSort(valeurs)
print( valeurs ) 

[1, 2, 3, 5, 6, 8, 9, 10]


## TimSort

![](https://images2015.cnblogs.com/blog/853900/201611/853900-20161121162920596-791931678.gif)

#### Description (wikipédia)

> Timsort est un algorithme de tri hybride dérivé du tri fusion et du tri par insertion, stable et conçu pour fonctionner de manière efficace sur des données réelles. Il a été mis au point par Tim Peters en 2002 pour le langage de programmation Python.

L'algorithme procède en cherchant des monotonies, c'est-à-dire des parties de l'entrée déjà correctement ordonnées, et peut de cette manière trier efficacement l'ensemble des données en procédant par fusions successives. Pour des entrées de petites tailles, il revient à effectuer un tri fusion.

In [None]:
def rechercheDichotomique(valeurs, item, debut, fin):
    if debut == fin:
        if valeurs[debut] > item:
            return debut
        else:
            return debut + 1
    if debut > fin:
        return debut

    milieu = round((debut + fin)/ 2)

    if valeurs[milieu] < item:
        return rechercheDichotomique(valeurs, item, milieu + 1, fin)
    elif valeurs[milieu] > item:
        return rechercheDichotomique(valeurs, item, debut, milieu - 1)
    else:
        return milieu

def insertionSort(valeurs):
    taille = len(valeurs)
    for i in range(1, taille):
        uneValeur = valeurs[i]
        pos = rechercheDichotomique(valeurs, uneValeur, 0, i - 1)
        valeurs = valeurs[:pos] + [uneValeur] + valeurs[pos:i] + valeurs[i+1:]
    return valeurs

def fusionner(partieGauche, partieDroite):
    if not partieGauche:
        return partieDroite
    if not partieDroite:
        return partieGauche
    if partieGauche[0] < partieDroite[0]:
        return [partieGauche[0]] + fusionner(partieGauche[1:], partieDroite)
    return [partieDroite[0]] + fusionner(partieGauche, partieDroite[1:])

def timSort(valeurs):
    series, seriesTriees = [], []
    taille = len(valeurs)
    nouvelleSerie = [valeurs[0]]

    for i in range(1, taille):
        if i == taille - 1:
            nouvelleSerie.append(valeurs[i])
            series.append(nouvelleSerie)
            break
        if valeurs[i] < valeurs[i-1]:
            if not nouvelleSerie:
                series.append([valeurs[i]])
                nouvelleSerie.append(valeurs[i])
            else:
                series.append(nouvelleSerie)
                nouvelleSerie = [valeurs[i]]
        else:
            nouvelleSerie.append(valeurs[i])
    for item in series:
        seriesTriees.append(insertionSort(item))

    valeursTriees = []
    for uneSerie in seriesTriees:
        valeursTriees = fusionner(valeursTriees, uneSerie)
    return valeursTriees

# essai
valeurs = [2,3,1,5,8,6,10,9]
valeurs = timSort(valeurs)
print( valeurs ) 