<img src = "Python_Icon.png", width=300, height=300>

# Algorithmes de tri et de recherche
par Dr. H. Abdulkader

L'art de l'algorithmique consiste à trouver les algorithmes les plus performants. En général il s'agit des plus rapides, mais cela peut aussi être les moins gourmand en mémoire ou ceux qui se parallélisent le mieux. On peut aussi se focaliser sur le comportement moyen de l'algorithme ou son comportement dans le pire des cas.

Quoi qu'il en soit, pour écrire un algorithme performant, il faut savoir l'analyser. La première étape consiste à calculer sa compléxité à savoir le nombre d'opérations qu'il nécessite en fonction de la taille des données.

Exemple :

    for i in range(N):
      res += i
   
est un programme qui exécute `+=` N fois donc en autant opérations qu'il y a de données. Il est dit __linéaire__.

    l1 = [1,2,3,4,5,6,7,8,9]
    for i in range(len(l1)):
      for j in range(len(l1)):
        l1[i] += 2
       
est un programme en N² opérations (avec `N = len(l1)`). Il est dit __quadratique__.

## Examples de complexité de calcul
<p>
O(1) fois
 1. Acceder à un indice dans un tableau ou liste ( a = lst[5] )
 2. Insertion an élément dans un tableau
 3. Insertion et suppression d'un élément de queue
 4. ...

O(n) fois
 1. Survoler un tableau ou une liste
 2. Recherche linéaire
 3. Deletion d'un élément particulier dans une liste non mise en ordre
 4. Comparaison de deux chaînes de caractères
 5. ...

O(log n) fois
 1. Algorithmes de recherche binaires et linéaires
 2. Trouver la valeur Max ou Min par la méthode de recherche binaire
 3. Algorithmes de diviser pour régner linéaire
 4. ...

O(nlogn) fois
 1. Tri par fusion 
 2. Tri rapid
 3. Algorithmes d'optimization O(n^2) basés sur la méthode de diviser pour régner 
 4. ...

O(n^2) fois
 1. Tri de Bulle 
 2. Tri par Insertion 
 3. Tri par Selection 
 4. Exploration de tableaux de 2D
 5. ...
 <p>
 <p>
(cf. https://fr.wikipedia.org/wiki/Analyse_de_la_complexit%C3%A9_des_algorithmes )

## Algorithmes de tri

Le but est de trier un grand tableau de nombre aléatoire de différentes façon et de calculer laquelle est la plus rapide.

In [None]:
import numpy.random as rnd
Len = 12   # longueur de liste
N = 10     # intervalle des valeur aléatoires [0,N-1]
# generer une liste de Len entiers tirés aléatoirement de l'intervalle [0,N-1]
data = list(rnd.randint(N,size=Len))
print('liste originale : ',data)
data.sort()     # pour mettre en ordre croissant
print('liste en ordre croissant : ',data)
data.reverse()
print('liste en ordre decroissant : ',data)     # pour mettre en ordre decroissant

**Dans la littérature, il existe un grand nombre d'algorithmes de tri. Nous nous intéressons à 4 méthodes parmi elles :**
+ Tri par selection (ou permutation)
+ Tri par insertion
+ Tri à bulle
+ Tri rapid  

### Tri par permutation

Le tri par permutation parcourt tous les éléments dans l'ordre pour trouver la valzur minimale (ou maximale) afin de permuter cette valeur avec la valeur qui occupe la position. La valeur dans la position k est la valeur minimale (ou maximale) parmi les valeur de rang 0 jusqu'à rang (k).
<p>
Si on ne parcourt qu'une seule fois la liste, cela ne suffit pas. 
<p>
Ecrire la fonction triParPermutation(tableau)

In [None]:
import numpy
import numpy.random as rnd
Len = 12   # longueur de liste
N = 10     # intervalle des valeur aléatoires [0,N-1]
# generer une liste de Len entiers tirés aléatoirement de l'intervalle [0,N-1]
data = list(rnd.randint(N,size=Len))
print('liste originale : ',data)
for j in range(Len):
    enOrdre = True 
    positionMax = Len - 1 - j
    maximale = data[positionMax]
    for i in range(Len - 1 - j):
        if maximale < data[i] :
            positionMax = i
            maximale = data[i]
    data[Len - 1 - j],data[positionMax] = data[positionMax], data[Len - 1 - j]
    print('Etape {} : '.format(j+1),data)
    
print('liste  en ordre croissant : ',data)
data.reverse()
print('liste  en ordre decroissant : ',data)

<img src = "Sort_Selection.png", width=30, height=30>

### Tri par insertion

In [None]:
import numpy.random as rnd
Len = 12   # longueur de liste
N = 10     # intervalle des valeur aléatoires [0,N-1]
data = list(rnd.randint(N,size=Len)) 
print('liste originale : ',data)
for j in range (Len): 
  for i in range(j) :
    if data[j] < data[i] :
        data.insert(i,data.pop(j))
  print('Etape {} : '.format(j), data)
print('liste  en ordre croissant : ',data)

<img src = "Sort_Insertion.png", width=30, height=30>

### Tri à bulle

In [None]:
import numpy.random as rnd
Len = 12   # longueur de liste
N = 10     # intervalle des valeur aléatoires [0,N-1]
# generer une liste de Len entiers tirés aléatoirement de l'intervalle [0,N-1]
data = rnd.randint(N,size=Len)   
print("liste originale", data)
for j in range (Len):
    enOrdre = True 
    for i in range(1,Len-j) :
        if data[i-1] > data[i] :
            data[i-1], data[i] = data[i], data[i-1]
            enOrdre = False
    print('Etape {} : '.format(j), data)
    if enOrdre :
        break
print('liste  en ordre croissant : ',data)

### Diviser pour régner
Un problème complexe peut-être diviser en plusieurs problèmes plus simple. La solution finale est la somme (cobinaison) des solutions parielles.

<img src = "Sort_Divide.png", width=50, height=50>

### Tri rapide (Quicksort in English)
Cet algorithme est basé sur le principe dit **diviser pour régner (divide and conquer en anglais)**.

Le tri rapide consiste à choisir un pivot et à mettre tous les éléments plus petit que le pivot dans une première partie de la liste et tous les plus grands dans la seconde partie.

     [5, 4, 9, 6, 4, 7, 8, 4, 9, 2, 1]

Choisissons comme pivot la valeur au mileu à savoir la 5e c.a.d. 8. Je parcours mes données et je place les éléments en fonction de leur valeur. Cela donne :

     [5, 4, 6, 4, 4, 2, 1]  7  [9, 8, 9]

maintenant il ne me reste plus qu'à trier le deux listes (par récursivité bien sûr).

Ecrire la fonction **deviserPourReigner(liste)**

In [None]:
import numpy.random as rnd

def deviserPourReigner(lst):
    if len(lst) <2 :
        return lst     
    pivot = lst[len(lst)//2]
    print('Element de milieu : ',pivot)
    lst1 = list(filter(lambda x : x < pivot ,   lst))
    print('liste inferieur à pivot : ',lst1)
    lst2 = list(filter(lambda x : x > pivot ,   lst))
    print('liste superieur à pivot : ',lst2)
    lst3 = list(filter(lambda x : x == pivot ,   lst))
    print('liste egale à pivot : ',lst3)
    if len(lst1) > 0 and len(lst2) > 0 :
        return [deviserPourReigner(lst1), lst3, deviserPourReigner(lst2)]
    elif len(lst1)==0 and len(lst2)!=0:
        return [ lst3, deviserPourReigner(lst2)]
    elif len(lst1)!=0 and len(lst2)==0:
        return [deviserPourReigner(lst1), lst3]
    else:
        return lst3
Len = 12   # longueur de liste
N = 10     # intervalle des valeur aléatoires [0,N]
data = list(rnd.randint(N,size=Len))
print(data)
res = deviserPourReigner(data)
print(res)

### Exercice : calcul de la durée d'execution

Calculez la complexité du tri à bulle et du tri rapide. 

Pour valider vos résultats vous pouvez chronométrer vos programmes avec la fonction de `time` de Python

In [None]:
import time 

start = time.time()
res = 0                 # mettre votre code entre start et stop
for i in range(1000):
    res += i**2 + 3.0/2
stop =  time.time()
duree = stop - start
print('la duree est : ', duree)

In [None]:
# dans notebook, il y a la fonction timeit qui donne une estimation precise
# après plusiers repetition du code
%%timeit
res = 0                 # mettre votre code entre start et stop
for i in range(1000):
    res += i**2 + 3.0/2


### Comment utiliser la méthode sort() ?

Dans un exemple plus haut, nous avons montré l'usage de cette méthode au tri en ordre croissant ou décroissant d'une liste. Nous allons, à présent, découvrir davantage sur cette méthode.

In [None]:
help(list.sort)  # sort seulement suffit avec iPython mais pas avec Python

Sort accepte deux paramètres optionnels : key et reverse.
Sans ses paramètres, ``sort`` permet de mettre en ordre croissant une liste. Or, le paramètre **reverse = True** permet la mise en ordre décroissant. 

In [None]:
lst1 = [1,2,7,0,4]
lst2 = lst1.copy()
lst1.sort()
lst2.sort(reverse=True)
print(lst1)
print(lst2)

Le deuxième paramètre, **`key`**, permet de selectionner un critère specifique pour la mise en ordre. Cette clé est implémentée sous une fonction.

In [None]:
def distanceCarree(a):
    """ calcul la distance depuis l'origine (0,0) """
    return a[0]**2 + a[1]**2
lst = [(1,1),(0,2),(2,2),(1,2),(0,0),(1,0)]
lst.sort(key=distanceCarree, reverse = True)
print(lst)

## Fonction lambda
La fonction lambda est une fonction **anonyme** utilisée pour exprimer des courtes fonctions qui ne dépasse pas une ligne. Cette fonction est très utile quand nous voulons passer une fonction comme argumet dans une autre fonction.

In [None]:
#Exemple de la fonction lambda
f = lambda x,y : x+y
print(f(5,8))

In [None]:
#usage de la fonction lambda comme un argument
def accumuler(g,lst):
    somme = 0
    accumuls = []
    for k in lst:
        somme += g(k)
        accumuls.append(somme)
    return accumuls

liste = list(range(8))
g = lambda x : x**3
f  = lambda x : x**5
print('list entree : ',liste)
print('liste de cubes cumules : ',accumuler(g,liste))
print('liste de puissance 5 cumules : ',accumuler(f,liste))

## Fonctions map et filter
la fonction lambda est souvent utilisée comme argment des fonctions **map** et **filter**
La fonction map permet de générer une liste (ou un itérable) dont les éléments obeissent à une régle donnée.
La fonction filter permet d'extraire les éléments d'une liste qui satisfont une régle donnée.
Voir les deux exemple ci-dessous :

In [None]:
# Ex1:
from math import sin
b = range(5,15,2)
a = range(15,5,-2)
f = lambda x,y : x*(1+y)
lst = list(map(f, a, b))
print(lst)

In [None]:
#Ex2:
a = range(5,20,2)
f = lambda x : (x**2>100)
lst = list(filter(f, a))
print(lst)

## Appliquer la fonction lambda avec la méthode sort.

In [None]:
distanceCarree = lambda a : a[0]**2 + a[1]**2
lst = [(1,1),(0,2),(2,2),(1,2),(0,0),(1,0)]
lst.sort(key=distanceCarree, reverse = True)
print(lst)

In [None]:
distanceCarree = lambda a : a[0]**2 + a[1]**2
lst = [(1,1),(0,2),(2,2),(1,2),(0,0),(1,0)]
lst.sort(key=distanceCarree)# ordre croissant
print(lst)