Parcours
=======
Parcourir une structure de données signifie considérer successivement chacun de ses éléments, pour y appliquer éventuellement un traitement.

<em>Ronan Charpentier IREM Caen</em> <img src="by-nc-sa.png" alt="CC-BY-NC-SA"/>

## Parcours d'une liste
Nous définissons une liste et examinons quelques façons de la parcourir, dans un premier temps en affichant ses éléments.

In [None]:
liste=[2,3,5,7,11,13,17,19]
len(liste)

In [None]:
for element in liste:
    print(element)

In [None]:
for indice in range(len(liste)):
    print(indice,'--->',liste[indice])

In [None]:
for indice,element in enumerate(liste):
    print(indice,'--->',element)

## Nous parcourons une liste en effectuant un traitement sur chaque élément.

In [None]:
def occurence(element,liste):
    """
    cette fonction à valeur booléenne teste l'appartenance de l'élément passé en paramètre
    à la liste également fournie en paramètre
    >>> occurence(12,[2,3,5,7,11,13,17,19])
    False
    >>> occurence(13,[2,3,5,7,11,13,17,19])
    True
    """
    for elt in liste:
        if elt==element:
            return True
    return False

print(occurence(12,liste))
print(occurence(13,liste))

In [None]:
def somme(liste):
    """
    cette fonction ajoute les nombres de la liste passée en paramètre
    """
    s=0
    for e in liste:
        s+=e
    return s

print(somme(liste))    

In [None]:
def maximum(liste):
    """
    cette fonction renvoie le maximum de la liste
    """
    m=liste[0]
    for i in range(1,len(liste)):
        if liste[i]>m:
            m=liste[i]
    return m

print(maximum(liste))    

Bien sûr les trois fonctions proposés ci-dessus peuvent être efficacemnt remplacées par les **built-ins** correspondantes, `in`, `sum`, `max`.
Les trois fonctions sont des exemples d'accumulation (reduce) où on part d'un élément neutre (`False`, `0` et $-\infty$ respectivement), puis on applique une opération `or`, `+` ou `max` sur la valeur actuelle de l'accumulateur et l'élément suivant de la liste.

In [None]:
from math import inf

def maximumAvecInfini(liste):
    """
    fonction qui renvoie le maximum d'une liste en initialisant à -inf
    """
    m=-inf
    for e in liste:
        if e>m:
            m=e
    return m

print(maximumAvecInfini(liste))
print(maximumAvecInfini([]))    

Pour les accumulations logiques on a respectivement `any` et `all` pour `or` et `and`.

In [None]:
help(any)

In [None]:
help(all)

## Parcours récursif
L'algorithme d'accumulation se prête particulièrement bien à une programmation récursive, avec une fonction qui s'appelle elle-même sauf sur le cas de base. On pourra utilement aller observer le déroulement pas-à-pas sur <a href="https://urlz.fr/eqYJ">Python Tutor</a>.

In [None]:
def occurenceRec(elt,liste):
    if liste==[]:
        return False
    if liste[0]==elt:
        return True
    return occurenceRec(elt,liste[1:])

def sommeRec(liste):
    if liste==[]:
        return 0
    return liste[0]+sommeRec(liste[1:])

from math import inf

def maximumRec(liste):
    if liste==[]:
        return -inf
    m=maximumRec(liste[1:])
    return liste[0] if liste[0]>m else m

print(occurenceRec(6,liste))
print(occurenceRec(5,liste))

print(sommeRec(liste))

print(maximumRec(liste))

Il arrive parfois qu'on veuille l'indice d'un élément dans une liste, p.ex l'indice de la première occurence (`find`), ou bien l'indice du maximum (pour le tri sélection typiquement).

In [None]:
def trouve(elt,liste):
    """
    renvoie l'indice de la première occurence
    renvoie -1 si l'élément n'est pas dans la liste
    """
    for i,e in enumerate(liste):
        if elt==e:
            return(i)
    return -1


def indiceMaximum(liste):
    """
    renvoie l'indice du maximum
    et pas l'indice maximum (qui est len(liste)-1) !
    """
    i,m=0,liste[0]
    for j in range(1,len(liste)):
        if liste[j]>m:
            i,m=j,liste[j]
    return m

print(trouve('d','abracadabra'))
print(trouve('e','abracadabra'))
print(indiceMaximum('abracadabra'))

**Q1.1** Compléter la fonction minimum esquissée ci-dessous.

In [None]:
def minimum(liste):
    """
    renvoie le minimum d'une liste
    >>> mimimum([10,5,13,4,9,11])
    4
    """
    # au début on prend comme minimum le premier élément
    # pour chaque élément 
        # on vérifie s'il est plus petit que le minimum déjà trouvé
            # auquel cas il devient le nouveau minimum
    # on renvoie le minimum

**Q1.2** Compléter la fonction ci-dessous, qui doit renvoyer des effectifs cumulés croissants. On utlisera la méthode `append`.

In [None]:
def ECC(liste):
    """
    >>> ECC([1,3,2,8,4,6,7,6])
    [1,4,6,14,18,24,31,37]
    """
    s=0
    ecc=[]
    # pour chaque élément de la liste
        # le rajouter à s
        # rajouter s à la fin de la liste ecc
    # renvoyer ecc

**Q1.3** Compléter une fonction qui trouve la dernière occurence d'un élément dans une liste.

In [None]:
def evuort(elt,liste):
    """
    >>> evuort(5,[3,5,6,7,8,5,9,4,1,5,3])
    9
    >>> evuort(2,[3,5,6,7,8,5,9,4,1,5,3])
    -1
    """
    return
    

## Benny l'escargot narcoleptique

Benny est un escargot <a href="">narcoleptique</a>, il est sujet à des endormissements soudains qui peuvent durer plusieurs minutes.

C'est fort contrariant, car Benny essaie de se sortir d'un mauvais pas : il est tombé au fond d'un puits, et a besoin de rester éveillé suffisamment longtemps pour sortir du puits.

Entre deux endormissements, Benny remonte de plusieurs cm, par contre à chaque fois qu'il s'endort il redescend d'une hauteur plus ou moins importante en fonction de la durée de son sommeil.

**Un exemple**

L'escargot a commencé par monter de 3 cm avant de s'endormir et de redescendre d'un centimètre, puis il est remonté de 4 cm, etc.
`l=[3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4]`

**Quatre questions**

**Q2.1** Quelle est la hauteur à laquelle arrive Benny après les déplacements codés dans la liste de l'exemple ?

**Q2.2** Quelle est la distance totale parcourue par l'escargot ?

**Q2.3** A quelle hauteur maximale est arrivé Benny ?

**Q2.4** Benny est-il sorti du puits, dont la hauteur n'est que de 20 cm, et si oui au bout de combien de mouvements ?

**Q2.5**
On demande de compléter les quatre fonctions dont le prototype est donné ci-dessous. 

On a utilisé des `doc strings` entre triple guillemets, avec un exemple d'utilisation.


In [None]:
def position_finale(liste):
    """
    La fonction position_finale renvoie la position de Benny
    à la fin des déplacements.
    L'argument est une liste de déplacements entiers relatifs.
    
    >>>position_finale([])
    0
    >>>position_finale([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4])
    4
    """
    return

In [None]:
def hauteur(liste):
    """
    La fonction hauteur renvoie la hauteur maximale à laquelle 
    Benny l'escargot arrive.
    Son argument est une liste de déplacements entiers relatifs.
    
    >>>hauteur([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4])
    12
    """
    return

In [None]:
def temps(liste,profondeur):
    """
    La fonction temps renvoie le temps mis par Benny pour
    arriver à la hauteur donnée, ou None si Benny n'y arrive pas.
    Son argument liste est une liste de déplacements entiers relatifs,
    son argument profondeur est la hauteur à atteindre ou dépasser.
    
    >>>temps([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4],10)
    7
    >>>temps([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4],30)
    None
    """
    return

In [None]:
def distance(liste):
    """
    La fonction distance renvoie la distance totale parcourue
    par Benny.
    Son argument est une liste de déplacements entiers relatifs.
    
    >>>distance([])
    0
    >>>distance([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4])
    44
    """
    return

On exécutera les instructions ci-dessous pour tester les fonctions sur quelques exemples.
On peut aussi utiliser la bibliothèque `doctest`, qui permet de vérifier que les cas d'usages contenus dans la `docstring` renvoient bien les valeurs indiquées.

In [None]:
assert(position_finale([])==0)
assert(position_finale([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4])==4)
assert(hauteur([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4])==12)
assert(temps([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4],10)==7)
assert(temps([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4],30)==None)
assert(distance([])==0)
assert(distance([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4])==44)

## Parcours de dictionnaires
Comme pour les listes, il y a trois façons de parcourir un dictionnaire :
    * par clés
    * par valeurs
    * par items

In [None]:
d={'Nom':'Tournesol','Prénom':'Tryphon','Profession':'Radiesthésiste','Téléphone':'4242',
   'Adresse':'Château de Moulinsart'}

In [None]:
for k in d.keys():
    print(k)

In [None]:
for v in d.values():
    print(v)

In [None]:
for k,v in d.items():
    print(f"la valeur associée à la clé {k} est {v}")

## Parcours de listes de dictionnaires (données en table)
Voici les 20 films les mieux notés sur la basse de données IMDb ; pour chacun on précisé le rang, le titre, l'année de réalisation, le nom du réalisateur, et la durée en minutes.
On se propose de parcourir cette table (liste de dictionnaires qui représentent desp-uplets nommés) pour répondre à quelques questions.

In [None]:
top20imdb =[{'rang':1,'titre':"Les évadés",'année':1994,'réalisateur':'Frank Darabont','duree':142},
            {'rang':2,'titre':"Le parrain",'année':1972,'réalisateur':'Francis Ford Coppola','duree':175},
            {'rang':3,'titre':"Le parrain deuxième partie",'année':1974,'réalisateur':'Francis Ford Coppola','duree':202},
            {'rang':4,'titre':"The Dark Knight : le chevalier noir",'année':2008,'réalisateur':'Christopher Nolan','duree':152},
            {'rang':5,'titre':"12 hommes en colère",'année':1957,'réalisateur':'Sidney Lumet','duree':96},
            {'rang':6,'titre':"La liste de Schindler",'année':1993,'réalisateur':'Steven Spielberg','duree':195},
            {'rang':7,'titre':"Le seigneur des anneaux : le Retour du Roi",'année':2003,'réalisateur':'Peter Jackson','duree':201},
            {'rang':8,'titre':"Pulp fiction",'année':1994,'réalisateur':'Quentin Tarantino','duree':154},
            {'rang':9,'titre':"Le bon, la brute, le truand",'année':1966,'réalisateur':'Sergio Leone','duree':161},
            {'rang':10,'titre':"Le seigneur des anneaux : la Communauté de l'Anneau",'année':2001,'réalisateur':'Peter Jackson','duree':178},
            {'rang':11,'titre':"Fight club",'année':1999,'réalisateur':'David Fincher','duree':139},
            {'rang':12,'titre':"Forrest Gump",'année':1994,'réalisateur':'Robert Zemeckis','duree':142},
            {'rang':13,'titre':"Inception",'année':2010,'réalisateur':'Christopher Nolan','duree':148},
            {'rang':14,'titre':"Le seigneur des anneaux : les Deux Tours",'année':2002,'réalisateur':'Peter Jackson','duree':179},
            {'rang':15,'titre':"L'empire contre attaque",'année':1980,'réalisateur':'Irvin Kershner','duree':124},
            {'rang':16,'titre':"Matrix",'année':1999,'réalisateur':'Les frères Warchawski','duree':136},
            {'rang':17,'titre':"Les affranchis",'année':1990,'réalisateur':'Martin Scorcese','duree':146},
            {'rang':18,'titre':"Vol au-dessus d'un nid de coucou",'année':1975,'réalisateur':'Milos Forman','duree':133},
            {'rang':19,'titre':"Les sept samouraïs",'année':1954,'réalisateur':'Akira Kurosawa','duree':207},
            {'rang':20,'titre':"Seven",'année':1995,'réalisateur':'David Fincher','duree':127}]

**Q3.1** Que renvoit la séquence ci-dessous ? Que signifie cette réponse ?

In [None]:
t=0
for d in top20imdb:
    if d['année']>2000:
        t=t+d['duree']
t

**Q3.2** Compléter la fonction ci-dessous, qui renvoie la liste des titres des films qui durent plus d'un certain temps.

In [None]:
def filmsLongs(duree):
    liste=[]
    for 
        if
            liste.append()
    return liste

print(filmsLongs(180))

## Listes en compréhension

On va utiliser ici la construction `[expr(k) for k in iterable if condition]` éventuellement en utilisant `len`, `sum` ou `max`.
La même construction s'applique aux dictionnaires et aux tuples.

In [None]:
sum( d['duree'] for d in top20imdb if d['réalisateur']=='Peter Jackson')

In [None]:
min(d['année'] for d in top20imdb if 'Akira' not in d['réalisateur'])

In [None]:
len([d for d in top20imdb if d['réalisateur']=='David Fincher'])

In [None]:
len([d for d in top20imdb if d['année']<2001])

In [None]:
len({d['réalisateur'] for d in top20imdb})

**Q3.3** Traduire chaque couple question-réponse ci-dessus en Français.

## Lecture de fichiers

Le fichier boxo.csv contient les 100 plus gros succès au box-office en France. Nous allons lire ce fichier à l'aide de la bibliothèque `csv`, puis traiter les données obtenues.

In [None]:
import csv

In [None]:
with open('boxo.csv','r') as boxo:
    table=[]
    lecteur=csv.DictReader(boxo,delimiter=';')
    for film in lecteur:
        table.append(film)

In [None]:
table[:3]

**Q3.4** Donner la valeur et la signification des expressions suivantes.

In [None]:
sum(int(film['entrées']) for film in table[:10])/10

In [None]:
len([film for film in table[:42] if 'France' in film['pays']])

In [None]:
[film['titre'] for film in table if 'James' in film['réalisateur'] and int(film['entrées'])>10000000]

**Q3.5** Comparer le nombre moyen d'entrées des films français avec le nombre moyen d'entrées des films américains pour les films de ce top 100.

**Q3.6** Combien de films suisses sont présents dans ce top 100 ?

## Deux tris quadratiques

Les algorithmes de tri "naïfs" vus en première sont **quadratiques** dans le pire des cas, ce qui signifie qu'un doublement du nombre d'élément à trier se traduit par un quadruplement du nombre de comparaisons effectuées pour le tri. Cette complexité est valable dans le pire des cas, en particulier le tri par inserion présenté ici est linéaire sur des données déjà triées.

Les versions présentées ici sont de style impératif, et on trie des tableaux : les accès aux données se font par indice dans des tableaux de taille fixée, on utilise les listes Python comme des tableaux, on n'utilise ni `append` ni d'énumération par `for elt in liste`.

In [None]:
def triSelection(tableau):
    #pour chaque position du tableau en partant du début
    #chercher le minimum du reste du tableau en partant de cette position
    #placer ce minimum en tête en l'échangeant avec le premier élément

In [None]:
def triInsertion(tableau):
    #pour chaque élément du tableau
    #l'insérer dans le début du tableau en l'échangeant avec l'élément précédent si celui-ci lui est supérieur

**Q4.1** Ecrire la fonction `triSelection` à partir des indications données plus haut.

**Q4.2** Donner un variant de boucle pour la boucle extérieure, et un invariant de boucle. Qu'est ce que cela permet de prouver ?

**Q4.3** Calculer la complexité de la boucle intérieure puis celle de la boucle extérieure, en nombre de comparaison. Est-ce que cette complexité dépend des données ?

**Q4.4** Mêmes questions pour la fonction `triInsertion`.

**Q4.5** Montrer que la complexité de la boucle intérieure dépend des données qu'on trie. Qule est le meilleur cas ? Le pire cas ?

In [None]:
def triSelection(l):
    for i in range(len(l)):
        j,m=i,l[i]
        for k in range(j+1,len(l)):
            if l[k]<m:
                j,m=k,l[k]
        l[i],l[j]=l[j],l[i]

liste=[80,76,14,50,35,22,29,56,44]
triSelection(liste)  #tri en place, comme la méthode .sort(), paradigme impératif
print(liste)

In [None]:
def triInsertion(l):
    for i in range(len(l)):
        j=i
        while j>0 and l[j-1]>l[j]:
            l[j-1],l[j]=l[j],l[j-1]
            j=j-1

liste=[80,76,14,50,35,22,29,56,44]
triInsertion(liste)  #tri en place, comme la méthode .sort(), paradigme impératif
print(liste)

On pourra consulter le déroulement des deux fonctions sur <a href="https://pythontutor.com">Python Tutor</a> (un site indispensable) :
<a href="http://pythontutor.com/visualize.html#code=def%20triSelection%28l%29%3A%0A%20%20%20%20for%20i%20in%20range%28len%28l%29%29%3A%0A%20%20%20%20%20%20%20%20j,m%3Di,l%5Bi%5D%0A%20%20%20%20%20%20%20%20for%20k%20in%20range%28j%2B1,len%28l%29%29%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20if%20l%5Bk%5D%3Cm%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20j,m%3Dk,l%5Bk%5D%0A%20%20%20%20%20%20%20%20l%5Bi%5D,l%5Bj%5D%3Dl%5Bj%5D,l%5Bi%5D%0A%0Aliste%3D%5B80,76,14,50,35,22,29,56,44%5D%0AtriSelection%28liste%29%20%20%23tri%20en%20place,%20comme%20sorted%28%29,%20paradigme%20imp%C3%A9ratif%0Aprint%28liste%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false">tri sélection</a> et <a href="http://pythontutor.com/visualize.html#code=def%20triInsertion%28l%29%3A%0A%20%20%20%20for%20i%20in%20range%28len%28l%29%29%3A%0A%20%20%20%20%20%20%20%20j%3Di%0A%20%20%20%20%20%20%20%20while%20j%3E0%20and%20l%5Bj-1%5D%3El%5Bj%5D%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20l%5Bj-1%5D,l%5Bj%5D%3Dl%5Bj%5D,l%5Bj-1%5D%0A%20%20%20%20%20%20%20%20%20%20%20%20j%3Dj-1%0A%0Aliste%3D%5B80,76,14,50,35,22,29,56,44%5D%0AtriInsertion%28liste%29%20%20%23tri%20en%20place,%20comme%20sorted%28%29,%20paradigme%20imp%C3%A9ratif%0Aprint%28liste%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false">tri insertion</a>.

Ci-dessous on utilise le magic `%%timeit` pour chronométrer nos deux fonctions sur quelques listes générées aléatoirement ; attention on doit recopier les listes avant de les trier, sinon à partir de la deuxième tentative on trie un eliste déjà triée. On constatera que la recopie prend un temps négligeable devant le tri.

In [None]:
from random import randint
liste=[randint(1,10000) for k in range(1000)]
liste[:10]

In [None]:
%%timeit
l=liste[:]

In [None]:
%%timeit
l=liste[:]
triSelection(l)

In [None]:
%%timeit
l=liste[:]
triInsertion(l)

In [None]:
listetriee=list(range(1000))

In [None]:
%%timeit
l=listetriee[:]
triInsertion(l)

## Les $k$ plus proches voisins
Le fichier `communes.csv` contient les coordonnées et les noms des communes bas-normandes et de deux départements voisins.

Nous écrivons une fonction qui va parcourir la liste de ces communes et ne garder que les $k$ communes les plus proches d'un point donné.

Nous effectuons ensuite un vote majoritaire pour proposer le département dans lequel doit se trouver le point proposé.

In [None]:
from math import pi,cos,sin,acos

def distance(pos1,pos2):
    lat1=pos1[0]/180*pi
    long1=pos1[1]/180*pi
    lat2=pos2[0]/180*pi
    long2=pos2[1]/180*pi
    alpha=acos(sin(lat1)*sin(lat2)+cos(lat1)*cos(lat2)*cos(long1-long2))
    return 6378137*alpha

def trie(liste):
    i=len(liste)-1
    while i>0 and liste[i-1]>liste[i]:
        liste[i-1],liste[i]=liste[i],liste[i-1]
        i=i-1

In [None]:
def knn(lat0,long0,k=7):
    with open('communes.csv','r') as comm:
        champs=['nom','code','dpt','lat','long','alt','superficie','population','geometrie']
        reader=csv.DictReader(comm,fieldnames=champs,delimiter=";")
        nn=[]
        for commune in reader:
            lat,long=float(commune['lat']),float(commune['long'])
            d=distance((lat0,long0),(lat,long))
            if len(nn)<k:
                nn.append((d,commune['nom'],commune['dpt']))
                trie(nn)
            elif d<nn[k-1][0]:
                nn[k-1]=(d,commune['nom'],commune['dpt'])
                trie(nn)
    return nn

knn(48.8512,-0.8896)
                

In [None]:
def compte(liste):
    candidats=dict()
    for i,t in enumerate(liste):
        if t[2] not in candidats:
            candidats[t[2]]=(1,1/(1+t[0]))
        else:
            candidats[t[2]]=(candidats[t[2]][0]+1,candidats[t[2]][1]+1/(1+t[0]))
    cc=[(c[0],c[1],c) for c in candidats.keys()]
    cc.sort()
    return cc[-1][2]

compte(knn(48.8512,-0.8896,10))
        

In [None]:
knn(48.6361,-1.5114,7)

In [None]:
Lison=knn(49.2414,-1.0381,30)
for d,v,dpt in Lison:
    print(f"distance {d} de {v} qui est dans le département {dpt}")
print('Conclusion de 30-nn : département ',compte(Lison))

## Fusionner deux listes : le tri fusion
Le tri fusion est un exemple canonique de la méthode diviser pour régner. Il s'agit de trier chaque moitié d'une liste puis de fusionner les deux listes triées en une seule liste, triée elle aussi. 

La version proposée ci-dessous est **récursive**, avec une approche fonctionnelle comme `sorted()`, sans effet de bord : la liste initiale n'est pas modifiée.

On peut visualiser le déroulement de la fonction `fusion` sur l'exemple <a href="http://pythontutor.com/visualize.html#code=def%20fusion%28l1,l2%29%3A%0A%20%20%20%20if%20l1%3D%3D%5B%5D%3A%0A%20%20%20%20%20%20%20%20return%20l2%0A%20%20%20%20if%20l2%3D%3D%5B%5D%3A%0A%20%20%20%20%20%20%20%20return%20l1%0A%20%20%20%20if%20l1%5B0%5D%3Cl2%5B0%5D%3A%0A%20%20%20%20%20%20%20%20return%20%5Bl1%5B0%5D%5D%2Bfusion%28l1%5B1%3A%5D,l2%29%0A%20%20%20%20else%3A%0A%20%20%20%20%20%20%20%20return%20%5Bl2%5B0%5D%5D%2Bfusion%28l1,l2%5B1%3A%5D%29%0A%0Al1%3D%5B22,29,35,44,56%5D%0Al2%3D%5B14,27,50,61,76%5D%0Aprint%28fusion%28l1,l2%29%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false">ici</a>, et le tri complet <a href="http://pythontutor.com/visualize.html#code=def%20triFusion%28l%29%3A%0A%20%20%20%20if%20len%28l%29%3C2%3A%0A%20%20%20%20%20%20%20%20return%20l%0A%20%20%20%20else%3A%0A%20%20%20%20%20%20%20%20return%20fusion%28triFusion%28l%5B%3Alen%28l%29//2%5D%29,triFusion%28l%5Blen%28l%29//2%3A%5D%29%29%0A%0Al%3D%5B80,76,14,50,35,22,29,56,44%5D%0Aprint%28triFusion%28l%29%29%0Aprint%28l%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false">là</a>.

In [None]:
def fusion(l1,l2):
    if l1==[]:
        return l2
    if l2==[]:
        return l1
    if l1[0]<l2[0]:
        return [l1[0]]+fusion(l1[1:],l2)
    else:
        return [l2[0]]+fusion(l1,l2[1:])

l1=[22,29,35,44,56]
l2=[14,27,50,61,76]
print(fusion(l1,l2))

In [None]:
def triFusion(liste):
    #si la liste est de longueur 0 ou 1, elle est déjà tiée
    #sinon trier récursivement la première moitié, puis la deuxième moitié
    #et renvoyer la fusion de ces deux moitiés triées

**Q4.6** Compléter la fonction `triFusion` en utilisant la fonction `fusion`

In [None]:
def triFusion(l):
    if len(l)<2:
        return l
    else:
        return fusion(triFusion(l[:len(l)//2]),triFusion(l[len(l)//2:]))

l=[80,76,14,50,35,22,29,56,44]
print(triFusion(l))
print(l)

## Parcourir une liste pour la partitionner : le tri rapide
L'idée du tri rapide est de choisir un élément de la liste à trier appelé le **pivot**, et de trier séparément la liste des éléments plus petits que le pivot et la liste des éléments plus grands que le pivot.

Comme le tri fusion, c'est un exemple canaonique de l'approche diviser pour régner ; contrairement au tri pivot, la division du problème ne se fait pas nécessairement en deux parties (presque) égales, et le tri rapide peut être quadratique dans des cas comme celui d'une liste déjà triée.

On propose ci-dessous deux implémentations assez différentes :
* la première est fonctionnelle et traduit directement l'idée du tri rapide
* la deuxième est impérative, en place (elle ne crée pas de nouvelles structures de données mais travaille dans le tableau initial).

Cependant les deux fonctions proposées sont récursives.

In [None]:
def triRapideFonctionnel(liste):
    if len(liste)<2:
        return liste
    else:
        return triRapideFonctionnel([k for k in liste[1:] if k<liste[0]])+\
        [liste[0]]+triRapideFonctionnel([k for k in liste[1:] if k>=liste[0]]) #le \ casse une ligne trop longue

liste=[80,76,14,50,35,22,29,56,44]
print(triRapideFonctionnel(liste))
print(liste)

In [None]:
def partitionne(tableau,debut,fin):
    j=debut
    for i in range(debut,fin):
        if tableau[i]<=tableau[fin]:
            tableau[i],tableau[j]=tableau[j],tableau[i]
            j=j+1
    tableau[j],tableau[fin]=tableau[fin],tableau[j]
    return j

def triRapideImperatif(tableau,debut=0,fin=None):
    if fin is None:
        fin=len(liste)-1
    if debut<fin:
        k=partitionne(tableau,debut,fin)
        triRapideImperatif(tableau,debut,k-1)
        triRapideImperatif(tableau,k+1,fin)
        
liste=[80,76,14,50,35,22,29,56,44]
print(triRapideImperatif(liste))
print(liste) #il s'agit d'un tri en place      

## Mélanger une liste
**Q4.7** De quel tri cet algorithme est-il l'inverse ?

In [None]:
from random import randint
#randint(a,b) renvoit un entier entre a et b inclus

def knuth(l):
    n=len(l)
    for i in range(n-1):
        j=randint(i,n-1)
        l[i],l[j]=l[j],l[i]

liste=list(range(1,21))
print(liste)
knuth(liste)
print(liste)
knuth(liste)
print(liste)

## Parcours logarithmique : diviser pour régner
On peut grandement améliorer le coût d'une recherche d'un élément dans un tableau si ce tableau a été préalablement trié. En comparant la valeur recherchée à la valeur présente au milieu du tableau, si ces deux valeurs ne sont pas égales on sait dans quelle moitié chercher.

**Q5.1** Compléter la fonction `rechercheDicho` ci-dessous, en prêtant attention aux cas de base.

In [None]:
def rechercheDicho(elt,liste):
    #si la liste est vide ...
    #si elt est égal au terme médian de la liste ...
    #sinon en comparant elt à ce terme median faire un appel récursif

In [None]:
l=[14,22,29,35,44,50,56,76,80]
print(rechercheDicho(61,liste))
print(rechercheDicho(22,liste))

Une proposition est au bout de ce <a href="hhttp://pythontutor.com/visualize.html#code=def%20rechercheDicho%28elt,liste%29%3A%0A%20%20%20%20if%20liste%3D%3D%5B%5D%3A%0A%20%20%20%20%20%20%20%20return%20False%0A%20%20%20%20m%3Dlen%28liste%29//2%0A%20%20%20%20if%20elt%3D%3Dliste%5Bm%5D%3A%0A%20%20%20%20%20%20%20%20return%20True%0A%20%20%20%20elif%20elt%3Cliste%5Bm%5D%3A%0A%20%20%20%20%20%20%20%20return%20rechercheDicho%28elt,liste%5B%3Am%5D%29%0A%20%20%20%20else%3A%0A%20%20%20%20%20%20%20%20return%20rechercheDicho%28elt,liste%5Bm%2B1%3A%5D%29%0A%0A%0Al%3D%5B14,22,29,35,44,50,56,76,80%5D%0Aprint%28rechercheDicho%2861,l%29%29%0Aprint%28rechercheDicho%2822,l%29%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false">lien</a>.