Parcours
=======
Parcourir une structure de données signifie considérer successivement chacun de ses éléments, pour y appliquer éventuellement un traitement.

<em>Ronan Charpentier IREM Caen</em> <img src="by-nc-sa.png" alt="CC-BY-NC-SA"/>

## Parcours d'une liste
Nous définissons une liste et examinons quelques façons de la parcourir, dans un premier temps en affichant ses éléments.

In [None]:
liste=[2,3,5,7,11,13,17,19]
len(liste)

In [None]:
for element in liste:
    print(element)

In [None]:
for indice in range(len(liste)):
    print(indice,'--->',liste[indice])

In [None]:
for indice,element in enumerate(liste):
    print(indice,'--->',element)

## Nous parcourons une liste en effectuant un traitement sur chaque élément.

In [None]:
def occurence(element,liste):
    """
    cette fonction à valeur booléenne teste l'appartenance de l'élément passé en paramètre
    à la liste également fournie en paramètre
    >>> occurence(12,[2,3,5,7,11,13,17,19])
    False
    >>> occurence(13,[2,3,5,7,11,13,17,19])
    True
    """
    for elt in liste:
        if elt==element:
            return True
    return False

print(occurence(12,liste))
print(occurence(13,liste))

In [None]:
def somme(liste):
    """
    cette fonction ajoute les nombres de la liste passée en paramètre
    """
    s=0
    for e in liste:
        s+=e
    return s

print(somme(liste))    

In [None]:
def maximum(liste):
    """
    cette fonction renvoie le maximum de la liste
    """
    m=liste[0]
    for i in range(1,len(liste)):
        if liste[i]>m:
            m=liste[i]
    return m

print(maximum(liste))    

Bien sûr les trois fonctions proposés ci-dessus peuvent être efficacemnt remplacées par les **built-ins** correspondantes, `in`, `sum`, `max`.
Les trois fonctions sont des exemples d'accumulation (reduce) où on part d'un élément neutre (`False`, `0` et $-\infty$ respectivement), puis on applique une opération `or`, `+` ou `max` sur la valeur actuelle de l'accumulateur et l'élément suivant de la liste.

In [None]:
from math import inf

def maximumAvecInfini(liste):
    """
    fonction qui renvoie le maximum d'une liste en initialisant à -inf
    """
    m=-inf
    for e in liste:
        if e>m:
            m=e
    return m

print(maximumAvecInfini(liste))
print(maximumAvecInfini([]))    

Pour les accumulations logiques on a respectivement `any` et `all` pour `or` et `and`.

In [None]:
help(any)

In [None]:
help(all)

## Parcours récursif
L'algorithme d'accumulation se prête particulièrement bien à une programmation récursive, avec une fonction qui s'appelle elle-même sauf sur le cas de base. On pourra utilement aller observer le déroulement pas-à-pas sur <a href="https://urlz.fr/eqYJ">Python Tutor</a>.

In [None]:
def occurenceRec(elt,liste):
    if liste==[]:
        return False
    if liste[0]==elt:
        return True
    return occurenceRec(elt,liste[1:])

def sommeRec(liste):
    if liste==[]:
        return 0
    return liste[0]+sommeRec(liste[1:])

from math import inf

def maximumRec(liste):
    if liste==[]:
        return -inf
    m=maximumRec(liste[1:])
    return liste[0] if liste[0]>m else m

print(occurenceRec(6,liste))
print(occurenceRec(5,liste))

print(sommeRec(liste))

print(maximumRec(liste))

Il arrive parfois qu'on veuille l'indice d'un élément dans une liste, p.ex l'indice de la première occurence (`find`), ou bien l'indice du maximum (pour le tri sélection typiquement).

In [None]:
def trouve(elt,liste):
    """
    renvoie l'indice de la première occurence
    renvoie -1 si l'élément n'est pas dans la liste
    """
    for i,e in enumerate(liste):
        if elt==e:
            return(i)
    return -1


def indiceMaximum(liste):
    """
    renvoie l'indice du maximum
    et pas l'indice maximum (qui est len(liste)-1) !
    """
    i,m=0,liste[0]
    for j in range(1,len(liste)):
        if liste[j]>m:
            i,m=j,liste[j]
    return m

print(trouve('d','abracadabra'))
print(trouve('e','abracadabra'))
print(indiceMaximum('abracadabra'))

**Q1.1** Compléter la fonction minimum esquissée ci-dessous.

In [None]:
def minimum(liste):
    """
    renvoie le minimum d'une liste
    >>> mimimum([10,5,13,4,9,11])
    4
    """
    # au début on prend comme minimum le premier élément
    # pour chaque élément 
        # on vérifie s'il est plus petit que le minimum déjà trouvé
            # auquel cas il devient le nouveau minimum
    # on renvoie le minimum

**Q1.2** Compléter la fonction ci-dessous, qui doit renvoyer des effectifs cumulés croissants. On utlisera la méthode `append`.

In [None]:
def ECC(liste):
    """
    >>> ECC([1,3,2,8,4,6,7,6])
    [1,4,6,14,18,24,31,37]
    """
    s=0
    ecc=[]
    # pour chaque élément de la liste
        # le rajouter à s
        # rajouter s à la fin de la liste ecc
    # renvoyer ecc

**Q1.3** Compléter une fonction qui trouve la dernière occurence d'un élément dans une liste.

In [None]:
def evuort(elt,liste):
    """
    >>> evuort(5,[3,5,6,7,8,5,9,4,1,5,3])
    9
    >>> evuort(2,[3,5,6,7,8,5,9,4,1,5,3])
    -1
    """
    return
    

## Benny l'escargot narcoleptique

Benny est un escargot <a href="">narcoleptique</a>, il est sujet à des endormissements soudains qui peuvent durer plusieurs minutes.

C'est fort contrariant, car Benny essaie de se sortir d'un mauvais pas : il est tombé au fond d'un puits, et a besoin de rester éveillé suffisamment longtemps pour sortir du puits.

Entre deux endormissements, Benny remonte de plusieurs cm, par contre à chaque fois qu'il s'endort il redescend d'une hauteur plus ou moins importante en fonction de la durée de son sommeil.

**Un exemple**

L'escargot a commencé par monter de 3 cm avant de s'endormir et de redescendre d'un centimètre, puis il est remonté de 4 cm, etc.
`l=[3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4]`

**Quatre questions**

**Q2.1** Quelle est la hauteur à laquelle arrive Benny après les déplacements codés dans la liste de l'exemple ?

**Q2.2** Quelle est la distance totale parcourue par l'escargot ?

**Q2.3** A quelle hauteur maximale est arrivé Benny ?

**Q2.4** Benny est-il sorti du puits, dont la hauteur n'est que de 20 cm, et si oui au bout de combien de mouvements ?

**Q2.5**
On demande de compléter les quatre fonctions dont le prototype est donné ci-dessous. 

On a utilisé des `doc strings` entre triple guillemets, avec un exemple d'utilisation.


In [None]:
def position_finale(liste):
    """
    La fonction position_finale renvoie la position de Benny
    à la fin des déplacements.
    L'argument est une liste de déplacements entiers relatifs.
    
    >>>position_finale([])
    0
    >>>position_finale([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4])
    4
    """
    return

In [None]:
def hauteur(liste):
    """
    La fonction hauteur renvoie la hauteur maximale à laquelle 
    Benny l'escargot arrive.
    Son argument est une liste de déplacements entiers relatifs.
    
    >>>hauteur([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4])
    12
    """
    return

In [None]:
def temps(liste,profondeur):
    """
    La fonction temps renvoie le temps mis par Benny pour
    arriver à la hauteur donnée, ou None si Benny n'y arrive pas.
    Son argument liste est une liste de déplacements entiers relatifs,
    son argument profondeur est la hauteur à atteindre ou dépasser.
    
    >>>temps([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4],10)
    7
    >>>temps([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4],30)
    None
    """
    return

In [None]:
def distance(liste):
    """
    La fonction distance renvoie la distance totale parcourue
    par Benny.
    Son argument est une liste de déplacements entiers relatifs.
    
    >>>distance([])
    0
    >>>distance([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4])
    44
    """
    return

On exécutera les instructions ci-dessous pour tester les fonctions sur quelques exemples.
On peut aussi utiliser la bibliothèque `doctest`, qui permet de vérifier que les cas d'usages contenus dans la `docstring` renvoient bien les valeurs indiquées.

In [None]:
assert(position_finale([])==0)
assert(position_finale([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4])==4)
assert(hauteur([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4])==12)
assert(temps([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4],10)==7)
assert(temps([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4],30)==None)
assert(distance([])==0)
assert(distance([3,-1,4,-2,5,-1,2,-3,5,-6,4,-3,1,-4])==44)

## Parcours de dictionnaires
Comme pour les listes, il y a trois façons de parcourir un dictionnaire :
    * par clés
    * par valeurs
    * par items

In [None]:
d={'Nom':'Tournesol','Prénom':'Tryphon','Profession':'Radiesthésiste','Téléphone':'4242',
   'Adresse':'Château de Moulinsart'}

In [None]:
for k in d.keys():
    print(k)

In [None]:
for v in d.values():
    print(v)

In [None]:
for k,v in d.items():
    print(f"la valeur associée à la clé {k} est {v}")

## Parcours de listes de dictionnaires (données en table)
Voici les 20 films les mieux notés sur la basse de données IMDb ; pour chacun on précisé le rang, le titre, l'année de réalisation, le nom du réalisateur, et la durée en minutes.
On se propose de parcourir cette table (liste de dictionnaires qui représentent desp-uplets nommés) pour répondre à quelques questions.

In [None]:
top20imdb =[{'rang':1,'titre':"Les évadés",'année':1994,'réalisateur':'Frank Darabont','duree':142},
            {'rang':2,'titre':"Le parrain",'année':1972,'réalisateur':'Francis Ford Coppola','duree':175},
            {'rang':3,'titre':"Le parrain deuxième partie",'année':1974,'réalisateur':'Francis Ford Coppola','duree':202},
            {'rang':4,'titre':"The Dark Knight : le chevalier noir",'année':2008,'réalisateur':'Christopher Nolan','duree':152},
            {'rang':5,'titre':"12 hommes en colère",'année':1957,'réalisateur':'Sidney Lumet','duree':96},
            {'rang':6,'titre':"La liste de Schindler",'année':1993,'réalisateur':'Steven Spielberg','duree':195},
            {'rang':7,'titre':"Le seigneur des anneaux : le Retour du Roi",'année':2003,'réalisateur':'Peter Jackson','duree':201},
            {'rang':8,'titre':"Pulp fiction",'année':1994,'réalisateur':'Quentin Tarantino','duree':154},
            {'rang':9,'titre':"Le bon, la brute, le truand",'année':1966,'réalisateur':'Sergio Leone','duree':161},
            {'rang':10,'titre':"Le seigneur des anneaux : la Communauté de l'Anneau",'année':2001,'réalisateur':'Peter Jackson','duree':178},
            {'rang':11,'titre':"Fight club",'année':1999,'réalisateur':'David Fincher','duree':139},
            {'rang':12,'titre':"Forrest Gump",'année':1994,'réalisateur':'Robert Zemeckis','duree':142},
            {'rang':13,'titre':"Inception",'année':2010,'réalisateur':'Christopher Nolan','duree':148},
            {'rang':14,'titre':"Le seigneur des anneaux : les Deux Tours",'année':2002,'réalisateur':'Peter Jackson','duree':179},
            {'rang':15,'titre':"L'empire contre attaque",'année':1980,'réalisateur':'Irvin Kershner','duree':124},
            {'rang':16,'titre':"Matrix",'année':1999,'réalisateur':'Les frères Warchawski','duree':136},
            {'rang':17,'titre':"Les affranchis",'année':1990,'réalisateur':'Martin Scorcese','duree':146},
            {'rang':18,'titre':"Vol au-dessus d'un nid de coucou",'année':1975,'réalisateur':'Milos Forman','duree':133},
            {'rang':19,'titre':"Les sept samouraïs",'année':1954,'réalisateur':'Akira Kurosawa','duree':207},
            {'rang':20,'titre':"Seven",'année':1995,'réalisateur':'David Fincher','duree':127}]

**Q3.1** Que renvoit la séquence ci-dessous ? Que signifie cette réponse ?

In [None]:
t=0
for d in top20imdb:
    if d['année']>2000:
        t=t+d['duree']
t

**Q3.2** Compléter la fonction ci-dessous, qui renvoie la liste des titres des films qui durent plus d'un certain temps.

In [None]:
def filmsLongs(duree):
    liste=[]
    for 
        if
            liste.append()
    return liste

print(filmsLongs(180))

## Listes en compréhension

On va utiliser ici la construction `[expr(k) for k in iterable if condition]` éventuellement en utilisant `len`, `sum` ou `max`.
La même construction s'applique aux dictionnaires et aux tuples.

In [None]:
sum( d['duree'] for d in top20imdb if d['réalisateur']=='Peter Jackson')

In [None]:
min(d['année'] for d in top20imdb if 'Akira' not in d['réalisateur'])

In [None]:
len([d for d in top20imdb if d['réalisateur']=='David Fincher'])

In [None]:
len([d for d in top20imdb if d['année']<2001])

In [None]:
len({d['réalisateur'] for d in top20imdb})

**Q3.3** Traduire chaque couple question-réponse ci-dessus en Français.

## Lecture de fichiers

Le fichier boxo.csv contient les 100 plus gros succès au box-office en France. Nous allons lire ce fichier à l'aide de la bibliothèque `csv`, puis traiter les données obtenues.

In [None]:
import csv

In [None]:
with open('boxo.csv','r') as boxo:
    table=[]
    lecteur=csv.DictReader(boxo,delimiter=';')
    for film in lecteur:
        table.append(film)

In [None]:
table[:3]

**Q3.4** Donner la valeur et la signification des expressions suivantes.

In [None]:
sum(int(film['entrées']) for film in table[:10])/10

In [None]:
len([film for film in table[:42] if 'France' in film['pays']])

In [None]:
[film['titre'] for film in table if 'James' in film['réalisateur'] and int(film['entrées'])>10000000]

**Q3.5** Comparer le nombre moyen d'entrées des films français avec le nombre moyen d'entrées des films américains pour les films de ce top 100.

**Q3.6** Combien de films suisses sont présents dans ce top 100 ?

## Deux tris quadratiques

Les algorithmes de tri "naïfs" vus en première sont **quadratiques** dans le pire des cas, ce qui signifie qu'un doublement du nombre d'élément à trier se traduit par un quadruplement du nombre de comparaisons effectuées pour le tri. Cette complexité est valable dans le pire des cas, en particulier le tri par inserion présenté ici est linéaire sur des données déjà triées.

Les versions présentées ici sont de style impératif, et on trie des tableaux : les accès aux données se font par indice dans des tableaux de taille fixée, on utilise les listes Python comme des tableaux, on n'utilise ni `append` ni d'énumération par `for elt in liste`.

In [None]:
def triSelection(tableau):
    #pour chaque position du tableau en partant du début
    #chercher le minimum du reste du tableau en partant de cette position
    #placer ce minimum en tête en l'échangeant avec le premier élément

In [None]:
def triInsertion(tableau):
    #pour chaque élément du tableau
    #l'insérer dans le début du tableau en l'échangeant avec l'élément précédent si celui-ci lui est supérieur

**Q4.1** Ecrire la fonction `triSelection` à partir des indications données plus haut.

**Q4.2** Donner un variant de boucle pour la boucle extérieure, et un invariant de boucle. Qu'est ce que cela permet de prouver ?

**Q4.3** Calculer la complexité de la boucle intérieure puis celle de la boucle extérieure, en nombre de comparaison. Est-ce que cette complexité dépend des données ?

**Q4.4** Mêmes questions pour la fonction `triInsertion`.

**Q4.5** Montrer que la complexité de la boucle intérieure dépend des données qu'on trie. Qule est le meilleur cas ? Le pire cas ?

In [None]:
def triSelection(l):
    for i in range(len(l)):
        j,m=i,l[i]
        for k in range(j+1,len(l)):
            if l[k]<m:
                j,m=k,l[k]
        l[i],l[j]=l[j],l[i]

liste=[80,76,14,50,35,22,29,56,44]
triSelection(liste)  #tri en place, comme la méthode .sort(), paradigme impératif
print(liste)

In [None]:
def triInsertion(l):
    for i in range(len(l)):
        j=i
        while j>0 and l[j-1]>l[j]:
            l[j-1],l[j]=l[j],l[j-1]
            j=j-1

liste=[80,76,14,50,35,22,29,56,44]
triInsertion(liste)  #tri en place, comme la méthode .sort(), paradigme impératif
print(liste)

On pourra consulter le déroulement des deux fonctions sur <a href="https://pythontutor.com">Python Tutor</a> (un site indispensable) :
<a href="http://pythontutor.com/visualize.html#code=def%20triSelection%28l%29%3A%0A%20%20%20%20for%20i%20in%20range%28len%28l%29%29%3A%0A%20%20%20%20%20%20%20%20j,m%3Di,l%5Bi%5D%0A%20%20%20%20%20%20%20%20for%20k%20in%20range%28j%2B1,len%28l%29%29%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20if%20l%5Bk%5D%3Cm%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20j,m%3Dk,l%5Bk%5D%0A%20%20%20%20%20%20%20%20l%5Bi%5D,l%5Bj%5D%3Dl%5Bj%5D,l%5Bi%5D%0A%0Aliste%3D%5B80,76,14,50,35,22,29,56,44%5D%0AtriSelection%28liste%29%20%20%23tri%20en%20place,%20comme%20sorted%28%29,%20paradigme%20imp%C3%A9ratif%0Aprint%28liste%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false">tri sélection</a> et <a href="http://pythontutor.com/visualize.html#code=def%20triInsertion%28l%29%3A%0A%20%20%20%20for%20i%20in%20range%28len%28l%29%29%3A%0A%20%20%20%20%20%20%20%20j%3Di%0A%20%20%20%20%20%20%20%20while%20j%3E0%20and%20l%5Bj-1%5D%3El%5Bj%5D%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20l%5Bj-1%5D,l%5Bj%5D%3Dl%5Bj%5D,l%5Bj-1%5D%0A%20%20%20%20%20%20%20%20%20%20%20%20j%3Dj-1%0A%0Aliste%3D%5B80,76,14,50,35,22,29,56,44%5D%0AtriInsertion%28liste%29%20%20%23tri%20en%20place,%20comme%20sorted%28%29,%20paradigme%20imp%C3%A9ratif%0Aprint%28liste%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false">tri insertion</a>.

Ci-dessous on utilise le magic `%%timeit` pour chronométrer nos deux fonctions sur quelques listes générées aléatoirement ; attention on doit recopier les listes avant de les trier, sinon à partir de la deuxième tentative on trie un eliste déjà triée. On constatera que la recopie prend un temps négligeable devant le tri.

In [None]:
from random import randint
liste=[randint(1,10000) for k in range(1000)]
liste[:10]

In [None]:
%%timeit
l=liste[:]

In [None]:
%%timeit
l=liste[:]
triSelection(l)

In [None]:
%%timeit
l=liste[:]
triInsertion(l)

In [None]:
listetriee=list(range(1000))

In [None]:
%%timeit
l=listetriee[:]
triInsertion(l)

## Les $k$ plus proches voisins
Le fichier `communes.csv` contient les coordonnées et les noms des communes bas-normandes et de deux départements voisins.

Nous écrivons une fonction qui va parcourir la liste de ces communes et ne garder que les $k$ communes les plus proches d'un point donné.

Nous effectuons ensuite un vote majoritaire pour proposer le département dans lequel doit se trouver le point proposé.

In [None]:
from math import pi,cos,sin,acos

def distance(pos1,pos2):
    lat1=pos1[0]/180*pi
    long1=pos1[1]/180*pi
    lat2=pos2[0]/180*pi
    long2=pos2[1]/180*pi
    alpha=acos(sin(lat1)*sin(lat2)+cos(lat1)*cos(lat2)*cos(long1-long2))
    return 6378137*alpha

def trie(liste):
    i=len(liste)-1
    while i>0 and liste[i-1]>liste[i]:
        liste[i-1],liste[i]=liste[i],liste[i-1]
        i=i-1

In [None]:
def knn(lat0,long0,k=7):
    with open('communes.csv','r') as comm:
        champs=['nom','code','dpt','lat','long','alt','superficie','population','geometrie']
        reader=csv.DictReader(comm,fieldnames=champs,delimiter=";")
        nn=[]
        for commune in reader:
            lat,long=float(commune['lat']),float(commune['long'])
            d=distance((lat0,long0),(lat,long))
            if len(nn)<k:
                nn.append((d,commune['nom'],commune['dpt']))
                trie(nn)
            elif d<nn[k-1][0]:
                nn[k-1]=(d,commune['nom'],commune['dpt'])
                trie(nn)
    return nn

knn(48.8512,-0.8896)
                

In [None]:
def compte(liste):
    candidats=dict()
    for i,t in enumerate(liste):
        if t[2] not in candidats:
            candidats[t[2]]=(1,1/(1+t[0]))
        else:
            candidats[t[2]]=(candidats[t[2]][0]+1,candidats[t[2]][1]+1/(1+t[0]))
    cc=[(c[0],c[1],c) for c in candidats.keys()]
    cc.sort()
    return cc[-1][2]

compte(knn(48.8512,-0.8896,10))
        

In [None]:
knn(48.6361,-1.5114,7)

In [None]:
Lison=knn(49.2414,-1.0381,30)
for d,v,dpt in Lison:
    print(f"distance {d} de {v} qui est dans le département {dpt}")
print('Conclusion de 30-nn : département ',compte(Lison))

## Fusionner deux listes : le tri fusion
Le tri fusion est un exemple canonique de la méthode diviser pour régner. Il s'agit de trier chaque moitié d'une liste puis de fusionner les deux listes triées en une seule liste, triée elle aussi. 

La version proposée ci-dessous est **récursive**, avec une approche fonctionnelle comme `sorted()`, sans effet de bord : la liste initiale n'est pas modifiée.

On peut visualiser le déroulement de la fonction `fusion` sur l'exemple <a href="http://pythontutor.com/visualize.html#code=def%20fusion%28l1,l2%29%3A%0A%20%20%20%20if%20l1%3D%3D%5B%5D%3A%0A%20%20%20%20%20%20%20%20return%20l2%0A%20%20%20%20if%20l2%3D%3D%5B%5D%3A%0A%20%20%20%20%20%20%20%20return%20l1%0A%20%20%20%20if%20l1%5B0%5D%3Cl2%5B0%5D%3A%0A%20%20%20%20%20%20%20%20return%20%5Bl1%5B0%5D%5D%2Bfusion%28l1%5B1%3A%5D,l2%29%0A%20%20%20%20else%3A%0A%20%20%20%20%20%20%20%20return%20%5Bl2%5B0%5D%5D%2Bfusion%28l1,l2%5B1%3A%5D%29%0A%0Al1%3D%5B22,29,35,44,56%5D%0Al2%3D%5B14,27,50,61,76%5D%0Aprint%28fusion%28l1,l2%29%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false">ici</a>, et le tri complet <a href="http://pythontutor.com/visualize.html#code=def%20triFusion%28l%29%3A%0A%20%20%20%20if%20len%28l%29%3C2%3A%0A%20%20%20%20%20%20%20%20return%20l%0A%20%20%20%20else%3A%0A%20%20%20%20%20%20%20%20return%20fusion%28triFusion%28l%5B%3Alen%28l%29//2%5D%29,triFusion%28l%5Blen%28l%29//2%3A%5D%29%29%0A%0Al%3D%5B80,76,14,50,35,22,29,56,44%5D%0Aprint%28triFusion%28l%29%29%0Aprint%28l%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false">là</a>.

In [None]:
def fusion(l1,l2):
    if l1==[]:
        return l2
    if l2==[]:
        return l1
    if l1[0]<l2[0]:
        return [l1[0]]+fusion(l1[1:],l2)
    else:
        return [l2[0]]+fusion(l1,l2[1:])

l1=[22,29,35,44,56]
l2=[14,27,50,61,76]
print(fusion(l1,l2))

In [None]:
def triFusion(liste):
    #si la liste est de longueur 0 ou 1, elle est déjà tiée
    #sinon trier récursivement la première moitié, puis la deuxième moitié
    #et renvoyer la fusion de ces deux moitiés triées

**Q4.6** Compléter la fonction `triFusion` en utilisant la fonction `fusion`

In [None]:
def triFusion(l):
    if len(l)<2:
        return l
    else:
        return fusion(triFusion(l[:len(l)//2]),triFusion(l[len(l)//2:]))

l=[80,76,14,50,35,22,29,56,44]
print(triFusion(l))
print(l)

## Parcourir une liste pour la partitionner : le tri rapide
L'idée du tri rapide est de choisir un élément de la liste à trier appelé le **pivot**, et de trier séparément la liste des éléments plus petits que le pivot et la liste des éléments plus grands que le pivot.

Comme le tri fusion, c'est un exemple canaonique de l'approche diviser pour régner ; contrairement au tri pivot, la division du problème ne se fait pas nécessairement en deux parties (presque) égales, et le tri rapide peut être quadratique dans des cas comme celui d'une liste déjà triée.

On propose ci-dessous deux implémentations assez différentes :
* la première est fonctionnelle et traduit directement l'idée du tri rapide
* la deuxième est impérative, en place (elle ne crée pas de nouvelles structures de données mais travaille dans le tableau initial).

Cependant les deux fonctions proposées sont récursives.

In [3]:
def triRapideFonctionnel(liste):
    if len(liste)<2:
        return liste
    else:
        return triRapideFonctionnel([k for k in liste[1:] if k<liste[0]])+\
        [liste[0]]+triRapideFonctionnel([k for k in liste[1:] if k>=liste[0]]) #le \ casse une ligne trop longue

liste=[80,76,14,50,35,22,29,56,44]
print(triRapideFonctionnel(liste))
print(liste)

[14, 22, 29, 35, 44, 50, 56, 76, 80]
[80, 76, 14, 50, 35, 22, 29, 56, 44]


In [4]:
def triRapideFonctionnel(liste):
    return liste if len(liste)<2 else triRapideFonctionnel([k for k in liste[1:] if k<liste[0]])+\
        [liste[0]]+triRapideFonctionnel([k for k in liste[1:] if k>=liste[0]])

In [2]:
def partitionne(tableau,debut,fin):
    j=debut
    for i in range(debut,fin):
        if tableau[i]<=tableau[fin]:
            tableau[i],tableau[j]=tableau[j],tableau[i]
            j=j+1
    tableau[j],tableau[fin]=tableau[fin],tableau[j]
    return j

def triRapideImperatif(tableau,debut=0,fin=None):
    if fin is None:
        fin=len(liste)-1
    if debut<fin:
        k=partitionne(tableau,debut,fin)
        triRapideImperatif(tableau,debut,k-1)
        triRapideImperatif(tableau,k+1,fin)
        
liste=[80,76,14,50,35,22,29,56,44]
print(triRapideImperatif(liste))
print(liste) #il s'agit d'un tri en place      

None
[14, 22, 29, 35, 44, 50, 56, 76, 80]


## Mélanger une liste
**Q4.7** De quel tri cet algorithme est-il l'inverse ?

In [None]:
from random import randint
#randint(a,b) renvoit un entier entre a et b inclus

def knuth(l):
    n=len(l)
    for i in range(n-1):
        j=randint(i,n-1)
        l[i],l[j]=l[j],l[i]

liste=list(range(1,21))
print(liste)
knuth(liste)
print(liste)
knuth(liste)
print(liste)

## Parcours logarithmique : diviser pour régner
On peut grandement améliorer le coût d'une recherche d'un élément dans un tableau si ce tableau a été préalablement trié. En comparant la valeur recherchée à la valeur présente au milieu du tableau, si ces deux valeurs ne sont pas égales on sait dans quelle moitié chercher.

**Q5.1** Compléter la fonction `rechercheDicho` ci-dessous, en prêtant attention aux cas de base.

In [None]:
def rechercheDicho(elt,liste):
    #si la liste est vide ...
    #si elt est égal au terme médian de la liste ...
    #sinon en comparant elt à ce terme median faire un appel récursif

In [None]:
l=[14,22,29,35,44,50,56,76,80]
print(rechercheDicho(61,liste))
print(rechercheDicho(22,liste))

Une proposition est au bout de ce <a href="hhttp://pythontutor.com/visualize.html#code=def%20rechercheDicho%28elt,liste%29%3A%0A%20%20%20%20if%20liste%3D%3D%5B%5D%3A%0A%20%20%20%20%20%20%20%20return%20False%0A%20%20%20%20m%3Dlen%28liste%29//2%0A%20%20%20%20if%20elt%3D%3Dliste%5Bm%5D%3A%0A%20%20%20%20%20%20%20%20return%20True%0A%20%20%20%20elif%20elt%3Cliste%5Bm%5D%3A%0A%20%20%20%20%20%20%20%20return%20rechercheDicho%28elt,liste%5B%3Am%5D%29%0A%20%20%20%20else%3A%0A%20%20%20%20%20%20%20%20return%20rechercheDicho%28elt,liste%5Bm%2B1%3A%5D%29%0A%0A%0Al%3D%5B14,22,29,35,44,50,56,76,80%5D%0Aprint%28rechercheDicho%2861,l%29%29%0Aprint%28rechercheDicho%2822,l%29%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false">lien</a>.

## Parcourir un arbre binaire de recherche
Un arbre binaire de recherche est un arbre binaire qui possède la propriété que chaque sous arbre a une étiquette sur sa racine qui est supérieure à toutes les étiquettes du sous arbre gauche et inférieure à toutes les étiquettes du sous arbre droit.

On utilise les primitives suivantes : 
* `ab(racine,sabg=None,sabgd=None)` construit un arbre binaire de racine donnée, avec les sous-arbres `sabg` à gauche et `sabd` à droite
* `vide()` renvoie un arbre vide
* `est_vide(arbre)` est une fonction à valeurs booléennes qui teste si un arbre est vide
* `racine(arbre)` renvoie l'étiquette de la racine
* `gauche(arbre)` et `droite(arbre)` renvoient le sous arbre gauche et le sous arbre droit respectivement

On propose une implémentation de ces cinq fonctions <a href="http://pythontutor.com/visualize.html#code=def%20ab%28r,g%3DNone,d%3DNone%29%3A%0A%20%20%20%20return%20%28r,g,d%29%0A%20%20%20%20%0Adef%20est_vide%28arbre%29%3A%0A%20%20%20%20return%20arbre%20is%20None%0A%0Adef%20racine%28arbre%29%3A%0A%20%20%20%20return%20arbre%5B0%5D%0A%20%20%20%20%0Adef%20gauche%28arbre%29%3A%0A%20%20%20%20return%20arbre%5B1%5D%0A%20%20%20%20%0Adef%20droite%28arbre%29%3A%0A%20%20%20%20return%20arbre%5B2%5D%0A%0A%0Aabr%3Dab%2850,ab%2835,ab%2822,ab%2814%29,ab%2829%29%29,ab%2844%29%29,ab%2876,ab%2856%29,ab%2880%29%29%29%0A&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false">ici</a>, et une version sous forme de classe un peu plus bas.

<img src="abr.png"/>

**Q5.2** Que faut-il modifier dans la fonction `rechercheDicho(elt,liste)` pour obtenir une fonction `rechercheABR(elt,arbre)` ?

**Q5.3** Ecrire une fonction `liste2ABR` qui transforme une liste triée en arbre binaire de recherche récursivement.

In [None]:
def liste2ABR(liste):
    #si la liste est vide renvoyer ...
    #si la liste est de longueur 1 renvoyer ...
    #sinon m=len(l)//2, renvoyer l'arbre de racine ..., de sous-arbre gauche ..., de sous-arbre droit ...

**Q5.4** Est-ce que la fonction `liste2ABR` proposée <a href="http://pythontutor.com/visualize.html#code=def%20ab%28r,g%3DNone,d%3DNone%29%3A%0A%20%20%20%20return%20%28r,g,d%29%0A%20%20%20%20%0Adef%20vide%28%29%3A%0A%20%20%20%20return%20None%0A%0Adef%20est_vide%28arbre%29%3A%0A%20%20%20%20return%20arbre%20is%20None%0A%0Adef%20racine%28arbre%29%3A%0A%20%20%20%20return%20arbre%5B0%5D%0A%20%20%20%20%0Adef%20gauche%28arbre%29%3A%0A%20%20%20%20return%20arbre%5B1%5D%0A%20%20%20%20%0Adef%20droite%28arbre%29%3A%0A%20%20%20%20return%20arbre%5B2%5D%0A%0Adef%20liste2ABR%28liste%29%3A%0A%20%20%20%20if%20liste%3D%3D%5B%5D%3A%0A%20%20%20%20%20%20%20%20return%20vide%28%29%0A%20%20%20%20if%20len%28liste%29%3D%3D1%3A%0A%20%20%20%20%20%20%20%20return%20ab%28liste%5B0%5D%29%0A%20%20%20%20m%3Dlen%28liste%29//2%0A%20%20%20%20return%20ab%28liste%5Bm%5D,liste2ABR%28liste%5B%3Am%5D%29,liste2ABR%28liste%5Bm%2B1%3A%5D%29%29%0A%20%20%20%20%20%20%20%20%0Aabr%3Dliste2ABR%28%5B14,22,29,35,44,50,56,76,80%5D%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false">ici</a> construit le même ABR que celui qui est représenté ci-dessus, à partir de la liste `[14,22,29,35,44,50,56,76,80]` ?

## Structures linéaires, structures hiérarchiques
On a donné ci-dessous les méthodes plusieurs classes linéaires (Pile, File) ou hiérarchiques/relationelles (arbre binaire/graphe).

La première méthode est le constructeur, les autres définissent l'ensemble des opérations possibles sur le type d'objet.

<img src="classes.png"/>

## Algorithme + structure de données = programmation
L'étape cruciale entre la description informelle d'un algorithme et la programmation de cet algorithme est le choix de structures de données adaptées.
Chaque structure est définie par les opérations primitives qu'on peut lui appliquer.

**Q6** On donne la classe arbreBinaire ci-dessous. Compléter les méthodes `hauteur` et `taille` (on considérera que la hauteur d'un arbre vide est $-1$).
(Notons que ce n'est pas le choix fait dans le sujet zéro)

In [None]:
class arbreBinaire:
    def __init__(self,racine,g=None,d=None):
        self.r=racine
        if racine:
            self.g=g if g else arbreBinaire(None)
            self.d=d if d else arbreBinaire(None)
    def estVide(self):
        return self.r is None
    def racine(self):
        return self.r
    def gauche(self):
        return self.g
    def droite(self):
        return self.d
    def hauteur(self):
        return
    def taille(self):
        return

In [None]:
arbre=arbreBinaire('s',arbreBinaire('i',arbreBinaire('g',arbreBinaire('a'),arbreBinaire('l')),
                                    arbreBinaire('r',arbreBinaire('o'))),
                  arbreBinaire('e',arbreBinaire('h',arbreBinaire('t')),arbreBinaire('m')))

In [None]:
assert arbre.taille()==11
assert arbre.hauteur()==3

## Parcours d'arbres

<img src="arbre.png"/>

Il y a trois façons de parcourir cet arbre récursivement :
* parcours préfixe chaque sommet est traité dès qu'il est rencontré 
* parcours infixe chaque sommet est traité après avoir traité son sous arbre gauche et avant de traiter son sous arbre droit
* parcours suffixe chaque sommet est traité après que ses deux sous arbres l'aient été

La fonction récursive `DFSprefixe` ci-dessous effectue un parcours en profondeur préfixe, en affichant les sommets visités dans l'ordre de la visite.

In [None]:
def DFSprefixe(arbre):
    if not arbre.estVide():
        print(arbre.racine())
        DFSprefixe(arbre.gauche())
        DFSprefixe(arbre.droite())
                   
DFSprefixe(arbre)

**Q7.1** Ecrire la fonction `DFSinfixe` qui effectue un parcours en profondeur infixe.

**Q7.2** Dans quel ordre sont visités les sommets de l'arbre avec un parcours suffixe ?

**Q7.3** Pour transformer un ABR en liste, lequel des trois parcours en profondeur est adapté ?

## Piles et files, DFS et BFS
On propose ci-dessous des implémentations simples des types Pile (LIFO Last In First Out) et File (FIFO First In First Out), qui vont nous servir pour les algorithmes DFS et BFS itératifs (aussi bien sur les arbres que sur les graphes).

En ce qui concerne les choix d'implémentation, pour les Piles on utilise ici les listes Python et leurs méthodes `append()` et `pop()` ; pour les files on utilise deux piles, une pile d'entrée et une pie de sortie.

In [None]:
class Pile:
    def __init__(self):
        self.t=[]
    def estVide(self):
        return self.t==[]
    def empile(self,elt):
        self.t.append(elt)
    def depile(self):
        return t.pop()

In [None]:
class File:
    def __init__(self):
        self.entree=Pile()
        self.sortie=Pile()
    def estVide(self):
        return self.entree.estVide() and self.sortie.estVide()
    def enfile(self,elt):
        self.entree.empile(elt)
    def defile(self):
        if self.sortie.estVide():
            while not self.entree.estVide():
                self.sortie.empile(self.entrer.depile())
        return self.sortie.depile()

In [None]:
def DFS(arbre):
    #la liste dejavus est initialement vide
    #on crée une pile vide
    #on empile la racine
    #tant que la pile n'est pas vide 
        #dépiler le sommet et l'ajouter à dejavus
        #empiler les éventuels enfants du sommet
    #renvoyer dejavus

In [None]:
def BFS(arbre):
    #la liste dejavus est initialement vide
    #on crée une file vide
    #on enfile la racine
    #tant que la file n'est pas vide 
        #défiler le sommet et l'ajouter à dejavus
        #enfiler les éventuels enfants du sommet
    #renvoyer dejavus

**Q7.4** Compléter les deux fonctions ci dessus (sans regarder la solution ci-dessous).

**Q7.5** Ecrire une séquence d'instruction créant un ou des arbres puis les explorant.

In [None]:
def DFS(arbre):
    dejavus=[]
    p=Pile()
    p.empile(arbre.racine())
    while not p.estVide(): 
        s=p.depile()
        dejavus.append(s)
        if not arbre.gauche.estVide():
            p.empile(arbre.gauche.racine())
        if not arbre.droite.estVide():
            p.empile(arbre.droite.racine())
    return dejavus

In [None]:
def BFS(arbre):
    dejavus=[]
    f=File()
    f.enfile(arbre.racine())
    while not f.estVide():
        s=f.defile()
        dejavus.append(s)
        if not arbre.gauche.estVide():
            f.enfile(arbre.gauche.racine())
        if not arbre.droite.estVide():
            f.enfile(arbre.droite.racine())
    return dejavus

**Q7.6** Ecrire une fonction `evalAST` qui calcule la valeur de l'expression algébrique représentée par un AST (abstract syntax tree) du type de celui ci-dessous.

<img src="ast.png"/>

**Q7.7** Ecrire une fonction `expr2AST` qui construit un `AST` à partir d'une expression <a href="https://fr.wikipedia.org/wiki/Notation_polonaise_inverse">postfixe</a>, p.ex l'arbre ci-dessous correspond à l'expression `5 8 * 10 2 / 3 - +`.

**Q7.8** Ecrire une fonction `AST2infixe` qui transforme l'arbre ci-dessus en la chaîne `(5*8)+((10/2)-3)` (qu'on pourra évaluer avec `eval`). Attention aux parenthèses !

## Parcours de graphes

<img src="grapheWP.png"/>

**Q7.9** Explorer le graphe ci-dessus, en partant du sommet 1,
* en largeur,
* en profondeur.

On explorera les voisins par numéros croissants.

La seule modification par rapport à un parcours d'arbre est qu'on ne visite que les voisins qui n'ont pas déjà été visités.

In [None]:
def DFS(graphe,sommet):
    dejavus=[]
    p=Pile()
    p.empile(sommet)
    while not p.estVide(): 
        s=p.depile()
        dejavus.append(s)
        for v in graphe.voisins(sommet):
            if v not in dejavus:
                p.empile(v)
    return dejavus

In [None]:
def BFS(graphe,sommet):
    dejavus=[]
    f=File()
    f.enfile(sommet)
    while not f.estVide(): 
        s=f.defile()
        dejavus.append(s)
        for v in graphe.voisins(sommet):
            if v not in dejavus:
                f.enfile(v)
    return dejavus

## Algorithmes de graphes basés sur des parcours

Quelques algorithmes de graphes basés sur des parcours :
* Dijkstra est basé sur BFS
* La recherche de cycles
* A* basé sur une exploration d'arbre avec élagage
* backtracking : DFS sur un arbre des possibles 

## Utilisation de graphviz
Les arbres et graphes présentés ci-dessus ont été générés avec la bibliothèque `graphviz`.

In [None]:
from graphviz import Digraph, Graph

abr=Digraph(filename='abr',format='png')
abr.node('a','50')
abr.node('b','35')
abr.node('c','76')
abr.node('d','22')
abr.node('e','44')
abr.node('f','56')
abr.node('g','80')
abr.node('h','14')
abr.node('i','29')
abr.edges(['ab','ac','bd','be','cf','cg','dh','di'])

arbre = Digraph(comment='arbre',format='png')
for c in 'algorithmes':
    arbre.node(c)
arbre.edges(['si','se','ig','ir','ga','gl','ro','eh','em','ht'])

ast=Graph(filename='ast',format='png')
ast.node('a','+')
ast.node('b','*')
ast.node('c','-')
ast.node('d','5')
ast.node('e','8')
ast.node('f','/')
ast.node('g','3')
ast.node('h','10')
ast.node('i','2')
ast.edges(['ab','ac','bd','be','cf','cg','fh','fi'])

graphe=Graph(filename='grapheWP',format='png')
graphe.attr(rankdir='LR')
for n in range(1,9):
    graphe.node(str(n))
graphe.edges(['12','13','14','23','24','26','35','38','45','46','57','58','78'])

graphe2=Graph(filename='c-exWP',format='png')
graphe2.attr(rankdir='LR')
for c in 'abcdefgh':
    graphe2.node(c)
graphe2.edges(['ab','bc','bd','cf','de','fg','eg','gh'])

abr.view()

## Récursivité, pile d'appels, arbre d'appels

In [None]:
def facto(n):
    if n<2:
        return 1
    return n*facto(n-1)

print(facto(5))

En exécutant l'appel `facto(5)` <a href="">dans Python Tutor</a>, on voit que les appels successifs sont
* `facto(5)`
* `facto(4)`
* `facto(3)`
* `facto(2)`
* `facto(1)` qui est un cas de base renvoyant 1;
ensuite on remonte la pile des appels avec 
* `facto(2)`->`2*1`
* `facto(3)`->`3*2`
* `facto(4)`->`4*6`
* `facto(5)`->`5*24`
On voit que la récursivité n'est pas terminale : chaque étape de la remontée contient un calcul qui modifie le résultats transmis.

In [None]:
def factoRT(n,acc=1):
    if n<2:
        return acc
    else:
        return factoRT(n-1,n*acc)

print(factoRT(5))

**Q8** Exécuter la fonction `factoRT` avec l'argument `5` dans <a href="pythontutor.com">Python Tutor</a>.

Cette fonction est-elle récursive terminale ?

Identifier un variant de boucle et un invariant de boucle qui prouvent la teminaison et la correction de cette fonction récursive.

## Identifier des sous -problèmes indépendants : la programmation dynamique

La suite de Fibonacci $(F_n)$ est définie par les deux premiers termes $F_0=F_1=1$ et par la relation de récurrence $F_n=F_{n-2}+F_{n-1}$ pour $n \geqslant 2$ entier ; chaque terme est la somme des deux termes précédents.

In [None]:
def Fibo(n):
    if n<2:
        return 1
    else:
        return Fibo(n-2)+Fibo(n-1)

print(Fibo(5))

**Q9.1** Dessiner l'arbre des appels récursifs liés à l'appel initial `Fibo(5)`.

Le principe de la programmation dynamique est de traiter les sous problèmes communs avant de traiter le problème initial.

Par exemple pour calculer le n$^\text{ième}$ terme de la suite de Fibonacci, on calcule les termes précédents d'abord. 

In [None]:
def FiboProgDyn(n):
    f={0:1,1:1}
    for k in range(2,n+1):
        f[k]=f[k-2]+f[k-1]
    return f[n]

FiboProgDyn(5)

In [None]:
%time Fibo(30)
%time FiboProgDyn(30)

Les coefficients binomiaux "$k$ parmi $n$" sont définis pour $k,n \in \mathbb{N}$ par $\binom{n}0 = \binom n 1=1$ et $\binom {n}{k}=\binom{n-1}{k-1}+\binom{n-1}{k}$ pour $0 < k <n$.

In [None]:
def binom(n,k):
    if k==0 or k==n:
        return 1
    else:
        return binom(n-1,k-1)+binom(n-1,k)

binom(10,4)

**Q9.2** Combien d'appels récursifs à la fonction `binom` sont-ils effectués lors de l'appel `binom(10,4)` ? Et pour `binom(20,10)` ?

**Q9.3** Compléter la fonction ci-dessous qui renvoie la n$^\text{ième}$ ligne du triangle de Pascal. (Commencer par construire un <a href="https://fr.wikipedia.org/wiki/Triangle_de_Pascal">triangle de Pascal</a> sur papier est indispensable). (<a href="http://pythontutor.com/visualize.html#code=def%20pascal%28n%29%3A%0A%20%20%20%20l%3D%5B1%5D%0A%20%20%20%20for%20u%20in%20range%28n%29%3A%0A%20%20%20%20%20%20%20%20for%20i%20in%20range%28u,0,-1%29%3A%0A%20%20%20%20%20%20%20%20%20%20%20%20l%5Bi%5D%2B%3Dl%5Bi-1%5D%0A%20%20%20%20%20%20%20%20l.append%281%29%0A%20%20%20%20return%20l%0A%0Apascal%287%29&cumulative=false&curInstr=0&heapPrimitives=nevernest&mode=display&origin=opt-frontend.js&py=3&rawInputLstJSON=%5B%5D&textReferences=false">corrigé</a>)

In [None]:
def pascal(n):
    """
    >>> pascal(5)
    [1, 5, 10, 10, 5, 1]
    """
    #initialiser la ligne l avec un seul coefficient, 1
    #pour chaque nouvelle ligne
        #ajouter à chaque élément, en partant de la droite, l'élément précédent
        #sauf pour le 1 initial évidemment, qui n'a pas d'élément précédent
        #ajouter un 1 à la fin de la nouvelle ligne
    return l

pascal(5)

Voici un petit programme pour générer l'arbre des appels récursifs de la fonction `Fibo` de la question **9.1**.

Noter la structure récursive de cette fonction !

In [None]:
from graphviz import Graph

fib=Graph(filename='Fibo',format='png')
noeud=0

def fibo(n):
    global noeud
    nom=str(noeud)
    noeud=noeud+1
    fib.node(nom,f"Fibo({n})")
    if n>1:
        g=fibo(n-2)
        d=fibo(n-1)
        fib.edge(nom,g)
        fib.edge(nom,d)
    return nom

fibo(5)
fib.view()

Et voilà le résultat pour l'appel `Fibo(5)`.
<img src="Fibo.png"/>

**Q9.4** Installer graphviz et lancer `fibo(10)`.

## Parcourir une liste de choix successifs, et faire les bons
Un **algorithme glouton** a comme principe de faire une succession de choix locaux afin d'arriver rapidement à une solution. Nous prenons l'exemple de Welsh Powell, algorithme de coloration de graphe. 

<img src="grapheWP.png"/>

Voici l'algorithme :
* ranger les sommets par degré décroissant
* tant qu'il reste des sommets à colorier :
  * choisir une nouvelle couleur
  * parcourir les sommets pas encore coloriés dans l'ordre, en utilisant cette couleur pour les colorier si aucun de leur voisins n'a cette couleur

**Q10.1** Appliquer Welsh Powell à la main sur le graphe ci-dessus. Prouver la terminaison et la correction dans le cas général.

**Q10.2** Estimer la complexité en fonction de l'ordre du graphe (le nombre de sommets) ou de sa taille (son nombre d'arêtes).

**Q10.3** Appliquer Welsh Powell au graphe ci-dessous. L'algorithme est-il optimal ?

<img src="c-exWP.png"/>

**Q10.4** On donne ci-dessous une représentation du premier graphe par liste d'adjacence. 

Ecrire une fonction qui à une telle représentation associe la liste des sommets par ordre décroissant.

Quelles sont les structures de données qui vont être utiles pour la question suivante ?

Ecrire une fonction qui colorie un graphe avec l'algorithme de Welsh Powell.

In [None]:
g={1:[2,3,4],2:[1,3,4,6],3:[1,2,5,8],4:[1,2,5,6],5:[3,4,7,8],6:[2,4],7:[5,8],8:[3,5,7]}

## Parcourir l'univers (des possibles)
Le <a href="https://fr.wikipedia.org/wiki/Probl%C3%A8me_des_huit_dames">problème des huit reines</a>, posé par Gauss en 1842, consiste à placer huit reines sur un échiquier de façon à ce qu'aucune ne soit sur la même ligne, colonne ou diagonale qu'une autre.
Une démarche possible pour déterminer toutes les solutions est d'explorer systématiquement toutes les possibilités. Choisir 8 cases parmi 64 donne $\binom{64}8 = 4426165368$ possibilités à explorer, dont la plupart comporteront plusieurs reines sur une même ligne ou une même colonne. Il est simple d'**élaguer** l'arbre des possibles en remarquant qu'il doit y avoir exactement une reine par ligne, avec des numéros de colonnes distincts. Par conséquent les solutions sont à chercher parmi les permutations de $\left\{0;1;2;3;4;5;6;7\right\}$. 

In [None]:
def reines(n,l=[]):
    impossible=l[:]
    for i,j in enumerate(l):
        impossible.append(j+len(l)-i)
        impossible.append(j-len(l)+i)
    possible=[k for k in range(n) if k not in impossible]
    for k in possible:
        l.append(k)
        if len(l)==n:
            print(l)
        else:
            reines(n,l)
        l.pop()

reines(4)

In [None]:
reines(8) #attention il y a 92 solutions

## Fabriquer un labyrinthe et en sortir

De chaque salle de notre labyrinthe nous pouvons nous rendre dans d'autres salles (pour les cul de sac, au moins nous pouvons revenir sur nos pas). Ainsi un labyrinthe peut être modélisé par un graphe, et l'exploration du labyrinthe par une exploration graphe.

Nous allons nous intéresser ici à des labyrinthes rectangulaires, dans le sens où les salles sont des couples $(i,j)$ d'entiers, pour $0 \leqslant i < n$ et $0 \leqslant j < p$. On prendra ici la convention usuelle pour les matrices, à savoir **licol** : $i$ est le numéro de ligne (soit l'ordonnée, mais avec des ordonnées qui croissent vers le bas), $j$ est le numéro de colonne (abscisses croissant vers la droite).

Cette convention est cohérente avec le codage habituel en Python, sous forme de **grille**, liste de $n$ listes de $p$ éléments.

Cependant la structuure de données qui nous intéresse n'est pas la liste des salles, l'enjeu est de savoir si entre deux salles voisines données il y a un passage ou pas. C'est donc l'ensemble des arêtes qui joue le premier rôle.

Trois problèmes intéressants se posent à nous :
* l'exploration d'un labyrinthe
* la création d'un labyrinthe
* l'affichage d'un labyrinthe (textuel ou graphique)

Une technique de construction de labyrinthe classique est de casser des murs jusqu'à ce que le graphe soit connexe, et sans créer de cycle ; classiquement, pour $n*p$ sommets le graphe connexe acyclique obtenu est un arbre de taille $np-1$.

Deux questions se posent alors : 
* comment choisir quels murs casser ?
* comment éviter de créer des cycles ?

Les murs à casser peuvent être choisis au hasard, et une façon intéressante d'effectuer ce choix est d'affecter à chaque arête un poids aléatoire, et de se ramener à la construction d'un arbre couvrant minimal (ACM, en anglais Minimal Spanning Tree MST), problème très classique en théorie des graphes (et en routage sur un réseau local).

Pour éviter la création de cycles,
* l'algorithme de Kruskal (on ajoute des arêtes) construit des arbres (une forêt) en faisant diminuer le nombre de composantes connexes de 1 à chaque itération, chaque itération rajoutant une arête entre deux CC. 
* l'algorithme de Prim (on ajoute des sommets) part d'un sommet pris au hasard et fait grandir un arbre en n'ajoutant que des arêtes reliant un sommet de l'arbre et un sommet encore isolé.

Les deux algorithmes sont gloutons, et optimaux grâce au choix à chaque étape de l'arête au poids le plus faible.

Nous proposons ci-dessous la construction d'un labyrinthe aléatoire par la l'algorithme de Prim, et la la visualisation du labyrinthe ainsi construit.

Notons que le problème traité se prêterait particulièrement bien à une approche orientée objet.

In [None]:
import random 

def sommets(n,p):
    liste=[]
    for i in range(n):
        for j in range(p):
            liste.append((i,j))
    return liste

def aretes(n,p,germe=None):
    if germe:
        random.seed(germe)
    dico=dict()
    for i in range(n):
        for j in range(p):
            if i!=n-1:
                pds=random.random()
                dico[((i,j),(i+1,j))]=pds
                dico[((i+1,j),(i,j))]=pds# arêtes NS
            if j!=p-1:
                pds=random.random()
                dico[((i,j),(i,j+1))]=pds
                dico[((i,j+1),(i,j))]=pds # arêtes EO
    return dico

n,p=10,20
V=sommets(n,p)
E=aretes(n,p,42)

In [None]:
from math import inf

def minimum(l):
    """
    cherche le minimum dans un dict de la forme
    {sommet:(voisin,poids),...}
    le renvoie en le supprimant du dictionnaire
    (utiliser plutôt un tas binaire minimum améliorerait la complexité de l'algorithme)
    """
    print(l.keys())
    s,poids=None,inf
    for u in l.keys():
        if l[u][1]<poids:
            s,poids=u,l[u][1]
    p=l[s][0]
    del l[s]
    return s,p
            
def voisins(s):
    """
    fonction spécifique à nos labyrinthes rectangulaires
    """
    print(s)
    i,j=s[0],s[1]
    v=[]
    if i>0:
        v.append((i-1,j))
    if i<n-1:
        v.append((i+1,j))
    if j>0:
        v.append((i,j-1))
    if j<p-1:
        v.append((i,j+1))
    return v
    

def Prim(V,E):
    pred={V[0]:None}
    F={}
    for v in voisins(V[0]):
        F[v]=(V[0],E[v,V[0]])
    dejavus={V[0]}
    while F:
        u,p=minimum(F)
        pred[u]=p
        dejavus.add(u)
        for v in voisins(u):
            if v not in dejavus and (v not in F.keys() or E[(u,v)]<F[v][1]):
                F[v]=(u,E[(u,v)])
    return pred

laby=Prim(V,E)

In [None]:
mur=chr(0x2B1B)
vide=chr(0x2B1C)

def printlaby(l):
    a={(u,l[u]) for u in l}
    s=mur*(2*p+1)+'\n'
    for i in range(n):
        s+=mur
        for j in range(p-1):
            if ((i,j),(i,j+1)) in a or ((i,j+1),(i,j)) in a:
                s+=vide*2
            else:
                s+=vide+mur
        s+=vide+mur+'\n'
        if i<n-1:
            s+=mur
            for j in range(p):
                if ((i,j),(i+1,j)) in a or ((i+1,j),(i,j)) in a:
                    s+=vide+mur
                else:
                    s+=mur*2
            s+='\n'
    s+=mur*(2*p+1)+'\n'
    return s

s=printlaby(laby)
print(s)