<h1 style="font-size: 30px; text-align: center">Algorithmes sur les graphes - Activité d'introduction : explorer/parcourir un graphe</h1>

>On a un graphe et on veut l'explorer pour connaître la liste de tous les sommets.

# Exemple introductif : voyage en Roumanie

*d'après S. Russel et R. Norvig*

![graphe Roumanie](data/roumanie.png)

**Situation** : On part d'Arad et on souhaite explorer tout le graphe, c'est-à-dire passer par tous les sommets.

> Comment ne pas tourner en rond ?

Penser au petit poucet : marquer les sommets par lesquels on est passé (pour ne pas y repasser)

> Comment ne pas oublier de sommets ? 

S'obliger à utiliser toutes les arêtes (ou arcs).

## Comment procéder ?

- On explore Arad (on marque Arad) et on a le choix entre Zerind, Sibiu et Timisoara.
- Lequel choisit-on ensuite ? Par exemple Zerind.
- La question est : "après Zerind on va à Oreada ou à Sibiu ?"

On pourrait à chaque fois choisir au hasard parmi les villes que l'on sait atteignables, mais en pratique on va préférer établir une stratégie claire et simple :

- Soit on choisit d'explorer la dernière ville trouvée (et encore à explorer) : on choisirait Oradea.
- Soit on choisit d'explorer la première ville trouvée (et encore à explorer) : on choisirait Sibiu.

C'est deux stratégies correspondent à ce qu'on appelle respectivement **parcours en profondeur d'abord** et **parcours en largeur d'abord**.

Détaillons un peu le début de chaque parcours.

## Parcours en profondeur d'abord

<img src="data/roumanie.png" alt="graphe Roumanie" width="500">

1. On explore Arad (que l'on marque comme chaque sommet qui sera exploré) et on stocke ses voisins pas encore visités : Timisoara, Sibiu et Zerind.

| Sommets visités (marqués) | Sommets stockés (à visiter) |
| --- | --- |
| Arad | Timisoara, Sibiu, Zerind |


2. On explore le dernier, Zerind, et on stocke ses voisins pas encore visités : Oradea.

| Sommets visités (marqués) | Sommets stockés (à visiter) |
| --- | --- |
| Arad, Zerind | Timisoara, Sibiu, Oradea|


3. On explore le dernier, Oradea, et on stocke ses voisins pas encore visités : Sibiu (qui se retrouve deux fois puisqu'il n'a pas encore été marqué (visité), cela signifie qu'on peut atteindre Sibiu en venant de deux endroits différents : cela permet de détecter un cycle).

| Sommets visités (marqués) | Sommets stockés (à visiter) |
| --- | --- |
| Arad, Zerind, Oradea | Timisoara, Sibiu, Sibiu |


4. On explore le dernier, Sibiu, et on stocke ses voisins pas encore visités : Fagaras, Rimniu Vilcea.

| Sommets visités (marqués) | Sommets stockés (à visiter) |
| --- | --- |
| Arad, Zerind, Oradea, Sibiu | Timisoara, Sibiu, Fagaras, Rimnicu Vilcea |


5. Ainsi de suite...

## Parcours en largeur d'abord

<img src="data/roumanie.png" alt="graphe Roumanie" width="500">

1. On explore Arad (que l'on marque comme chaque sommet qui sera exploré) et on stocke ses voisins pas encore visités : Timisoara, Sibiu et Zerind.

| Sommets visités (marqués) | Sommets stockés (à visiter) |
| --- | --- |
| Arad | Timisoara, Sibiu, Zerind |

2. On explore le premier, Timisoara, et on stocke ses voisins pas encore visités : Lugoj.

| Sommets visités (marqués) | Sommets stockés (à visiter) |
| --- | --- |
| Arad, Timisoara | Sibiu, Zerind, Lugoj |

3. On explore le premier, Sibiu, et on stocke ses voisins pas encore visités : Oradea, Fagaras, Rimniu Vilcea.

| Sommets visités (marqués) | Sommets stockés (à visiter) |
| --- | --- |
| Arad, Timisoara, Sibiu | Zerind, Lugoj, Oradea, Fagaras, Rimnicu Vilcea |

4. On explore le premier, Zerind, et on stocke ses voisins pas encore visités : Oradea.

| Sommets visités (marqués) | Sommets stockés (à visiter) |
| --- | --- |
| Arad, Timisoara, Sibiu, Zerind | Lugoj, Oradea, Fagaras, Rimnicu Vilcea, Oradea |

5. Ainsi de suite...

# Ecriture des algorithmes de parcours

On souhaite écrire les algorithmes de parcours en profondeur d'abord et en largeur d'abord.

Quelle que soit la stratégie, il est nécessaire de stocker les sommets (villes) à visiter. 

**Question 1** : Selon la stratégie, quelle structure de données vous paraît la plus adaptée pour stocker les sommets à visiter ? *Réfléchissez à celles étudiées cette année ;-)*.

On suppose qu'on utilise un *dictionnaire* `visites` pour stocker les sommets marqués (visités). Il suffira d'ajouter à ce dictionnaire les sommets marqués au fur et à mesure en leur donnant par exemple la valeur `True` (valeur qui n'a pas d'importance ici).

**Quelques rappels sur la manipulation des dictionnaires Python**

Pour ajouter un élément (une clé) à un dictionnaire Python, il suffit de lui associer une valeur.

In [None]:
visites = {} # crée un ensemble vide
visites["a"] = True # ajoute la paire ("a", True) au dictionnaire
print(visites)
visites["b"] = True
print(visites)

On peut vérifier qu'un élément (un clé) appartient à un dictionnaire en utilisant le mot clé `in` ou sa négation.

In [None]:
"a" in visites # ou "a" in visites.keys()

In [None]:
"c" in visites

In [None]:
"c" not in visites

## Algorithme de parcours en profondeur d'abord

### Principe de l'algorithme

> Vous pouvez passez ce paragraphe si vous pensez être capable de (ou si vous souhaitez) programmer l'algorithme sans indications.

Pour effectuer le parcours d'un graphe en profondeur nous utilisons une pile qui contient initialement le sommet de départ. Tant que cette pile n'est pas vide, nous dépilons son sommet et regardons s'il a déjà été visité :
- Si ce n'est pas le cas, on le rajoute au dictionnaire `visites` des sommets visités et on empile tous ses voisins pas encore visités.
- Si c'est le cas, on ne fait rien (autrement dit, on passe à l'itération suivante avec le sommet suivant dans la pile).

Lorsque la pile est vide, le dictionnaire `visites` contient tous les sommets atteints par le parcours en profondeur du graphe à partir du sommet de départ.

### Ecriture de l'algorithme

On suppose dans cette partie qu'un graphe est représenté par un dictionnaire contenant la liste de successeurs de chaque sommet. Par exemple, un graphe `g1` est mémorisé par

In [None]:
g1 = {'a': ['c', 'f'],
      'b': ['c', 'e'],
      'c': ['a', 'b', 'd', 'e'],
      'd': ['c'],
      'e': ['b', 'c'],
      'f': ['g', 'a'],
      'g': ['f']
}

On suppose de plus que l'on implémente une pile par une `list` Python. On empile et dépile à la fin de la liste pour que les opérations soient efficaces.

In [None]:
pile = ["e"]
pile.append("b") # pour empiler un sommet
pile.append("c")
print(pile)
s = pile.pop() # pour dépiler (renvoie le sommet)
print(s)
print(pile)

**Question 1** : Ecrivez une fonction `parcours_prof(graphe, debut)` qui renvoie le dictionnaire `visites` des sommets visités par un parcours en profondeur du graphe `graphe` en partant du sommet `debut`.

In [None]:
# à vous de jouer !


**Question 2** : Appliquez cette fonction au graphe `g` précédent en partant du sommet `"a"`, puis en partant du sommet `"e"`. Tous les sommets du graphe sont-ils visités ? Pourquoi ?

> Si à partir d'un sommet le parcours en profondeur permet d'atteindre tous les autres sommets, on dit que le graphe (non orienté) est *connexe*.

In [None]:
# à vous de jouer !


> Comme on n'a pas vraiment besoin de la valeur (`True`) associée à chaque sommet (toute valeur aurait marché), on aurait pu utiliser une structure abstraite de données plus simple comme l'ensemble (type prédéfini `set` en Python).

**Question 3** : Si on applique l'algorithme sur la Roumanie, ça marche. Si on l'applique sur la France (en partant d'Angers par exemple) ça ne marche pas. Pourquoi ?

*Réponse* : 

**Question 4**: Proposez un dictionnaire `g2` représentant un graphe non orienté de 5 sommets dans lequel on ne peut pas atteindre tous les sommets à partir des autres, autrement dit un graphe *non connexe*.

In [None]:
# à vous de jouer !


**Question 5** : En utilisant le parcours en profondeur, vérifiez qu'en partant d'un sommet on ne peut pas atteindre tous les autres.

In [None]:
# à vous de jouer !


> Le parcours en profondeur permet de trouver tous les sommets accessibles à partir du sommet de départ, on appelle cela la *composante connexe* du sommet de départ. 

L'algorithme programmé ne liste que les sommets atteints par le parcours. Une façon de voir les sommets visités et ceux qui ne le sont pas est de supposer qu'on connaît tous les sommets (c'est souvent le cas comme ici) et d'initialiser le dictionnaire `visites` à `False` pour tous les sommets. Ainsi, les sommets visités prendront la valeur `True` au cours du parcours et les autres resteront à leur état initial `False`.

**Question 6** : Modifiez la fonction `parcours_prof` pour écrire une fonction `parcours_prof2` qui initialise le dictionnaire `visites` à `False` pour tous les sommets.

In [None]:
def parcours_prof2(graphe, debut):
    visites = {s: False for s in graphe} # initialisation de tous les sommets à False
    # à vous de jouer !
    

**Question 7** : Appliquez cette fonction au graphe `g2` (non connexe) que vous avez défini à la question 5.

In [None]:
# à vous de jouer !


## Algorithme de parcours en largeur d'abord

### Principe de l'algorithme

On rappelle que l'algorithme est quasiment identique en veillant à remplacer une pile par une file pour stocker les villes à visiter.

**Question 8** : Ecrivez le principe de l'algorithme (en vous inspirant de ce qui a été fait pour le parcours en profondeur d'abord).

*Réponse* : 

### Ecriture de l'algorithme
On suppose de plus que l'on implémente une file par une `list` Python. On suppose que l'élément à traiter en priorité dans la file est le premier élément de la liste. On défile donc en tête (avec la méthode `pop(0)`) et on enfile en queue de liste.

In [None]:
file = ["e"]
file.append("b") # pour enfiler
file.append("c")
print(file)
s = file.pop(0) # pour défiler (renvoie l'élément défilé)
print(s)
print(file)

**Question 9** : Ecrivez une fonction `parcours_larg(graphe, debut)` qui renvoie le dictionnaire `visites` des sommets visités par un parcours en largeur du graphe `graphe` en partant du sommet `debut`.

In [None]:
# à vous de jouer !


**Question 10** : Appliquez cette fonction aux deux graphes `g1` et `g2` définis précédemment.

In [None]:
# à vous de jouer !


## Ordre des sommets visités

Les parcours en largeur et en profondeur d'abord donnent bien évidemment les mêmes sommets visités. Cependant, l'ordre n'est pas le même selon le parcours.

Pour connaître l'ordre des sommets visités, une idée simple est de créer une liste `chemin` dans laquelle on va ajouter au fur et à mesure les sommets visités, *s'ils ne sont pas déjà dans la liste* `chemin` !

**Question 11** : Ecrivez deux fonctions `chemin_parcours_prof(graphe, debut)` et `chemin_parcours_larg(graphe, debut)` qui renvoie la liste `chemin` contenant les sommets visités dans le bon ordre. *Il suffit d'ajouter trois lignes aux fonctions de parcours en profondeur et en largeur d'abord*.

>**ATTENTION** : l'ordre des sommets empruntés dépend de l'ordre dans lequel sont mémorisés les successeurs dans le dictionnaire implémentant le graphe !!

In [None]:
# à vous de jouer !


**Question 12** : Appliquez ces deux fonctions au graphe `g1` en partant du sommet `"a"`.

In [None]:
# à vous de jouer


**Question 13 (BONUS)** : Ecrivez une fonction `affiche(chemin)` qui renvoie une chaîne de caractères des sommets de la liste `chemin`.

In [None]:
# à vous de jouer
def affiche(chemin):
    """Renvoie une chaine de caractères représentant les sommets de la liste chemin.
    Exemples :
    
    >>> affiche(['a', 'c', 'e'])
    'a -> c -> e'
    
    >>> affiche([])
    ''
    
    """
    # à compléter
    pass

# Remarque importante

Dans les deux parcours, lorsqu'on traite un sommet (celui qui est dépilé/défilé), on n'effectue un traitement que si ce dernier n'a pas encore été visité (marqué dans le dictionnaire `visites`). On a écrit cela de la façon suivante :

```python
def parcours_prof(graphe, debut):
    visites = {}
    pile = [debut]
    while len(pile) > 0:
        s = pile.pop()
        if s not in visites:  # TRAITEMENT SI SOMMET PAS ENCORE VISITE, RIEN SINON
            visites[s] = True
            for voisin in graphe[s]:
                if voisin not in visites:
                    pile.append(voisin)
    return visites
```

On peut écrire un programme équivalent de manière plus élégante en utilisant le mot clé `continue` qui une fois rencontré passe directement à l'itération suivante de boucle. Ainsi, le parcours en profondeur peut s'écrire également comme suit, et c'est cette écriture que nous garderons pour la suite.

```python
def parcours_prof(graphe, debut):
    visites = {}
    pile = [debut]
    while len(pile) > 0:
        s = pile.pop()
        if s in visites:   # si s a déjà été visité
            continue       # on passe à l'itération suivante
        visites[s] = True  # sinon l'itération en cours se poursuit
        for voisin in graphe[s]:
            if voisin not in visites:
                pile.append(voisin)
    return visites
```

>On peut bien sûr faire la même chose avec le parcours en largeur !

---

**Références :**
- Equipe pédagoqique DIU EIL, Université de Nantes.

---
Germain BECKER, Lycée Mounier, ANGERS

![Licence Creative Commons](https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png)