# Algorithmique de graphes

![](tokyo-metro.png)

## Objectif du chapitre

* Illustration des **structures de données** (listes, tableaux, piles, files) via la représentation d'un graphe en machine
* Montrer comment le modèle mathématique graphe peut être utilisé pour **modéliser des réseaux**
* Codage en Python des **algorithmes** présentés
* Connaître les différents **algorithmes de parcours**
* Savoir dérouler les algorithmes présentés sur des instances de graphes
* Reformuler un problème concret en utilisant un graphe, proposer une solution algorithmique en s'appuyant sur ce graphe et interpréter les résultats


## Modélisation par les graphes

### Introduction
Quel est le plus court itinéraire pour se rendre d'une station A à une station B ?

Vous pouvez bien sûr vous fier à votre intuition mais il existe aussi des méthodes plus rigoureuses comme le modèle des graphes par exemple.

En informatique, les graphes sont des modèles qui permettent de structurer les données. Ils peuvent par exemple être utilisés pour représenter un réseau social. 

Dans ce ce chapitre, nous allons dans un premier temps définir les graphes, puis nous introduirons les façons de représenter ce modèle en machine. Nous présenterons ensuite deux algorithmes qui permettent de les parcourir. L'un **en profondeur, l'autre en largeur**. Nous montrerons comment ces stratégies de parcours permettent de déduire des propriétés structurelles du graphe sur lequel elles sont exécutées. Enfin, nous appliquerons les notions étudiées à un problème concret modélisé par un graphe sous forme d'un système à état. 

### Que peuvent modéliser les graphes ?
Un graphe peut servir à modéliser un nombre de réseaux réels. Citons quelques familles de réseaux classiquement représentés par les graphes :
* Les **réseaux de transport** (par exemple routiers, maritimes, ferroviaires) dans lesquels les sommets sont des arrêts ou escales (station, gare, ville, port...) et les arcs représentent les liaisons de transports. 
* Les **réseaux sociaux** dans lesquels les sommets correspondent à des personnes et les arcs à des relations d'amitié.
* Les **réseaux informatique** pour lesquels les sommets sont les équipements (ordinateurs, routeur, commutateur) et les arcs traduisent l'existence d'une connexion.
* Les **systèmes à état** dans lesquels chaque sommet est un état du système et chaque arc représente une transition possible entre deux états du système. 

### Définition d'un graphe
Il existe deux types de graphes : Les graphes **orientés** et les graphes **non orientés**.

#### Graphe orienté 
Un graphe orienté noté $G = (X, U)$ est défini par un ensemble de **sommets** $X$ et un ensemble d'**arcs** $U$ dont les éléments sont des **couples de sommets**.  

Un graphe orienté possède les propriétés suivantes :
* le sommet $x_{i}$ est **l'extrémité initiale** de l'arc $u$
* le sommet $x_{j}$ est **l'extrémité terminale** de l'arc $u$
* $x_{j}$ est appelé le successeur de $x_{i}$
* $x_{i}$ est le précédesseur de $x_{j}$
* $|X|$ est le nombre de sommets de $G$
* $|U|$ est le nombre d'arcs de $G$
* $\Gamma^{+}({x_{i}})$ sont les successeurs de $x_{i}$ et $\Gamma^{-}({x_{i}})$ sont les précédesseurs de $x_{i}$

#### Graphe non orienté
Un graphe non orienté noté $G' = (X, E)$ est défini par un ensemble de **sommets** $X$ et un ensemble d'**arêtes** $E$ dont les éléments sont des **pairs de sommets**.

Un graphe non orienté possède les propriétés suivantes : 
* Si il y a une arête entre $x_{i}$ et $x_{j}$ alors ont dit que le sommet $x_{i}$ est **adjacent** au sommet $x_{j}$
* Un lien entre les sommets $x_{i}$ et $x_{j}$ s'appelle une arête et est noté $e = \{x_{i}, x_{j}\}$ 



## Représentation des graphes en machine
Pour pouvoir être utilisé dans des algorithmes, un graphe doit être représenté par une structure de données. Nous pouvons utiliser diverses structures de données mais les deux structures les plus utilisées sont les **matrices d'adjacence** et les **listes d'incidence**.

La graphe suivant : 

![graph1](11-G2.svg)

Est définie par $G=(X,U)$ où les sommets sont $X=\{A, B, C, D, E, F, G\}$ et les arcs sont $U=\{(A, B), (A, D), (B, C), (B, D), (B, G), (E, F), (E, G), (F, A), (F, B), (G, C)\}$

Pour simplifier nous désignons les sommets par des indices commençant à zéro. Ceci est plus rapide et évite de devoir mettre des guillements. Donc voici l'ensemble des sommets **X**.

In [5]:
X = (0, 1, 2, 3, 4, 5, 6)

**Exercice**  
Définsissez l'ensemble des arcs **U**

In [1]:
U = ((0, 1), (0, 3), (1, 2), (1, 3), (1, 6), (4, 5), (4, 6), (5, 1), (6, 2))

### Matrices d'adjacence
Nous pouvons premièrement utiliser une matrice d'incidence pour représenter notre graphe en mémoire. Les matrices d'incidence sont particulièrement bien adaptées lorsque les graphes sont denses. 

Pour se faire, nous allons utiliser les matrices de **numpy**. Chaque ligne de notre matrice représente un sommet de départ et chaque colonne représente un sommet d'arrivée. Nous allons mettre le chiffre 1 dans la case correspondante.

In [1]:
import numpy as np
              #0  1  2  3  4  5  6 
G = np.array([[0, 1, 0, 1, 0, 0, 0],#0
              [0, 0, 1, 1, 0, 0, 1],#1
              [0, 0, 0, 0, 0, 0, 0],#2
              [0, 0, 0, 0, 0, 0, 0],#3
              [0, 0, 0, 0, 0, 1, 1],#4
              [0, 1, 0, 0, 0, 0, 0],#5
              [0, 0, 1, 0, 0, 0, 0]])#6

G

array([[0, 1, 0, 1, 0, 0, 0],
       [0, 0, 1, 1, 0, 0, 1],
       [0, 0, 0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0, 1, 1],
       [0, 1, 0, 0, 0, 0, 0],
       [0, 0, 1, 0, 0, 0, 0]])

In [2]:

              #A  B  C  D  E  F  G
M = np.array([[0, 1, 0, 1, 0, 0, 0],#A
              [0, 0, 1, 1, 0, 0, 1],#B
              [0, 0, 0, 0, 0, 0, 0],#C
              [0, 0, 0, 0, 0, 0, 0],#D
              [0, 0, 0, 0, 0, 1, 1],#E
              [1, 1, 0, 0, 0, 0, 0],#F
              [0, 0, 1, 0, 0, 0, 0]])#G

M

array([[0, 1, 0, 1, 0, 0, 0],
       [0, 0, 1, 1, 0, 0, 1],
       [0, 0, 0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0, 0, 0],
       [0, 0, 0, 0, 0, 1, 1],
       [1, 1, 0, 0, 0, 0, 0],
       [0, 0, 1, 0, 0, 0, 0]])

### Liste d'incidence
Nous pouvons aussi utiliser les listes d'incidence pour représenter les graphes avec des listes. 

Nous allons utiliser un `dict` avec autant de clés que notre nombre de sommets. A chaque sommet, nous associons la liste de ses successeurs.

In [None]:
G = {
  'A': ['B', 'D'], 
  'B': ['C', 'D'],
  'C': [],
  'D': [],
  'E': ['F', 'G'],
  'F': ['A', 'B'],
  'G': ['C']
}

G

{'A': ['B', 'D'],
 'B': ['C', 'D'],
 'C': [],
 'D': [],
 'E': ['F', 'G'],
 'F': ['A', 'B'],
 'G': ['C']}

**Exercice**

![graph1](11-G2.svg)

Ecrivez la liste d'incidence en utilisant les indices à partir de 0.

In [3]:
G = {
    '0': ['1', '3'],
    '1': ['2', '3', '6'],
    '2': [],
    '3': [],
    '4': ['5', '6'],
    '5': ['1'],
    '6': ['2'],
}

G

{'0': ['1', '3'],
 '1': ['2', '3', '6'],
 '2': [],
 '3': [],
 '4': ['5', '6'],
 '5': ['1'],
 '6': ['2']}

Les listes d'incidences sont généralement les plus utilisées car elles restent simple à manipuler et prennent moins d'espace mémoire pour les graphes de moins grande densité. 

## Parcourir un graphe
Nous pouvons parcourir un graphe de deux manière. 

La première est de manière **récursive**. Nous créons une fonction de parcourt qui s'appelle elle-même jusqu'à arriver à la fin du graphe. 




La seconde manière est **itérative**. Nous utilisons les **piles** et les **files** afin de créer deux types de parcours de graphe. Nous pouvons ainsi faire des parcours en **largeur** et **profondeur** et nous n'avons pas à nous soucier de problème de mémoire. 

Nous allons utiliser le graphe suivant pour illustrer nos algorithmes de parcours :

![](11-G2.svg)

*Illustration: graph2.png*

Il est défini par $G=\{A, B, C, D, E, F\}$ et $U=\{(A, B), (A, C), (B, D), (B, E), (E, F), (C, F)\}$

### Recherche en largeur
La recherche Breath-first Search (BFS) est un algorithme utilisé pour parcourir les arbres et graphes. BFS peut être facilement implémenté en utilisant la récursivité et les structures de données comme les dictionnaires et les files.

L'algorithme se comporte de la manière suivante :
1. Créer une liste de sommets visités et une file que nous initialiserons avec un sommet au hasard
1. Défiler la liste jusqu'à ce qu'elle soit vide
  1. Pour tous les sommets dépilés, visiter chaque successeur
  1. Si le successeur n'a pas encore été visité, alors on l'ajoute à la liste des noeuds visités et à la file
1. Retourner la liste des sommets visités

In [None]:
#graph
graph = {
  'A' : ['B','C'],
  'B' : ['D', 'E'],
  'C' : ['F'],
  'D' : [],
  'E' : ['F'],
  'F' : []
}

In [None]:
def BFS(graph, start_node):
  # Initialisation
  visited = [start_node] 
  queue   = [start_node] 
  
  while len(queue) > 0:
    node = queue.pop(0)

    for neighbour in graph[node]:
      if neighbour not in visited:
        visited.append(neighbour)
        queue.append(neighbour)

  return visited

print(BFS(graph, 'A'))

['A', 'B', 'C', 'D', 'E', 'F']


### Recherche en profondeur
La recherche Depth-first Search (DFS) est un algorithme utilisé pour parcourir les arbres et graphes. DFS peut être facilement implémenté en utilisant la récursivité et les structures de données comme les dictionnaires et les piles.

L'algorithme se comporte de la manière suivante. Il se comporte exactement de la même manière à la seule différence que au lieu d'utiliser une file, on utilise une pile.

In [None]:
def DFS(graph, start_node):
  # Initialisation
  visited = [start_node] 
  queue   = [start_node] 
  
  while len(queue) > 0:
    node = queue.pop()

    for neighbour in graph[node]:
      if neighbour not in visited:
        visited.append(neighbour)
        queue.append(neighbour)

  return visited

print(DFS(graph, 'A'))

['A', 'B', 'C', 'F', 'D', 'E']


### Recherche en profondeur récursif
Nous allons maintenant voir la recherche en profondeur de manière récursive en implémentant la méthode `RDFS`: 

In [None]:
def RDFS(graph, start_node, visited):
  for neighbour in graph[start_node]:
    if neighbour not in visited: 
      visited.append(neighbour)
      RDFS(graph, neighbour, visited)


visited = ['A']
RDFS(graph, visited[0], visited)
print(visited)

['A', 'B', 'D', 'E', 'F', 'C']


Les parcours **récursifs** ne fonctionnent qu'en **profondeur** et peuvent dans le cas de grand graphe arriver à saturer la mémoire dû au changement de contexte.  

Le code suivant montre les limites de la récusion du point de vue de la mémoire : 

In [None]:
# RecursionError
def f (n):
  print(n)
  f(n+1)

f(1)

# Exercices

## Exercice 1
On vous donne le graph suivant : 

![graph1](https://static.grosjean.io/bugnon/graph3.png)

*Illustration: graph3.png*

Vous devez :
* Représenter le graph avec une liste
* Parcourir et afficher le résultat avec un BFS en commencant par A
* Parcourir et afficher le résultat avec un BFS en commancant par A

In [None]:
# graphe
graph = {
    'A': ['B', 'C'],
    'B': ['D', 'E'],
    'C': ['E', 'D'],
    'D': ['F'],
    'E': ['F'],
    'F': [],
}

In [None]:
# DFS
print(DFS(graph, 'A'))

['A', 'B', 'C', 'E', 'D', 'F']


In [None]:
# BFS
print(BFS(graph, 'A'))

['A', 'B', 'C', 'D', 'E', 'F']


## Exercice 2
Reprenez le graph *graph1.png* qui se trouve au début du document.

En parcourant ce graphe, est-ce que à partir de n'importe quel sommet, on arrive à parcourir tout le graphe en entier ?

In [None]:
G = {
  'A': ['B', 'D'], 
  'B': ['C', 'D'],
  'C': [],
  'D': [],
  'E': ['F', 'G'],
  'F': ['A', 'B'],
  'G': ['C']
}

for node in G.keys():
  print(DFS(G, node))

['A', 'B', 'D', 'C']
['B', 'C', 'D']
['C']
['D']
['E', 'F', 'G', 'C', 'A', 'B', 'D']
['F', 'A', 'B', 'C', 'D']
['G', 'C']


**Non on n'y arrive pas car selon d'où on part, on ne peut pas parcourir tout le graphe car il est orienté**

## Exercice 3
Reprenez le graph que de l'exercice 2. Transformez le en graphe non orienté et essayez de répondre à la même question que la question précédente. 

Est-il possible de parcourir tout le graphe en partant de n'importe quel noeud ?

In [None]:

G = {
  'A': ['B', 'D', 'F'], 
  'B': ['A', 'D', 'C', 'G', 'F'],
  'C': ['B', 'G'],
  'D': ['A', 'B'],
  'E': ['F', 'G'],
  'F': ['A', 'B', 'E'],
  'G': ['B', 'C', 'E']
}

for node in G.keys():
  print(DFS(G, node))

['A', 'B', 'D', 'F', 'E', 'G', 'C']
['B', 'A', 'D', 'C', 'G', 'F', 'E']
['C', 'B', 'G', 'E', 'F', 'A', 'D']
['D', 'A', 'B', 'C', 'G', 'F', 'E']
['E', 'F', 'G', 'B', 'C', 'A', 'D']
['F', 'A', 'B', 'E', 'G', 'C', 'D']
['G', 'B', 'C', 'E', 'F', 'A', 'D']


**Oui on arrive à parcourir tout le graphe car il est non orienté**

## Exercice 4
On vous donne le labyrinthe suivant : 

![graph1](https://static.grosjean.io/bugnon/lab1.png)

Vous devez :
* Représentez ce graphe en mémoire avec des listes d'incidences
* Créer une fonction qui prend comme argument :
  * votre graphe
  * un argument afin d'indiquer le type de recherche (DFS ou BFS)
  * le sommet de départ
  * le sommet d'arrivée
* Appliquer les algorithmes DFS et BFS afin de trouver la sortie

In [None]:
def FS(graph, t, start_node, end_node):
  # Initialisation
  visited = [start_node] 
  queue   = [start_node] 
  
  while len(queue) > 0:
    node = queue.pop() if t == 'DFS' else queue.pop(0)

    for neighbour in graph[node]:
      if neighbour not in visited:
        visited.append(neighbour)
        queue.append(neighbour)
        if neighbour == end_node:
          return visited

  return visited

In [None]:
graph = {
    'A': ['B'],
    'B': ['A', 'C'],
    'C': ['B', 'D'],
    'D': ['C', 'I'],
    'E': ['J'],
    'F': ['G', 'K'],
    'G': ['F', 'H'],
    'H': ['G', 'I'],
    'I': ['D', 'H'],
    'J': ['E', 'D'],
    'K': ['F', 'L'],
    'L': ['K', 'M'],
    'M': ['L', 'N'],
    'N': ['M', 'S'],
    'O': ['J', 'T'],
    'P': ['U'],
    'Q': ['R', 'V'],
    'R': ['Q', 'W'],
    'S': ['N', 'X'],
    'T': ['O', 'Y'],
    'U': ['P', 'V'],
    'V': ['U', 'Q'],
    'W': ['R', 'X'],
    'X': ['W', 'S', 'Y'],
    'Y': ['X', 'T'],
}

for t in ('DFS', 'BFS'):
  print(FS(graph, t, 'A', 'T'))

['A', 'B', 'C', 'D', 'I', 'H', 'G', 'F', 'K', 'L', 'M', 'N', 'S', 'X', 'W', 'Y', 'T']
['A', 'B', 'C', 'D', 'I', 'H', 'G', 'F', 'K', 'L', 'M', 'N', 'S', 'X', 'W', 'Y', 'R', 'T']


## Exercice 5
On vous donne le graphe suivant : 

![graph1](https://static.grosjean.io/bugnon/graph4.png)

Dans cette exercice, vous devez modifier l'algorithme de recherche **DFS** et y inclure une limite de recherche par niveau. Un niveau représente la profondeur de l'arbre par rapport au noeud de départ. 

Par exemple le :
* niveau 0 est: Marcel
* niveau 1 est: Marcel, Raphael, Julien

Vous devez : 
* Modifier la recherche DFS et y ajouter le paramètre `lvl`
* Vous devez chercher les amis et les amis des amis de Marcel

In [None]:
graph = {
  'Marcel': ['Raphael', 'Julien'],
  'Raphael': ['Gilles', 'Pascal'],
  'Pascal': ['Renzo'],
  'Renzo': [],
  'Julien': ['Loic'],
  'Loic': [],
  'Gilles': []
}



In [None]:
9# Modifier cet algorithme pour y limiter la recherche par niveau
def DFS(graph, start_node, lvl):
  # Initialisation
  visited = [start_node] 
  queue   = [start_node] 
  level = {}
  level[start_node] = 0
  
  while len(queue) > 0:
    node = queue.pop()

    for neighbour in graph[node]:
      if neighbour not in visited:
        if level[node] + 1 <= lvl:
          visited.append(neighbour)
          queue.append(neighbour)
          level[neighbour] = level[node] + 1

  return visited

In [None]:
print(DFS(graph, 'Marcel', 2))

['Marcel', 'Raphael', 'Julien', 'Loic', 'Gilles', 'Pascal']
