# Vocabulaire

Un graphe est formé de :
- un ensemble, appelé ensemble des sommets (Noté $S$ ou $V$)
- un sous-ensemble de $S^2$, appelé ensemble des arrêtes (Noté $E$)

**Exemple :** $S={1,2,3,4}$ et $A={(1,2),(1,3),(2,1)}$ Alors $(S,A)$ est un graphe.  
Représentation graphique : 

Soit $k=(S,A)$ un graphe.  
- Un chemin est une suite $(s_0,...,s_n) \in S^{n+1}$ tq $\forall i \in [[0,n[[, (s_i,s_{i+1}\in A$  
- Deux sommet $s$,$t$ $\in S^n$ sont dits reliés lorsqu'il existe un chemin de $s$ à $t$.
- La longueur d'un chemin est le nombre d'arretes empruntées
- $\forall (s,t)) \in S^2)$ deux sommets reliés. On note $d(s,t)$ la longueur du plus court chemin de $s$ à $t$.
- On dit que $G$ est non orienté lorsque $\forall (s,t) \in S^2, (s,t) \in A \equiv (t,s) \in A$.  
- Supposons G non-orienté
    - on dit que G est connexe lorsque tous ses sommets sont reliés
    - $\forall ss \in S$, on appelle composant connexe de $s$ l'ensemble des sommets accessible depuis $s$

**Propriété :** Supp G connexe et non orienté. La distance vérifie :
- $\forall (s,t) \in S^2, d(s,t)=d(t,s)$
- $\forall (s,t,u) \in S^3, d(s,t) \leq d(s,u) + d(u,t)$ (Inégalité triangulaire)
- $\forall (s,t) \in S^2, d(s,t)=0 \equiv s=t$

Remarque : Si $G$ n'est pas connexe, on pose $\forall (s,t) \in S^2$ non connectés : $d(s,t)=+\infty$  

- si $G$ est orienté, les deux derniers points restent valides

**Demonstration :** Soit $(s,t) \in S^2$, notons $a=d(s,t)$ et $b=d(t,s)$.  
Montrons que $a=b$  
Soit $\gamma$ un plus court chemin de $s$ à $t$. Il est de longueur a. Soit $s_o,...,s_a$ les sommets traversé par $\gamma$.  

$(s_a,s_{a-1},...,s_o)$ est aussi un chemin. Notons le $\gamma^T$. Sa longueur est $a$.  
Donc il existe un chemin de longueur $a$ de $t$ vers $s$. Donc $d(t,s)\leq l$, cad $b\leq a$.  
Puis avec le même raisonement, on a $a\leq b$  

Soit $(s,t,u) \in S^3$. Soit $\gamma_1$ un chemin de $s$ à $t$ et $\gamma_2$ un chemin de $t$ à $s$.  

Notons $@$ la concatenation des chemin et $|.|$ la longueur.  
$\gamma_1 @ \gamma_2$ est un chemin de s à u de longueur $|\gamma_1|+|\gamma_2|$  
Donc il existe un chemin de $s$ à $u$ de longueur $|\gamma_1|+|\gamma_2|$.  
Donc $d(s,u) \leq |\gamma_1|+|\gamma_2| = d(s,t)+d(t,u)$

Soit $(s,t) \in S^2$ :  
Si $s=t$, soit $\gamma=(s)$. $\gamma$ relie $s$ à $t$ et sa longueur est $0$.  

Si $d(s,t)=0$. Soit $\gamma$ un plus court chemin de $s$ à $t$. $|\gamma|=0$. Donc le sommet de départ est le sommet d'arrivé donc $s=t$ 

# Implementation

Soit $G$ un graphe et $(S,E)$ ses composants   
Soit $n=|S|$.  
On supp dans la suite que $S=[[0,n[[$  
On utilise principalement deux méthodes pour enregistrer G.

- Matrice d'adjacence  
C'est la matrice $M\in \mathbb M_n(\mathbb N)$ tq $\forall (i,j) \in [[0,n[[^2, M_{i,j}=(1 \text{ si } (i,j) \in A) (0 \text{ sinon })$

- Tableau de liste d'adjacences  
C'est le tableau g de longueur n tq $\forall i \in [[0,n[[$.
g.(i) contient la liste des voisins de i

In [1]:
type graphe1 = int array array;;
type graphe2 = int list array;; 

type graphe1 = int array array


type graphe2 = int list array


# Parcours d'un graphe

Souvent, on a besoin de parcourir les sommets de proche en proche à partir d'un sommet de départ.

## Vocabulaire et invariants de boucle

**Vocabulaire :** 
- Un sommet est dit *blanc* s'il n'est pas découvert
- Un sommet est dit *noir* s'il a été traité
- Un sommet est dit *gris* s'il est découvert mais pas traité (Sommet alors à traité)

**Invariants de boucle :**
- (V N) : Les voisins des sommet noir sont noirs ou gris
- (V G) : Tout sommet gris a au moins un voisin noir

Les seuls changement de couleurs autorisés sont de *blanc vers gris* et de *gris vers noir*  

NB : Pour que le programme termine, il faudra éviter de revenir à un noir.  

Consequences des invariants de boucle :

**Lemme 1 :**  
On suppose (V N) et (V G) vérifiés. On suppose que l'algo a aussi satisfait à (C C). On suppose qu'il n'y a plus de sommet gris.  
Alors les sommets blancs sont déconnectés des noirs cad : $\not\exists$ des chemins d'un noir vers un blanc

**Preuve :**  
Supposons qu'il existe un chemin $\gamma$ tq en notant $n=|\gamma|$ et $s_0,...s_n$ ses sommets, $s_0$ est noir et $s_n$ est blanc. Soit $i=\max\{k\in [[0,n]],s_k \text{noir}\}$. On a $i \leq n$ car $s_n$ est blanc. Donc $s_{i+1}$ existe, et est différent de noir. Donc $s_{i+1}$ est blanc car pas de gris par hypothese. Donc (V N) n'est pas vérifiée en $s_{i}$ et $s_{i+1}$  

**Lemme 2 :**  
On suppose (V N), (V G), (C C). Notons $D$ l'ensemble des gris ou noir au debut de l'algorithme. Alors tout sommet noir ou gris est relié à $D$  $(*)$  

**Preuve :**  
Notons $(*)$ la propriété et verifions que c'est un invariant de boucle.  
*Initialisation :* Soit $s$ un sommet noir ou gris au debut de l'algo alors $s \in D$. Prendre $\gamma = (s)$ de longueur 0 il relie s à l.  
*Heredité :* Supposons $(*)$ vraie à un instant de l'algo. Effectuant une étape qui respecte (V N), (V G), et (C C).  
S'il y a un changement de couleurs de gris vers noir, l'ensemble des sommets noirs ou gris n'est pas changé donc $(*)$ reste vrai.  
S'il y a un changement blanc vers gris, Soit $s$ le sommet concerné. Par (V G), $s$ a un voisin noir,disons $t$. Par hypothese de récurrence, $t$ est relié à $l$. Alors $s$ est relié à $l$

**Proposition :**  
On suppose qu'il n'y a plus de (V N), (V G), (C C). On suppose qu'au début de l'algo, $N=\emptyset$ et un seul sommet est gris, notons le $s_d$. On suppose que à la fin, $G=\emptyset$  
Alors à la fin de la boucle, $N=$ (la composante connexe de $s_d$)  

Rappel : La composante connexe de  $s_d$ est l'ensemble des sommets reliés a $s_d$  

Remarque : C'est aussi la plus petite composante connexe de $G$ contenant $s_d$

**Preuve :**  
Montrons que $N \subset CC$ de $s_d$. Soit $s \in N$, par le lemme 2, $s$ est rellié à $s_d$  
Montrons que N $\not\subset$ CC de $s_d$. Soit $s$ relié a $s_d$, par le lemme 1, $s \not\in B$ et $G=\emptyset$ alors $s \in N$  

Ainsi un algo vérifiant nos 3 props permet de trouver la composante connexe de $s_d$. Ce sera notre premier exemple. Une simple modification permettra de trouver un chemin de $s_d$ vers un autre sommet $s_a$. Puis un plus court chemin.  

## Squelette de programme impératif

### Algorithme

Entrée :
- Un graphe $(S,A)$
- Un sommet $s_d \in S$

Créer 3 ensembles $N$,$G$ et $B$  
$N$ <- $\emptyset$
$B$ <- S  
$G$ <- $\emptyset$  

Peindre $s_d$ en gris  

Tant que $G \not= \emptyset$:  

----extraire un sommet $s$ de $G$  
----Faire quelque chose  
----Peindre $s$ en noir  
    
----$\forall t$ voisin de $s$:  
--------Si $t \in B$, le peindre en gris    
Renvoyer le resultat

### Les invariants de boucle

- (V N) est verifié
- (C C) est vérifié
- (V G) est vérifié

### En pratique
(cf exercice 1 pour programmer la boucle interne)  

Comment enregistrer $N$,$G$,$B$ ?  

En général, 
- $B$ n'est pas enregistré. Ce sont les sommets ni noirs, ni gris
- $N$ : Un tableau "deja_vu" tq $\forall i \in S$, deja_vu.(i) <=> $i \in N$
- $G$ : ça dépend de l'ordre dans lequel on veut traiter les sommets

### En autorisant les doublons dans G

Il est souvent plus pratique et parfois obligatoire d'utiliser à la place de $G$ une structure qui autorise les doublons.  
Exemple : $(1,4,0,2,4)$ Après avoir traité $4$, celui-ci devient noir, et la file contient donc des noirs.  

Ainsi :
- La structure utilisée ne s'appellera plus $G$ mais aVisiter
- Quand on sort un sommet de aVisiter, il faut vérifier qu'il est gris

Alors l'algo devient  

Créer 3 ensembles $N$,$G$ et $B$  
$N$ <- un tab de |S| bool initialement faux  
aVisiter <- Une structure contenant initialement $s_d$    
Peindre $s_d$ en gris  
Tant que $G \not= \emptyset$:  
----extraire un sommet $s$ de Avisiter  
----Si Non N.(s):
--------Faire quelque chose  
--------Peindre $s$ en noir  
--------$\forall t$ voisin de $s$:  
------------Si NON N.(t):  
----------------Mettre t dans aVisiter  
Renvoyer le resultat  

**Exemple :** Calcul de composante connexe. Avec pour aVisiter une file d'attente  

In [8]:
let composante_connexe g sd=
  let n= Array.length g in
  let deja_vu= Array.make n false in
  let a_Visiter= Queue.create () in
  Queue.add sd a_Visiter; 
  let rec visite_voisins = function
    | [] -> ()
    | t::q -> Queue.add t a_Visiter;
              visite_voisins q
  in
  while  not (Queue.is_empty a_Visiter) do
    let s= Queue.take a_Visiter in
    if not (deja_vu.(s)) then
    (
      visite_voisins g.(s);
      deja_vu.(s) <- true;
    )
  done;
  (* Maintenant, la composante connexe de sd correspond aux sommetsde deja_vu *)
  let res = ref [] in
  for i=0 to n-1 do
    if deja_vu.(i) then 
      res:= i::(!res)
  done;
  !res
  ;;

val composante_connexe : int list array -> int -> int list = <fun>


In [3]:
let exemple1 = 
[|  [1;2];
    [];
    [1;3];
    [1];
    [5];
    []
|]

val exemple1 : int list array = [|[1; 2]; []; [1; 3]; [1]; [5]; []|]


In [4]:
composante_connexe exemple1 0;;

- : int list = [3; 2; 1; 0]


### Terminaison

Variant de boucle :
- Pour la version 1 (sans doublons dans $G$), le nombre de sommets non noirs est un variant de boucle.
- Pour la version 2 (avec A_visiter qui peut contenir des doublons), on peut prendree le couple (nombre de sommets non noir,|aVisiter|) pour l'ordre lexicographique (Demonstration dans le poly). 

### Complexité

Méthode de l'exercice 1 :  
Prendre chaque ligne, voir ce qu'elle coute et combien de fois max elle est executée.

On a alors $C=O(|A|)+O(|S|)$

In [5]:
let composante_connexe g sd=
  let n= Array.length g in (*O(1)*)
  let deja_vu= Array.make n false in (*O(n)*)
  let a_Visiter= Queue.create () in (*O(1)*)
  Queue.add sd a_Visiter;  (*O(1)*)
  let rec visite_voisins = function  (*O(|A|)*)
    | [] -> () (*O(1)*)
    | t::q -> Queue.add t a_Visiter; (*O(1)*)
              visite_voisins q 
  in
  while  not (Queue.is_empty a_Visiter) do (*O(|A|)*)  (* Nombre d'élément au max dans la file : O(|A|)*)
    let s= Queue.take a_Visiter in (*O(|A|)*)
    if not (deja_vu.(s)) then    (*O(|A|)*)
    (
      visite_voisins g.(s);  (*O(|A|)*)
      deja_vu.(s) <- true;   (*O(|S|)*)
    )
  done;
  (* Maintenant, la composante connexe de sd correspond aux sommets de deja_vu *)
  let res = ref [] in (*O(1)*)
  for i=0 to n-1 do (*O(n)*)
    if deja_vu.(i) then  (*O(n)*)
      res:= i::(!res)(*O(n)*)
  done;
  !res(*O(1)*)
  ;;

val composante_connexe : int list array -> int -> int list = <fun>


## Parcours en largeur

Un parcours en largeur traite d'abord les sommets les plus proches du sommet de départ.

Pour réaliser un parcours en largeur, on prend aVisiter de type file d'attente.  
Les deux exemples précedents étaient des parcours en largeur.  

Evolution de la file d'attente sur un exemple

$\vec{(0)}$  
$\vec{(4,5)}$  
$\vec{(4,2,4)}$  
$\vec{(3,2,4,2)}$  
$\vec{(1,3,2,4)}$  
$\vec{(1,3,2)}$  
$\vec{(1,3)}$  
$\vec{(1,1)}$  
$\vec{(1)}$  
$\vec{(\emptyset)}$  

### Invariant de boucle du parcours en largeur

**Propriété :**  
A un certain instant d'un parcours en largeur. Soit $n$ le nombre de sommets dans la file et $s_0,...,s_{n-1}$ les sommets dans l'ordre.  
Alors $\exists d \in \mathbb N$ et $k \in [[0,n[[$ tq $\vec{(s_{n-1},...,s_k,...,s_0)}$
- $s_0,...,s_{k-1}$ sont à distance inferieur a $d$ de $s_d$
- $s_k,...,s_{n}$ sont a distance inferieur a $d+1$ de $s_d$

En outre, les noirs sont les sommets à distance inferieur a $d-1$ ainsi que les sommets à distance $d$ qui ne sont pas dans la file.

**Application :** Montrons que le programme est correct :

In [7]:
let plus_court_chemin sd sa g=
  let n= Array.length g in
  let chemin = Array.make n [] in 
  let dist = Array.make n (-1) in
  let a_Visiter= Queue.create () in
  let deja_vu= Array.make n false in

  Queue.add sd a_Visiter; 
  chemin.(sd)<-[sd];

  let rec visite_voisins s l=
    match l with 
    | [] -> ()
    | t::q when dist.(t)=(-1) ->   Queue.add t a_Visiter;
                                    dist.(t)<- dist.(s)+1;
                                    chemin.(t)<- t::chemin.(s);
                                    visite_voisins s q
    | t::q -> visite_voisins s q
    in
  while  not (Queue.is_empty a_Visiter) && chemin.(sa)=[] do
    let s= Queue.take a_Visiter in
    if not (deja_vu.(s)) then
    (
      visite_voisins s g.(s);
      deja_vu.(s) <- true;
    )
  done;
  List.rev chemin.(sa)
  ;;

val plus_court_chemin : int -> int -> int list array -> int list = <fun>


On a programmé que la file n'a pas de doublon. Donc la file d'attente ne contient que des gris. Alors on peut enlevé la vérification avec le "if" (version du paragraphe 3.2.1 - "Si s n'est pas noir" de la boucle principale devient inutile)  

$\exists n \in \mathbb N, R \in \mathbb N,(s_0,...,s_n) \in S^{n+1},d \in \mathbb N, aVivister = \{s_n,...,s_k,s_{k+1},...s_n\}$  

Prouvons que la propriété est un invariant de boucle pour tout parcours en largeur :  
$(I) : "\forall s \in S, dist.(s)= d(s_d,s) \text{ si } s \text{ est noir ou gris et } -1 \text{ sinon}$  
En outre, aVisiter n'a pas de doublon et ne contient que des gris$"$.

*Initialisation :* Avant la boucle, 
- $aVisiter = \vec{s_d}$ et $dist.(s_d)=0$
- Pas de noir
- $\forall s \in S-\{s_d\}, dist.(s)=-1$

*Hérédité :* On se place au début d'une itération où $(I)$ est vrai.  
Soit $n,k,(s_0,...,s_n,d$ :  
$aVivister = \{s_n,...,s_k,s_{k+1},...s_n\}$  
On extrait $s_0$ et on lance ```visite_voisin s0 g.(s0) ```.

Soit t un voisin de $s_0$

- Si $dist.(t) = -1 :$
Donc t est blanc. De plus, tous les sommets à distance inférieur à $d$ de $s_d$ sont noirs ou gris.  
Donc $d(s_d,t)>d$  
En outre, $dist.(s_0)=d(s_d,s_0)$.  
De plus $s_0$ n'est pas noir donc $s_0, \not\in \barre{B}(s_d,d)$  

Donc $d(s_d,d_0)=d$

Donc il existe u chemin de distance d+1 de $s_d$ à t donc $d(s_d,t) \leq d+1$

Alors $d(s_d,t)=d+1$  

On a bien $dist.(t) = d(s_d,t)$  

- Si $dist.(t) \not= -1$ alors t était noir ou gris, $dist.(t)=d(s_d,t)$
- aVisiter n'a pas de doublon car on rajoute t que s'il était blanc et dans ce cas il n'était pas dans aVisiter  
- aVisiter n'a que des gris, le seul sommets devenu noir en $s_0$ et il n'est plus dans aVisiter (pas de doublon)

Conclusion : sortie de la boucle
- Si aVisiter est vide et $dist.(s_a)=-1$ : alors $s_a$ n'est pas relié au sommet de départ $s_d$
- Sinon, $dist.(s_a) = d(s_d,s_a)$