# Vocabulaire

Un graphe est formé de :  
- un ensemble, appelé ensemble des sommets (Noté $S$ ou $V$)
- un sous-ensemble de $S^2$, appelé ensemble des arrêtes (Noté $E$)

**Exemple :** $S={1,2,3,4}$ et $A={(1,2),(1,3),(2,1)}$ Alors $(S,A)$ est un graphe.  
Représentation graphique : 

Soit $k=(S,A)$ un graphe.  
- Un chemin est une suite $(s_0,...,s_n) \in S^{n+1}$ tq $\forall i \in ⟦0,n⟦, (s_i,s_{i+1}\in A$  
- Deux sommet $s$,$t$ $\in S^n$ sont dits reliés lorsqu'il existe un chemin de $s$ à $t$.
- La longueur d'un chemin est le nombre d'arretes empruntées
- $\forall (s,t)) \in S^2)$ deux sommets reliés. On note $d(s,t)$ la longueur du plus court chemin de $s$ à $t$.
- On dit que $G$ est non orienté lorsque $\forall (s,t) \in S^2, (s,t) \in A \equiv (t,s) \in A$.  
- Supposons G non-orienté
    - on dit que G est connexe lorsque tous ses sommets sont reliés
    - $\forall ss \in S$, on appelle composant connexe de $s$ l'ensemble des sommets accessible depuis $s$

**Propriété :** Supp G connexe et non orienté. La distance vérifie :
- $\forall (s,t) \in S^2, d(s,t)=d(t,s)$
- $\forall (s,t,u) \in S^3, d(s,t) \leq d(s,u) + d(u,t)$ (Inégalité triangulaire)
- $\forall (s,t) \in S^2, d(s,t)=0 \equiv s=t$

Remarque : Si $G$ n'est pas connexe, on pose $\forall (s,t) \in S^2$ non connectés : $d(s,t)=+\infty$  

- si $G$ est orienté, les deux derniers points restent valides

**Demonstration :** Soit $(s,t) \in S^2$, notons $a=d(s,t)$ et $b=d(t,s)$.  
Montrons que $a=b$  
Soit $\gamma$ un plus court chemin de $s$ à $t$. Il est de longueur a. Soit $s_o,...,s_a$ les sommets traversé par $\gamma$.  

$(s_a,s_{a-1},...,s_o)$ est aussi un chemin. Notons le $\gamma^T$. Sa longueur est $a$.  
Donc il existe un chemin de longueur $a$ de $t$ vers $s$. Donc $d(t,s)\leq l$, cad $b\leq a$.  
Puis avec le même raisonement, on a $a\leq b$  

Soit $(s,t,u) \in S^3$. Soit $\gamma_1$ un chemin de $s$ à $t$ et $\gamma_2$ un chemin de $t$ à $s$.  

Notons $@$ la concatenation des chemin et $|.|$ la longueur.  
$\gamma_1 @ \gamma_2$ est un chemin de s à u de longueur $|\gamma_1|+|\gamma_2|$  
Donc il existe un chemin de $s$ à $u$ de longueur $|\gamma_1|+|\gamma_2|$.  
Donc $d(s,u) \leq |\gamma_1|+|\gamma_2| = d(s,t)+d(t,u)$

Soit $(s,t) \in S^2$ :  
Si $s=t$, soit $\gamma=(s)$. $\gamma$ relie $s$ à $t$ et sa longueur est $0$.  

Si $d(s,t)=0$. Soit $\gamma$ un plus court chemin de $s$ à $t$. $|\gamma|=0$. Donc le sommet de départ est le sommet d'arrivé donc $s=t$ 

# Implementation

Soit $G$ un graphe et $(S,E)$ ses composants   
Soit $n=|S|$.  
On supp dans la suite que $S=⟦0,n⟦$  
On utilise principalement deux méthodes pour enregistrer G.

- Matrice d'adjacence  
C'est la matrice $M\in \mathbb M_n(\mathbb N)$ tq $\forall (i,j) \in ⟦0,n⟦^2, M_{i,j}=(1 \text{ si } (i,j) \in A) (0 \text{ sinon })$

- Tableau de liste d'adjacences  
C'est le tableau g de longueur n tq $\forall i \in ⟦0,n⟦$.
g.(i) contient la liste des voisins de i

In [14]:
type graphe1 = int array array;;
type graphe2 = int list array;; 

type graphe1 = int array array


type graphe2 = int list array


# Parcours d'un graphe

Souvent, on a besoin de parcourir les sommets de proche en proche à partir d'un sommet de départ.

## Vocabulaire et invariants de boucle

**Vocabulaire :** 
- Un sommet est dit *blanc* s'il n'est pas découvert
- Un sommet est dit *noir* s'il a été traité
- Un sommet est dit *gris* s'il est découvert mais pas traité (Sommet alors à traité)

**Invariants de boucle :**
- (V N) : Les voisins des sommet noir sont noirs ou gris
- (V G) : Tout sommet gris a au moins un voisin noir

Les seuls changement de couleurs autorisés sont de *blanc vers gris* et de *gris vers noir*  

NB : Pour que le programme termine, il faudra éviter de revenir à un noir.  

Consequences des invariants de boucle :

**Lemme 1 :**  
On suppose (V N) et (V G) vérifiés. On suppose que l'algo a aussi satisfait à (C C). On suppose qu'il n'y a plus de sommet gris.  
Alors les sommets blancs sont déconnectés des noirs cad : $\not\exists$ des chemins d'un noir vers un blanc

**Preuve :**  
Supposons qu'il existe un chemin $\gamma$ tq en notant $n=|\gamma|$ et $s_0,...s_n$ ses sommets, $s_0$ est noir et $s_n$ est blanc. Soit $i=\max\{k\in ⟦0,n⟧,s_k \text{noir}\}$. On a $i \leq n$ car $s_n$ est blanc. Donc $s_{i+1}$ existe, et est différent de noir. Donc $s_{i+1}$ est blanc car pas de gris par hypothese. Donc (V N) n'est pas vérifiée en $s_{i}$ et $s_{i+1}$  

**Lemme 2 :**  
On suppose (V N), (V G), (C C). Notons $D$ l'ensemble des gris ou noir au debut de l'algorithme. Alors tout sommet noir ou gris est relié à $D$  $(*)$  

**Preuve :**  
Notons $(*)$ la propriété et verifions que c'est un invariant de boucle.  
*Initialisation :* Soit $s$ un sommet noir ou gris au debut de l'algo alors $s \in D$. Prendre $\gamma = (s)$ de longueur 0 il relie s à l.  
*Heredité :* Supposons $(*)$ vraie à un instant de l'algo. Effectuant une étape qui respecte (V N), (V G), et (C C).  
S'il y a un changement de couleurs de gris vers noir, l'ensemble des sommets noirs ou gris n'est pas changé donc $(*)$ reste vrai.  
S'il y a un changement blanc vers gris, Soit $s$ le sommet concerné. Par (V G), $s$ a un voisin noir,disons $t$. Par hypothese de récurrence, $t$ est relié à $l$. Alors $s$ est relié à $l$

**Proposition :**  
On suppose qu'il n'y a plus de (V N), (V G), (C C). On suppose qu'au début de l'algo, $N=\emptyset$ et un seul sommet est gris, notons le $s_d$. On suppose que à la fin, $G=\emptyset$  
Alors à la fin de la boucle, $N=$ (la composante connexe de $s_d$)  

Rappel : La composante connexe de  $s_d$ est l'ensemble des sommets reliés a $s_d$  

Remarque : C'est aussi la plus petite composante connexe de $G$ contenant $s_d$

**Preuve :**  
Montrons que $N \subset CC$ de $s_d$. Soit $s \in N$, par le lemme 2, $s$ est rellié à $s_d$  
Montrons que N $\not\subset$ CC de $s_d$. Soit $s$ relié a $s_d$, par le lemme 1, $s \not\in B$ et $G=\emptyset$ alors $s \in N$  

Ainsi un algo vérifiant nos 3 props permet de trouver la composante connexe de $s_d$. Ce sera notre premier exemple. Une simple modification permettra de trouver un chemin de $s_d$ vers un autre sommet $s_a$. Puis un plus court chemin.  

## Squelette de programme impératif

### Algorithme

Entrée :
- Un graphe $(S,A)$
- Un sommet $s_d \in S$

Créer 3 ensembles $N$,$G$ et $B$  
$N$ <- $\emptyset$
$B$ <- S  
$G$ <- $\emptyset$  

Peindre $s_d$ en gris  

Tant que $G \not= \emptyset$:  

----extraire un sommet $s$ de $G$  
----Faire quelque chose  
----Peindre $s$ en noir  
    
----$\forall t$ voisin de $s$:  
--------Si $t \in B$, le peindre en gris    
Renvoyer le resultat

### Les invariants de boucle

- (V N) est verifié
- (C C) est vérifié
- (V G) est vérifié

### En pratique
(cf exercice 1 pour programmer la boucle interne)  

Comment enregistrer $N$,$G$,$B$ ?  

En général, 
- $B$ n'est pas enregistré. Ce sont les sommets ni noirs, ni gris
- $N$ : Un tableau "deja_vu" tq $\forall i \in S$, deja_vu.(i) <=> $i \in N$
- $G$ : ça dépend de l'ordre dans lequel on veut traiter les sommets

### En autorisant les doublons dans G

Il est souvent plus pratique et parfois obligatoire d'utiliser à la place de $G$ une structure qui autorise les doublons.  
Exemple : $(1,4,0,2,4)$ Après avoir traité $4$, celui-ci devient noir, et la file contient donc des noirs.  

Ainsi :
- La structure utilisée ne s'appellera plus $G$ mais aVisiter
- Quand on sort un sommet de aVisiter, il faut vérifier qu'il est gris

Alors l'algo devient  

Créer 3 ensembles $N$,$G$ et $B$  
$N$ <- un tab de |S| bool initialement faux  
aVisiter <- Une structure contenant initialement $s_d$    
Peindre $s_d$ en gris  
Tant que $G \not= \emptyset$:  
----extraire un sommet $s$ de Avisiter  
----Si Non N.(s):
--------Faire quelque chose  
--------Peindre $s$ en noir  
--------$\forall t$ voisin de $s$:  
------------Si NON N.(t):  
----------------Mettre t dans aVisiter  
Renvoyer le resultat  

**Exemple :** Calcul de composante connexe. Avec pour aVisiter une file d'attente  

In [15]:
let composante_connexe_largeur g sd=
  let n= Array.length g in
  let deja_vu= Array.make n false in
  let a_Visiter= Queue.create () in
  Queue.add sd a_Visiter; 
  let rec visite_voisins = function
    | [] -> ()
    | t::q -> Queue.add t a_Visiter;
              visite_voisins q
  in
  while  not (Queue.is_empty a_Visiter) do
    let s= Queue.take a_Visiter in
    if not (deja_vu.(s)) then
    (
      visite_voisins g.(s);
      deja_vu.(s) <- true;
    )
  done;
  (* Maintenant, la composante connexe de sd correspond aux sommetsde deja_vu *)
  let res = ref [] in
  for i=0 to n-1 do
    if deja_vu.(i) then 
      res:= i::(!res)
  done;
  !res
  ;;

val composante_connexe_largeur : int list array -> int -> int list = <fun>


In [16]:
let exemple1 = 
[|  [1;2];
    [];
    [1;3];
    [1];
    [5];
    []
|]

val exemple1 : int list array = [|[1; 2]; []; [1; 3]; [1]; [5]; []|]


In [17]:
composante_connexe exemple1 0;;

- : int list = [3; 2; 1; 0]


### Terminaison

Variant de boucle :
- Pour la version 1 (sans doublons dans $G$), le nombre de sommets non noirs est un variant de boucle.
- Pour la version 2 (avec A_visiter qui peut contenir des doublons), on peut prendree le couple (nombre de sommets non noir,|aVisiter|) pour l'ordre lexicographique (Demonstration dans le poly). 

### Complexité

Méthode de l'exercice 1 :  
Prendre chaque ligne, voir ce qu'elle coute et combien de fois max elle est executée.

On a alors $C=O(|A|)+O(|S|)$

In [18]:
let composante_connexe g sd=
  let n= Array.length g in (*O(1)*)
  let deja_vu= Array.make n false in (*O(n)*)
  let a_Visiter= Queue.create () in (*O(1)*)
  Queue.add sd a_Visiter;  (*O(1)*)
  let rec visite_voisins = function  (*O(|A|)*)
    | [] -> () (*O(1)*)
    | t::q -> Queue.add t a_Visiter; (*O(1)*)
              visite_voisins q 
  in
  while  not (Queue.is_empty a_Visiter) do (*O(|A|)*)  (* Nombre d'élément au max dans la file : O(|A|)*)
    let s= Queue.take a_Visiter in (*O(|A|)*)
    if not (deja_vu.(s)) then    (*O(|A|)*)
    (
      visite_voisins g.(s);  (*O(|A|)*)
      deja_vu.(s) <- true;   (*O(|S|)*)
    )
  done;
  (* Maintenant, la composante connexe de sd correspond aux sommets de deja_vu *)
  let res = ref [] in (*O(1)*)
  for i=0 to n-1 do (*O(n)*)
    if deja_vu.(i) then  (*O(n)*)
      res:= i::(!res)(*O(n)*)
  done;
  !res(*O(1)*)
  ;;

val composante_connexe : int list array -> int -> int list = <fun>


## Parcours en largeur

Un parcours en largeur traite d'abord les sommets les plus proches du sommet de départ.

Pour réaliser un parcours en largeur, on prend aVisiter de type file d'attente.  
Les deux exemples précedents étaient des parcours en largeur.  

Evolution de la file d'attente sur un exemple

$\vec{(0)}$  
$\vec{(4,5)}$  
$\vec{(4,2,4)}$  
$\vec{(3,2,4,2)}$  
$\vec{(1,3,2,4)}$  
$\vec{(1,3,2)}$  
$\vec{(1,3)}$  
$\vec{(1,1)}$  
$\vec{(1)}$  
$\vec{(\emptyset)}$  

### Invariant de boucle du parcours en largeur

**Propriété :**  
A un certain instant d'un parcours en largeur. Soit $n$ le nombre de sommets dans la file et $s_0,...,s_{n-1}$ les sommets dans l'ordre.  
Alors $\exists d \in \mathbb N$ et $k \in ⟦0,n⟦$ tq $\vec{(s_{n-1},...,s_k,...,s_0)}$
- $s_0,...,s_{k-1}$ sont à distance inferieur a $d$ de $s_d$
- $s_k,...,s_{n}$ sont a distance inferieur a $d+1$ de $s_d$

En outre, les noirs sont les sommets à distance inferieur a $d-1$ ainsi que les sommets à distance $d$ qui ne sont pas dans la file.

**Application :** Montrons que le programme est correct :

In [19]:
let plus_court_chemin sd sa g=
  let n= Array.length g in
  let chemin = Array.make n [] in 
  let dist = Array.make n (-1) in
  let a_Visiter= Queue.create () in
  let deja_vu= Array.make n false in

  Queue.add sd a_Visiter; 
  chemin.(sd)<-[sd];

  let rec visite_voisins s l=
    match l with 
    | [] -> ()
    | t::q when dist.(t)=(-1) ->   Queue.add t a_Visiter;
                                    dist.(t)<- dist.(s)+1;
                                    chemin.(t)<- t::chemin.(s);
                                    visite_voisins s q
    | t::q -> visite_voisins s q
    in
  while  not (Queue.is_empty a_Visiter) && chemin.(sa)=[] do
    let s= Queue.take a_Visiter in
    if not (deja_vu.(s)) then
    (
      visite_voisins s g.(s);
      deja_vu.(s) <- true;
    )
  done;
  List.rev chemin.(sa)
  ;;

val plus_court_chemin : int -> int -> int list array -> int list = <fun>


On a programmé que la file n'a pas de doublon. Donc la file d'attente ne contient que des gris. Alors on peut enlevé la vérification avec le "if" (version du paragraphe 3.2.1 - "Si s n'est pas noir" de la boucle principale devient inutile)  

$\exists n \in \mathbb N, R \in \mathbb N,(s_0,...,s_n) \in S^{n+1},d \in \mathbb N, aVivister = \{s_n,...,s_k,s_{k+1},...s_n\}$  

Prouvons que la propriété est un invariant de boucle pour tout parcours en largeur :  
$(I) : "\forall s \in S, dist.(s)= d(s_d,s) \text{ si } s \text{ est noir ou gris et } -1 \text{ sinon}$  
En outre, aVisiter n'a pas de doublon et ne contient que des gris$"$.

*Initialisation :* Avant la boucle, 
- $aVisiter = \vec{s_d}$ et $dist.(s_d)=0$
- Pas de noir
- $\forall s \in S-\{s_d\}, dist.(s)=-1$

*Hérédité :* On se place au début d'une itération où $(I)$ est vrai.  
Soit $n,k,(s_0,...,s_n,d$ :  
$aVivister = \{s_n,...,s_k,s_{k+1},...s_n\}$  
On extrait $s_0$ et on lance ```visite_voisin s0 g.(s0) ```.

Soit t un voisin de $s_0$

- Si $dist.(t) = -1 :$
Donc t est blanc. De plus, tous les sommets à distance inférieur à $d$ de $s_d$ sont noirs ou gris.  
Donc $d(s_d,t)>d$  
En outre, $dist.(s_0)=d(s_d,s_0)$.  
De plus $s_0$ n'est pas noir donc $s_0 \not\in \bar{B}(s_d,d)$  

Donc $d(s_d,d_0)=d$

Donc il existe u chemin de distance d+1 de $s_d$ à t donc $d(s_d,t) \leq d+1$

Alors $d(s_d,t)=d+1$  

On a bien $dist.(t) = d(s_d,t)$  

- Si $dist.(t) \not= -1$ alors t était noir ou gris, $dist.(t)=d(s_d,t)$
- aVisiter n'a pas de doublon car on rajoute t que s'il était blanc et dans ce cas il n'était pas dans aVisiter  
- aVisiter n'a que des gris, le seul sommets devenu noir en $s_0$ et il n'est plus dans aVisiter (pas de doublon)

Conclusion : sortie de la boucle
- Si aVisiter est vide et $dist.(s_a)=-1$ : alors $s_a$ n'est pas relié au sommet de départ $s_d$
- Sinon, $dist.(s_a) = d(s_d,s_a)$

## Parcours en profondeur

Dans un parcours en profondeur, on poursuit un chemin autant que possible avant de partir sur un autre. Plus précisement, on visite en priorité les voisins du dernier sommet visité. Il suffit de remplacer la file par une pile.

**Exemple :** Calcul d'un composante connexe  

In [20]:
let composante_connexe_profondeur g sd=
  let n= Array.length g in
  let deja_vu= Array.make n false in
  let a_Visiter= Stack.create () in
  Stack.push sd a_Visiter; 
  let rec visite_voisins = function
    | [] -> ()
    | t::q -> Stack.push t a_Visiter;
              visite_voisins q
  in
  while  not (Stack.is_empty a_Visiter) do
    let s= Stack.pop a_Visiter in
    if not (deja_vu.(s)) then
    (
      visite_voisins g.(s);
      deja_vu.(s) <- true;
    )
  done;
  (* Maintenant, la composante connexe de sd correspond aux sommetsde deja_vu *)
  let res = ref [] in
  for i=0 to n-1 do
    if deja_vu.(i) then 
      res:= i::(!res)
  done;
  !res
  ;;

val composante_connexe_profondeur : int list array -> int -> int list = <fun>


In [21]:
let testTab = [|[1;2];[3;4;5];[6];[4];[];[];[0]|];;

composante_connexe_profondeur testTab 2;;

val testTab : int list array = [|[1; 2]; [3; 4; 5]; [6]; [4]; []; []; [0]|]


- : int list = [6; 5; 4; 3; 2; 1; 0]


*remarque :* Pour faire un vrai parcours en profondeur, il faut autoriser les doublons dans  la pile ```aVisiter```

Le parcours en largeur est équivalent au parcours en profondeur (complexité : ($O(|S|+|A|)$)

Cependant, il est plus facile à programmer en récursif.

### Révision de parcours en profondeur d'un arbre de valence non bornée

In [22]:
type 'a arbre = Noeud of 'a * ('a arbre) list;; 

let arbre_exemple=
  Noeud(2,[
    Noeud(3,[
      Noeud(4,[]);
      Noeud(5,[])
    ]);
    Noeud(-1,[]);
    Noeud(5,[])
  ]);;

let rec somme = function
  | Noeud(e,fils) -> e + somme_foret fils
and somme_foret = function
  | [] -> 0
  | t::q -> (somme t)+somme_foret(q)
;;
    
somme arbre_exemple;;

let rec etiquettes_arbre = function
  | Noeud(e,fils)-> e::(etiquettes_foret fils)
and etiquettes_foret = function
  | [] -> []
  | t::q -> etiquettes_arbre(t)@(etiquettes_foret q)
;;

etiquettes_arbre arbre_exemple;;

type 'a arbre = Noeud of 'a * 'a arbre list


val arbre_exemple : int arbre =
  Noeud (2,
   [Noeud (3, [Noeud (4, []); Noeud (5, [])]); Noeud (-1, []); Noeud (5, [])])


val somme : int arbre -> int = <fun>
val somme_foret : int arbre list -> int = <fun>


- : int = 18


val etiquettes_arbre : 'a arbre -> 'a list = <fun>
val etiquettes_foret : 'a arbre list -> 'a list = <fun>


- : int list = [2; 3; 4; 5; -1; 5]


En général, on ecrit deux fonctions récursives : une sur les arbres et une sur les forêts (liste d'arbres)

### Parcours en profondeur d'un graphe, version recursive

On utilise deux fonctions mutuellement récursive :
- une qui traite un sommet
- une qui traite la liste des sommets

**Squellette du programme :**

In [10]:
let parcours_prof g sd =
  let n = Array.length g in
  let deja_vu = Array.make n false in

  let rec visite_sommet s=
    deja_vu.(s) <- true;
    (* Faire quelque chose avec s... *)
    visite_voisins s g.(s)
  and visite_voisins s= function
    | [] -> (* Renvoyer quelque chose *)
    | t::autre_Voisin when not(deja_vu.(t)) -> (* Renvoyer quelque chose avec visite_sommet et visite_voisins *)
    | t::autre_Voisin -> visite_voisins autre_Voisin

  in visite_sommet sd
;; 

error: compile_error

In [11]:
let composante_connexe_rec g sd=
  let n = Array.length g in
  let deja_vu = Array.make n false in

  let rec visite_sommet s=
    deja_vu.(s) <- true;
    s::(visite_voisins g.(s))
  and visite_voisins = function
    | [] -> []
    | t::autre_Voisin when not(deja_vu.(t)) -> (visite_sommet t)@(visite_voisins autre_Voisin)
    | t::autre_Voisin -> visite_voisins autre_Voisin

  in visite_sommet sd
;;

val composante_connexe_rec : int list array -> int -> int list = <fun>


Avantage de cette version : 
- plus court
- On peut facilement lorsqu'on traite un sommet d'où on vient : mettre l'argument (s) en plus dans la fonction ```visite_voisins``` (cf exercice 11 et 12)

# Graphe pondérés

## Notation
On suppose maintenant qu'à chaque arêtes $G$ est associé un flottant. Dans les applications, ce nombre sera la longueur de l'arête. On note $\forall (s,t) \in A, l_{s,t}$ la longueur de $st$
Soit $n \in \mathbb N$ et $(s_0,...,s_n) \in S^{n+1}$ tq $\gamma=(s_0,...,s_n)$ est un chemin.  
Dans cette partie, on appelle longueur de $\gamma$ le nombre $\sum_{i=1}^{n}l_{s_{i-1}s_i}$  
$\forall s,t \in S^2$ on note $d(s,t)=min\{|\gamma|,\gamma:s->t\}$ s'il existe, sinon $+\infty$  

On ne suppose pas que $\forall (s,t) \in A, l_{s,t}=l_{t,s}$ (même si $G$ est non orienté) donc $d$ ne sera à priori pas symétrique. En général, on prendra $\forall (s,t) \in A l_{s,t}>0$  

**Cas extrême :** s'il existe $\gamma$ un cycle de longueur négative alors $\forall s \in \gamma, d(s,s)$ n'est pas définie.  

## Implémentation

- Matrice d'adjacence : $\forall i,j \in S$, prendre $M_{ij}=l_{i,j}$ si $(i,j) \in A$, sinon $+\infty$ ```infinity``` en Ocaml
- Liste d'adjacence : $\forall i \in S$ ```g.(i)``` contient la liste des couples (j voisin de i,$l_{i,j}$)

In [12]:
type graphe_pondere = (int*float) list array;;

type graphe_pondere = (int * float) list array


In [13]:
let exemple_matrice = [|[|0.;1.;infinity;4.;infinity|];
                        [|1.;0.;1.;infinity;infinity|];
                        [|infinity;1.;0.;1.;3.|];
                        [|4.;infinity;1.;0.;1.|];
                        [|infinity;infinity;2.;1.;0.|]        
                      |];;
                      
let exemple_liste = [|
                        [(1,1.);(3,4.)];
                        [(0,1.);(2,1.)];
                        [(1,1.);(3,1.);(4,3.)];
                        [(0,4.);(2,1.);(4,1.)];
                        [(3,1.);(2,2.)]
                    |];;

val exemple_matrice : float array array =
  [|[|0.; 1.; infinity; 4.; infinity|]; [|1.; 0.; 1.; infinity; infinity|];
    [|infinity; 1.; 0.; 1.; 3.|]; [|4.; infinity; 1.; 0.; 1.|];
    [|infinity; infinity; 2.; 1.; 0.|]|]


val exemple_liste : (int * float) list array =
  [|[(1, 1.); (3, 4.)]; [(0, 1.); (2, 1.)]; [(1, 1.); (3, 1.); (4, 3.)];
    [(0, 4.); (2, 1.); (4, 1.)]; [(3, 1.); (2, 2.)]|]


## Floyd-Warshall

**But :** Calculer $d(s,t) \forall (s,t) \in S^2$. Ce qui fait $|S|^2$ flottants à calculer.  
On suppose que $G$ n'a pas de cycle de longueur nulle ou negative.  

**Lemme :**  
- Soit $\gamma_1$ et $\gamma_2$ deux chemins tq la fin de $\gamma_1$ est le début de $\gamma_2$ alors $\gamma_1 @ \gamma_2=|\gamma_1|+|\gamma_2|$
- ...
Soit $\gamma_1,\gamma_2$ tq $\gamma=\gamma_1 @ \gamma_2$ et $\gamma_1 : s -> u$, $\gamma_2: u -> t$ alors $\gamma_1$ est un plus court chemin de $s$ à $u$. De meme entre $u$ et $t$.

**Preuve :**
- Evident
- 
- Idem

**Principe de l'algorithme :**
$\forall (i,j,k) \in ⟦0,n⟦^2*⟦0,n⟧$ on pose $d_{ij}^k ) min \{|\gamma|, \gamma: i->j$ qui ne passe que par des sommets dans $⟦0,k⟦\}$  

Ainsi, $\forall (i,j) \in ⟦0,n⟦^2$, $d_{i,j}^n=d(i,j)$ et $d_{i,j}^0=l_{i,j}, 0 si i=j, +\infty (i,j) \not\in A$  

Cherchons une relation de recurrence pour calculer les $(d_{i,j}^{k+1})_{i,j}$ à partir des $(d_{i,j}^{k})_{i,j}$  

Soit $k \in ⟦0,n⟦$, on suppose connue $(d_{i,j}^{k})_{i,j \in ⟦0,n⟦}$  
Soit $(i,j) \in ⟦0,n⟦^2$ Calculon $d_{i,j}^{k+1}$.

Soit $\gamma$ un plus court chemin de $i$ à $j$ avec étapes dans $⟦0,n⟦$  
On distingue deux cas :

1 - Si $\gamma$ passe par $k$  
Mq $|\gamma|=d_{i,k}^{k}+d_{k,j}^{k}$
Comme $\gamma$ est un plus court chemin, il n'a pas de cycle (les cycles sont de longueur >= 0) Donc il ne passe qu'une seul fois par $k$.

Soit $\gamma_1,\gamma_2 tq \gamma=\gamma_1@\gamma_2$ i->k->j  
- $\gamma_1$ et $\gamma_2$ sont à étapes dans $⟦0,k⟦$  
- $\gamma_1$ est un plus court chemin de $i$ à $k$ à étape dans $⟦0,k⟦$. Donc $|\gamma_1|=d_{i,k}^{k}$
- De même avec $|\gamma_1|=d_{i,k}^{k}$

D'où $|\gamma|=d_{i,k}^{k}+d_{k,j}^{k}$

2 - Si $\gamma$ ne passe pas par k :  
Alors $|\gamma|=d_{i,k}^{k}$

Pour conclure : $d_{i,j}^{k+1}$ vaut $d_{i,k}^{k}+d_{k,j}^{k}$ OU $d_{i,j}^{k})$

Montrons alors que $d_{i,j}^{k}=min(d_{i,k}^{k}+d_{k,j}^{k},d_{i,j}^{k}$  

Cas 1: si $d_{i,j}^{k} \leq d_{i,k}^{k}+d_{k,j}^{k}$
Soit $\gamma,\gamma_1,\gamma_2$ des chemins correspondant  

$\gamma$ est un plus court chemin de $i$ à $j$ avec étapes dans $⟦0,k⟦$ et il ne passe pas par $k$. On est alors dans le cas 1 précedent.

Cas 2 : si $d_{i,j}^{k} \geq d_{i,k}^{k}+d_{k,j}^{k}$  
Alors $\gamma$ ne peut pas être un plus court chemin de $i$ à $j$ avec étapes dans $⟦0,k+1⟦$ car $\gamma_1@\gamma_2$ est strictement plus court. Donc on n'est pas dans le cas 1 prec. donc on est dans le cas 2 et $d_{i,j}^{k}=d_{i,k}^{k}+d_{k,j}^{k}$

Bilan : $\forall (i,j) \in ⟦0,n⟦^2, d_{i,j}^{k}=min(d_{i,k}^{k}+d_{k,j}^{k},d_{i,j}^{k})$  

Il suffit d'utiliser un tableau de format $n*n$ et une boucle for sur k.  

L'invariant de boucle sera "En entrée de l'itération k, $\forall (i,j) \in ⟦0,n⟦^2, dist.(i).(j) = d_{i,j}^{k}$"  

On peut prouver qu'on a aussi $\forall i,jk \in ⟦0,n⟦ d_{i,j}^{k}=min(d_{i,k}^{k+1}+d_{k,j}^{k},d_{i,j}^{k})=d_{i,j}^{k}=min(d_{i,k}^{k}+d_{k,j}^{k},d_{i,j}^{k+1})$  

En effet, $d_{i,k}^{k+1}=d_{i,k}^{k}$ et $d_{k,j}^{k+1}=d_{k,j}^{k}$. On peut alors s'épargner la copie de ```dist```

In [2]:
let copie_mat m=
  let n,p = Array.length m,Array.length m.(0) in
  let res = Array.make_matrix n p m.(0).(0) in

  for i=0 to n-1 do
    for j=0 to p-1 do
      res.(i).(j)<-m.(i).(j);
    done;
  done;
  res
;;

val copie_mat : 'a array array -> 'a array array = <fun>


In [3]:
let floyd_warshall m=
  (* Entrée : m matrice d'adjacence d'un graphe pondéré G *)
  let n = Array.length m in
  let dist = copie_mat m in
  for k=0 to n-1 do
    (* Ici dist contient les d_{i,j}^{k} *)
    let sauv = copie_mat dist in
    for i=0 to n-1 do
      for j=0 to n-1 do
        dist.(i).(j) <- min (sauv.(i).(j)) (sauv.(i).(k)+.sauv.(k).(j));
      done;
    done;
    (* Maintenant, dist contient les d_{i,j}^{k+1} *)
  done;
  dist
;;

val floyd_warshall : float array array -> float array array = <fun>


In [8]:
let floyd_warshall_chemin m sd sa=
  let n = Array.length m in
  let chemin = Array.make_matrix n n [] in
  let dist = copie_mat m in
  for i=0 to n-1 do
    for j=0 to n-1 do
      if m.(i).(j) <> infinity && i<>j then
        chemin.(i).(j) <- [i];
    done;
  done;
    for k=0 to n-1 do
        let sauv = copie_mat dist in
        for i=0 to n-1 do
            for j=0 to n-1 do
                if (sauv.(i).(k) +. sauv.(k).(j)) < dist.(i).(j) then
                    (
                    dist.(i).(j) <- sauv.(i).(k) +. sauv.(k).(j);
                    chemin.(i).(j) <- chemin.(i).(k)@chemin.(k).(j);
          )
            done;
        done;
    done;
  chemin.(sd).(sa)@[sa]
;;

val floyd_warshall_chemin : float array array -> int -> int -> int list =
  <fun>


Complexité de l'algo : $O(|S|^3)$  Sauf pour les chemins qui est plus lent à cause des ```@```

## Dijkstra

**But :** Calculer le plus court chemin entre deux points.  
Fixons $(s_d,s_a) \in S^2$.

Même principe que pour un plus court chemin dans un graphe non pondéré :on effectue un parcours en largeur en partant de $s_d$. Gardons le vocabulaire des sommets noirs, blancs et gris. On maintient un tableau ```dist``` tq $\forall t \in S$ ```dist.(t)```contient à chauque instant la longueur d'un plus court chemin "connu" de $s_d$ à $t$. S'il n'y a pas de telle chemin, cad si t est blanc. Dans ce cas on met ```dist.(t)```$=+\infty$.  

**Invariants de boucle précis :**  
- (IG), (IN), (CC) restent valide (cf debut chapitre)
- (DN) : $\forall s \in N$ ```dist.(s)```$=d(s_d,s)$ : On connait la distance à $s_d$ pour les sommets noirs
- (DG) : ```dist.(s)``` contient la longueur d'un pcc de $s_d$ à $t$ avec étapes dans $N$
- (DB) : $\forall s \in B$ ```dist.(t)```$=+\infty$.  

### Lemme fondamental

**Lemme :**  
Soit $s$ un sommet gris pour lequel ```dist.(s)``` est minimal. On suppose les invariants de boucle vérifiés.  
Alors ```dist.(s)```=$d(s_d,s)$ ainsi on peut peindre $s$ en noir.

**Demonstration :**  
Soit $\gamma$ un pcc de $s_d$ à $s$ avec étapes noires. Donc par (D N) $|\gamma|=$```dist.(s)```  

Mq $|\gamma|=d(s_d, s)$ cad que $\gamma$ est un pcc de $s_d$ à $s$ .
Supposons $\eta$ un chemin de $s_d$ à $s$ tq $|\eta|<|\gamma|$. Donc par (D N), $\eta$ ne passe que par des sommets noirs. Soit $t$ le premier sommet non noir traversé par $\eta$. $t$ est gris par (I N).  
Notons $\eta_1$ la partie de $\eta$ de $s_d$ à $t$. $\eta_1$ a ses étapes dans $N$.  
Donc ```dist.(t)```$\leq |\eta| < |\gamma| =$```dist.(t)``` D'où la contradiction

Ainsi à chaque étape on va chercher $s \in G$ tq ```dist.(t)``` est minimal et on va peindre $s$ en noir

Il faudra alors pour tout voisins de s
- Le peindre en gris s'il était blanc pour (I N)
- mettre à jour ```dist.(t)``` pour (D G)

Comment faire ?

Auparavant, ```dist.(t)``` contenait la longueur d'un pcc de $s$ vers $t$ à étapes dans $N$. On utilise le même raisonnement que pour FW : soit $\gamma$ un pcc de $s_d$ à $t$ avec étapes dans $N\union\{s\}$

- si $\gamma$ ne passe pas par $s$ c'est un pcc de $s_d$ à $t$ à étapes dans $N$. Donc ```dist.(t)```$=|\gamma|$, on ne fait rien
- si $\gamma$ passe par $s$. Soient $\gamma_1$, $\gamma_2$ tq $\gamma=\gamma_1 @ \gamma_2$. $\gamma_1 : s_d-> s$ et $\gamma_2 : s-> t$. $\gamma_1$ est un pcc de $s_d$ à $s$ à étapes dans $N$ donc $|\gamma_1$=```dist.(s)```
- si $\gamma_2$ passe par un sommet $u$. Soit $\eta$ un pcc noir de $s_d$ à $u$. On peut remplacer le début de $\gamma$ par $\eta$ : $\exists$ un pcc noir de $s_d$ à $t$ qui ne passe pas par $s$. Donc ```dist.(t)``` contient déja la bonne valeur (comme dans le cas précedent).
- $\gamma_2$ est juste une arete. Donc $|\gamma_2|$ est connue c'est $l_{s,t}$ et dans ```dist.(t)``` il faut mettre $|\gamma_1|+|\gamma_2|$ cad ```dist.(s)```$+ l_{s,t}$  

Ainsi dans ```dist.(t)``` il faut mettre ```dist.(s)```$+ l_{s,t}$. Pour resumer tous les cas, il faut effectuer :  
```dist.(t) <- min (dist.(t), dist.(s)+```$l_{s,t}$```)```  

En effet : notons $d$ la valeur à mettre dans ```dist.(t)```
- On a que $d=$```dist.(t)``` ou $d= l_{s,t}+$```dist.(t)``` donc $d \geq$ ```min (dist.(t), dist.(s)+```$l_{s,t}$```)```
- De même on a $d \leq$ ```min (dist.(t), dist.(s)+```$l_{s,t}$```)```

### Algorithme simplifié

Entrées : 
- le graphe G=(S,A)
- $s_a,s_d \in S$

Sortie :
- $d(s_a,s_d)$

Créer un tableau dist de longueru $|S|$ contenant initialement des $\infty$  
Créer une structure pour les sommets gris contenant $s_d$.  
dist.(sd)<-0  
$s$ blanc -> dist.(s)=$\infty$  
$s$ est noir s'il n'est pas gris et s'il n'est pas blanc  

Tant que $s_a$ n'est pas noir et gris pas vide:

    extraire de gris le sommet pour lequelle dist est minimal  
    pour tout t voisin de s:  
        si t est blanc:  
            on le met en gris  
            dist.(t)<-dist.(s)+l_st  
        sinon si t est gris:  
            dist.(t) <- min(dist.(t), dist.(s)+l_st  
        sinon  
            ()  
Renvoyer dist.(s_a)
          
**Implémentation :**  
le plus adapté pour les gris est un tas 

### Avec des tas mutables

*Attention à deux points :*
- pour choisir la place dans le tas, il faut utiliser dist.(s) et non $s$ lui même donc ```fun s t -> dist.(s) <= dist.(t)```
- mettre dans le tas des couples ```(dist.(s),s)```

Le problème est qu'a chaque fois que l'on change dist.(s) il faudra le changer dans le tas puis remonter à sa place l'élément. Pour retrouver $s$ il faut aussi enregistrer sa position donc faire par exemple un tableau position

### Complexité

Le tas contient à chaque instant <= |S| éléments. Donc les opérations sont en $O(log|S|)$,,
La complexité est la même que le parcours en largeur car même sutructure : mais enfile et défile sont en O(1) et entasse et detasse en O(log|S|). On a alors une complexité en $O((|A|+|S|)log(S))$  

### Avec des tas persistants

On y mettra des couples de la forme ```(dist.(s),s)```. Si on met a jour dist.(s), on va entasser ```(nouvelle valeur de dist.(s),s)```. Le sommet sera en double avec sa version plus récente au dessus.  
Lorsqu'on aura traité la premiere version, ne pas retraiter la deuxième.  

-> utiliser un tableau dejaVu pour les noirs  

Problèmes : le tas peut contenir plus d'élément, donc les operations de base seront plus lente... 
L'opération "entasser un élément" est effectué au plus $O(|A|)$
Donc les operations sont en $O(log|S|)$. Mais $|A|\leq |S|^2$

Donc $log|A| \leq 2 log(|S|)$
$O(log|A|) = O (log(|S|))$