# Les algorithmes gloutons

![Monsieur glouton](img/Monsieur-Glouton.jpg)

## Problématique

Soit une liste de villes dans lesquelles un groupe doit se rendre pour faire sa tournée de concerts. Afin de minimiser les frais et les temps de transport, on cherche un **itinéraire minimisant la distance totale parcourue.** 
On s'autorise à visiter les villes dans n'importe quel ordre, mais aucune ne doit être négligée et il faudra à la fin revenir à la ville de départ.

Cette recherche du meilleur itinéraire est connu dans la littérature scientifique comme le [problème du voyageur de commerce](https://fr.wikipedia.org/wiki/Probl%C3%A8me_du_voyageur_de_commerce)

Prenons Nancy, Metz, Paris, Reims, Troyes comme villes à parcourir et choisissons arbitrairement Nancy comme ville de départ. (le choix de la ville de départ ne change rien au résultat car l'itinéraire est un parcours fermé). Le tableau ci-dessous représente les distances kilométriques entre ces différentes villes :

![tableau de distance kilométrique](img/distance1.jpg) *tableau 1 : tableau des distances kilométriques entre villes (source : Numérique et sciences informatiques (30 leçons avec exercices corrigés - Ellipse)*

## Résolution par force brute

La recherche exhaustive ou recherche par [force brute](https://fr.wikipedia.org/wiki/Recherche_exhaustive) est une méthode algorithmique qui consiste principalement à essayer toutes les solutions possibles. (Elle peut notamment être utilisée pour *cracker* des mots de passe trop courts...)

Dans notre cas, cela consiste à calculer la distance totale pour tous les itinéraires possibles puis de sélectionner le plus court.

En dénombrant tous les itinéraires possibles, on se rend compte qu'il y en a 24. Mais comme chaque itinéraire possède un itinéraire en sens inverse ayant la même distance totale, on a donc au total **12 distances possibles**, détaillées dans le tableau ci-dessous où le départ et l'arrivée à Nancy sont sous-entendus.

![tableau des 12 distances possibles](img/distance2.jpg) *tableau 2 : tableau des 12 distances totales possibles (source : Numérique et sciences informatiques (30 leçons avec exercices corrigés - Ellipse)*


### Combien de temps une résolution par force brute mettra-t-elle pour trouver l'itinéraire le plus court?

Cet algorithme devra réaliser le travail suivant :
1. Déterminer les 12 itinéraires possibles
2. Calculer la distance de chacun de ces 12 parcours
3. Rechercher le minimum parmi ces 12 distances pour trouver le meilleur itinéraire 
    
La *commande magique* `%timeit` permet de donner le temps mis par l'ordinateur pour exécuter du code python. Ainsi, la distance d'un itinéraire sera calculé par python en un temps d'environ 10ns autrement dit 10 milliardième de seconde (voir ci-dessous)

In [2]:
#Temps de calcul du premier itinéraire
%timeit 55+306+142+123+183

9.35 ns ± 0.0943 ns per loop (mean ± std. dev. of 7 runs, 100000000 loops each)


Ainsi pour réaliser le point 2 précédent, l'algorithme prendra 120ns. En négligeant le temps mis par les points 1 et 3, on peut dire que pour **une liste de 5 villes, l'algorithme met 120 ns à trouver le meilleur itinéraire par force brute.**

*Remarque : en fait, le temps sera plus long car on ne peut pas négliger le temps de calcul des points 1 et 3.*

### Explosion combinatoire de la recherche par force brute

**Que se passe t'il pour des tournées plus longue ?**

Si on appelle n le nombre de villes à visiter, on démontre qu'il y a $\frac{1}{2}(n-1)!$ distances à calculer. Voir détails [ici](https://fr.wikipedia.org/wiki/Probl%C3%A8me_du_voyageur_de_commerce#Explosion_combinatoire)

Ainsi, si on a une tournée de 20 villes, il y a $\frac{1}{2}(20-1)! = 6,082.10^{16}$ distances à calculer

Comme chaque distance est calculée en 10ns, la recherche par force brute du meilleur itinéraire prendrait à l'ordinateur un temps de  $6,082.10^{16} . 10ns = 19,27 années $

**... et pour 27 villes, le temps de calcul de l'algorithme (plus de 63 milliards d'années) dépasse l'âge de l'univers !!!**

En fait, le [problème du voyageur de commerce](https://fr.wikipedia.org/wiki/Probl%C3%A8me_du_voyageur_de_commerce) a une [complexité factorielle en O(n!)](https://fr.wikipedia.org/wiki/Analyse_de_la_complexit%C3%A9_des_algorithmes#Complexit%C3%A9,_comparatif)

Le problème vient du fait que la fonction *factorielle* fait partie des fonctions mathématiques à la croissance la plus rapide en fonction de la taille des données à traiter (ici le nombre de villes). 

**Conclusion : Il est donc impossible de résoudre le problème du voyageur par force brute**

### Petit aparté : les problèmes "NP-complets"

> Cette partie doit simplement être prise comme culture informatique et mathématique

Le problème du voyageur fait partie d'une catégorie de problème qu'on appelle **NP-complet**. Ces problèmes ont 2 caractéristiques :
* Il est facile de vérifier la validité d'une solution potentielle. (Comprendre ici : un intinéraire étant donné, il est facile de vérifier qu'il passe par toutes les villes et de calculer sa distance totale)
* L'ensemble des solutions est trop vaste et il est impossible de toutes les explorer à la recheche de la meilleure solution

Une majorité d'algorithmiticiens pensent qu'il est impossible de résoudre les problèmes **NP-Complet** comme celui du voyageur en un temps polynomial. Toutefois, cette conjecture n'a jamais été démontrée mathématiquement et un [prix d'un million de dollars](https://fr.wikipedia.org/wiki/Probl%C3%A8mes_du_prix_du_mill%C3%A9naire#Probl%C3%A8me_ouvert_P_=_NP) est offert à celui qui trancherait la question.... avis aux matheux !!


## Résolution par méthode "gloutonnne"

Comme la résolution par force brute est inenvisageable, pour une tournée de 20 villes,  il convient de trouver un autre algorithme pour résoudre le problème du voyageur.

### Principe des algorithmes gloutons

Les [algorithmes gloutons](https://fr.wikipedia.org/wiki/Algorithme_glouton) servent principalement à résoudre des **problèmes d'optimisation**

Un algorithme glouton va aborder la résolution d'un problème par étape. A chaque étape, il va rechercher un choix optimal. Avec l'espoir que cette succession de choix optimaux locaux aboutira à un résultat final optimal.... mais ce n'est pas garanti ! On parle d'[heuristique](https://fr.wikipedia.org/wiki/Heuristique_(math%C3%A9matiques)).

Un algorithme glouton ne repart jamais en arrière (les choix locaux sont définitifs !)

### Application au problème du voyageur

**Heuristique possible** pour résoudre la problème du voyageur par la méthode gloutonne :

> A chaque étape (c'est-à-dire à chaque ville), choisir comme ville suivante **la ville la plus proche**

Reprenons le tableau 1 et appliquons l'heuristique : 

![tableau de distance kilométrique](img/distance1.jpg)

1. On part de Nancy
2. la ville la plus proche (non visitée) de Nancy est Metz
3. la ville la plus proche (non visitée) de Metz est Reims
4. la ville la plus proche (non visitée) de Reims est Troyes
5. la ville la plus proche (non visitée) de Troyes est Paris
6. On revient à Nancy

**Conclusion :** 
* Selon la méthode gloutonne, le meilleur itinéraire est donc : Nancy , Metz, Reims, Troyes, Paris, Nancy. 
* A l'aide du tableau 2, on constate que cet itinéraire a une distance de 810 km
* On constate que la méthode gloutonne nous donne un "bon itinéraire" mais pas le meilleur (qui fait 709km). En fait il correspond au 3ème meilleur itinéraire.
* L'avantage de la méthode gloutonne est qu'elle analyse **un seul itinéraire** et donc que son temps de calcul est très rapide (quelques microsecondes).

*Remarque :* Evidemment, dans notre exemple où il n'y a que 5 villes pour la tournée, il est plus judicieux de procéder par **force brute**. Mais si la tournée possède plus de villes (par exemple 20), mieux vaut utiliser la stratégie gloutonne et obtenir tout de suite une *bonne solution* que d'attendre 19 ans la *meilleure solution* !!

### Exemple de cas où la stratégie gloutonne n'est pas optimale

Ci-dessous, quelques exemples qui montrent que la stratégie gloutonne n'aboutit pas toujours à un optimum global 

* En partant du point A et en cherchant à monter selon la plus forte pente, un algorithme glouton trouvera le maximum local m, mais pas le maximum global M.
<img src="img/Greedy_Glouton.png" width="40%">*source : wikipedia*

* En partant du point O pour atteindre le plus rapidement possible tous les points A, B, C, D, E, F, (l'ordre de parcours des points étant sans importance) l'algorithme glouton (en rouge) ne donne pas pas la meilleure solution (en vert).

![trajet](img/pluscourt3.png)*source : Gilles Lassus (lycée François Mauriac / bordeaux)*


## A retenir :

<div class = "alert alert-danger">
    
* Un algorithme glouton est une méthode algorithmique cherchant à résoudre les **problèmes d'optmisation**, c'est-à-dire à trouver parmi les différentes solutions d'un problème une solution qui soit la **meilleure possible**
* Un algorithme glouton peut s'appliquer si la recherche d'une solution peut se ramener à une succession de choix qui produit petit à petit la solution finale
* La stratégie gloutonne applique une **heuristique** qui procède par une **suite de choix** en sélectionnant à chaque étape la solution qui paraît être la **meilleure localement**
* La stratégie gloutonne applique l'heuristique **sans retour en arrière et sans anticipation des étapes ultérieures**
* **Parfois** la statégie gloutonne donne effectivement la meilleure solution
* La stratégie gloutonne permet de rechercher **une bonne solution** (peut-être la meilleure) en **un temps très court**

