# Projet Algorithmique avancée

![alt Représentation graphique](https://cdn.discordapp.com/attachments/980738951117676546/990991843267338250/unknown.png)

## Sommaire

1. Contexte
2. Version
3. Reformulation
    1. Complexité théorique
        1. Démonstration
        2. Solution
    2. Métaheuristiques
        1. Fonction objectif
        2. Plus proche voisin
        3. Colonie de fourmis
        4. Génétique
    3. Comparaison
4. Test statistique
    1. Sans contraintes
    2. Avec contraintes
5. Bibliographie

## Contexte :

Nous sommes une équipe de 4 personnes appartenant à **CesiCDP**. L’ADEME (Agence de l’Environnement et de la maîtrise de l’Énergie) nous a sollicité pour proposer une nouvelle solution afin d'optimiser la mobilité de personnes et de marchandises entre différentes villes. 

Nous avons décidé d’orienter notre étude sur la gestion de tournées de livraison. Pour cela, nous aurons à prendre en compte différents facteurs comme le trafic, les horaires. Tout cela sera résumé par un problème algorithmique issu de la recherche opérationnelle.

Le but est de développer un algorithme qui permettra de trouver un chemin le plus **optimal** possible.

## Version

Langage de programmation imposé : **Python**

Nous avons décidé d'utiliser **Python** car étant un langage de programme de *haut niveau*, la conception de prototype est relativement aisé. De plus, en pensant évolutivité de notre solution, nous pourrons faire en sorte que l'algorithme utilise une solution de **machine learning** ou d'**intelligence artificielle**. Cela nous permettra de rendra la solution encore plus viable et rapide en permettant de nombreuses contraintes.

Algorithme permettant de gérer les tournées de livraison de manière optimale. Il doit être capable de gérer des instances de taille importante (plusieurs milliers de villes). Il doit permettre de trouver le chemin optimal afin d'optimiser le temps de la tournée et le nombre de kilomètres. De plus, nous avons décidé d'ajouter des contraintes :
- De **trafic** (il peut y avoir des bouchons)

## Reformulation

### Complexité théorique

Notre problème correspond à un problème du VRP (Vehicule Routing Problem), ou en français problème de tournée de véhicule. Le problème du VRP est un problème appartenant à la classe des problèmes du voyageur de commerce. Ce problème est NP-complet, c'est-à-dire qu'il ne peut être résolu exactement dans des temps concevables.

#### Démonstration

*Il est important de préciser que comme le problème de tournée de véhicules est un dérivé du problème du voyageur de commerce, il possède la même complexité que celui-ci. Donc démontrer que le problème du voyageur de commerce est NP-Complet revient à démontrer que le problème de la tournée de véhicule est NP-Complet.*

Le problème du voyageur de commerce définit $n$ villes et les distances entre chaque ville. Le but est de trouver le chemin de longueur minimale passant par tous les points *une seule fois* et reviens au point de départ. Une instance étant un **graphe complet**, on a : 
<br/><img src="https://cdn.discordapp.com/attachments/980738951625183283/991630534495182848/unknown.png"><br/>
avec $V$ un ensemble de sommets, $A$ un ensemble d'arêtes et $\omega$ une fonction de coût sur les arcs. On cherche donc un **cycle hamiltonien**.

Pour un nombre $n$ de villes, il existe $n!$ solutions possibles. Comme le point de départ ne change pas, on peut écrire la chose suivante représentant le nombre de chemins différents :

<img src="https://cdn.discordapp.com/attachments/980738951625183283/991630814154588281/unknown.png">

Les chemins pouvant être parcourus dans les **deux sens** (graphe *non-orienté*) et ces chemins ont la même longueur, on peut alors diviser le total par *deux*, ce qui donne :

<img src="https://cdn.discordapp.com/attachments/980738951625183283/991630992680960071/unknown.png">

À titre d'exemple, on peut citer si $n=8$ on aura 2520 possibilités et si $n=20$ on aura 6,082 × 10<sup>16</sup> possibilités. 

On peut alors analyser la complexité temporelle de cet algorithme à $O(n!)$.

D'une autre manière, Held et Karp ont montré que le problème pourrait être résolu en $O(n^2 2^n)$

#### Solution

Afin de résoudre des problèmes NP-Complets, des algorithmes ont été développés : les métaheuristiques. 

> *Une métaheuristique est un algorithme d’optimisation visant à résoudre des problèmes d’optimisation difficile pour lesquels on ne connaît pas de méthode classique plus efficace.*

Grâce à ces métaheuristiques, on va pouvoir trouver une solution approchée dans des temps de traitements corrects. Il existe beaucoup de métaheuristiques différentes, permettant des approches différentes du problème et des méthodes de résolution différentes. Nous nous sommes concentrés sur 3 de ces métaheuristiques : 
- Colonie de fourmis
- Génétique


### Métaheuristiques 

#### Fonction objectif

<img src="https://cdn.discordapp.com/attachments/980738951625183283/991627293535522907/unknown.png" width="150">

avec :
- $e$ : Une arête
- $E$ : L'ensemble des arêtes
- $x_e$ : Le nombre de passage sur l'arrête
- $c_e$ : Le coût de l'arête

On cherche à minimiser le coût total de la solution, qui revient à avoir la somme la plus basse des coûts des arrêtes utilisés.

#### Colonie de fourmis

Les algorithmes de colonies de fourmis sont inspirés du comportement des fourmis. 

- Une fourmi *eclaireuse* parcours au hasard le territoire autour de la colonie. 
- Si quelque chose est trouvé, elle rentre au nid en suivant les **phéromones** qu'elle a laissées. 
- Ces phéromones étant attractives, les fourmis à proximité vont suivre cet itinéraire de façon plus ou moins directe, elles renforceront ainsi la puissance des phéromones présentes. Si deux *chemins* mènent au même endroit le plus court sera privilégiée, renforçant les phéromones sur ce chemin et poussant les autres fourmis à le suivre plutôt qu'un autre. 
- Les *chemins* les plus longs finissent par disparaîtres et à terme la piste la plus courte est la seule présente.

<img style="margin: 40px auto;" src="https://upload.wikimedia.org/wikipedia/commons/thumb/a/af/Aco_branches.svg/330px-Aco_branches.svg.png" alt="Schéma colonie de fourmis" width="300"/>

Pour rentrer dans les détails du fonctionnement, chaque fourmis est initialement placé sur un point *aléatoire* du graphe. Chaque fourmis possède une **mémoire** permettant de stocker les chemins et villes déjà parcourues. Lorsqu'une ville $i$ est visitée, la fourmi $k$ choisi d'aller visiter une ville non visitée $j$ avec une probabilité donnée par la formule suivante :

![image.png](attachment:image.png)

où :
- $T_{ij}(t)$ : l'intensité de la trace de phéromone dans l'arrête $(i,j)$ à l'instant $t$.
- $n_ij = \frac{1}{d_{ij}}$ : Information heuristique avec $d_{ij}$ est la distance entre la ville $i$ et la ville $j$. On essaye d'attirer les fourmis vers les villes adjacentes.
- $\alpha, \beta$ : Déterminent l'influence relative de la trace des phéromones et de l'information heuristique.
- $N_i^k$ : Voisinage faisable de la foumi $k$. C'est l'ensemble de villes non encore visitées par la fourmi.

Lorsque chaque fourmi a **complété** un tour, la construction de la solution s'arrête. On *met à jour* les phéromones pour orienter les prochaines fourmis. On *réduit* la trace de phéromones avec un facteur constant $\rho$ correspondant à l'évaporation des phéromones. Les fourmis vont ensuite *redéposer* leur phéromones sur les arrêtes appartenant au tour. On peut alors transposer comme suit :

![image-2.png](attachment:image-2.png)

avec :
- $0 \leq \rho \leq 1$ : Le coefficient d'évaporation des phéromones.
- $nbAnts$ : Le nombre de fourmis.
- $\Delta T_{ij}^k$ : La quantité de phéromone que la fourmi $k$ dépose sur l'arrête $(i,j)$. Sachant que $\Delta T_{ij}^k$ est défini par :

![image-3.png](attachment:image-3.png)

avec :
- $L^k$ : Longeur du tour généré par la foumi $k$.
- $Q$ : Une constante de l'algorithme.
- $Tabou^k$ : La liste des villes déjà visitées

Grâce à $\Delta T_{ij}^k$, les arêtes du tour le plus court recevront la plus grande quantité de phéromone. De même, grâce au coefficent $\rho$, on permet à l'algorithme d'oublier les mauvaises décisions qui ont été faites précédemment en empêchant l'accumulation infinie de phéromones.

#### Génétique

Un algorithme génétique est un algorithme appartenant à la famille des algorithmes évolutionnistes. Le but de ces algorithmes est de trouver des solutions approchées pour des problèmes d'optimisations. Ils permettent de fournir une réponse en un temps acceptable lorsque l'on ne connaît pas de méthodes de résolution plus efficaces.

On retrouve la notion de **sélection naturelle** dans ces algorithmes. C'est-à-dire qu'à la fin d'une *génération*, on va garder seulement les *individus* possédant les *valeurs d'aptitudes* les plus hautes. On aura alors une nouvelle génération dans laquelle seuls les individus les plus intéressants auront survécu et fusionnés. On pourra alors, au fur et à mesure des générations, avoir une précision de plus en plus précise.

<img style="margin: 40px auto;" src="https://khayyam.developpez.com/articles/algo/genetic/images/schema_gen.gif" alt="schéma algo génétique" width="300"/>

Pour entrer dans les détails, cet algorithme utilise la théorie de Darwin sur l'évolution des éspèces. On retrouve trois principes :
- **Variation** : Chaque individu est unique. Les différences vont êtres décisives pour le processus de sélection.
- **Adaptation** : Les individus qui arrivent à s'adapter à l'environnement survivront plus facilement. Ceux qui survivent le plus facilement auront des facilités pour se reproduire.
- **Hérédité** : Les caractéristiques d'un individu sont transmises à leur descendance. Ce mécanisme permettra de faire évoluer l'espèce pour partager les caractéristiques facilitant la survie.

Nous allons caractériser une population selon une notion de cercle concentrique comme suit :

<img style="margin: 40px auto;" src="http://igm.univ-mlv.fr/~dr/XPOSE2013/tleroux_genetic_algorithm/slide/xpose_files/PPMf3MP2.png" alt="schéma algo génétique" width="300"/>

- Une **population** correspond à l'ensemble des solutions envisageables
- Un **individu** représente une solution
- Un **chromosome** est une composante de la solution
- Un **gène** se réfère à une caractéristique, une particularité

Grâce à cela, nous pouvons définir trois opérateurs d'évolution :
- La **sélection** : Choix des individus les plus adaptés au problème.
    - Cette transformation permet de converger vers un optimum global. C'est le principe d'*adaptation* de la théorie de Darwin. On a plusieurs sélection possibles :
        - Par rang : Sélection des individus ayant les meilleurs score d'adaptation.
        - Par probabilité de sélection proportionnelle à l'adaptation : La probabilité d'être sélectionner est proportionnelle à son adaptation au problème.
        - Par tournois : Sélection proportionnelle sur des paires d'individus, puis on choisi ceux qui ont le meilleur score d'adaptation.
        - Uniforme : Sélection aléatoire, uniforme et sans valeur d'adaptation.
    - On réalise un croisement entre deux chromosomes parmi la population restante.
- Le **croisement** : Mélange par la reproduction des particularité d'un individu.
    - C'est le résultat obtenu lorsque deux chromosomes partagent leurs particularités. C'est le principe d'*hérédité* de la théorie de Darwin. Il existe deux méthodes de croisement :
        - *Simple* enjambement : Fusionner les particularités de deux individus à partir d'un pivot dans le but d'obtenir un ou deux enfants.      
            <img style="margin: 40px auto;" src="https://i0.wp.com/ledatascientist.com/wp-content/uploads/2020/10/One-point-XO.png?resize=768%2C209&ssl=1" alt="schéma algo génétique" width="300">
        
        - *Double* enjambement : Même principe mais avec deux pivots.
        
            <img style="margin: 40px auto;" src="https://i0.wp.com/ledatascientist.com/wp-content/uploads/2020/10/Two-point-XO.png?resize=768%2C209&ssl=1" alt="schéma algo génétique" width="300"/>
        
    - On réalise ensuite une mutation sur les enfants obtenues lors du croisement.
- La **mutation** : Altération aléatoire des particularité d'un individu.
    - On altère un gène dans un chromosome selon un facteur de mutation. C'est la probabilité qu'une mutation soit effectuée sur un individu. C'est le principe de *variation* de la théorie de Darwin. Cela permet aussi de converger vers un extermum local.
        - Insertion : On insert un chromosome à la suite d'un autre.
        <img style="margin: 40px auto;" src="https://i0.wp.com/ledatascientist.com/wp-content/uploads/2020/10/Insertion-mutation.png?resize=768%2C82&ssl=1" alt="schéma algo génétique" width="300"/>
        - Swap : On échange la position de deux chromosomes.
        <img style="margin: 40px auto;" src="https://i0.wp.com/ledatascientist.com/wp-content/uploads/2020/10/Swap-mutation.png?resize=768%2C82&ssl=1" alt="schéma algo génétique" width="300"/>
        - Reversion : On inverse l'ordre des éléments sélectionnés.
        <img style="margin: 40px auto;" src="https://i0.wp.com/ledatascientist.com/wp-content/uploads/2020/10/Reversion-mutation.png?resize=768%2C82&ssl=1" alt="schéma algo génétique" width="300"/>
        
Enfin, on va créer la prochaine génération. On applique différentes transformations génétiques sur une partie de notre génération actuelle. On dispose alors de deux méthodes :
- **Élitisme** : On sélectionne seulement l'élite et on les positionne dans l'ordre de notre prochain génération. Le reste de la population sera croisé et muté puis ajouté dans l'ordre.
    
    <img style="margin: 40px auto;" src="https://i0.wp.com/ledatascientist.com/wp-content/uploads/2020/10/Elitisme.png?resize=768%2C326&ssl=1" alt="schéma algo génétique" width="300"/>
    
- **Fusion** : On prend toute la génération actuelle et on lui ajoute des individus croisés et mutés issus de la génération actuelle. On trie et selectionne les $P$ premiers individus de notre liste pour former la prochaine génération.
    
    <img style="margin-top: 40px;" src="https://i0.wp.com/ledatascientist.com/wp-content/uploads/2020/10/Fusion.png?resize=768%2C509&ssl=1" alt="schéma algo génétique" width="300"/>

### Comparaison

#### Généralités

Notre problème va compter des instances **importantes** (plusieurs milliers de villes) et, comme précisé plus haut, nous allons avoir un nombre très important de solutions. Ce nombre de solutions, fait partie d'un ensemble de solutions *envisageables* pour la résolution de notre problème. Pour exploiter ces solutions, nous avons décidé d'utiliser des métaheuristiques par **population** plutôt que par trajectoire. Les méthodes par trajectoire se basant sur le **voisinage**, l'implementation nous semblait plus complexe et coûteuse en temps et nous préférons explorer un ensemble important de solution plutôt qu'une seule que nous aurions faite évoluer.

Bien entendu, il existe une multitude de métaheuristiques par population. Parmi ces algorithmes, on retrouve la famille des **algorithmes évolutionnistes**. Ceux-ci s'inspirent de la théorie de l'évolution pour résoudre des problèmes divers dont des problèmes d'optimisations. On prend un ensemble de solutions et on va rechercher les meilleures solutions parmi cet ensemble. On peut dire que ces algorithmes sont **stochastiques** car ils itèrent sur des processus aléatoires, ils incorporent donc une partie d'aléatoire. Si un seuil est défini (nombre d'itération ou temps d'exécution), il se peut que la solution la plus optimale soit *ignorée* car la recherche se serait arrêtée avant. Néanmoins, on trouvera une solution **correcte** et **optimisée** dans un temps *acceptable*. L'algorithme génétique fait partie de cette catégorie.

Concernant l'algorithme de colonie de fourmis, nous avons décidé de l'implémenter pour plusieurs raisons. C'est un algorithme par population où tous les individus partagent un **savoir commun**, cette notion est primordiale pour le bon fonctionnement de l'algorithme. Ce savoir commun permet de trouver les résultats les plus *optimisés possible*. Il est également très efficace sur les instances de tailles réduites. Il n'y a pas de notion de générations de populations, les itérations de l'algorithme correspondent aux déplacements des fourmis. Ce mode d'itérations va aussi privilégier les plus courts chemins puisque les fourmis auront besoin de moins d'itérations pour en arriver au bout.


#### Tableau de comparaison

L'environnement expérimental utilisé pour tester les différents algorithme est un ordinateur DELL Studio15 avec un processeur *Intel Core I3 M370* à *2,40 GHz* et *4 Go* de RAM. Les algorithme on été implémenté dans des programmes MATLAB. 
Les ensembles de données du problème du **Voyageur de Commerce** sont des instances téléchargées à partir de *TSPLIB* dont les solutions sont connues. Les algorithmes s'exécutent jusqu'à ce que le critères de fin soit satisfait. Le critère de fin utilisé est la stagnation du résultat. Les résultats obtenus dans le tableau sont une moyenne sur **25 exécutions** de tous les modèles pour chaque ensemble de données.

| Instance utilisée  | Nombre de Villes | Recherche Tabou | Algo Génétique | Colonie de fourmis | Recherche du Coucou | Algo des lucioles | Colonie d'abeilles | Recuit simulé | Algo mémétique | **Solution Connu** |
| :----------------- |:---------------:| :-----:| :-----:| :-----:| :-----:| :-----:| :-----:| :-----:| :-----:| :-----: |
| Ulysses16          | 16             |   8979 | 7399 |  7400 | 7235 | 7398 | 7567 | 8977 |  7808 | **6859** |
| Eil51  | 51          |    1352.51 | 445.80 |  428.87 | 428.72 |  435.60 |  447.87 | 1275.83 |  458.21 | **426** |
| Bier127  | 127          |    8667.83 | 10066.13 |  9298.97 | 8190.8 |  8290.67 |  8345.9 | 8392.76 |  9807.66 | **11828** |

## Test statistique

### Sans contrainte

<br>
<table style="border: 1px solid black;">
<thead>
  <tr>
    <th rowspan="2">Taille de l'instance</th>
    <th colspan="3">Algorithme Génétique</th>
    <th colspan="4">Colonie de Fourmis</th>
  </tr>
  <tr style="border: 1px solid black;">
    <th>Temps total</th>
    <th>Temps itération</th>
    <th>Nb itérations</th>
    <th>Solution optimale</th>
    <th>Temps total</th>
    <th>Temps itération</th>
    <th>Nb itérations</th>
    <th>Solution optimale</th>
  </tr>
</thead>
<tbody>
  <tr>
    <td>10</td>
    <td>4.31</td>
    <td>0.017</td>
    <td>250</td>
    <td>4630.13</td>
    <td>4.51</td>
    <td>0.018</td>
    <td>250</td>
    <td>4680.13</td>
  </tr>
  <tr>
    <td>30</td>
    <td>5.91</td>
    <td>0.023</td>
    <td>250</td>
    <td>16986.08</td>
    <td>25.67</td>
    <td>0.102</td>
    <td>250</td>
    <td>7744.06</td>
  </tr>
  <tr>
    <td>50</td>
    <td>7.91</td>
    <td>0.031</td>
    <td>250</td>
    <td>32281.56</td>
    <td>69.08</td>
    <td>0.276</td>
    <td>250</td>
    <td>10001.81</td>
  </tr>
  <tr>
    <td>500</td>
    <td>109.12</td>
    <td>0.436</td>
    <td>250</td>
    <td>422257.92</td>
    <td>1041.79</td>
    <td>4.167</td>
    <td>250</td>
    <td>33712.89</td>
  </tr>
  <tr>
    <td>1000</td>
    <td>271.89</td>
    <td>1.084</td>
    <td>250</td>
    <td>962541.34</td>
    <td>14084.17</td>
    <td>56.33</td>
    <td>250</td>
    <td>817621.78</td>
  </tr>
</tbody>
</table>

<br>

<table>
    <tr>    
        <td>
            <img src="https://cdn.discordapp.com/attachments/915974638876627024/991628723923198002/unknown.png" width="500" height="600">
        </td>
        <td>
        <img src="https://cdn.discordapp.com/attachments/915974638876627024/991630437191532605/unknown.png" width="500" height="600">
        </td>
    </tr>
</table>

<br>


### Avec contrainte sur la colonie de fourmis

<br>
<table style="border: 1px solid black;">
<thead>
  <tr>
    <th rowspan="2">Taille de l'instance</th>
    <th colspan="3">Colonie de Fourmis</th>
  </tr>
  <tr style="border: 1px solid black;">
    <th>Temps total (s)</th>
    <th>Temps itération (s)</th>
    <th>Nb itérations</th>
    <th>Solution optimale (m)</th>
  </tr>
</thead>
<tbody>
  <tr>
    <td>10</td>
    <td>4.2</td>
    <td>0.017</td>
    <td>250</td>
    <td>3815.47</td>
  </tr>
  <tr>
    <td>25</td>
    <td>14.32</td>
    <td>0.057</td>
    <td>250</td>
    <td>10096.37</td>
  </tr>
  <tr>
    <td>50</td>
    <td>51.54</td>
    <td>0.206</td>
    <td>250</td>
    <td>23077.19</td>
  </tr>
  <tr>
    <td>75</td>
    <td>128.53</td>
    <td>0.502</td>
    <td>250</td>
    <td>38197.25</td>
  </tr>
  <tr>
    <td>100</td>
    <td>217.97</td>
    <td>0.872</td>
    <td>250</td>
    <td>54555.07</td>
  </tr>
  <tr>
    <td>150</td>
    <td>96.47</td>
    <td>0.386</td>
    <td>250</td>
    <td>86145.2</td>
  </tr>
  <tr>
    <td>250</td>
    <td>315.69</td>
    <td>1.263</td>
    <td>250</td>
    <td>143409.01</td>
  </tr>
  <tr>
    <td>500</td>
    <td>1601.56</td>
    <td>6.406</td>
    <td>250</td>
    <td>291755.28</td>
  </tr>
  <tr>
    <td>1000</td>
    <td>20019.5</td>
    <td>80.078</td>
    <td>250</td>
    <td>584510,56</td>
  </tr>
</tbody>
</table>

<table>
    <tr>    
        <td>
            <img src="https://cdn.discordapp.com/attachments/915974638876627024/991633917918584832/unknown.png" width="500" height="600">
        </td>
        <td>
        <img src="https://cdn.discordapp.com/attachments/915974638876627024/991633811815288872/unknown.png" width="300" height="400">
        </td>
    </tr>
</table>

*Sur le graphique de droite, nous pouvons observer une diminution de la courbe pour 150 itérons car nous supprimons l'affichage et donc gagnons en performance*

## Bibliographie

Sources :
- https://tel.archives-ouvertes.fr/tel-00966428/document
- https://tel.archives-ouvertes.fr/tel-00502988/document
- https://tel.archives-ouvertes.fr/tel-01688288/document
- https://tel.archives-ouvertes.fr/tel-00603780/document
- http://www.numdam.org/article/RO_1990__24_3_217_0.pdf
- http://indexation.univ-fcomte.fr/nuxeo/site/esupversions/d5248833-8393-46e1-8710-f5e605e99d86
- https://publications.polymtl.ca/1603/1/2014_AlexandreLeuliet.pdf
- https://online-journals.org/index.php/i-jes/article/view/3233