CESI CDP - Rapport de projet
===

### Introduction

Notre équipe du CesiCDP est assignée à une mission d'optimisation: nous devons résoudre un problème de VRP (Vehicle Routing Problem) afin de pouvoir diriger les livraisons sur un parcours optimisé. Bien qu'il existe des outils open-source résolvant ce type de problème, le groupe CesiCDP nous a demandé de créer un outil sur mesure en langage python, et d'analyser ses performances.

### Sommaire

1. Modélisation du problème
    * Définition du problème
    * Étude de complexité
2. Présentation du choix et description de l'algorithme
    * Fonctionnement & paramètres
    * Spécificités ajoutées à l'algorithme
3. Illustration de cas de tests
4. Étude statistique
    * Statistiques descriptives et prédictives
    * Variation en fonction des paramètres
    * Analyse des résultats

## 1. Modélisation du problème

### Définition du problème

Il nous a été demandé de résoudre un problème de tournées de véhicule. Nous avons décidé que les sommets à visiter seronts définis par leurs coordonnées. Dans notre cas, nous devrons trouver des itinéraires pour effectuer des tournées de livraisons pour atteindre différentes villes sur un large territoire, nous admettons alors que le graphe est complet, et non orienté. Par ailleurs, la plupart des datasets de recherche utilisent les mêmes contraintes pour leurs implémentations d'algorithmes.
L'objectif est de passer une fois seulement par tous les sommets, et de revenir au point de départ, en minimisant la distance totale parcourue.

### Étude de complexité

Le problème du VRP est NP-Complet. Nous ne savons pas résoudre ce problème de façon optimale, c'est pour cela que nous allons utiliser une méta-heuristique: le recuit simulé.
Les problèmes NP-complets d'optimisation combinatoire sont caractérisés par une complexité exponentielle ou factorielle, par conséquent, il est impossible d'énumérer toutes les solutions possibles car cela dépasse la capacité de calcul de n'importe quel ordinateur. Il est donc très difficile de trouver la solution optimale.

Les méthodes approchées ou heuristiques présentent l'avantage d'un temps de calcul réduit mais ne donnent aucune information sur la qualité de la solution trouvée.
Pour résoudre des problèmes difficiles (par exemple ceux qui présentent de nombreux extrema locaux pauvres), des techniques ont été conçues pour déterminer des solutions qui ne sont pas rigoureusement optimales, mais qui s’en approchent. Ces méthodes se basent généralement sur des phénomènes physiques, biologiques, socio-psychologiques ou font appel au hasard. Les domaines d’application sont vastes et s’étendent souvent bien au-delà des problèmes pour lesquels elles ont été initialement conçues.

Les métaheuristiques sont le plus souvent des recherches locales modifiées pour éviter les minima locaux. Leur conception commence par l’étude d’une recherche locale classique (définition d’un voisinage, avec transformations simples), que l’on promeut ensuite en une méthode plus puissante si elle s’avère insuffisante. Il s’agit de méthodes très générales, dans lesquelles plusieurs composants doivent être précisés en fonction du problème à traiter.

# 2. Présentation du choix et description de l'algorithme

### Fonctionnement et paramètres

Le recuit simulé repose sur une analogie avec la métallurgie et le recuit des métaux : un métal refroidi trop vite présente de nombreux défauts qui correspondent à des excédents d'énergie interne. L'objectif du recuit est de minimiser ces excédents de façon à obtenir une configuration d'énergie minimale. Pour le réaliser, on réchauffe le métal ce qui a pour effet d'augmenter encore l'énergie interne, mais un réglage judicieux de la température de refroidissement permet de sortir de l'état initial et d'obtenir finalement une énergie interne plus faible. L'application de ce principe à l'optimisation est le suivant : Il est possible, contrairement à un algorithme de recherche locale, d'accepter une dégradation de la fonction objectif avec une certaine probabilité, sachant que cette dégradation pourra entraîner une amélioration ultérieurement.
Cette méthode d’optimisation s’appuie sur les travaux de Metropolis qui permettent de décrire l’évolution de l’équilibre thermodynamique d’un système.

![image.png](attachment:image.png)

Dans l'algorithme de Metropolis, on part d'une configuration donnée, et on lui fait subir une modification aléatoire. Si cette modification fait diminuer la fonction objectif (ou énergie du système), elle est directement acceptée ; Sinon, elle n’est pas acceptée qu’avec une probabilité égale à `ΔE/T` (avec E : énergie, et T : température), cette règle est appelé critère de Metropolis. 

La température varie selon une fonction appelée "temperature schedule".

### Spécifités ajoutées à l'algorithme

Nous avons ajouté trois spécificités à l'algorithme du recuit simulé:

* Le réchaud

Une fois la température descendue proche de zéro, nous remontons la température afin d'éviter de trop tomber dans un extremum local. Nous ne remontons pas la température autant que la température initiale, mais suffisament pour être sûr de sortir d'un optimum local.

* Le multi-start

Nous générons plusieurs situations de départ, et gardons la meilleure dans le but de commencer avec une solution déjà proche d'une solution efficace.

* Sauvegarde du meilleur résultat

Nous vérifions à chaque itération que le nouveau cycle généré soit le plus petit. Dans ce cas, nous le gardons en mémoire et le retournons à la fin de l'éxecution de l'algorithme.

## 3. Illustration et cas de test



Voici la fonction principale du programmme. Le code ne pourra pas être lancé car il n'est pas dans son intégralité, mais vous pourrez l'exécuter avec les fichiers du livrable technique.

In [None]:
for temperature in temperatures():
    iteration = iteration + 1

    [i,j] = sorted(random.sample(range(city_count),2))
    newTour = tour[:i] + tour[j:j+1] + tour[i+1:j] + tour[i:i+1] + tour[j+1:]

    old_distances = distance_between(tour, cities, i, j)
    new_distances = distance_between(newTour, cities, i, j)
    new_tour_distance = distance(newTour, cities)

    if math.exp( (old_distances - new_distances) / temperature) > random.random():
        tour = copy.copy(newTour)

    if new_tour_distance < lowest_distance:
        lowest_distance = new_tour_distance
        lowest_tour = copy.copy(tour)

Avec un seul véhicule, nous obtenons un résultat avec quelques dizaines de secondes (80s). Voici quelques exemples de résultats:

![image.png](attachment:image.png)

L'algorithme se déroule à l'intérieur d'une boucle for principale, et se déroule donc dans une complexité O(n) dans le meilleur des cas.

Voici un exemple avec 2 camions et 20 villes:
    
![image.png](attachment:image.png)

## 4. Étude statistique


### 4.1 Statistiques descriptives
 
 **Statistiques descriptives** : L'objectif de la statistique descriptive est de décrire, c'est-à-dire de résumer ou représenter, par des statistiques, les données disponibles quand elles sont nombreuses.

* **Population**: La population est l’ensemble des individus (ou unités statistiques) auxquels on décide de s’intéresser. Le choix de la population étudiée dépend du problème qui est à l’origine de la démarche statistique, et de la façon dont on décide de le traiter.


* **Individu**:  Un individu est un élément d'un ensemble, généralement appelé « population », dont on mesure (ou observe) la valeur qu'il a pour la variable étudiée. Pour une étude sur les catégories professionnelles, un individu observé peut être, par exemple, « un enseignant », « un médecin », « un secrétaire », etc.


* **Modalité**: Une modalité est la valeur prise par une variable statistique qu’elle soit qualitative ou quantitative. Les modalités correspondent donc à l’ensemble des valeur possibles.

Dans notre cas nous avons fais notre étude sur nos résultats obtenus par notre algorithme.

### 4.2 Variation en fonction des paramètres
Dans cette partie nous allons parler des analyses statistiques réalisés sur notre algorithme, les resultats sont les suivants:

La fonction summary() permet d'avoir la description statistique d'une variable ou d'une table de donnée (dataset).

Pour une variable donnée, la fonction renvoie 5 valeurs : le minimum (Min.), le premier quartile (1st Qu.), la médiane (Median), la moyenne (Mean), le troisième quartile (3rd Qu.) et le maximum (Max).

Aussi, nous avon calculé l'écart type qui nous permet (racine carré de la variance) de mesurer la dispersion de l'échantillon statistique, c'est-à-dire mesurer la variabilité des valeurs prélevées autour de leur moyenne. Plus l'écart type est faible, plus la population est homogène.

Le parametre range nous permet d'avoir la valeur maximun et minimun de notre dataset.

Dans notre cas nous avons exécuter notre programme d'une durée de 80 secondes.

![image.png](attachment:image.png)









![image.png](attachment:image.png)

![image.png](attachment:image.png)

### Explication et sythése du graphe :

Les itérations en fonction du temps évoluent quasiment linéairement, ce qui permet de prédire le nombre d’itération en fonction du temps. 
Le facteur définissant le nombre d’itérations dans un laps défini de temps est : les ressources disponibles de la machine exécutant le calcul.


### Distance en fonction du temps :

![image.png](attachment:image.png)

![image.png](attachment:image.png)

![image.png](attachment:image.png)

### Explication et sythése du graphe :

Nous remarquons qu’après exécution du programme, la distance minimale de la tournée de véhicules se stabilise à une certaine valeur et cela est du au fait que la meilleure solution soit trouvée. Il n’y’a donc pas d’autre possibilité de combinaison de solution meilleure que celle-ci.

### Temperature en fonction des iterations :

![image.png](attachment:image.png)

![image.png](attachment:image.png)

![image.png](attachment:image.png)

### Explication et sythése du graphe :

Nous remarquons sur ce graph que la température ne cesse de croitre et de décroitre en fonction du nombre d’itérations, et cela est du au fait que le recuit simulé utilise le paramètre nommé « température » qui permet de modifier la fonction appelée « cooling schedule » permettant de prendre des solutions de moins bonne qualité. Ce paramètre « Température » est modifié constamment en le multipliant par un coefficient de refroidissement et cela permet de faire de l’intensification, le remettre à sa valeur initiale permet de faire de la diversification.
Conclusion : La température ne cesse de décroitre et de recroitre a sa valeur initiale, et ce pour faire de l’intensification et de la diversification dans le but de sortir des optimum locaux ( en prenant des solutions de moins bonne qualité avec une probabilité proche de 1).



### Temperature en fonction du temps :

![image.png](attachment:image.png)

### Mémoire en foction du temps :

![image.png](attachment:image.png)

![image.png](attachment:image.png)

### Explication et synthése du graphe :

La mémoire RAM ne cesse de croire au fur et a mesure de l’avancement des calculs, jusqu’à se stabiliser aux environs de 80 méga octets. 

Conclusion : Le programme a une consommation de mémoire fixe après les opérations de démarrage.


### Variation des résultats obtenus à travers le nombre d'iteration en fonction de la température initiale définie (modèle: Paris):

Code pour générer le graphe :

![image.png](attachment:image.png)

![image.png](attachment:image.png)

### Explication et synthése du graphe :

### Variation des résultats obtenus à travers le nombre d'iteration en fonction de la température initiale définie (modèle: 1000 villes):

Code pour générer le graphe :

![image.png](attachment:image.png)

![image.png](attachment:image.png)

Nous remarquons que le programme dont la température minimale est initiée a 10<sup>15</sup> mets plus de temps a trouver la meilleure solution et cela est dû au fait qu'il faut beaucoup plus d'itératopns pour que la température ne baisse pour atteindre la phase d'intensfication. Il y a donc beaucoup de diversifiation inutile. Le paramètre température baisse de valeur grâçe au Cooling Schedule qui est une fonction mathématique qui régit l'évolution de la température.

Quant aux deux graphs représentant la temperature initiée a 10<sup>3</sup> et 10<sup>2</sup>, nous remarquons que la distance minimale est trouvée assez rapidement, car la phase de diversification est beaucoup plus rapide étant donné quil ne faut pas enormément d'itérations pour arriver a la température la plus basse (la valeur initiale de la température n'étant pas importante).

On observe que peu importe la température de départ, on peut instinctivement modéliser les courbes d'évolution de distance minimal par des courbes décroissantes convergeant vers la valeur de l'optimum. Ainsi, il est possible d'estimer à l'aide des statistiques préictives l'évolution du résultat dans le temps.

## Analyse de résultats

Nous avons pu évaluer la qualité de l'algorithme à l'aide de la méthode de la borne inférieure, et de datasets issus du milieu de la recherche opérationnelle.

Connaissant à l'avance la distance la plus courte pour un ensemble de ville, nous pouvons juger en direct de la solution trouvée, grâce aux données écrites dans la console, et au fichier de log CSV généré.

Une autre méthode est de trouver la borne inférieure de l'instance du problème. Elle peut être trouvée en résolvant le système d'équations suivant:

![image.png](attachment:image.png)

Les variables utilisées ici sont les mêmes que celles du système précédent, auxquelles on peut rajouter la variable u<sub>i</sub> représentant l'index du noeud visité. Par exemple u<sub>5</sub> = 64 signifie que le noeud 5 est visité au 64<sup>e</sup> arrêt du véhicule.

## Sources scientifiques utilisées

* Méthode d’optimisation : Simulated Annealing ou le “recuit simulé” – Algorithme Metropolis Hastings pour le changement artificiel de la température

* S. Kirkpatrick, C. D. Gelatt and M. P. Vecchi, Optimization by Simulated Annealing, Science, vol. 220, pp. 671-680 (1983)

* S. Kirkpatrick, Optimization by Simulated Annealing: Quantitative Studies, Journal of Statistical Physics, vol. 34, pp. 975-986 (1984)

* N. Metropolis et al., Equations of State Calculations by Fast Computing Machines, Journal of Chemical Physics, vol. 21, pp. 1087-1092 (1953)

* W. K. Hastings, Monte Carlo sampling methods using Markov chains and their applications, Biometrika, vol. 57, pp. 97-109 (1970)

* C. P. Robert and G. Casella, Monte Carlo Statistical Methods, Springer-Verlag, 2004

* J.-M. Marin and C. P. Robert, Bayesian Core: A Practical Approach to Computational Bayesian Statistics, Springer-Verlag, 2007

* J W. R. Gilks, S. Richardson and D. Spiegelhalter, Markov Chain Monte Carlo in Practice, Chapman & Hall, 1996

* J. S. Rosenthal, Optimal Proposal Distributions and Adaptive MCMC, Chapter for MCMC

* Handbook, S. Brooks, A. Gelman, G. Jones, and X.-L. Meng, eds.

* http://what-when-how.com/artificial-intelligence/a-comparison-of-cooling-schedules-for-simulated-annealing-artificial-intelligence/

* https://fr.slideshare.net/achrafmanaa3/chapitre-2-le-recuit-simul