# Projet Data
## _DIDIER L√©o - HAAS Lucas  - EKOBE Nicolas - PIQUE Valentin - MOHR Antoine_

## Livrable 3 - Pr√©sentation de l'ensemble de la d√©marche de la solution

## Mod√©lisation du probl√®me algorithmique

### Sujet

Le but de cette √©tude est de g√©n√©rer une tourn√©e de livraison (probl√®me du VRP). Le probl√®me algorithmique consiste donc √† calculer sur un r√©seau routier une tourn√©e permettant de relier entre elles un sous-ensemble de villes, puis de revenir √† son point de d√©part, de mani√®re √† minimiser la dur√©e totale de la tourn√©e. Cette optimisation devra tenir compte du trafic pr√©vu sur chaque axe pour les diff√©rentes tranches horaires.

Vous devrez proposer une m√©thode issue de la Recherche Op√©rationnelle pour g√©n√©rer une tourn√©e de livraison correspondant √† ce probl√®me. L‚Äôimpl√©mentation se fera sur une version de base du probl√®me, √† laquelle vous pourrez ajouter des contraintes suppl√©mentaires, rendant le probl√®me plus r√©aliste, mais aussi plus dur √† traiter.

Par ailleurs, vous devrez effectuer une √©tude statistique du comportement de votre m√©thode de r√©solution, faisant apparaitre ses performances (qualit√© de solution, temps de convergence). Id√©alement, des statistiques pr√©dictives permettent d‚Äôextrapoler ce comportement sur des cas d‚Äôusages que vos ordinateurs seuls ne pourraient traiter.


### Sp√©cificit√©s et contraintes

L'objectif est de minimiser le temps de la tourn√©e. Le temps de la tourn√©e correspond √† la diff√©rence entre le d√©part du premier camion, et l'arriv√©e du dernier camion au d√©p√¥t.

#### Choix des contraintes

<h6>Contraintes du probl√®me de base</h6>
<ol>
    <li>La tourn√©e de livraison doit passer <i>au minimum</i> une fois par chaque ville </li>
    <li>La tourn√©e de livraison doit commencer et se terminer sur le m√™me point (le d√©p√¥t)</li>
    <li>Le trafic doit √™tre pris en compte (pour toutes heures)</li>
</ol>
<h6>Contraintes suppl√©mentaires optionnelles</h6>
<ol>
    <li>La livraison doit tenir compte de "fen√™tre de livraison" pour chaque ville (plage de temps sur laquelle la livraison est autoris√©e) </li>
    <li>Plusieurs camions disponibles, ayant chacun une capacit√© pr√©d√©finie. Certains camions ne pouvant livrer que certains objets. </li>
    <li>Point de collecte sp√©cifique </li>
    <li>Chaque livraison dure un certain temps</li>
</ol>

### D√©finition math√©matique du probl√®me

Soit le graphe G non orient√© $$G=(V,E)$$

$x_{ijk}$ √©gale √† 1 si le v√©hicule k parcourt l'arc $(v_i, v_j)$, not√© plus simplement $(i,j)$
. 
L'ensemble des sommets est not√© $V = {\{v1,...,vn\}}$

Les constantes du probl√®me sont les suivantes :
- $n$ nombre de clients (ou sommets)
- $m$ nombre de v√©hicules
- $c_{ijt}$ le co√ªt de l'ar√™te entre les sommets $i$ et $j$ √† l'heure $t$(distance ou temps de parcours / trafic)

#### A termes certaines contraintes seront ajout√©es :
- $Q$ capacit√© des v√©hicules
- $q_i$ demande du client $i$


- $[a_i,b_i]$ o√π $a_i$ repr√©sente l'heure d'arriv√©e au plus t√¥t dans une ville, et $b_i$ l'heure d'arriv√©e au plus tard
- $t_i$ l'heure d'arriv√©e dans la ville $i$
- $\Delta t_j$ le temps pass√© sur un point de livraison $j$
- Tel que 

$ x_{ijk} \in{[0,1} ] \space et \space ‚àÄ0 \leq \{i,j\} \leq n$

$1 \leq k \leq m $

$t \in [0,24]$
<hr/>


La fonction objectif du probl√®me d'optimisation est d√©finie telle que :

$$Minimiser \sum \limits _{i=1}^n \sum \limits _{j=1}^n \sum \limits _{t=1}^{24} c_{ijt} \sum \limits _{k=1}^m x_{ijk}$$

$s.c :$

Les clients doivent √™tre desservis une et une seule fois :
$$ \sum \limits _{i=1}^n \sum \limits _{k=1}^m x_{ijk} = 1 \,‚àÄ 1 \leq j \leq n$$
$$ \sum \limits _{j=1}^n \sum \limits _{k=1}^m x_{ijk} = 1 \,‚àÄ 1 \leq i \leq n$$

Chaque tourn√©e commence et se termine au d√©p√¥t:
$$\sum \limits _{j=1}^n x_{0jk} = 1 \space‚àÄ 1\leq k \leq m $$ 
$$\sum \limits _{i=1}^n x_{i0k}=1 \space ‚àÄ 1\leq k \leq m $$ 




#### A termes certaines contraintes seront ajout√©es :

Contraintes de capacit√© :

 $$\sum \limits _{i=1}^n q_i \sum \limits _{j=1}^n x_{ijk} \leq Q_k \space \space ‚àÄ1 \leq k \leq m $$ 


Contraintes de fen√™tre de livraison :

 $$t_j \geq t_i + t_{ij} - x_{ijk}\Delta t_j $$ 
 $$t_j \leq t_i + t_{ij} + x_{ijk}\Delta t_j $$ 

 
 $$a_i \leq t_i \leq b_i$$


### Etude de complexit√© du probl√®me

Le probl√®me du voyage de commerce est NP-complet car il est possible de v√©rifier une solution en temps polynomial et tous les autres probl√®mes de la classe NP se ram√®nent √† celui-ci via une r√©duction polynomiale. Il donc √©galement NP-difficile. Le VRP √©tant au moins aussi difficile que le TSP, il est √©galement NP-difficile.

Richard M. Karp a montr√© en 1972 que le probl√®me √©tait NP-complet, dans son article "Reducibility Among Combinatorial Problems".

Ce probl√®me d'optimisation n'admet pas encore √† ce jour d'algorithme permettant de trouver une solution exacte rapidement dans tous cas. Il est donc n√©cessaire de parcourir tous les chemins  ùëõ  possibles, ce qui revient √† une complexit√© asymptotique de :  ùëÇ(ùëõ!) 
Le nombre de possibilit√©s s'√©l√®ve donc √†  ùëõ!  ( ùëõ  factorielle). Pour  ùëõ=3 , cela fait 6 possibilit√©s. Pour 10 villes, cela fait 3,6 millions de combinaisons possibles et pour 20 villes 2,4.10^18 combinaisons possibles !

En cons√©quence du nombre important de possibilit√©s, le temps de r√©solution d'un algorithme de r√©solution exacte sera trop important. Nous allons donc utiliser un algorithme qui ne nous donnera pas forcement le r√©sultat exact mais une tr√®s bonne estimation en temps raisonnable : les m√©ta-heuristiques.

## Explication de la m√©thode de r√©solution

Nous avons choisi d'utiliser plusieurs m√©taheuristique pour r√©pondre aux besoins de ce probl√®mes afin de pouvoir comparer l'efficacit√© de ces m√©thodes.
Cette comparaison nous semble pertinente afin de comparer l'incidence de la modification des diff√©rents param√®tres. Nous pourrons ainsi en d√©duire la m√©thode la plus adapt√©e dans chaque cas de figures.

Nous avons ainsi choisi d'utiliser et d'impl√©menter les m√©taheuristiqus suivantes :
<ul>
    <li><b>Recherche Tabou (Tabu-search)</b> : + Permet d'√©viter de rester bloquer dans un optimum local / - Consommation de m√©moire </li>
    <li><b>Recuit simul√© (Simulated Annealing)</b> : + Permet d'√©viter de rester bloquer dans un optimum local / - Choix des nombreux param√®tres </li>
   
D'autres m√©thodes pourront √™tre √©ventuellement √©tudi√©es et ajout√©es par la suite √† titre de comparaison : algorithme g√©n√©tique, GRASP, VND, ...

<hr/> 


<h6>Recherche Tabou :</h6>
 
Utilise une m√©thode de g√©n√©ration de voisinage 
Utilise la recherche tabou pour explorer le voisinage et choisir la position dans ce voisinage qui minimise notre fonction objectif. Pour √©viter de rester pi√©g√© dans un minimum local, on utilise une liste FIFO (tabou), qui conserve les solutions d√©j√† explor√©es.

Exemple d'impl√©mentation :
![image.png](attachment:image.png)
<hr/>

<h6>Recuit simul√© :</h6>
 
S'inspire de l'alternance chauffage/refroidissement pour faire varier l'√©nergie d'un materiau dans le milieu de la m√©tallurgie. On utilise cette m√©thode pour trouver l'ensemble des extremas d'une fonction et ainsi trouver l'optimum global.


Exemple d'impl√©mentation tel que :

E est une fonction calculant l'√©nergie de l'√©tat s, k est l'index de l'√©tape en cours, e est l'energie
![image.png](attachment:image.png)
<hr/>

## Pr√©sentation de la solution

### Biblioth√®ques Python

#### Google OR Tools

OR-Tools est une suite logicielle open source mettant a disposition un grand nombre de solutions d'optmisation r√©pondant entre autre √† notre probl√®me via la bibliot√®que python. On a donc pu impl√©menter les m√©thaheuristiques Recherche Tabou et Recuit Simul√©.

### Les Algorithmes

#### Connexions √† la base

#### Demonstration

In [None]:
from vrp import VRP
from cvrp import CVRP
from ortools.constraint_solver import routing_enums_pb2

from load_data import from_file_to_adj_matr
from load_data import get_particular_info

algos_metaheuristic = [
   routing_enums_pb2.LocalSearchMetaheuristic.TABU_SEARCH,
   routing_enums_pb2.LocalSearchMetaheuristic.SIMULATED_ANNEALING,
]

timeout = 15 # in s
cvrpOrVrp = 'cvrp'
random = True

mat, capacity, cities_nb, vehicules_nb, demand_matrix, coords = from_file_to_adj_matr('../data/A-VRP/A-n33-k6.vrp')
if cvrpOrVrp == 'vrp':
        # VRP
        vrp = VRP(vehicules_nb,cities_nb)
        if random:
            vrp.create_data_model()
        else:
            vrp.pass_matrix(mat)
        #print(vrp.data)
        
        
    elif cvrpOrVrp == 'cvrp':
        # CVRP
        vrp = CVRP(vehicules_nb,cities_nb)
        if random:
            vrp.create_data_model()
        else:
            vrp.pass_matrix(mat, demand_matrix,capacity)
        #print(vrp.data)

    # R√©soud le probl√®me du VRP/CVRP
    for strategy in algos_heuristic:
            solution = vrp.solve(strategy, timeout, useTimeout=True, useHeuristic=True)
            if not random:
                print("Solution attendue : " + str(cost))
            print("Solution obtenue : " + str(solution[1]))
            print(solution)

## Etude Statistique

### Statistiques comparatives

Nous avons jug√© pertinent de comparer les statistiques issues de nos deux alorogithmes.

Dans un premier temps, pour 1000 solutions max, on compare le temps d'execution en fonction du nombre de vehicules (pour 30 villes) :

![image.png](attachment:image.png)

### Statistiques suppl√©mentaires

#### Analyse pr√©dictive