# Contexte

## Strory telling :
Les problèmes de transport, appelés aussi problèmes de routage, modélisent des problèmes réels liés au transport de marchandises ou de personnes. Afin d'introduire le problème de routage de véhicules, nous parlerons de deux autres problèmes de transport : le problème du voyageur du commerce et le problème du postier chinois.

### Traveling Salesman Problem (TSP) : 
Selon Laporte and Osman et Dhaenens, le problème du voyageur de commerce serait le problème le plus célèbre et le plus étudié en optimisation combinatoire. Dans ce problème, un voyageur de commerce doit visiter plusieurs villes (ou clients) en passant une et une seule fois par chacune d'entre elles, et en minimisant la distance totale parcourue.

Plus formellement, un TSP est modélisé sous forme d'un graphe où les sommets représentent les villes à visiter, et les arêtes les liaisons entre ces villes. La pondération ou le poids associé à chaque arête représente le coût de la liaison entre les deux villes et correspond généralement à la distance qui
les sépare. L'objectif est de trouver un cycle hamiltonien, c'est-à-dire un cycle passant une et une seule fois par tous les sommets du graphe, et de longueur minimale.

En tant que problème d'optimisation, le TSP est un problème NP-diffcile (un problème NP-difficile est un problème vers lequel on peut ramener tout problème de la classe NP par une réduction polynomiale). En effet, dans sa version symétrique, c'est-à-dire dans le cas où le graphe associé n'est pas orienté, le nombre total de solutions possibles est (n−1)!2
où n est le nombre de villes. Avec une telle complexité factorielle, une résolution efficace du TSP nécessite donc le recours à des heuristiques spécialisées voire même à des métaheuristiques. En effet, les méthodes exactes restent limitées aux problèmes de petite taille.

### Vehicle Routing Problem (VRP) : 

Le problème de routage de véhicules est une extension du problème du voyageur du commerce. Il a été introduit pour la première fois par Dantzig sous le nom de "Truck Dispatching Problem" et a depuis fait l'objet d'études intensives pour le modéliser et le résoudre.
Dans ce problème, il s'agit de déterminer les tournées d'une flotte de véhicules afin de livrer une liste de clients, ou de réaliser des tournées d'interventions (maintenance, réparation, contrôles) ou de visites (visites médicales, commerciales, etc.). Le but est de minimiser le coût de livraison des biens. Comme dit précedement ce problème est une extension classique du problème du voyageur de commerce, et fait partie de la classe des problèmes NP-complet.

Il existe quelques variantes classiques du problème de tournées de véhicules :
- tournées de véhicules avec profits (aussi appelé VRPP pour Vehicle Routing Problem with Profits) : Un problème de maximisation de collecte de profits où il faut sélectionner quels clients visiter tout en respectant les capacités limitées des véhicules,
- contraintes de capacité (aussi appelé CVRP pour Capacitated Vehicle Routing Problem) : Les véhicules ont une capacité d'emport limitée (quantité, taille, poids, etc.),
- contraintes liées aux ressources et aux clients : disponibilité, localisation, compétences requises, etc,
- tournées de véhicules avec fenêtre de temps : Pour chaque client on impose une fenêtre de temps dans laquelle la livraison doit être effectuée ;
- tournées de véhicules avec collecte et livraison : Un certain nombre de marchandises doivent être déplacées de sites de collecte vers des sites de livraisons.

#### Méthodes de résolution du VRP :
Comme pour la plupart des problèmes NP-complet il est difficile de résoudre des instances de grande taille de façon optimale. On se contente alors de trouver des solutions de « bonne qualité ». Afin d'obtenir des solutions dans des temps de calculs raisonnables, on se tourne généralement vers des méthodes approchées à base d'heuristique ou encore de métaheuristique.

#### Application du VRP :
Les algorithmes de calcul de tournées sont utilisés dans les moteurs des logiciels d’optimisation de tournées. Ces solutions sont utilisées par des entreprises qui souhaitent rationaliser leur flotte de véhicules, réduire leurs coûts ou encore optimiser l’occupation de leur personnel mobile.

La fonction d’optimisation de tournée peut aussi être intégrée dans des solutions de planification de ressources mobiles. Ces solutions ont pour vocation de planifier des tâches ou missions avec ou sans prise de rendez-vous, et de les répartir entre les ressources en fonction de leurs contraintes (disponibilité, localisation, compétences requises, durées d’interventions, etc.).

Les entreprises concernées par l’optimisation de tournées peuvent appartenir aux secteurs d’activités suivants :
- livraison de biens à des entreprises ou à des particuliers : transporteurs, messageries (distribution de presse), grandes surfaces (livraison de marchandises des entrepôts aux magasins,
- livraison et installation d’équipement à domicile, etc.) ;
- réparation et maintenance d’équipements de particuliers (électroménager, chaudières, informatique, etc.), d’équipements collectifs (ascenseurs, tapis roulants) ou d’entreprises (distributeurs automatiques, équipements industriels, informatique, etc.) ;


# Génération des données de traffic basée sur une courbe de traffic réele

Les données de trafic seront retournée sous la forme d'un tableau de coefficient qui pourra être multiplié au poids de l'arête du graph

In [19]:
import random
import math
cache = []
# Generate traffic data for an edge
def generate():
    global cache
    if len(cache) == 0:

        m_a = 1503.43402
        m_b = -556561.2208
        m_max = m_a*60*12+m_b

        e_a = -1507.393614
        e_b = 1862163.515
        e_max = e_a*60*12+e_b
        morning = [int(round(10*(m_a*60*i+m_b)/m_max)) if 10*(m_a*60*i+m_b)/m_max >= 0 else 0 for i in range(0,12) ]
        evening = [int(round(10*(e_a*60*i+e_b)/e_max)) if 10*(e_a*60*i+e_b)/e_max >=0 else 0 for i in range(12,24)]

        cache=morning+evening
    # Predicted weight array from project given data
    # traffic = [0, 0, 0, 0, 0, 0, 0, 2, 4, 6, 8, 10, 10, 9, 8, 7, 5, 4, 3, 2, 1, 0, 0, 0]

    # Base weighted array from offical french stats
    # traffic = [1, 1, 1, 1, 1, 1, 1, 2, 7, 8, 3, 2, 1, 1, 1, 2, 3, 5, 7, 5, 1, 1, 1, 1, 1]

    # Return array of slowth coeficient [0-10]
    return cache

# Génération paramètrisé d'un graphe
Deux classe sont déclaré ici.
La classe "Edge" correspond aux arêtes. Elle possède un attribut poids qui est obtenue en multipliant une distance de base aléatoire, par une coefficient de trafic qui est variable en fonction du temps
La classe "Graph" correspond au graphe. Elle possède un attribut matrice qui correspond à la représentation matricielle du graph

In [20]:
import sys
import time

def console_clear():
    "Use this function to delete the last line in the STDOUT"

    #cursor up one line
    sys.stdout.write('\x1b[1A')

    #delete last line
    sys.stdout.write('\x1b[2K')

In [21]:
from traffic import generate
from utility import console_clear
import random
import math

class Edge:
    def __init__(self,length, traffic):
        # Generate an array of weight for base weight * traffic coefficient 
        self.weight = [(length + 30*scale) if length!=0 else length for scale in traffic ]

class Graph:
    def __init__(self, n, has_traffic, is_oriented):
        g = []
        for i in range(n):
            console_clear()
            print("Progress : "+str(math.ceil(100*i/n)))
            row = []
            for j in range(n):
                    # For non oriented graphs use symmetry to generate the bottom left part of the graph
                if(j<i and not is_oriented):
                    weight = g[j][i]
                else:
                    weight = Edge(
                        # Random base weight for the edge, range start at 1 if the graphs is complete,
                        # weight is 0 if the edge is a loop
                        random.randrange(5, 240, 5) if i!=j else 0,
                        # Generated traffic data or 1 if traffic is not used
                        generate() if has_traffic else [0] 
                        ).weight
                row.append(weight)
            g.append(row)
        self.matrice = g 


ModuleNotFoundError: No module named 'traffic'

# Stockage des graphs

Cette partie consiste à appeler la génération de graphs et à les stocker dans une collection mongoDB avec les paramètre ayant servi à leur génération

In [None]:
from graph import Graph 
from tour import create_tour
from pymongo import MongoClient
import matplotlib.pyplot as plt
import pprint
import random
import time

# Constants
FLUSH = True
GENERATE = True
PRINT = True
SEARCH = False
STATS = False
algo = antAlgo

# Connection to MongoDB
client = MongoClient('localhost', 27017)
db = client['DataProject']
graphs = db['graphs']

if(FLUSH):
    graphs.delete_many({"n":{"$lte":500}})
if(GENERATE):

    n_min = 10
    n_max = 400
    n_step = 20
    graph_per_size = 4

    for _ in range(4):
        # Using binary to generate boolean dict to test each combination
        b = "{0:b}".format(_)
        if len(b) < 2 : b = '0'+ b
        params = {"has_traffic" : b[0] == '1', "is_oriented" : b[1] == '1'}

        for n in range(n_min, n_max+n_step, n_step) :
            graph_id = 0
            for _ in range(graph_per_size):
                
                # Generate a graph with parameters
                matrice = Graph(n, params["has_traffic"], params["is_oriented"]).matrice

                # Generate the row that will be saved in MongoDB 
                for node in range(len(matrice)) :       
                    
                    # Opening time between 13h and 22h minutes
                    time_window = random.randrange(800,1340 + 15, 15)


                    # Start time between midnight and midnight - time window
                    start_time = random.randrange(0, 1_440 - time_window + 10, 10)
                    end_time = start_time+time_window

                    # Save generated data into graphs collection
                    graphs.insert_one( {"graph_id" : graph_id , "node" : node, "start_time" : start_time, "end_time" : end_time, "n" : n, "has_traffic" : params["has_traffic"], "is_oriented" : params["is_oriented"], "row" : matrice[node]})
                graph_id += 1
    # Rows check
    print("Rows : "+str(graphs.count_documents({})))

# Modélisation du problème
Cette phase aboutira à la création d'un notebook décrivant :

- La définition du problème formel

- L'étude de complexité de ce problème

Il est fortement recommandé d'intégrer à ce notebook des références bibliographiques vers des articles ou des ouvrages scientifiques.


## Définition du problème formel
#### Indices et ensembles
Un graphe G = (V, E) représente notre problème où :
- V représente l'ensemble des villes et du dépôt,
- E représente l'ensemble d'arêtes entre deux villes i, j ∈ V.

<p> W représente l'ensemble des véhicules. </p>

<p>Nous utilisons alors une matrice de taille n*n</p>

#### Définition des paramètres

\begin{equation}
    n{} = le \ nombre \ de \ ville. \\
\end{equation}

\begin{equation}
    k{} = le \ nombre \ de \ véhicules. \\
\end{equation}

\begin{equation}
    v{} = un \ véhicule \ ∈ \ W. \\
\end{equation}

\begin{equation}
    tr_{i,j} = le \ trafic \ entre \ deux \ villes \ i,j. \\
\end{equation}

\begin{equation}
    d_{i,j} = la \ distance \ entre \ la \ ville \ i \ et \ la \ ville \ j. \\
\end{equation}

\begin{equation}
    x_{i,j}^{v} => \ voyage \ d'une \ ville \ i \ à \ une \ ville \ j \ de \ la \ voiture \ v. \\
    x_{i,j}^{v} = 1 => \ le \ véhicule \ v \ voyage \ de \ la \ ville \ i \ à \ \ la \ ville \ j.\\
    x_{i,j}^{v}  \ = \ 0 \ => \ le \ véhicule \ v \ ne \ voyage \ pas.
\end{equation}



### Définition des contraintes
##### Contraintes sur les villes
Cela signifie qu'une ville ne peut être l'arrivé d'un voyage (j) qu'une seule fois. Donc : 

\begin{equation}
    \sum_{i=1}^n x_{i,j}^{v} = 1, \forall j\in [1,n]  \\
\end{equation}


De la même manière, une ville ne peut être un point de départ (i) qu'une seule fois. Donc : 

\begin{equation}
    \sum_{j=1}^n x_{i,j}^{v} = 1, \forall i\in [1,n]  \\
\end{equation}


Pour éviter les mini cycles x{i,j} = x{j,i} = 1 on utilise la contrainte :

\begin{equation}
    x_{i,j}^{v} + x_{j,i}^{v} = 1, \forall i\in V, \forall i\in V \\
\end{equation}


Il n'y a pas de voyage dans la même ville, i le départ et l'arrivé du voyage :

\begin{equation}
    x_{i,i}^{v} = 0 , \forall i\in [1,n]  \\
\end{equation}


##### Contraintes sur les véhicules
Assure que chaque véhicule ne sort qu’une seule fois du dépôt (0 = Départ du dépot).

\begin{equation}
 \sum_{j=1}^n x_{0,j}^{v} = 1, \forall v\in W, \forall j\in V \\
\end{equation}

Assure le retour unique au dépôt pour chaque véhicule (ou tournée) (n+1 = Arrivé au dépot).

\begin{equation}
 \sum_{i=1}^n x_{i,n+1}^{v} = 1, \forall v\in W, \forall i\in V \\
\end{equation}


#### Contraintes sur le temps


Variables à déterminer :
\begin{equation}
    a_i = instant \ d’arrivée \ chez \ le \ client \ i ∈ V.  \\
    b_i = instant \ de \ début \ de \ service \ chez \ le \ client \ i ∈ V.  \\ 
    b_0^v = instant \ auquel \ le \ véhicule \ v \ quitte \ le \ dépôt. \\
    b_{n_c+1}^v = instant \ auquel \ le \ véhicule \ v \ retourne \ au \ dépôt. \\
    w_i = temps \ d’attente \ chez \ le \ client \ i ∈ V \\
\end{equation}

Constantes connues :
\begin{equation}
    e_i = borne \ inférieure \ de \ la \ fenêtre \ de \ temps \ du \ client \ i ∈ V. \\
    l_i = borne \ supérieure \ de \ la \ fenêtre \ de \ temps \ du \ client \ i ∈ V. \\
    t_{i,j} = le \ temps \ de \ parcours \ entre \ les \ deux \ clients \ i \ et \ j; i, j ∈ V. \\
    s_i = temps \ de \ service \ chez \ le \ client \ i ∈ V = 0 \ dans \ notre \ cas \\
\end{equation}


Contraintes :

Instant d'arrivé à j avant le début du service chez j
\begin{equation}
    x_{i,j}^v = 1 ⇒ b_i + s_i + t_{i,j} ≤ b_j , ∀i, j ∈ V, v ∈ W \\
    a_j = b_i + s_i + t_{i,j}
\end{equation}

Instant d'arrivé à j avant le début du service chez j (en partant du dépot)
\begin{equation}
    x_{0,j}^v = 1 ⇒ b_0^v + t_{0,j} ≤ b_j , ∀j ∈ V, v ∈ W
\end{equation}

Instant de retour au dépot à la fin de la tourné
\begin{equation}
    x_{i,n+1}^v = 1 ⇒ b_i + s_i + t_{i,n+1} ≤ b_{n+1}^v, ∀i ∈ V, v ∈ W
\end{equation}

Début de service entre les bornes de fenêtre de temps
\begin{equation}
    e_i ≤ b_i ≤ l_i, ∀i ∈ V
\end{equation}

Instant ou le camion revient au dépot entre une plage horaire
\begin{equation}
    e_{n+1} ≤ b_{n+1}^v ≤ l_{n+1}, ∀v ∈ W
\end{equation}

### Définition du problème

Définition du coût du trajet entre i et j (en seconde):

\begin{equation}
    c_{i,j}^{v} = d_{i,j} + 30*tr_{i,j}
\end{equation}


Les contraintes décritent, on ajoute les distances pour obtenir la solution à notre problème :

\begin{equation}
    w_{i,j} = Le \ temps \ d'attente \ avant \ le \ début \ de \ service
\end{equation}

\begin{equation}
    \sum_{i=1}^n  \sum_{j=1}^n x_{i,j}(c_{i,j} + w_{i,j})
\end{equation}


Notre modèle mathématique consiste à minimiser cette fonction, dite fonction objectif par rapport aux variables x{i,j} , tout en satisfaisant les contraintes préalablement décrites:

\begin{equation}
    Min \sum_{i=1}^n  \sum_{j=1}^n x_{i,j}(c_{i,j} + w_{i,j}) \\
 s.c. \\ x_{i,i} = 0 , \forall i\in [1,n]  \\
 \sum_{i=1}^n x_{i,j} = 1, \forall j\in [1,n]  \\
 \sum_{j=1}^n x_{i,j} = 1, \forall i\in [1,n]  \\
 \sum_{j=1}^n x_{0,j}^{v} = 1, \forall v\in W, \forall j\in V \\
 \sum_{i=1}^n x_{i,n+1}^{v} = 1, \forall v\in W, \forall i\in V \\ 
 x_{i,j} + x_{j,i} = 1, \forall i\in V, \forall i\in V \\
 x_{i,j}^v = 1 ⇒ b_i + s_i + t_{i,j} ≤ b_j , ∀i, j ∈ V, v ∈ W \\
 x_{0,j}^v = 1 ⇒ b_0^v + t_{0,j} ≤ b_j , ∀j ∈ V, v ∈ W \\
 x_{i,n+1}^v = 1 ⇒ b_i + s_i + t_{i,n+1} ≤ b_{n+1}^v, ∀i ∈ V, v ∈ W \\
 e_i ≤ b_i ≤ l_i, ∀i ∈ V \\
 e_{n+1} ≤ b_{n+1}^v ≤ l_{n+1}, ∀v ∈ W \\
 x_{i,j} \in[0,1], \forall i\in V, \forall i\in V \\
\end{equation}

s.c = "sous les contraintes"


## Etude de complexité de ce problème

Notre problème est similaire à un problème du voyageur du commerce possédant une contrainte supplémentaire étant une fenêtre temporelle de livraison, on peut donc penser qu'il serait donc NP-complet. De plus, le problème VRP impose le fait d'utiliser k véhicules pour réaliser des tournées différentes dans notre graph.
Nous allons donc voir si notre pronlème est effectivement NP-complet :

D'abords, nous pouvons verifier la solution dans un temps polynomiale en vérifiant que on passe par tous les sommets du graph et qu'on remplisse les conditions associées aux sommets et leurs horaires. Notre problème est donc dans NP.

Ensuite nous allons faire une réduction à partire du problème du Cycle Hamiltonien. Soit I ≤ G = (V, E) > une instance du problème du cycle Hamiltonien. A présent nous allons transformer cette instance en une instance I' de notre problème de la façon suivante: 

Soit le graph G'=(V', E') tel que 
$$
    V' = V, donc\ soit\ u\ et\ u'\ et\ v\ et\ v'\ des\ sommets\ arbitraires\ voisins\ de\ V\ et\ V' \\

    Soit\ H_u\ la\ plage\ horaire\ associée\ a\ la\ livraison\ au\ lieu\ représenté\ par\ le\ sommet\ u \\

    Soit\ P_uv\ le\ poids\ de\ l'\ arrête\ entre\ u\ et\ v\,\ il\ est\ égale\ au\ tepps\ de\ trajet\ dans\ le\ graph\ G\,\\ 
    contrairement\ à\ sa\ version\ de\ G':\ P'_{uv_t} = |uv| + p_t,\ p_t\ étant\ le\ temps\ supplémentaire\ ajouté\ théorique\ en\ fonction\ du\ temps\ et\ d'\ une\ fonction\ aléatoire\ représentative\ des\ accidents.\\
 
$$

Cette transformation peut se faire en temps polynomiale (le graph est le même à la différence des poids de arrête)

Si il existe une solution dans G', alors il existe un cycle Hamiltonien dans G tel que :

Soit C' = (u', l1....ln-1, u') une solution de notre problème. Le cycle C = (u, l1....ln-1, u) existe dans le graph G. Ce cycle est Hamiltonien car il passe une et une seule par tous les sommets du graph car C' est un cycle Hamiltonien.


Si il existe un cycle Hamiltonien dans G respectant les contraintes ci-dessus, alors il existe une solution dans G' :

Soit  C = (u, l1....ln-1, u) un cycle Hamiltonien respectant les contraintes ci-dessus. Le cycle C' = (u', l1....ln-1, u') existe dans le graph G'. Ce cyle, en plus d'être Hamiltonien repecte les contraintes supplémentaire, c'est donc une solution de notre problème.

Donc Cycle Hamiltonien ≤ Notre problème
Donc notre problème est NP-complet.






