# Contexte du sujet

Les problèmes de transport, appelés aussi problèmes de routage, modélisent des problèmes réels liés au transport de marchandises ou de personnes. Afin d'introduire le problème de routage de véhicules, nous parlerons de deux autres problèmes de transport : le problème du voyageur du commerce et le problème du postier chinois.

## Traveling Salesman Problem (TSP) : 
Selon Laporte and Osman et Dhaenens, le problème du voyageur de commerce serait le problème le plus célèbre et le plus étudié en optimisation combinatoire. Dans ce problème, un voyageur de commerce doit visiter plusieurs villes (ou clients) en passant une et une seule fois par chacune d'entre elles, et en minimisant la distance totale parcourue.

Plus formellement, un TSP est modélisé sous forme d'un graphe où les sommets représentent les villes à visiter, et les arêtes les liaisons entre ces villes. La pondération ou le poids associé à chaque arête représente le coût de la liaison entre les deux villes et correspond généralement à la distance qui
les sépare. L'objectif est de trouver un cycle hamiltonien, c'est-à-dire un cycle passant une et une seule fois par tous les sommets du graphe, et de longueur minimale.

En tant que problème d'optimisation, le TSP est un problème NP-diffcile (un problème NP-difficile est un problème vers lequel on peut ramener tout problème de la classe NP par une réduction polynomiale). En effet, dans sa version symétrique, c'est-à-dire dans le cas où le graphe associé n'est pas orienté, le nombre total de solutions possibles est (n−1)!2
où n est le nombre de villes. Avec une telle complexité factorielle, une résolution efficace du TSP nécessite donc le recours à des heuristiques spécialisées voire même à des métaheuristiques. En effet, les méthodes exactes restent limitées aux problèmes de petite taille.

## Vehicle Routing Problem (VRP) : 

Le problème de routage de véhicules est une extension du problème du voyageur du commerce. Il a été introduit pour la première fois par Dantzig sous le nom de "Truck Dispatching Problem" et a depuis fait l'objet d'études intensives pour le modéliser et le résoudre.
Dans ce problème, il s'agit de déterminer les tournées d'une flotte de véhicules afin de livrer une liste de clients, ou de réaliser des tournées d'interventions (maintenance, réparation, contrôles) ou de visites (visites médicales, commerciales, etc.). Le but est de minimiser le coût de livraison des biens. Comme dit précedement ce problème est une extension classique du problème du voyageur de commerce, et fait partie de la classe des problèmes NP-complet.

Il existe quelques variantes classiques du problème de tournées de véhicules :
- tournées de véhicules avec profits (aussi appelé VRPP pour Vehicle Routing Problem with Profits) : Un problème de maximisation de collecte de profits où il faut sélectionner quels clients visiter tout en respectant les capacités limitées des véhicules,
- contraintes de capacité (aussi appelé CVRP pour Capacitated Vehicle Routing Problem) : Les véhicules ont une capacité d'emport limitée (quantité, taille, poids, etc.),
- contraintes liées aux ressources et aux clients : disponibilité, localisation, compétences requises, etc,
- tournées de véhicules avec fenêtre de temps : Pour chaque client on impose une fenêtre de temps dans laquelle la livraison doit être effectuée ;
- tournées de véhicules avec collecte et livraison : Un certain nombre de marchandises doivent être déplacées de sites de collecte vers des sites de livraisons.

### Méthodes de résolution du VRP :
Comme pour la plupart des problèmes NP-complet il est difficile de résoudre des instances de grande taille de façon optimale. On se contente alors de trouver des solutions de « bonne qualité ». Afin d'obtenir des solutions dans des temps de calculs raisonnables, on se tourne généralement vers des méthodes approchées à base d'heuristique ou encore de métaheuristique.

### Application du VRP :
Les algorithmes de calcul de tournées sont utilisés dans les moteurs des logiciels d’optimisation de tournées. Ces solutions sont utilisées par des entreprises qui souhaitent rationaliser leur flotte de véhicules, réduire leurs coûts ou encore optimiser l’occupation de leur personnel mobile.

La fonction d’optimisation de tournée peut aussi être intégrée dans des solutions de planification de ressources mobiles. Ces solutions ont pour vocation de planifier des tâches ou missions avec ou sans prise de rendez-vous, et de les répartir entre les ressources en fonction de leurs contraintes (disponibilité, localisation, compétences requises, durées d’interventions, etc.).

Les entreprises concernées par l’optimisation de tournées peuvent appartenir aux secteurs d’activités suivants :
- livraison de biens à des entreprises ou à des particuliers : transporteurs, messageries (distribution de presse), grandes surfaces (livraison de marchandises des entrepôts aux magasins,
- livraison et installation d’équipement à domicile, etc.) ;
- réparation et maintenance d’équipements de particuliers (électroménager, chaudières, informatique, etc.), d’équipements collectifs (ascenseurs, tapis roulants) ou d’entreprises (distributeurs automatiques, équipements industriels, informatique, etc.).




# Choix de la contrainte
Nous avons choisi le problème de Tournées de Véhicules avec Fenêtre de Temps (Vehicle Routing Problem with Time Windows - VRPTW), qui constitue une généralisation du VRP dans la mesure où nous introduisons en plus une contrainte temporelle sur le service demandé. Chaque client dispose d’une fenêtre de temps à l’intérieur de laquelle il désire être servi. Le dépôt central possède également une fenêtre de temps que nous désignons couramment comme horizon de service ou temps d’ouverture de la journée. Son rôle est de fixer une plage horaire durant laquelle les véhicules peuvent effectuer leur tournée. Ces contraintes temporelles vont rendre nécessaire l’utilisation de plusieurs véhicules pour satisfaire l’ensemble des clients sur l’horizon de service.

Ainsi, s’il est tout à fait possible de déterminer une solution optimale pour des instances de petite taille, cela devient rapidement irréalisable pour des instances de moyenne ou de grande taille. Or la plupart des problèmes de la vie réelle se situent justement dans cette seconde catégorie. En dépit du caractère fortement restrictif de sa définition, le problème VRPTW conserve un pouvoir descriptif important. Il permet de modéliser un panel étendu d’applications réelles tels que : 
- service postal : il s’agit d’établir des tournées pour les facteurs de manière à distribuer le courrier le plus efficacement possible, mais on peut aussi réaliser des tournées pour effectuer le ramassage de courrier dans les boîtes aux lettres publiques.
- coopératives agricoles : il s’agit de mettre en place des tournées de véhicules pour collecter la production de différents exploitants agricoles. Ceci peut concerner le lait, les produits céréaliers, les produits maraîchers ou encore le ramassage d’animaux par exemple.
- service bancaire : il s’agit de déterminer des routes pour les convoyeurs de fond de manière à réaliser la collecte des recettes des commerçants et des grandes surfaces.
- ramassage scolaire : il s’agit d’établir les itinéraires de bus pour amener les écoliers des points de collecte vers l’école le matin et inversement le soir.
- etc.

Ces quelques exemples permettent d’illustrer la profonde implication de ce problème dans la
vie courante.

# Génération des données de traffic basée sur une courbe de traffic réele

Les données de trafic seront retournée sous la forme d'un tableau de coefficient qui pourra être multiplié au poids de l'arête du graph

In [19]:
import random
import math
cache = []
# Generate traffic data for an edge
def generate():
    global cache
    if len(cache) == 0:

        m_a = 1503.43402
        m_b = -556561.2208
        m_max = m_a*60*12+m_b

        e_a = -1507.393614
        e_b = 1862163.515
        e_max = e_a*60*12+e_b
        morning = [int(round(10*(m_a*60*i+m_b)/m_max)) if 10*(m_a*60*i+m_b)/m_max >= 0 else 0 for i in range(0,12) ]
        evening = [int(round(10*(e_a*60*i+e_b)/e_max)) if 10*(e_a*60*i+e_b)/e_max >=0 else 0 for i in range(12,24)]

        cache=morning+evening
    # Predicted weight array from project given data
    # traffic = [0, 0, 0, 0, 0, 0, 0, 2, 4, 6, 8, 10, 10, 9, 8, 7, 5, 4, 3, 2, 1, 0, 0, 0]

    # Base weighted array from offical french stats
    # traffic = [1, 1, 1, 1, 1, 1, 1, 2, 7, 8, 3, 2, 1, 1, 1, 2, 3, 5, 7, 5, 1, 1, 1, 1, 1]

    # Return array of slowth coeficient [0-10]
    return cache

# Génération paramètrisé d'un graphe
Deux classe sont déclaré ici.
La classe "Edge" correspond aux arêtes. Elle possède un attribut poids qui est obtenue en multipliant une distance de base aléatoire, par une coefficient de trafic qui est variable en fonction du temps
La classe "Graph" correspond au graphe. Elle possède un attribut matrice qui correspond à la représentation matricielle du graph

In [20]:
import sys
import time

def console_clear():
    "Use this function to delete the last line in the STDOUT"

    #cursor up one line
    sys.stdout.write('\x1b[1A')

    #delete last line
    sys.stdout.write('\x1b[2K')

In [21]:
from traffic import generate
from utility import console_clear
import random
import math

class Edge:
    def __init__(self,length, traffic):
        # Generate an array of weight for base weight * traffic coefficient 
        self.weight = [(length + 30*scale) if length!=0 else length for scale in traffic ]

class Graph:
    def __init__(self, n, has_traffic, is_oriented):
        g = []
        for i in range(n):
            console_clear()
            print("Progress : "+str(math.ceil(100*i/n)))
            row = []
            for j in range(n):
                    # For non oriented graphs use symmetry to generate the bottom left part of the graph
                if(j<i and not is_oriented):
                    weight = g[j][i]
                else:
                    weight = Edge(
                        # Random base weight for the edge, range start at 1 if the graphs is complete,
                        # weight is 0 if the edge is a loop
                        random.randrange(5, 240, 5) if i!=j else 0,
                        # Generated traffic data or 1 if traffic is not used
                        generate() if has_traffic else [0] 
                        ).weight
                row.append(weight)
            g.append(row)
        self.matrice = g 


ModuleNotFoundError: No module named 'traffic'

# Stockage des graphs

Cette partie consiste à appeler la génération de graphs et à les stocker dans une collection mongoDB avec les paramètre ayant servi à leur génération

In [None]:
from graph import Graph 
from tour import create_tour
from pymongo import MongoClient
import matplotlib.pyplot as plt
import pprint
import random
import time

# Constants
FLUSH = True
GENERATE = True
PRINT = True
SEARCH = False
STATS = False
algo = antAlgo

# Connection to MongoDB
client = MongoClient('localhost', 27017)
db = client['DataProject']
graphs = db['graphs']

if(FLUSH):
    graphs.delete_many({"n":{"$lte":500}})
if(GENERATE):

    n_min = 10
    n_max = 400
    n_step = 20
    graph_per_size = 4

    for _ in range(4):
        # Using binary to generate boolean dict to test each combination
        b = "{0:b}".format(_)
        if len(b) < 2 : b = '0'+ b
        params = {"has_traffic" : b[0] == '1', "is_oriented" : b[1] == '1'}

        for n in range(n_min, n_max+n_step, n_step) :
            graph_id = 0
            for _ in range(graph_per_size):
                
                # Generate a graph with parameters
                matrice = Graph(n, params["has_traffic"], params["is_oriented"]).matrice

                # Generate the row that will be saved in MongoDB 
                for node in range(len(matrice)) :       
                    
                    # Opening time between 13h and 22h minutes
                    time_window = random.randrange(800,1340 + 15, 15)


                    # Start time between midnight and midnight - time window
                    start_time = random.randrange(0, 1_440 - time_window + 10, 10)
                    end_time = start_time+time_window

                    # Save generated data into graphs collection
                    graphs.insert_one( {"graph_id" : graph_id , "node" : node, "start_time" : start_time, "end_time" : end_time, "n" : n, "has_traffic" : params["has_traffic"], "is_oriented" : params["is_oriented"], "row" : matrice[node]})
                graph_id += 1
    # Rows check
    print("Rows : "+str(graphs.count_documents({})))

# Modélisation du problème
Cette phase aboutira à la création d'un notebook décrivant :

- La définition du problème formel

- L'étude de complexité de ce problème

Il est fortement recommandé d'intégrer à ce notebook des références bibliographiques vers des articles ou des ouvrages scientifiques.


## Définition du problème formel
#### Indices et ensembles
Un graphe G = (V, E) représente notre problème où :
- V représente l'ensemble des villes et du dépôt,
- E représente l'ensemble d'arêtes entre deux villes i, j ∈ V.

<p> W représente l'ensemble des véhicules. </p>

<p>Nous utilisons alors une matrice de taille n*n</p>

#### Définition des paramètres

\begin{equation}
    n{} = le \ nombre \ de \ ville. \\
\end{equation}

\begin{equation}
    k{} = le \ nombre \ de \ véhicules. \\
\end{equation}

\begin{equation}
    v{} = un \ véhicule \ ∈ \ W. \\
\end{equation}

\begin{equation}
    tr_{i,j} = le \ trafic \ entre \ deux \ villes \ i,j. \\
\end{equation}

\begin{equation}
    d_{i,j} = la \ distance \ entre \ la \ ville \ i \ et \ la \ ville \ j. \\
\end{equation}

\begin{equation}
    x_{i,j}^{v} => \ voyage \ d'une \ ville \ i \ à \ une \ ville \ j \ de \ la \ voiture \ v. \\
    x_{i,j}^{v} = 1 => \ le \ véhicule \ v \ voyage \ de \ la \ ville \ i \ à \ \ la \ ville \ j.\\
    x_{i,j}^{v}  \ = \ 0 \ => \ le \ véhicule \ v \ ne \ voyage \ pas.
\end{equation}



### Définition des contraintes
##### Contraintes sur les villes
Cela signifie qu'une ville ne peut être l'arrivé d'un voyage (j) qu'une seule fois. Donc : 

\begin{equation}
    \sum_{i=1}^n x_{i,j}^{v} = 1, \forall j\in [1,n]  \\
\end{equation}


De la même manière, une ville ne peut être un point de départ (i) qu'une seule fois. Donc : 

\begin{equation}
    \sum_{j=1}^n x_{i,j}^{v} = 1, \forall i\in [1,n]  \\
\end{equation}


Pour éviter les mini cycles x{i,j} = x{j,i} = 1 on utilise la contrainte :

\begin{equation}
    x_{i,j}^{v} + x_{j,i}^{v} = 1, \forall i\in V, \forall i\in V \\
\end{equation}


Il n'y a pas de voyage dans la même ville, i le départ et l'arrivé du voyage :

\begin{equation}
    x_{i,i}^{v} = 0 , \forall i\in [1,n]  \\
\end{equation}


##### Contraintes sur les véhicules
Assure que chaque véhicule ne sort qu’une seule fois du dépôt (0 = Départ du dépot).

\begin{equation}
 \sum_{j=1}^n x_{0,j}^{v} = 1, \forall v\in W, \forall j\in V \\
\end{equation}

Assure le retour unique au dépôt pour chaque véhicule (ou tournée) (n+1 = Arrivé au dépot).

\begin{equation}
 \sum_{i=1}^n x_{i,n+1}^{v} = 1, \forall v\in W, \forall i\in V \\
\end{equation}


#### Contraintes sur le temps


Variables à déterminer :
\begin{equation}
    a_i = instant \ d’arrivée \ chez \ le \ client \ i ∈ V.  \\
    b_i = instant \ de \ début \ de \ service \ chez \ le \ client \ i ∈ V.  \\ 
    b_0^v = instant \ auquel \ le \ véhicule \ v \ quitte \ le \ dépôt. \\
    b_{n_c+1}^v = instant \ auquel \ le \ véhicule \ v \ retourne \ au \ dépôt. \\
    w_i = temps \ d’attente \ chez \ le \ client \ i ∈ V \\
\end{equation}

Constantes connues :
\begin{equation}
    e_i = borne \ inférieure \ de \ la \ fenêtre \ de \ temps \ du \ client \ i ∈ V. \\
    l_i = borne \ supérieure \ de \ la \ fenêtre \ de \ temps \ du \ client \ i ∈ V. \\
    t_{i,j} = le \ temps \ de \ parcours \ entre \ les \ deux \ clients \ i \ et \ j; i, j ∈ V. \\
    s_i = temps \ de \ service \ chez \ le \ client \ i ∈ V = 0 \ dans \ notre \ cas \\
\end{equation}


Contraintes :

Instant d'arrivé à j avant le début du service chez j
\begin{equation}
    x_{i,j}^v = 1 ⇒ b_i + s_i + t_{i,j} ≤ b_j , ∀i, j ∈ V, v ∈ W \\
    a_j = b_i + s_i + t_{i,j}
\end{equation}

Instant d'arrivé à j avant le début du service chez j (en partant du dépot)
\begin{equation}
    x_{0,j}^v = 1 ⇒ b_0^v + t_{0,j} ≤ b_j , ∀j ∈ V, v ∈ W
\end{equation}

Instant de retour au dépot à la fin de la tourné
\begin{equation}
    x_{i,n+1}^v = 1 ⇒ b_i + s_i + t_{i,n+1} ≤ b_{n+1}^v, ∀i ∈ V, v ∈ W
\end{equation}

Début de service entre les bornes de fenêtre de temps
\begin{equation}
    e_i ≤ b_i ≤ l_i, ∀i ∈ V
\end{equation}

Instant ou le camion revient au dépot entre une plage horaire
\begin{equation}
    e_{n+1} ≤ b_{n+1}^v ≤ l_{n+1}, ∀v ∈ W
\end{equation}

### Définition du problème

Définition du coût du trajet entre i et j (en seconde):

\begin{equation}
    c_{i,j}^{v} = d_{i,j} + 30*tr_{i,j}
\end{equation}


Les contraintes décritent, on ajoute les distances pour obtenir la solution à notre problème :

\begin{equation}
    w_{i,j} = Le \ temps \ d'attente \ avant \ le \ début \ de \ service
\end{equation}

\begin{equation}
    \sum_{i=1}^n  \sum_{j=1}^n x_{i,j}(c_{i,j} + w_{i,j})
\end{equation}


Notre modèle mathématique consiste à minimiser cette fonction, dite fonction objectif par rapport aux variables x{i,j} , tout en satisfaisant les contraintes préalablement décrites:

\begin{equation}
    Min \sum_{i=1}^n  \sum_{j=1}^n x_{i,j}(c_{i,j} + w_{i,j}) \\
 s.c. \\ x_{i,i} = 0 , \forall i\in [1,n]  \\
 \sum_{i=1}^n x_{i,j} = 1, \forall j\in [1,n]  \\
 \sum_{j=1}^n x_{i,j} = 1, \forall i\in [1,n]  \\
 \sum_{j=1}^n x_{0,j}^{v} = 1, \forall v\in W, \forall j\in V \\
 \sum_{i=1}^n x_{i,n+1}^{v} = 1, \forall v\in W, \forall i\in V \\ 
 x_{i,j} + x_{j,i} = 1, \forall i\in V, \forall i\in V \\
 x_{i,j}^v = 1 ⇒ b_i + s_i + t_{i,j} ≤ b_j , ∀i, j ∈ V, v ∈ W \\
 x_{0,j}^v = 1 ⇒ b_0^v + t_{0,j} ≤ b_j , ∀j ∈ V, v ∈ W \\
 x_{i,n+1}^v = 1 ⇒ b_i + s_i + t_{i,n+1} ≤ b_{n+1}^v, ∀i ∈ V, v ∈ W \\
 e_i ≤ b_i ≤ l_i, ∀i ∈ V \\
 e_{n+1} ≤ b_{n+1}^v ≤ l_{n+1}, ∀v ∈ W \\
 x_{i,j} \in[0,1], \forall i\in V, \forall i\in V \\
\end{equation}

s.c = "sous les contraintes"


## Etude de complexité de ce problème

Notre problème est similaire à un problème du voyageur du commerce possédant une contrainte supplémentaire étant une fenêtre temporelle de livraison, on peut donc penser qu'il serait donc NP-complet. De plus, le problème VRP impose le fait d'utiliser k véhicules pour réaliser des tournées différentes dans notre graph.
Nous allons donc voir si notre pronlème est effectivement NP-complet :

D'abords, nous pouvons verifier la solution dans un temps polynomiale en vérifiant que on passe par tous les sommets du graph et qu'on remplisse les conditions associées aux sommets et leurs horaires. Notre problème est donc dans NP.

Ensuite nous allons faire une réduction à partire du problème du Cycle Hamiltonien. Soit I ≤ G = (V, E) > une instance du problème du cycle Hamiltonien. A présent nous allons transformer cette instance en une instance I' de notre problème de la façon suivante: 

Soit le graph G'=(V', E') tel que 
$$
    V' = V, donc\ soit\ u\ et\ u'\ et\ v\ et\ v'\ des\ sommets\ arbitraires\ voisins\ de\ V\ et\ V' \\

    Soit\ H_u\ la\ plage\ horaire\ associée\ a\ la\ livraison\ au\ lieu\ représenté\ par\ le\ sommet\ u \\

    Soit\ P_uv\ le\ poids\ de\ l'\ arrête\ entre\ u\ et\ v\,\ il\ est\ égale\ au\ tepps\ de\ trajet\ dans\ le\ graph\ G\,\\ 
    contrairement\ à\ sa\ version\ de\ G':\ P'_{uv_t} = |uv| + p_t,\ p_t\ étant\ le\ temps\ supplémentaire\ ajouté\ théorique\ en\ fonction\ du\ temps\ et\ d'\ une\ fonction\ aléatoire\ représentative\ des\ accidents.\\
 
$$

Cette transformation peut se faire en temps polynomiale (le graph est le même à la différence des poids de arrête)

Si il existe une solution dans G', alors il existe un cycle Hamiltonien dans G tel que :

Soit C' = (u', l1....ln-1, u') une solution de notre problème. Le cycle C = (u, l1....ln-1, u) existe dans le graph G. Ce cycle est Hamiltonien car il passe une et une seule par tous les sommets du graph car C' est un cycle Hamiltonien.


Si il existe un cycle Hamiltonien dans G respectant les contraintes ci-dessus, alors il existe une solution dans G' :

Soit  C = (u, l1....ln-1, u) un cycle Hamiltonien respectant les contraintes ci-dessus. Le cycle C' = (u', l1....ln-1, u') existe dans le graph G'. Ce cyle, en plus d'être Hamiltonien repecte les contraintes supplémentaire, c'est donc une solution de notre problème.

Donc Cycle Hamiltonien ≤ Notre problème
Donc notre problème est NP-complet.








## Choix des algorithmes 



​	Pour répondre à ce besoin nous avons opté pour l'implémentation de trois métaheuristiques différentes

### Algorithme de colonie de fourmis



#### Fonctionnement  et paramètres 

​	Cet algorithme s'inspire du comportement de fourmis qui cherchent le chemin vers une source de nourriture. Dans notre cas cet algorithme est adapté pour trouver le cycle hamiltonien le plus cours de notre tournée de livraison, et en respectant les fenêtres de livraisons. Ainsi on fait donc parcourir le graphe à un nombre donné de fourmis, sachant que chaque fourmis ne peux visiter une même ville qu'une seule fois. Les fourmis vont déposer des phéromones sur les arcs du graphe en fonction de la qualité du trajet.

On définis la probabilité de choisir la prochaine ville comme suit : 


    Une fourmis k est placée sur le dépot i à l'intstant t et j la pochaine ville dans laquelle elle va se rendre. Pour choisir elle va prendre en compte la visibilité
    
$$\eta _{{ij}}$$
    
    (la distance, le temps, le poids) et
$$\tau _{{ij}}$$
    la quantité de phéromone pour l'arc allant de i à j. 
    Aussi les constantes alpha et beta qui contrôle l'importance donnée aux phéromones et à la visibilité.

    
    
\begin{equation}
    p_{{ij}}^{{k}}\left(t\right)=\left\{{\begin{matrix}{\frac  {\tau _{{ij}}\left(t\right)^{{\alpha }}\cdot \eta _{{ij}}^{{\beta }}}{{\scriptscriptstyle \sum _{{l\in J_{{i}}^{{k}}}}}\tau _{{il}}\left(t\right)^{{\alpha }}\cdot \eta _{{il}}^{{\beta }}}}&{\textrm  {si}}\,j\in J_{{i}}^{{k}}\\0&{\textrm  {si}}\,j\notin J_{{i}}^{{k}}\end{matrix}}\right.
\end{equation}


Puis la fonction qui permet de définir la mise à jour des phéromones :

\begin{equation}
    tau _{{ij}}(t+1) = \rho\tau _{{ij}}  + \Delta \tau _{{ij}}(t)
\end{equation}

$\Delta \tau _{{ij}}(t)$ étant la quantité de phéromone ajoutée à la fin du trajet de la fourmis et  $\rho$ la constante d'évaporation des phéromone qui est comprise entre 0 et 1.

Pour calculer la quantité de phéromone à ajouter on va utiliser la formule suivante avec la constante Q et le poids de la route parcourue par la fourmis ($\L^{{k}}(t)$)  :


\begin{equation}
    \Delta \tau _{{ij}}^{{k}}(t)=\left\{{\begin{matrix}{\frac  {Q}{L^{{k}}(t)}}&{\textrm  {si}}\,(i,j)\in T^{{k}}(t)\\0&{\textrm  {si}}\,(i,j)\notin T^{{k}}(t)\end{matrix}}\right.
\end{equation}




Nous avons ajouter un décompte du temps à cet algorithme afin de pouvoir parcourir la liste des traffics (sur 24h) et pouvoir respecter les fenêtre de livraisons.

Voici le code Python de cet algorithme :

In [1]:
ALPHA = 1.39  #Multiplicateur de phero
BETA = -1.25   #Multiplicateur de poids
RHO = 0.688  #constante d'evaporation
CUL = 62.5   #constante du cul

class Ant:
    def __init__(self):
        self.visited = list()
        self.toVisit = list()
        self.time = 0

    def choose(self, graph, phero, param):
        remaining_total = {}
        for city in self.toVisit:
            if graph[self.visited[len(self.visited)-1]][city][(self.time%1440)//60 if param["has_traffic"] else 0] != 0:
                remaining_total[city] = 0.00001 + (pow(phero[self.visited[len(self.visited)-1]][city], ALPHA) * pow(graph[self.visited[len(self.visited)-1]][city][(self.time%1440)//60 if param["has_traffic"] else 0], BETA))


        key_list = list(remaining_total.keys())
        val_list = list(remaining_total.values())
        chossen_city = random.choices(key_list, weights= val_list, k=1)
        self.visit(chossen_city[0], graph, param)
        return


    def deliver(self, tw):
        waiting_time = 0
        city = self.visited[len(self.visited)-1]
        if tw[city]["start_time"] >= self.time % 1440 or tw[city]["end_time"] <= self.time:
            waiting_time = (tw[city]["start_time"] - self.time) % 1440
        elif tw[city]["end_time"] >= self.time % 1440 and tw[city]["start_time"] <= self.time % 1440:
            waiting_time = 0
        self.time += waiting_time


                
    def visit(self, choosed, graph, param):
        self.time += graph[self.visited[len(self.visited)-1]][choosed][(self.time%1440)//60 if param["has_traffic"] else 0]
        last = None
        if self.toVisit == [0]:
            last = True
        self.visited.append(choosed)
        self.toVisit.remove(choosed)
        if self.toVisit == [] and not(last):
            self.toVisit.append(0)
        

    def travel(self, graph, phero, tw, param):
        self.time = 0
        while self.toVisit:
            self.choose(graph, phero, param)
            self.deliver(tw)



    def analyzeTravel(self, graph):
        deltasPheromones = list()

        for i in range(0, len(self.visited)-1):
            deltasPheromones.append(CUL/self.time)
        return deltasPheromones 
        
    def spittingPheromone(self, phero, graph, param):
        pheromone_path = self.analyzeTravel(graph)   #Spit new pheromones
        for i in range(0, len(self.visited)-1):
            phero[self.visited[i]][self.visited[i+1]] += pheromone_path[i]
        return phero
    
def antAlgo(param, graph, tw, tour, iter_max, level):
    nb_fourmis = 10 # number of ants
    ants = list() # list of ants
    starting_node = 0 #  node from where the ants
    for i in range(nb_fourmis):
        ants.append(Ant())  
    phero = [] # the amount of pheromones in each node of the graph

    for i in range(len(graph)):
        node = []
        for i in range(len(graph)):
            node.append(10)
        phero.append(node)

    verif = 0
    it= 0
    while True and it < 150:
        it += 1
        for ant in ants:
            ant.toVisit = list.copy(tour)
            ant.visited = [starting_node]
            ant.travel(graph, phero, tw, param)

        for i in range(len(phero)):         #Evaportaion
            for j in range(len(phero)):
                phero[i][j] = phero[i][j] * RHO

        for ant in ants :
            phero = ant.spittingPheromone(phero, graph, param)

        if DEBUG : print(verif,tour,ants[0].visited)

        same = True
        for ant in ants:
            if ants[0].visited != ant.visited:
                same = False
        if same:
            verif += 1
        else : verif = 0
        if verif >= 3:
            break
    solution = list.copy(ants[0].visited)
    solution.pop(0)
    solution.pop(len(solution)-1)
    return solution

### Algorithme de recherche local

L'algorithme de recherche local est une heuristique qui va permettre de trouver un optimum local.

Cet algorithme se base lui aussi sur la notion de voisinnage et de comparaison des voisins. Il va tout d'abord générer une solution aléatoire qui passe par tous les sommets qu'on lui demande:

In [None]:
def random_solution(tour):
    route = []
    possible = list.copy(tour)

    while len(possible) != 0:
        route.append(possible.pop(random.randrange(len(possible))))
    return route

Puis on va optimiser cette solution en explorant les différents voisins en ajoutant une perturbation qui va changer l'ordre de la solution initial de n rangs:

In [None]:
def optimisation(params, graph, tw, route, level_max):
    nb = 50
    level = 1
    while level <= level_max:
        old = list.copy(route)
        #Generate neighboorhood
        neighbour = []
        neighbour.append(route)
        for _ in range(nb):
            neighbour.append(perturbation(route, level))

        route = best(params, graph, tw,neighbour)

        # if no change was made
        if old != route : 
            level = 1
        else: level += 1
        if DEBUG : print("Weight : "+str(get_weight(params, graph, tw, route)) + " Level : "+str(level))
    return route
    
def perturbation(route, level = 1):
    # local random n-shift
    r = list.copy(route)
    for _ in range (level):
        index_1 = random.randrange(len(r))
        index_2 = random.randrange(len(r))
        r[index_1], r[index_2] = r[index_2], r[index_1]
    return r

Enfin on va répéter l'opération plusieurs fois pour trouver un optimum parmis les routes trouvées:

In [None]:
def local_search(params, graph, tw, tour, iter, level_max):
    best_route = []
    for _ in range(iter):
        route = random_solution(tour)
        route = optimisation(params, graph, tw, route, level_max)
        routes = []
        if len(best_route) != 0 : routes.append(best_route) 
        routes.append(route)
        best_route =  best(params, graph, tw, routes)
        if (DEBUG) :
            print(" Iteration : "+str(_)+" ; Weight : "+str(get_weight(params, graph, tw, best_route))+ " ; Route : " + str(best_route))
    return best_route

def best(params, graph, tw, routes):
    for _ in range(len(routes)):
        if len(routes[_]) == 0:
            routes.pop(_)
    best = routes[0]
    best_weight = get_weight(params, graph, tw, best)
    for _ in range(len(routes)):
        cur_weight = get_weight(params, graph, tw, routes[_])
        if cur_weight < best_weight:
            best = routes[_]
            best_weight = cur_weight

    return best

# Analyse prédictive du traffic

Les données fournies à l'étape 1 ont subient une régrassion linéaire à l'aide de la méthode des moindres carré tel que:

Echantillion des données (toutes ont été utilisée dans le projet mais pour des raisons de lisibilité un échantillion est plus utilisables):
  
On sépare le mation et le soir:

| Matin       |                   |
| ----------- | ----------------- |
| Minutes(xi) | Nb_vehicules (yi) |
| 420         | 74942             |
| 421         | 77363             |
| 422         | 77315             |
| 423         | 79366             |
| 424         | 82033             |
| 425         | 82224             |
| 426         | 84673             |
| 427         | 86153             |
| 428         | 86115             |
| 429         | 88384             |
| 430         | 89639             |
| 431         | 90963             |
| 432         | 94084             |
| 433         | 94572             |
| 434         | 96630             |
| 435         | 97824             |
| 436         | 98345             |
| 437         | 101810            |
| 438         | 101572            |
| 439         | 104011            |
| 440         | 104298            |

A partir de ces valeur on va calculer les différents indicateurs statistiques:

| Matin  :                                |             |
| --------------------------------------- | ----------- |
| V(x) =  Σ(xi^2-μ(x)^2/n)            | 1199,916667 |
| V(y) =  Σ(yi^2-μ(y)^2/n)            | 2712751937  |
| E(x) =  √(v(x))                       | 34,63981332 |
| E(y) =  √(v(y))                       | 52084,08526 |
| Cov(x,y) =  Σ(xiyi/n) - μ(x)*μ(y) | 1803995,538 |


Puis on calcule les membres de l'equation linéaire:

| Matin  :                            |              |
| ----------------------------------- | ------------ |
| a =                                 | 1503,43402   |
| b =                                 | -556561,2208 |
| correlation(r)  = Cov(xy)/E(x)*E(y) | 0,999896101  |
| détermination  = r^2                | 0,999792213  |

&nbsp;

![image.png](attachment:image.png)

On fait subire le même processus aux données du soir:

| Soir    |              |
| ------- | ------------ |
| Minutes | Nb_vehicules |
| 1020    | 324303       |
| 1021    | 323357       |
| 1022    | 322055       |
| 1023    | 320291       |
| 1024    | 319559       |
| 1025    | 316932       |
| 1026    | 316031       |
| 1027    | 313317       |
| 1028    | 312199       |
| 1029    | 310814       |
| 1030    | 309531       |
| 1031    | 307715       |
| 1032    | 305886       |
| 1033    | 305463       |
| 1034    | 303073       |
| 1035    | 302674       |
| 1036    | 300181       |
| 1037    | 297568       |
| 1038    | 297022       |
| 1039    | 295604       |
| 1040    | 295271       |

&nbsp;

| Soir  :                                 |              |
| --------------------------------------- | ------------ |
| V(x) =  Σ(xi^2-μ(x)^2/n)            | 1199,916667  |
| V(y) =  Σ(yi^2-μ(y)^2/n)            | 2727025214   |
| E(x) =  √(v(x))                       | 34,63981332  |
| E(y) =  √(v(y))                       | 52220,92697  |
| Cov(x,y) =  Σ(xiyi/n) - μ(x)*μ(y) | -1808746,721 |

&nbsp;

| Soir  :                             |              |
| ----------------------------------- | ------------ |
| a =                                 | -1507,393614 |
| b =                                 | 1862163,515  |
| correlation(r)  = Cov(xy)/E(x)*E(y) | -0,999902461 |
| détermination  = r^2                | 0,999804931  |

&nbsp;

![image-3.png](attachment:image-3.png)


Suite à cette étude un peut réaliser la même chose de façon automatique dans le code:

In [None]:
from pymongo import MongoClient
import matplotlib.pyplot as plt

client = MongoClient('localhost', 27017)
db = client['DataProject']
vehicules = db['vehicules']

vehicules_stamped = db['vehicules_stamped']


rows = vehicules_stamped.aggregate( [
                #{"$match": { "num_arete" : 93 }},
                {"$addFields": {
                    "h": {
                        "$arrayElemAt": [ 
                                    {"$split": [ "$date", " " ] },
                                    1 ]
                    }
                }},
                {"$group": {
                    "_id": {"date" : "$h", "arete" : "$num_arete"},
                    "count": {"$sum": "$nb_vehicules"}
                    }
                },
                {"$sort" : {"_id.date" :1}}
            ])
fig, (mx, sx) = plt.subplots(2) 
m = {}
s= {}
for i in rows:
    date_ar = i["_id"]["date"].split('h')
    minute = int(date_ar[0]) * 60 + int(date_ar[1][:-1])
    if i["_id"]["date"][0] == "0" : 
        if not minute in m : m[minute] = i["count"]
        else : m[minute] += i["count"]
    else:
        if not minute in s : s[minute] = i["count"]
        else : s[minute] += i["count"]


mx.scatter(m.keys(),m.values())
sx.scatter(s.keys(),s.values())


fig.suptitle("Mesured number of vehicule per minute for morning an evening period")
fig.add_axes(mx)
fig.add_axes(sx)
fig.show()
#print(m)
#print(s)
input()

# Étude statistique du comportement expérimental
## Statistiques descriptives du comportement de l'algorithme

Pour nos 3 algorithmes nous réalisons deux études pour chaque combinaison de paramètre. Ces études portent sur le temps d'execution et la qualité de la solution trouvé en fonction de la taille du graphe.

Les paramètres étudié ici sont :
- le nombre de vehicules, qui varie entre 1 et 5 pour notre étude. Ce paramètre donne lieu à un graphique spécifique
- les paramètres propres au graphe, ces paramètres donnent lieu à une courbe spécifique:
    - la présence de traffic,
    - le graphe est-il orienté,
Nous avons donc 20 combinaisons de paramètre donnant lieu a 5 graphique par algorithme et contenant chaqun 4 courbe par paramètre évalué (Temps de calcul ( seconde ) et qualité de la solution ( % ))

Pour améliorer l'étude, 5 graphes seront évalué par combinaison de paramètres afin d'obtenir une moyenne.
Un seul graph sera utilisé pour l'algorithme à colonie de fourmis en raison d'un temps de calcul plus conséquents sur la machine utilisé.

### Interprétation des valeurs de temps

Bien que le temps pour calculer un solution dépendent majoritairement de la puissance de calcul, la forme de la courbe donne un indication de la complexité de l'algorithme.
Ainsi pour l'algorithme de recherche tabou et l'algorithme à colonie de fourmi, on peut observer un complexité temporelle polynomiale.
Pour l'algorithme de recherche locale, la complexité en temps, bien que polynomiale se rapproche d'une compléxité linéaire.

### Interprétation des valeurs de qualité

La qualité est un ratio du poids de la route par rapport à l'étendue des solutions possibles.
La forme de la courbe est encore une fois plus importante que les valeurs atteintes puisque le minimum correspond ici a un cas ou chaque arrètes se voit attribué le poids minimal possible, évènement de moins en moins probable pour des instance de plus en plus grande.


Pour chaque courbe de qualité on peut observer un maximal qui se déplace en fonction du nombre de vehicules utilisé, ainsi nous obtiendront une meilleur solution avec un nombre de vehicules adapté à la taille de l'instance.

L'algorithme de recherche local et celui de colonie de fourmi ont des valeurs de qualité similaire avec une qualité comprise entre 95% et 90% pour des tailles de graphe de 10 à 400.

L'algorithme de recherche tabou obtient une qualité comprise entre 93% et 90%

## Analyse et commentaire des résultats d'analyse
On peut donc choisir un algorithme après cette étude statistique.

### Colonie de fourmi

Au vu des résultats obtenus, bien que fournissant des solutions de bonne qualité l'algorithme à colonie de fourmi prend trop de temps à converger et necessite des ajustement supplémentaire dans ces paramètres ( différentes constantes ) 


### Recherche tabou

Au vu des résultats obtenus, l'algorithme de recherche tabou fournit des solutions de moins bonne qualité que les deux autres algorithmes et son temps d'execution est satisfaisant. 

### Recherche locale

Au vu des résultats obtenus, l'algorithme de recherche locale démontre des valeurs de qualités similaire à l'algorythme de colonie de fourmi mais avec un temps inférieur à l'algorithme de recherche tabou


### Conclusion
On préférera l'algorithme de recherche local dans le cas général. L'algorithme de recherche tabou pourra être utilisé avec quelque modification. L'algorithme a colonie de fourmi pour quant à lui être utilisé après modification de ses constantes pour réduire le temps de calcul.