# INF 8215 - Intelligence artif.: m√©thodes et algorithmes 
## Automne 2018 - TP1 - M√©thodes de recherche 
### Membres de l'√©quipe
    - Amine BELLAHSEN 1965554
    - Sanae LOTFI 1968682
    - Th√©o Moins 1971821



## LE V√âLO √Ä MONTR√âAL
Chaque ann√©e, Montr√©al accueille √† peu pr√®s 10 millions de touristes. Soucieuse de la qualit√© de leur s√©jour, Tourisme Montr√©al a entam√© un projet de d√©veloppement d‚Äôune nouvelle application mobile afin d‚Äôassister les touristes lors de leurs d√©placements dans la ville. Cette application a pour but d‚Äôaider l‚Äôutilisateur √† planifier sa visite des importantes attractions de la ville, de la fa√ßon la plus efficace possible (ie, sur la dur√©e la plus courte). √âtant donn√© qu‚Äôil a √©t√© observ√© que le moyen de transport privil√©gi√© des touristes pour explorer Montr√©al est le v√©lo, cette application a pour but de g√©n√©rer des circuits cyclables de dur√©e minimale. Plus pr√©cis√©ment, √©tant donn√© une liste d‚Äôattractions munie de points de d√©part et d‚Äôarriv√©e, la t√¢che est de proposer, √† chaque fois, un chemin qui passe par toutes les attractions indiqu√©es une seule fois, qui d√©bute au point de d√©part et qui s‚Äôach√®ve au point d‚Äôarriv√©e et dont la dur√©e de trajet est minimale.

<img src="images/montreal.png" alt="" width="800"/>

Le travail demand√© dans ce TP est de d√©velopper l‚Äôalgorithme interne de l‚Äôapplication. Nous explorerons trois m√©canismes de r√©solution diff√©rents :
1. D√©finition et exploration na√Øve d‚Äôun arbre de recherche
2. Exploration plus efficace en utilisant l‚Äôalgorithme A*
3. Optimisation locale en utilisant une m√©taheuristique de recherche √† voisinage variable (Variable Neighborhood Search, VNS)

## PR√âSENTATION DU PROBL√àME
Une fa√ßon naturelle de repr√©senter notre probl√®me est d‚Äôutiliser un graphe $G=(V, A)$ dirig√© et complet. Chaque sommet dans $V$ est une attraction donn√©e et chaque arc dans $A$ repr√©sente une piste cyclable entre deux attractions distinctes. Chaque paire de sommets $i$ et $j$ est reli√©e par une paire d‚Äôarcs $a_{ij}$ et $a_{ji}$ dont les poids respectifs $w(a_{ij})$ et $w(a_{ji})$ ne sont pas n√©cessairement √©gaux. Concr√®tement, ces poids repr√©sentent la dur√©e du trajet d‚Äôun sommet √† l‚Äôautre (ainsi, $w$ est telle que $w : A \to\mathbb R^+$).

La liste des attractions √† visiter est indiqu√©e comme la suite $P = (p_1, ..., p_m)$ o√π $p_1$ et $p_m$ sont les sommets de d√©part et d‚Äôarriv√©e, respectivement.

## 1. D√âFINITION ET EXPLORATION NA√èVE D‚ÄôUN ARBRE DE RECHERCHE (5 points)
D√©finissons un arbre de recherche $\mathcal{T}$ o√π chaque n≈ìud repr√©sente une solution partielle $S$. Soient $V(S) \subseteq V$ et $A(S) \subset A$ l‚Äôensemble des sommets visit√©s et l‚Äôensemble des ar√™tes s√©lectionn√©es, respectivement. Ainsi, le co√ªt d‚Äôune solution est donn√© par :
$$g(S) = \sum_{a \in A(S)} w(a)$$

Seule l‚Äôorigine est visit√©e initialement. Ainsi, la racine de l‚Äôarbre de recherche contient une solution partielle vide $S_{\textrm{root}}$ telle que $V(S_{\textrm{root}})=\{p_1\}$ et $A(S_{\textrm{root}}) = \emptyset$.

<img src="images/tree1.png" alt="" width="100"/>

√Ä la suite de cela, les n≈ìuds subs√©quents dans l‚Äôarbre sont tous cr√©√©s en ajoutant, √† chaque solution partielle $S$, un sommet subs√©quent dans $P\backslash V(S)$ avec l‚Äôarc correspondant dans $A$ qui relie ce sommet √† la derni√®re attraction visit√©e. Le sommet $p_m$ n‚Äôest ajout√© qu‚Äô√† la fin, lorsqu‚Äôil est le seul sommet non encore visit√©. Plus formellement, si on note le sommet √† ajouter $c$ et le dernier sommet visit√© $c'$, alors la nouvelle solution partielle obtenue est $V(S) \gets V(S) \cup \{c\}$ et $A(S) \gets A(S) \cup \{(c‚Äô,c)\}$.

Ci-dessous est un exemple de l‚Äôarbre √©tendu depuis sa racine o√π $c'$ = $p_1$ :

<img src="images/tree2.png" alt="" width="400"/>

√Ä la fin, les feuilles de l‚Äôarbre sont des solutions compl√®tes :

<img src="images/tree3.png" alt="" width="600"/>

### 1.1 Code
La fonction fournie ci-dessous permet d‚Äôextraire d‚Äôun fichier un graphe qui r√©pond aux sp√©cifications d√©taill√©es plus haut. Cette fonction retourne une $\texttt{ndarray}$ ($\texttt{graph}$) de taille $|V|\times |V|$ o√π $\texttt{graph[i,j]}$ repr√©sente le temps n√©cessaire pour traverser la piste cyclable de $i$ vers $j$.



In [1]:
import numpy as np

def read_graph():
    return np.loadtxt("montreal", dtype='i', delimiter=',')

graph = read_graph()

Notre premi√®re t√¢che est de d√©finir la classe qui repr√©sente une solution partielle. Son constructeur est donn√© et re√ßoit comme argument la liste des sommets (attractions $P$) √† visiter et le graphe ($G$). Celui-ci cr√©e la solution $S_{\textrm{root}}$ avec les attributs suivants :
- $\texttt{g}$ : le co√ªt de la solution partielle
- $\texttt{visited}$ : repr√©sente $V(S)$, discut√© plus haut. Par d√©finition, $\mathtt{vistited[-1]}$ repr√©sente le dernier sommet ajout√©, $ c $.
- $\texttt{not}\_\texttt{visited}$ : repr√©sente $P\backslash V(S)$
- $\texttt{graph}$: repr√©sente le graphe G

Ensuite, il est demand√© d‚Äôimplanter la m√©thode $\texttt{add}$ qui mets √† jour la solution partielle en ajoutant une nouvelle attraction √† visiter parmi la liste $\texttt{not}\_\texttt{visited}$. Cette m√©thode re√ßoit comme arguments l‚Äôindex du sommet √† visiter parmi $\texttt{not}\_\texttt{visited}$ ainsi que le graphe courant.

Implantez $\texttt{add}$ :

In [2]:
import copy

class Solution:
    def __init__(self, places, graph):
        """
        places: a list containing the indices of attractions to visit
        p1 = places[0]
        pm = places[-1]
        """
        self.g = 0 # current cost
        self.h = None
        self.graph = graph 
        self.visited = [places[0]] # list of already visited attractions
        self.not_visited = copy.deepcopy(places[1:]) # list of attractions not yet visited
        
    def __ùöïùöù__(ùöúùöéùöïùöè, ùöòùöùùöëùöéùöõ):
        """
        method  used to overload the comparison operator "<" for our objects Solution
        It returns return true if  f(self)<f(other)
        """
        return self.g + self.h < other.g + other.h
        
    def add(self, idx):
        """
        Adds the point in position idx of not_visited list to the solution
        """
        self.g += self.graph[self.visited[-1],self.not_visited[idx]]
        self.visited.append(self.not_visited[idx])
        del self.not_visited[idx]
        
    def swap(self,i,j):
        """
        Swaps two visited nodes and updates the cost of the solution
        """
        self.visited[i],self.visited[j] = self.visited[j],self.visited[i]
        cout = 0
        for k in range(len(self.visited)-1):
            cout += self.graph[self.visited[k],self.visited[k+1]]
        self.g = cout

La prochaine √©tape est d‚Äôimplanter une strat√©gie de parcours de l‚Äôarbre de recherche. Une premi√®re m√©thode simple est na√Øve est de mettre en ≈ìuvre une recherche en largeur ([Breadth-first search](https://moodle.polymtl.ca/pluginfile.php/444662/mod_resource/content/1/recherche_en_largeur.mp4), BFS).

Implantez $\texttt{bfs}$ qui mets en ≈ìuvre cette recherche. Elle prend en arguments le graphe courant ainsi que la liste des attractions √† visiter $P$ et elle retourne la meilleure solution trouv√©e.

In [3]:
from queue import Queue

def bfs(graph, places):
    """
    Returns the best solution which spans over all attractions indicated in 'places'
    """
    solution = Solution(places, graph)
    # Creating a queue to contain the solution
    frontiere = Queue()
    # Adding the first node to the queue
    frontiere.put(solution)
    # Setting the best solution to the first node 
    best_solution = Solution(places, graph)
    # Setting its cost to a big number
    best_solution.g = float("inf")
    nbr_explored_nodes = 0
    # Starting the Breadth First Search
    while not frontiere.empty():
        nbr_explored_nodes += 1
        # Taking the first solution node in the queue
        current_solution = frontiere.get()
        # If pm is the only node that we didn't visit, we have to compare the costs
        if len(current_solution.not_visited) == 1:
            # Adding pm to the visited nodes
            current_solution.add(0)
            # If the global cost is less than the starting cost, we take it
            if current_solution.g < best_solution.g:
                best_solution = current_solution
        else:
            # we expand the current node by adding possible attractions to visit next
            for k in current_solution.not_visited[:-1]:
                copy_current_solution = copy.deepcopy(current_solution)
                copy_current_solution.add(current_solution.not_visited.index(k))
                frontiere.put(copy_current_solution)
    print("The number of explored nodes is: ", nbr_explored_nodes)
    return best_solution


### 1.2 Exp√©rimentations

On propose trois exemples d‚Äôillustration pour tester notre recherche en largeur. Le premier exemple prend en compte 7 attractions, le second 10 et le dernier 11. Vu que cette recherche √©num√®re toutes les solutions possibles, le troisi√®me exemple risque de prendre un temps consid√©rable √† s‚Äôachever.

Mettez en ≈ìuvre ces exp√©riences et notez le nombre de n≈ìuds explor√©s ainsi que le temps de calcul requis.

In [4]:
import time 

#test 1  --------------  OPT. SOL. = 27
start_time = time.time()
places=[0, 5, 13, 16, 6, 9, 4]
sol = bfs(graph=graph, places=places)
print(sol.g)
print("--- %s seconds ---" % (time.time() - start_time))

The number of explored nodes is:  326
27
--- 0.02809739112854004 seconds ---


In [5]:
#test 2 -------------- OPT. SOL. = 30
start_time = time.time()
places=[0, 1, 4, 9, 20, 18, 16, 5, 13, 19]
sol = bfs(graph=graph, places=places)
print(sol.g)
print("--- %s seconds ---" % (time.time() - start_time))

The number of explored nodes is:  109601
30
--- 7.168994426727295 seconds ---


In [6]:
#test 3 -------------- OPT. SOL. = 26
start_time = time.time()
places=[0, 2, 7, 13, 11, 16, 15, 7, 9, 8, 4]
sol = bfs(graph=graph, places=places)
print(sol.g)
print("--- %s seconds ---" % (time.time() - start_time))

The number of explored nodes is:  986410
26
--- 50.43657827377319 seconds ---


## 2. RECHERCHE GUID√âE √Ä L‚ÄôAIDE DE L‚ÄôALGORITHME A\* (7.5 points)
Pour notre deuxi√®me m√©thode de recherche, au lieu d‚Äô√©num√©rer toutes les solutions possibles, nous effectuons une recherche guid√©e √† l‚Äôaide de l‚Äôalgorithme A\*. Comme vu en classe, A\* est une recherche o√π les n≈ìuds √† explorer sont prioris√©s en fonction du co√ªt courant d‚Äôune solution $g(S)$ ainsi que d‚Äôune estimation du co√ªt restant vers la solution finale donn√© par une heuristique $h(S)$.

Dans le cas d‚Äôune minimisation, $h(S)$ est une borne inf√©rieure du co√ªt r√©el restant et on priorise l‚Äôexploration des n≈ìuds dont $f(S) = g(S)+h(S)$ est le plus petit. Avec cette m√©thode, la premi√®re solution compl√®te trouv√©e est assur√©ment la solution optimale.

Pour une solution donn√©e $S$ avec un dernier sommet visit√© $c$, une possible fonction $h$ est telle que :

$h(S) =$ Le poids du chemin le plus court entre $c$ et $p_m$ dans le sous graphe $G_S$ contenant les sommets $P\backslash V(S) \cup \{c\}$

Remarque que ce chemin le plus court utilis√© dans le calcul de l‚Äôestimation $h$ entre l‚Äôattraction courante et l‚Äôarriv√©e ne passera pas n√©cessairement pas tous les sommets restants.


Notre algorithme A\* se pr√©sente comme ceci :
1. D√©finir l‚Äôarbre de recherche $\mathcal{T}$ exactement comme auparavant. Le calcul de $h$ pour la solution initiale est inutile : c‚Äôest la seule solution qu‚Äôon a.
2. S√©lectionner le meilleur n≈ìud candidat pour expansion. La solution partielle $S_b$ de ce n≈ìud candidat est telle que :

   $$ f(S_b) \leq f(S) \quad \forall S \in \mathcal{T} \qquad S_B, S \text{ pas encore s√©lectionn√©s}$$

   Si $S_b$ est une solution compl√®te, l‚Äôalgorithme s‚Äôarr√™te et $S_b$ est assur√©ment la solution optimale, sinon on continue √† l‚Äô√©tape 3.
3. Cr√©er des solutions subs√©quentes qui connectent la derni√®re attraction visit√©e √† chacune des attractions restantes. Attention, on ignore l‚Äôarriv√©e tant que celle-ci n‚Äôest pas la seule qui reste.
 - Mettez √† jour les listes des sommets visit√©s et non visit√©s
 - Calculez $g$ et $h$ pour chaque solution
 - Ins√©rer la nouvelle solution partielle dans l‚Äôarbre.
4. R√©p√©ter 2 et 3.


### 2.1 Code
Commen√ßons d‚Äôabord par compl√©ter la classe $\texttt{Solution}$ pour prendre en compte les changements n√©cessaires √† A\* (on a besoin notamment d‚Äôun attribut suppl√©mentaire pour l‚Äôestimation $h$).

On verra plus tard que A\* s‚Äôimplante √† l‚Äôaide d‚Äôune file de priorit√© (priority queue). Pour que celle-ci marche, il est n√©cessaire de surcharger (overload) l‚Äôop√©rateur de comparaison ¬´ < ¬ª relatif √† nos objets $\texttt{Solution}$. En sachant ce qui fait qu'une solution est meilleure qu‚Äôune autre pour l'exploration, implanter la m√©thode $\_\_\texttt{lt}\_\_$ dans $\texttt{Solution}$. Son prototype est $\_\_\texttt{lt}\_\_\texttt{(self, other)}$.

Maintenant, nous devons implanter la fonction d‚Äôestimation $h$. Pour cela, on utilise l‚Äô[algorithme de Dijkstra](https://en.wikipedia.org/wiki/Dijkstra%27s_algorithm) pour trouver le chemin le plus court entre la derni√®re attraction visit√©e $c$ et l‚Äôarriv√©e $p_m$. Il est possible d‚Äôadapter cet algorithme pour qu‚Äôil s‚Äôarr√™te d√®s que le chemin le plus court entre c et pm est trouv√©.

**Prescriptions d‚Äôimplantation :**
- Appliquer Dijkstra pour trouver le chemin le plus court entre $c$ et $p_m$
- Retourner le poids de ce chemin

In [7]:
def fastest_path_estimation(sol):
    """
    Returns the time spent on the fastest path between 
    the current vertex c and the ending vertex pm
    """
    # retrieving the start node c
    c = sol.visited[-1]
    # retrieving the final node pm
    pm = sol.not_visited[-1]
    
    # the dictionary "nodes" does contain the minimal distance - at a given iteration - of each node to c
    nodes = {x:float("inf") for x in sol.not_visited}
    # the minimal distance of c to itself is zero
    nodes[c] = 0
    # nodes_out contains the nodes that are already explored by the djikstra method
    nodes_out = []
    
    # min_dis_node represents the node that has the least distance to the node c
    # and that is not in nodes_out
    min_dis_node = c
    
    while min_dis_node != pm:
        for (node,value) in nodes.items():
            if node not in nodes_out:
                # update the distance of node to c
                nodes[node] = min(value, nodes[min_dis_node]+graph[min_dis_node,node])
        nodes_out.append(min_dis_node)
        if len(nodes) != len(nodes_out):
            # choose the node with the minimal distance to c that is not in nodes_out
            min_dis_node = min({k : nodes[k] for k in set(nodes) - set(nodes_out) }, key=nodes.get)
            
    return nodes[pm]

Finalement, il est temps d‚Äôimplanter A\*. On aura besoin d‚Äôune file de priorit√© qui retournera toujours le meilleur n≈ìud candidat de $\mathcal{T}$ pour l‚Äô√©tendre (l‚Äôop√©rateur surcharg√© de comparaison assure cela).

**Prescriptions d‚Äôimplantation (cf. d√©tail des √©tapes de l‚Äôalgorithme plus haut) :**
- Tant que les solutions extraites de la file de priorit√© ne sont pas compl√®tes :
  *	S√©lectionner et √©tendre le n≈ìud extrait de la file comme d√©taill√© plus haut
  * Calculer $g$ et $h$ pour chaque nouvelle solution partielle obtenue
  * Remettre ces solutions dans la file
- Retourner la premi√®re solution compl√®te extraite de la file (c‚Äôest la solution optimale)

In [8]:
import heapq

def A_star(graph, places):
    """
    Performs the A* algorithm
    """

    # blank solution
    root = Solution(graph=graph, places=places)

    # search tree T
    T = []
    heapq.heapify(T)
    heapq.heappush(T, root)
    
    # retrieve the solution with the best f value in the tree
    active_sol = heapq.heappop(T)
    
    # initiating the number of explored nodes
    nbr_explored_nodes = 0
    
    # while the solution with the best f is incomplete
    while active_sol.not_visited:
        
        nbr_explored_nodes += 1
        
        # if the active solution contains places other than pm
        if len(active_sol.not_visited) > 1:
            
            for idx in range(len(active_sol.not_visited) - 1):
                # we add possible partial solutions
                copy_active_sol = copy.deepcopy(active_sol)
                # creating a new partial solution by adding a new place > g is calculated
                copy_active_sol.add(idx)
                # calculating h
                copy_active_sol.h = fastest_path_estimation(copy_active_sol)
                heapq.heappush(T, copy_active_sol)
            active_sol = heapq.heappop(T)
            
        # Otherwise, only the last attraction is left
        else:
            # we add the last attraction and return the solution
            active_sol.add(0)
    print("The number of explored nodes is: ", nbr_explored_nodes)
    return active_sol

### 2.2 Exp√©rimentations

On ajoute un Quatri√®me exemple d‚Äôex√©cution avec 15 attractions. L√† encore, mettez en ≈ìuvre ces exp√©riences avec le nouvel algorithme A\* con√ßu et notez le nombre de n≈ìuds explor√©s ainsi que le temps de calcul requis.

In [9]:
#test 1  --------------  OPT. SOL. = 27
start_time = time.time()
places=[0, 5, 13, 16, 6, 9, 4]
astar_sol = A_star(graph=graph, places=places)
print(astar_sol.g)
print(astar_sol.visited)
print("--- %s seconds ---" % (time.time() - start_time))

The number of explored nodes is:  57
27
[0, 5, 13, 16, 6, 9, 4]
--- 0.03133225440979004 seconds ---


In [10]:
#test 2  --------------  OPT. SOL. = 30
start_time = time.time()
places=[0, 1, 4, 9, 20, 18, 16, 5, 13, 19]
astar_sol = A_star(graph=graph, places=places)
print(astar_sol.g)
print(astar_sol.visited)
print("--- %s seconds ---" % (time.time() - start_time))

The number of explored nodes is:  358
30
[0, 1, 4, 5, 9, 13, 16, 18, 20, 19]
--- 0.11678600311279297 seconds ---


In [11]:
#test 3  --------------  OPT. SOL. = 26
start_time = time.time()
places=[0, 2, 7, 13, 11, 16, 15, 7, 9, 8, 4]
astar_sol = A_star(graph=graph, places=places)
print(astar_sol.g)
print(astar_sol.visited)
print("--- %s seconds ---" % (time.time() - start_time))

The number of explored nodes is:  997
26
[0, 2, 7, 7, 9, 13, 15, 16, 11, 8, 4]
--- 0.3290581703186035 seconds ---


In [12]:
#test 4  --------------  OPT. SOL. = 40
start_time = time.time()
places=[0, 2, 20, 3, 18, 12, 13, 5, 11, 16, 15, 4, 9, 14, 1]
astar_sol = A_star(graph=graph, places=places)
print(astar_sol.g)
print(astar_sol.visited)
print("--- %s seconds ---" % (time.time() - start_time))

The number of explored nodes is:  108397
40
[0, 3, 5, 13, 15, 18, 20, 16, 11, 12, 14, 9, 4, 2, 1]
--- 83.80060148239136 seconds ---


### 2.3 Une meilleure borne inf√©rieure

Notre algorithme A\* est d√©j√† beaucoup plus efficace qu‚Äôune recherche na√Øve. Cependant, la qualit√© de l‚Äôheuristique $h$ a un tr√®s grand impact sur la vitesse de A\*. Une heuristique plus serr√©e devrait acc√©l√©rer A\* de fa√ßon significative. Notre estimation $h$ bas√©e sur Dijkstra est tr√®s large √† cause du fait qu‚Äôelle ne consid√®re pas toutes les attractions restantes.

Une meilleure heuristique pourrait √™tre bas√©e sur la **Spanning Arborescence of Minimum Weight** qui s‚Äôapparente √† une Minimum Spanning Tree pour graphes orient√©s. On propose de construire une telle Spanning Arborescence sur le reste des attractions $P\backslash V(S) \cup \{c\}$. Ici la racine est la derni√®re attraction visit√©e $c$. Une fa√ßon classique de r√©soudre ce probl√®me est d‚Äôutiliser l‚Äô[algorithme de Edmonds](https://en.wikipedia.org/wiki/Edmonds%27_algorithm).

Implantez cet algorithme et refaites les exp√©riences avec A\* en utilisant cette nouvelle heuristique :

In [13]:
from queue import Queue

def minimum_spanning_arborescence(sol):
    """
    Returns the cost to reach the vertices in the unvisited list 
    """
    copie_sol = copy.deepcopy(sol)
    nodes = copie_sol.not_visited
    root = copie_sol.visited[-1]
    
    # creating a sub-graph for the selected univisted attractions & root
    sous_graph = copie_sol.graph[[root]+copie_sol.not_visited][:,copie_sol.not_visited]
    # creating an empty list of edges
    edges = []
    # creating an empty list of weights for the edges
    weights = {}
    
    # filling edges and weights
    for i in range(sous_graph.shape[0]):
        for j in range(sous_graph.shape[1]):
            if i != j+1:
                node_i = ([root]+copie_sol.not_visited)[i]
                node_j = copie_sol.not_visited[j]
                edges.append((node_i,node_j))
                weights[(node_i,node_j)] = sous_graph[i,j]
    
    # retrieving the minimum spanning arborescence
    tree = min_arborescence(nodes, edges, weights, root)
    return sum(weights[edge] for edge in tree)

def min_arborescence(nodes, edges, weights, root):
    """
    Recursive function that returns the edges of the minimum spanning arborescence
    for a given graph
    """
    # creating an empty dictionnary that gives minimum distance to each node
    P = {}
    # creating an empty dictionnary that gives the antecedant of each node with the minimum distance
    previous_node = {}
    # creating a dict that gives for an edge coming in the cycle the edge to be kicked out inside the cycle
    edges_out = {}
    
    # __ filling P __
    for v in nodes:
        dist_to_v = float("inf")
        best_node = v
        for x in (nodes+[root]):
            if ((x,v) in edges):
                if (x == v):
                    P[(x,v)] = 0
                if (weights[(x,v)] < dist_to_v and x != v):
                    dist_to_v = weights[(x,v)]
                    best_node = x
        P[(best_node,v)] = dist_to_v
        previous_node[v] = best_node
        
    # __ detecting the existence of in P __
    is_cycle = False
    for v in nodes:
        if iscycle(nodes,P.keys(),v):
            cycle = iscycle(nodes,P.keys(),v)
            is_cycle = True
            break
    
    # __ stop condition of the recursive algorithm __
    if not is_cycle:
        return list(P.keys())
    
    # __ creating new nodes, edges and weights to be given in the recursive call __
    else:
        v_c = max(nodes+[root])+1
        new_nodes = list(set(nodes) - set(cycle)) + [v_c]
        new_edges = []
        new_weights = {}
        Real={}
        for edge in edges:
            if (edge[0] == edge[1] and edge[1] in cycle):
                    new_edges.append((v_c,v_c))
                    new_weights[(v_c,v_c)] = 0
                    Real[(v_c,v_c)] = edge
            if (edge[0] not in cycle and edge[1] in cycle):
                new_weight = weights[edge] - weights[(previous_node[edge[1]],edge[1])]
                if ((edge[0],v_c) not in new_edges):
                    new_edges.append((edge[0],v_c))
                    new_weights[(edge[0],v_c)] = new_weight
                    Real[(edge[0],v_c)] = edge
                    edges_out[(edge[0],v_c)] = (previous_node[edge[1]],edge[1])
                else:
                    if (new_weight < new_weights[(edge[0],v_c)]):
                        new_weights[(edge[0],v_c)] = new_weight
                        edges_out[(edge[0],v_c)] = (previous_node[edge[1]],edge[1])
                        Real[(edge[0],v_c)] = edge
            elif (edge[0] in cycle and edge[1] not in cycle):
                if ((v_c, edge[1]) not in new_edges):
                    new_edges.append((v_c, edge[1]))
                    new_weights[(v_c, edge[1])] = weights[edge]
                    Real[(v_c, edge[1])] = edge
                else:
                    if (weights[edge] < new_weights[(v_c, edge[1])]):
                        new_weights[(v_c, edge[1])] = weights[edge]
                        Real[(v_c, edge[1])] = edge
            elif (edge[0] not in cycle and edge[1] not in cycle):
                new_edges.append(edge)
                Real[edge] = edge
                new_weights[edge] = weights[edge]
                
        # retrieving the minimum_spanning_arborescence with a recursive call
        arbre = min_arborescence(new_nodes,new_edges,new_weights,root)
        
        # keep edge = edge coming in the cycle to keep
        keep_edge = None
        for edge in arbre:
            if edge[1] == v_c and edge[0] != v_c:
                keep_edge = edge[0]
                
        # creating the edges of the cycle
        edge_cycle = []
        for i in range(len(cycle) - 1):
            edge_cycle.append((cycle[i],cycle[i+1]))
        edge_cycle.append((cycle[-1], cycle[0]))
        
        # generating the final minimum_spanning_arborescence
        if keep_edge is not None:
            s = set([Real[e] for e in arbre] + edge_cycle) - set([edges_out[(keep_edge,v_c)]])
        else:
            s = set([Real[e] for e in arbre] + edge_cycle)
        
        return list(s)
            

def neighbors_fct(edges, node):
    """
    Getting the list of next nodes
    """
    neighbors = []
    for edge in edges:
        if edge[0] == node and edge[1] != node:
            neighbors.append(edge[1])
    return neighbors


def iscycle(nodes,edges,node):
    file = Queue()
    # we add the initial path we have
    file.put([node])
    while not file.empty():
        # we retrieve a path from the queue
        current_path = file.get()
        last_node = current_path[-1]
        neighbors = neighbors_fct(edges,last_node)
        # we check the existence of the cycle as long as neighbors is not empty
        if neighbors:
            for new_node in neighbors:
                if new_node not in current_path:
                    copy_current_path = copy.deepcopy(current_path)
                    copy_current_path.append(new_node)
                    file.put(copy_current_path)
                else:
                    cycle = current_path[current_path.index(new_node):]
                    return cycle
    return []

In [14]:
import heapq

def A_star_edmonds(graph, places):
    """
    Performs the A* algorithm
    """

    # blank solution
    root = Solution(graph=graph, places=places)

    # search tree T
    T = []
    heapq.heapify(T)
    heapq.heappush(T, root)
    
    # retrieve the solution with the best f value in the tree
    active_sol = heapq.heappop(T)
    
    # initiating the number of explored nodes
    nbr_explored_nodes = 0
    
    # while the solution with the best f is incomplete
    while active_sol.not_visited:
        
        nbr_explored_nodes += 1
        
        # if the active solution contains places other than pm
        if len(active_sol.not_visited) > 1:
            
            for idx in range(len(active_sol.not_visited) - 1):
                # we add possible partial solutions
                copy_active_sol = copy.deepcopy(active_sol)
                # creating a new partial solution by adding a new place > g is calculated
                copy_active_sol.add(idx)
                # calculating h
                copy_active_sol.h = minimum_spanning_arborescence(copy_active_sol)
                heapq.heappush(T, copy_active_sol)
            active_sol = heapq.heappop(T)
            
        # Otherwise, only the last attraction is left
        else:
            # we add the last attraction and return the solution
            active_sol.add(0)
    print("The number of explored nodes is: ", nbr_explored_nodes)
    return active_sol

In [15]:
#test 1  --------------  OPT. SOL. = 27
start_time = time.time()
places=[0, 5, 13, 16, 6, 9, 4]
astar_sol = A_star_edmonds(graph=graph, places=places)
print(astar_sol.g)
print(astar_sol.visited)
print("--- %s seconds ---" % (time.time() - start_time))

The number of explored nodes is:  16
27
[0, 5, 13, 16, 6, 9, 4]
--- 0.04210782051086426 seconds ---


In [16]:
#test 2  --------------  OPT. SOL. = 30
start_time = time.time()
places=[0, 1, 4, 9, 20, 18, 16, 5, 13, 19]
astar_sol = A_star_edmonds(graph=graph, places=places)
print(astar_sol.g)
print(astar_sol.visited)
print("--- %s seconds ---" % (time.time() - start_time))

The number of explored nodes is:  18
30
[0, 1, 4, 5, 9, 13, 16, 18, 20, 19]
--- 0.06932735443115234 seconds ---


In [17]:
#test 3  --------------  OPT. SOL. = 26
start_time = time.time()
places=[0, 2, 7, 13, 11, 16, 15, 7, 9, 8, 4]
astar_sol = A_star_edmonds(graph=graph, places=places)
print(astar_sol.g)
print(astar_sol.visited)
print("--- %s seconds ---" % (time.time() - start_time))

The number of explored nodes is:  38
26
[0, 2, 7, 7, 9, 13, 15, 16, 11, 8, 4]
--- 0.14925503730773926 seconds ---


In [18]:
# test 4  --------------  OPT. SOL. = 40
start_time = time.time()
places=[0, 2, 20, 3, 18, 12, 13, 5, 11, 16, 15, 4, 9, 14, 1]
astar_sol = A_star_edmonds(graph=graph, places=places)
print(astar_sol.g)
print(astar_sol.visited)
print("--- %s seconds ---" % (time.time() - start_time))

The number of explored nodes is:  84
40
[0, 3, 9, 13, 15, 18, 20, 16, 11, 12, 14, 5, 4, 2, 1]
--- 1.3427271842956543 seconds ---


## 3. RECHERCHE LOCALE √Ä VOISINAGE VARIABLE  (7.5 points)

Cette fois-ci, au lieu de construire une solution optimale depuis une solution vide, on commence d‚Äôune solution compl√®te, non-optimale, qu‚Äôon am√©liore √† l‚Äôaide d‚Äôune recherche locale en utilisant une recherche locale √† voisinage variable ([Variable Neighborhood Search](https://en.wikipedia.org/wiki/Variable_neighborhood_search), VNS).

<img src="images/vns.png" alt="" width="800"/>

### 3.1 Code

On commence par cr√©er une solution initiale. Celle-ci est une suite ordonn√©e des attractions de $p_1$ √† $p_m$ dans $P$. Pour cela, on fait appel √† une [recherche en profondeur (Depth-First Search, DFS)](https://moodle.polymtl.ca/pluginfile.php/445484/mod_resource/content/1/recherche_en_profondeur.mp4) qu‚Äôon arr√™te aussit√¥t qu‚Äôune solution compl√®te est trouv√©e. Pour aider √† diversifier la recherche, la m√©thode permettant de g√©n√©rer une solution initiale peut √™tre randomis√©e de telle sorte que l'algorithme VNS puisse lancer la recherche dans diff√©rentes r√©gions de l'espace solution. Ainsi, dans la fonction DFS, la s√©lection de l'enfant pour continuer la recherche doit √™tre al√©atoire.

**Prescriptions d‚Äôimplantation :**
- Mettre en ≈ìuvre une recherche en profondeur
- Cr√©er un objet $\texttt{Solution}$ relatif √† cette solution
- Ajuster les attributs de cet objet avec les bonnes valeurs de co√ªts et d‚Äôattractions visit√©es
- Retourner la solution trouv√©e.

In [19]:
from random import shuffle, randint

def initial_sol(graph, places):
    """
    Return a completed initial solution
    """
    # shuffling intermediate attractions
    to_shuffle = places[1:-1]
    shuffle(to_shuffle)
    new_places = [places[0]] + to_shuffle + [places[-1]]
    sol = Solution(new_places, graph)
    # adding attractions to visit
    for i in range(len(sol.not_visited)):
        sol.add(0)
    return sol

Pour d√©finir une VNS, il faut d√©finir les $k_\textrm{max}$ voisinages de recherche locale possibles. Pour notre probl√®me, une bonne et simple r√©partition des voisinages est telle qu‚Äôun voisinage $k$ correspond √† la permutation de $k$-paires de sommets dans $V(S)$.

On appelle **shaking** l‚Äô√©tape de g√©n√©ration d‚Äôune solution dans le voisinage $k$. Le travail qui suit correspond √† l‚Äôimplantation de cette √©tape. $\texttt{shaking}$ admet 3 arguments que sont la solution de d√©part, l‚Äôindice du voisinage $k$ ainsi que le graph courant.

Attention, avant d‚Äôimplanter $\texttt{shaking}$, il est n√©cessaire de cr√©er une m√©thode $\texttt{swap}$ dans la classe $\texttt{Solution}$. Cette m√©thode permet de mettre en ≈ìuvre la permutation dans une solution donn√©e (en mettant √† jour tous les attributs n√©cessaires pour que la solution soit coh√©rente).

**Prescriptions d‚Äôimplantation de shaking :**
- S√©lectionner au hasard deux indices $i$ et $j$ diff√©rents et tels que $i, j \in \{2,...,m-1\}$
- Faire une copie de la solution courante et faire la permutation
- Retourner la solution cr√©√©e

In [20]:
import itertools

def shaking(sol,k):
    """
    Returns a solution on the k-th neighrboohood of sol
    """
    sol_copy = copy.deepcopy(sol)
    m = len(sol_copy.visited)
    # retrieving possible pairs
    pairs = list(itertools.combinations(list(range(1,m-1)), 2))
    # shuffling pairs to add randomness
    shuffle(pairs)
    if len(pairs)>= k:
        # Swapping the elements of every pair
        for i in range(k):
            sol_copy.swap(pairs[i][0], pairs[i][1])
        return sol_copy
    else:
        print("Unable to find a neibghor for k = %s !" % k)
        return None

Une derni√®re √©tape essentielle dans une VNS est l‚Äôapplication d‚Äôun algorithme de recherche locale √† la solution issue du shaking. Pour cela, on propose la recherche locale 2-opt. Celle-ci intervertit deux arcs dans la solution, √† la recherche d‚Äôune qui est meilleure.

Pour un sommet $ i $, soit $ i '$ le successeur imm√©diat de $ i $ dans la s√©quence $ V (S) $. L'algorithme 2-opt fonctionne comme suit: pour chaque paire de sommets non cons√©cutifs $ i, j $, v√©rifiez si en √©changeant la position des sommets $ i '$ et $ j $ entra√Æne une am√©lioration du co√ªt de la solution. Si oui, effectuez cet √©change. Ce processus se r√©p√®te jusqu'√† ce qu'il n'y ait plus d'√©changes rentables. On r√©alise cette op√©ration pour toutes les paires d‚Äôarcs √©ligibles √† la recherche du plus petit co√ªt.

<img src="images/2opt.png" alt="" width="800"/>

<img src="images/2opt2.png" alt="" width="800"/>


Implantez $\texttt{local}\_\texttt{search}\_\texttt{2opt}$. 

**Prescriptions d‚Äôimplantation :**
- Consid√©rer chaque paire d‚Äôindices $i = \{2,..,m-3\}$ and $j = \{i+2, m-1\}$
- Si l‚Äô√©change donne un plus bas co√ªt, on le r√©alise
- R√©p√©ter jusqu‚Äô√† optimum local.

In [21]:
def swap_edges(sol,i,j):
    """ 
    Returns the solution where the edges are swapped 
    """
    sol_copy = copy.deepcopy(sol)
    sol_copy.visited[i],sol_copy.visited[j] = sol_copy.visited[j],sol_copy.visited[i]
    to_reverse = sol_copy.visited[min(i,j):max(i,j)+1]
    sol_copy.not_visited[min(i,j):max(i,j)+1] = sol_copy.not_visited[min(i,j):max(i,j)+1][::-1]
    cout = 0
    for k in range(len(sol_copy.visited)-1):
        cout += graph[sol_copy.visited[k],sol_copy.visited[k+1]]
    sol_copy.g = cout
    return sol_copy

def local_search_2opt(sol):
    """
    Apply 2-opt local search over sol
    """
    active_sol = copy.deepcopy(sol)
    m = len(active_sol.visited)
    pairs = list(itertools.combinations(list(range(1,m-1)), 2))
    shuffle(pairs)
    idx = 0
    # Continue exploration from the first better solution
    while idx < len(pairs):
        i = min(pairs[idx][0],pairs[idx][1])
        j = max(pairs[idx][0],pairs[idx][1])
        if (1 < abs(i - j)):
            new_sol = swap_edges(active_sol, i, j)
            if new_sol.g < active_sol.g:
                active_sol = new_sol
                shuffle(pairs)
                idx = 0
            else:
                idx += 1
        else:
            idx += 1

    return active_sol

Finalement, il est temps d'implanter notre VNS. La m√©thode $\texttt{vns}$ re√ßoit une solution compl√®te, le graphe courant, le nombre maximal de voisinages et un temps de calcul limite. Celle-ci retourne la solution optimale trouv√©e

**Prescriptions d‚Äôimplantation :**
- √Ä chaque it√©ration, la VNS g√©n√®re une solution dans le k-√®me voisinage (shaking) √† partir de la meilleure solution courante et applique une recherche locale 2-opt dessus
- Si la nouvelle solution trouv√©e a un meilleur co√ªt, mettre √† jour la meilleure solution courante
- R√©p√©ter le processus jusqu'√† $\texttt{t}\_\texttt{max}$

In [22]:
def vns(sol, k_max, t_max):
    """
    Performs the VNS algorithm
    """
    # setting the start time
    start_time = time.time()
    # starting from the 1st neighborhood
    k = 1
    # performing a 1st local search
    active_sol = local_search_2opt(sol)
    while (time.time() - start_time) < t_max:
        # moving to the Kth neighborhood
        new_sol = shaking(active_sol,k)
        # performing a local search
        new_sol = local_search_2opt(new_sol)
        if new_sol.g < active_sol.g:
            active_sol = new_sol
            k = 1
        elif k < k_max:
            k += 1
        else:
            k = 1
        
    return active_sol

### 3.2 Experiments

Mettez en oeuvre la VNS sur les exemples d'illustration suivants et raportez les solutions obtenue:

In [23]:
# test 1  --------------  OPT. SOL. = 27
places=[0, 5, 13, 16, 6, 9, 4]
sol = initial_sol(graph=graph, places=places)
start_time = time.time()
vns_sol = vns(sol=sol, k_max=10, t_max=1)
print(vns_sol.g)
print(vns_sol.visited)
print("--- %s seconds ---" % (time.time() - start_time))

27
[0, 5, 13, 16, 6, 9, 4]
--- 1.0006752014160156 seconds ---


In [24]:
#test 2  --------------  OPT. SOL. = 30
places=[0, 1, 4, 9, 20, 18, 16, 5, 13, 19]
sol = initial_sol(graph=graph, places=places)

start_time = time.time()
vns_sol = vns(sol=sol, k_max=10, t_max=1)
print(vns_sol.g)
print(vns_sol.visited)

print("--- %s seconds ---" % (time.time() - start_time))

30
[0, 1, 4, 5, 9, 13, 16, 18, 20, 19]
--- 1.0005314350128174 seconds ---


In [25]:
# test 3  --------------  OPT. SOL. = 26
places=[0, 2, 7, 13, 11, 16, 15, 7, 9, 8, 4]
sol = initial_sol(graph=graph, places=places)

start_time = time.time()
vns_sol = vns(sol=sol, k_max=10, t_max=1)
print(vns_sol.g)
print(vns_sol.visited)
print("--- %s seconds ---" % (time.time() - start_time))

26
[0, 2, 7, 7, 9, 13, 15, 16, 11, 8, 4]
--- 1.0022814273834229 seconds ---


In [26]:
# test 4  --------------  OPT. SOL. = 40
places=[0, 2, 20, 3, 18, 12, 13, 5, 11, 16, 15, 4, 9, 14, 1]
sol = initial_sol(graph=graph, places=places)
start_time = time.time()
vns_sol = vns(sol=sol, k_max=10, t_max=1)
print(vns_sol.g)
print(vns_sol.visited)
print("--- %s seconds ---" % (time.time() - start_time))

40
[0, 3, 13, 15, 18, 20, 16, 11, 12, 14, 9, 5, 4, 2, 1]
--- 1.0076885223388672 seconds ---


In [27]:
# test 5 : convergence analysis --------------  OPT. SOL. = 40
places=[0, 2, 20, 3, 18, 12, 13, 5, 11, 16, 15, 4, 9, 14, 1]

N = 50
resu = 0

for i in range(N):
    sol = initial_sol(graph=graph, places=places)
    vns_sol = vns(sol=sol, k_max=10, t_max=1)
    if vns_sol.g == 40:
        resu += 1
print("Proportion for t_max = 1s : ", 100*resu/N)

resu = 0

for i in range(N):
    sol = initial_sol(graph=graph, places=places)
    vns_sol = vns(sol=sol, k_max=10, t_max=2)
    if vns_sol.g == 40:
        resu += 1
print("Proportion for t_max = 2s : ", 100*resu/N)

Proportion for t_max = 1s :  70.0
Proportion for t_max = 2s :  86.0


## 4. BONUS (1 point)

Expliquez dans quelle situation chacun des algorithmes d√©velopp√©s est plus appropri√© (prenez en compte l‚Äô√©volutivit√© du probl√®me)

# R√©ponse
Dans ce TP nous avons couvert trois algorithmes de recherche: Breadth-first search, A* dont on a implant√© deux heuristiques et enfin l'algorithme de recherche local √† voisinage variable.

Nous remarquons que la m√©thode BFS est une m√©thode assez na√Øve dont le but est de faire une recherche en largeur puis comparer le co√ªt global √† notre arriv√©e √† l'√©tat final avec les autres co√ªt globaux et prendre le meilleur, donc elle parcourt tout notre arbre. Cette m√©thode est facile √† implanter, et marche bien avec un petit nombre de noeuds √† visiter, mais nous remarquons qu'elle met beaucoup plus de temps √† trouver la solution en augmentant le nombre de noeuds √† visiter. 

L'algorithme A* est un peu plus difficile √† implanter, vu qu'on a aussi besoin d'estimer la distance entre les noeuds en utilisant des heuristiques. La premi√®re heuristique a √©t√© obtenu en utilisant l'algorithme de Djikstra. Nous remarquons que cette m√©thode est beaucoup plus rapide que la BFS, et parcourt moins de noeuds pour trouver la solution. La deuxi√®me heuristique a √©t√© obtenu en utilisant l'algorithme d'Edmonds. Cette heuristique permet d'approximer mieux la borne sup√©rieure dans A* sans sur-estimer. En effet, Djikstra permet d'obtenir le chemin le plus court entre la derni√®re attraction visit√©e et pm sans forc√©ment passer par toutes les attractions non visit√©es. Tandis que l'algorithme d'Edmonds assure le passage par toutes ces attractions, ce qui rend son estimation meilleure (h plus grand). Pourtant, l'algorithme d'Edmonds permet de trouver seulement une arborescence et non pas un chemin entre la derni√®re attraction visit√©e et pm, ce qui assure que cette heuristique ne sur-estime pas les co√ªts. La recherche d'une solution optimale est donc plus rapide et le nombre de noeuds visit√©s est drastiquement r√©duit. Notons aussi que ces 2 algorithmes assurent l'optimalit√© de la solution trouv√©e (pour A*, cette optimalit√© est assur√©e lorsque l'heuristique ne sur-estime pas les co√ªts).

On passe ensuite √† une approche plus stochastique avec l'algorithme de recherche local √† voisinage variable : VNS. Cet algorithme demande d'implanter une fonction qui nous permet de passer √† un k-√®me voisinage et une autre qui nous permet de faire une recherche locale dans un voisinage donn√©. En alternant entre les deux, nous augmentons nos chances de ne pas √™tre bloqu√©s dans un minimum local. Le VNS n'est pas difficile √† implanter mais assure n'assure pas l'optimalit√© de la solution trouv√©e. Son avantage principal est qu'il nous permet de fixer sa dur√©e d'ex√©cution car √† n'importe quel instant nous pouvons retourner une solution compl√®te. Pourtant, il est peut √™tre sensible √† la d√©finition du k√®me voisinage.