## Notebook 3 - Recuit simulé pour le problème du voyageur de commerce

CSI4506 Intelligence Artificielle  
Automne 2021   
Version 1 (2020) préparée par Julian Templeton et Justin Charbonneau. Version 2 (2021) adaptée par Caroline Barrière.

***INTRODUCTION***:

Ce devoir vous permettra de mieux comprendre les algorithmes de recherche aléatoire vus en classe, en particulier l'algorithme de *recuit simulé*, qui est une méthode connue qui exemplifie bien la *modification aléatoire*.  Au départ, une solution gloutonne est proposée.  Cette solution est révisée petit à petit pour arriver à une meilleure solution.

Le domaine d'application utilisé ici pour expérimenter avec le *recuit simulé* est le problème du voyageur de commerce (Traveling salesman problem).  C'est un problème classique, dans lequel le but est de visiter toutes les villes d'un graphe interconnecté de villes, et ce, en parcourant la plus petite distance possible.

Le Notebook mènera à la partie *Recuit simulé* après avoir exploré une *approche gloutonne* et une approche *étape aléatoire* également. N'oubliez pas qu'en *étape aléatoire*, nous suivons une recherche gloutonne, mais parfois nous faisons un choix différent.

***DEVOIR***:   

Parcourir le notebook, en exécutant chaque cellule, une à une.  
Pour chaque **(TO DO)**, effectuer les tâches demandées.  
Quand vous avez terminé, signez (voir cette étape ajoutée à la fin) et soumettez votre notebook.  N'oubliez pas de personnaliser le nom du notebook à NuméroEtudiant-NomFamille-Notebook3.ipynb.

Ce notebook sera évalué sur 20 points.  
Chaque **(TO DO)** aura un pointage associé.
***

**1. Définissons d'abord un petit nombre de villes à parcourir.**

In [None]:
# let's define 5 cities with a label and a (x,y) coordinate
cities = {'A': (0,0), 'B': (1,1), 'C': (1,0), 'D': (1,-1), 'E': (-1,-1)}

La méthode *showNodes* ci-bas nous permet de visualiser la position des villes.

Les packages **matplotlib** , **networkx** et **numpy** doivent d'abord être installés. 

Pour faire l'installation des packages, ouvrir une invite de commande, et tapez **pip install networkx** ainsi que **pip install numpy** (Si vous avez linux ou un Mac, vous pouvez utiliser **pip3** au lieu de **pip** selon la configuration de votre environnement). Matplotlib devrait déjà être installé mais si ce n'est pas le cas, utilisez la commande **pip install matplotlib** pour l'installer.

Vous pouvez également profiter des commandes magiques et insérer une cellule de code et inscrire **%pip install networkx**.  Une fois les packages installés, vous devrez probablement redémarrer le *kernel*.  Ensuite, vous serez en mesure d'exécuter la cellule ci-bas.

In [None]:
import matplotlib.pyplot as plt
import networkx as nx

# small method to show nodes
# provide defaults for figure size (size), as well as x and y axis
def showNodes(nodeDict, size= (6.5, 4), xLim=[-2,2], yLim=[-2,2]):
    fig = plt.figure(figsize=size)
    axg = fig.add_subplot(111)
    axg.set_xlim(xLim)
    axg.set_ylim(yLim)

    G=nx.Graph()
    for k in nodeDict.keys():
        G.add_node(k, coor=nodeDict.get(k))
    
    pos=nx.get_node_attributes(G,'coor')
    nx.draw(G, pos, with_labels = True)
    plt.axis('on')
    plt.show()

In [None]:
# show the cities on a map
showNodes(cities)

#### 2. Mesurons les distances entre les villes
D'abord, nous définissons une méthode pour calculer la distance entre deux villes spécifiques.  Ensuite nous définissons une méthode pour trouver l'ensemble des distances entre plusieurs paires de noeuds (villes).

In [None]:
import math

# returns the euclidian distance between two nodes
def dist(node1, node2):
    return round(math.sqrt(math.pow(node1[0] - node2[0], 2) + math.pow(node1[1] - node2[1], 2)), 3)

In [None]:
# Small test to see the distance
dist(cities.get('A'), cities.get('B'))

In [None]:
# building a dictionary of all pairs or distances
def distDict(nodes):
    distance = {}
    # go through all pairs of nodes
    for k in nodes.keys():
        for m in nodes.keys():
            distance[k,m] = dist(nodes.get(k), nodes.get(m))
    return distance

In [None]:
# showing the distances between the cities
distances = distDict(cities)
print(distances)

Ajoutons aussi une méthode pour trouver la ville la plus proche d'une autre ville.  Cette méthode sera utile plus tard.

In [None]:
# find the min distance from node1 to all other nodes.
# it receives the node1 label, the labels of other nodes to test,
# and the precalculated distances between all nodes
def closestNode(node1_label, otherNodes_Labels, distanceDict):
   
    # tricky syntax... it creates tuples where the distance is the first element of the tuple
    # and the position in the array is the second element of the tuple
    minDist = min( (distanceDict[node1_label,k], k) for k in otherNodes_Labels)
    # get the second element of the tuple which is the index found
    foundNode = minDist[1]
    return foundNode

In [None]:
# Testing the closest node
closestNode('B', ['C', 'D'], distances)

#### 3. Solution gloutonne d'abord
La première approche que nous explorons est un algorithme glouton.

In [None]:
# greedy solution
import random

def greedy_solution(nodes):
    # distance matrix
    allDist = distDict(nodes)
    # pick a first node at random among the set of keys (node names)
    cur_node = random.choice(list(nodes.keys()))
    # add that node to solution
    solution = [cur_node]
    # build a free list of nodes (not yet used) containing all nodes except the one just chosen 
    free_list = list(nodes.keys())
    free_list.remove(cur_node)
    
    # while there are still nodes to be attached
    while free_list:
        # find the closestNode
        found_node = closestNode(cur_node, free_list, allDist)
        cur_node = found_node
        free_list.remove(cur_node)
        solution.append(cur_node)

    return solution

In [None]:
# Test obtaining a greedy solution
gs = greedy_solution(cities)
print(gs)

**(TO DO) Q1 - 2 points**  
Il existe des cas de TSP dans lesquels la ville de départ est définie.\
(a) Définissez une nouvelle méthode de solution gloutonne dans laquelle vous incluez un paramètre supplémentaire qui est le nom du nœud de départ.\
(b) Testez votre méthode avec le nœud de départ « B ».  Montrez la solution obtenue.

In [None]:
# RÉPONSE - Q1 - Partie (a)
# Copy-paste from greedy_solution and make a small change
# greedy solution
import random
def greedy_solution_with_fixed_start(nodes, start):
    ...

    return solution

In [None]:
# RÉPONSE - Q1 - Partie (b)
# Test your new method with starting node 'B'
gs2 = ...

#### 4. Calcul de la distance parcourue et affichage d'un chemin.

Lorsque nous avons une solution au TSP (chemin parcourant toutes les villes), nous voudrons connaître la distance totale parcourue.

**(TO DO) Q2 - 2 points**  
Complétez la méthode pour trouver la longueur totale du chemin trouvé.

In [None]:
# RÉPONSE Q2 - Fill in the missing lines
def totalDist(path, distanceDict):
    total = 0
    for i in range(len(path) - 1):
        x = path[i]
        # The two lines below
        y = ...
        total += ...
    return round(total,3)

In [None]:
# Test the total distance method
print(gs1)
print(totalDist(gs1, distances))
print(gs2)
print(totalDist(gs2, distances))

Maintenant nous voulons visualiser le chemin trouvé. Nous modifions légèrement la méthode *showNodes* vue précédemment pour devenir *showPath* et montrer un chemin dans un graphe dirigé. 

In [None]:
# small method to show a path
# it receives an ordered list of nodes e.g. ['B','C','A', 'D', 'E']
# and a dictionary of all the nodes and their positions
def showPath(path, nodeDict, size= (6.5, 4), xLim=[-2,2], yLim=[-2,2]):

    fig = plt.figure(figsize=size)
    axg = fig.add_subplot(111)
    axg.set_xlim(xLim)
    axg.set_ylim(yLim)

    G=nx.DiGraph()
    for k in path:
        G.add_node(k, pos=nodeDict.get(k))
        
    for i in range(len(path) - 1):
        x = path[i]
        y = path[i + 1]
        G.add_edge(x,y)
        
    pos=nx.get_node_attributes(G,'pos')
    nx.draw(G, pos, with_labels = True, edge_color = ['b', 'r', 'c', 'y', 'g', 'm'], arrows=True)   
    # nx.draw(G, pos, with_labels = True)
    plt.axis('on')
    plt.show()

**(TO DO) Q3 - 2 points**  
Montrez le chemin obtenu avec la recherche gloutonne (n'importe quel nœud de départ) et la recherche gloutonne avec 'A' comme nœud de départ.  *ATTENTION: étant donné que les noeuds B, C et D sont verticalement alignés, il se peut qu'une solution comprenne un arc entre B et D ou D et B, mais il sera caché derrière le noeud C.*

In [None]:
# RÉPONSE - Q3
# Show paths
... 
# Testing to output the path chosen by the greedy solution
gs1 = ...
print(gs1)
showPath(gs1, cities)
# Testing to output the path chosen by the greedy solution with start 'A'
gs3 = ...
print(gs3)
... 

**(TO DO) Q4 - 4 points**  
Ajouter 3 nouvelles villes (positionner les villes où vous voulez dans le graphe prédéfini de -2 à 2).  Donc, refaire la séquence d'étapes que nous avons fait précédemment que nous résumons ci-bas: \
(1) définir un graphe \
(2) visualiser les positions des villes \
(3) contruire le dictionnaire des distances \
(4) trouver deux solutions gloutonnes (sans établir le noeud de départ) \
(5) montrer les chemins pour ces solutions avec les distances parcourues. 

In [None]:
# RÉPONSE - Q4

# (1) Defining a larger set of cities  (add two more)
moreCities = {'A': (0,0), 'B': (1,1), 'C': (1,0), 'D': (1,-1), 'E': (-1,-1), 'F':  ... 'G' ... 'H'
# (2) Show the points
...
# (3) Build the distance dictionary
...
# (4) Find two unique greedy solutions 
...
# (5) Show the two unique paths found above along with their total distances
...

**5. Algorithme d'étape aléatoire (random step)**

Avant de créer notre solution gloutonne aléatoire, nous définissons une fonction qui s'appelle kClosestNodes qui retournera les k noeuds les plus près du noeud spécifié.  Cela sera utile pour varier les étapes (pas toutes "gloutonnes"), sans toutefois faire des étapes entièrement aléatoire.

In [None]:
# find the min distance from node1 to all other nodes.
# it receives the node1 label, the labels of other nodes to test,
# the precalculated distances between all nodes, and k for how many to return
# The function then outputs a list of the k-closest nodes, where the
# first is the closest and the kth is the kth-closest
def kClosestNodes(node1_label, otherNodes_Labels, distanceDict, k):
    kClosest = []
    # Create a sorted distance list based on the values from the distance dictionary
    # This has the form [((node_1, node_2),value_1), ..., ((node_n, node_n), value_n)]
    sortedDistances = sorted(distanceDict.items(), key=lambda keyPair: keyPair[1])
    # Iterate through the sorted distance list to find our k min distances
    # from node1_label
    for key, value in sortedDistances:
        if (k > 0 and key[0] == node1_label and key[1] in otherNodes_Labels):
            k -= 1
            kClosest.append(key[1])
    return kClosest

In [None]:
# Example usage
# View the distance dictionary to verify correctness when finding the closest nodes
# to node B in cities
print(distances)
# Find the two closest nodes to the node B in cities (using its distance dictionary)
kClosestNodes('B', ['A', 'C', 'D', 'E'], distances, 2)

**(TO DO) Q5 - 3 points**  
Ci-dessous est défini l'algorithme étape aléatoire. Remplissez les parties manquantes. L'implémentation ci-bas suppose qu'à chaque étape, il y a 50% de chance de suivre la recherche gloutonne, et 50% de chance d'effectuer une action différente en allant vers un des k nœuds les plus proches.

In [None]:
# RÉPONSE - Q5 
import random
import numpy as np

# k represents the number of closest nodes to be returned from the
# function kClosestNodes
def random_step(nodes, k):
    # distance matrix
    allDist = distDict(nodes)
    # pick a first node at random among the set of keys (node names)
    cur_node = random.choice(list(nodes.keys()))
    # add that node to solution
    solution = [cur_node]
    # build a free list of nodes (not yet used) containing all nodes except the one just chosen 
    free_list = list(nodes.keys())
    free_list.remove(cur_node)
    
    # while there are still nodes to be attached
    while len(free_list) != 0:
        
        # if greedy_or_not is 0, chose among the k closest nodes, otherwise, do greedy meaning reduce k to 1
        greedy_or_not = random.randint(0,1)
        if (greedy_or_not == 0):
            nbPoss = ...
        else:
            nbPoss = ...
        # define the possible nodes for that step    
        possibilities = kClosestNodes(...
        print(possibilities)
        # randomly choose one node among the possibilities
        found_node = random.choice(...
        
        # Add the found node on the solution and remove from free list
        cur_node = found_node
        free_list.remove(cur_node)
        solution.append(cur_node)
        
    return solution

**(TO DO) Q6 - 5 points**  
Effectuer des tests et une évaluation. \
(a) Exécutez la recherche gloutonne 3 fois. \
(b) Exécutez l'étape aléatoire 3 fois avec k = 2. \
(c) Exécutez l'étape aléatoire 3 fois avec k = 3. \
Pour chaque test, montrez le chemin trouvé et sa longueur. Puis, à la fin, montrez les résultats moyens pour chacun de (a, b, c). \
Enfin, discuter des résultats obtenus. L'étape aléatoire est-elle meilleure ?  Y a-t-il une différence entre k=2 et k=3?

In [None]:
# RÉPONSE Q6 - partie Codage
# Perform tests
...

RÉPONSE Q6 - Partie de discussion \
...


**6. Definissons le processus du recuit simulé**  
Voyons maintenant un algorithme de modification aléatoire. Plus précisément, nous examinons le recuit simulé. La classe ci-bas définit le processus du recuit simulé.  Cette classe est une adaptation de la classe *anneal.py* qui se trouve dans le code python du github https://github.com/chncyhn/simulated-annealing-tsp. Vous n'avez pas à modifier cette classe, mais tenter de la comprendre pour assimiler l'algorithme du recuit simulé. 

In [None]:
# AUCUNE MODIFICATION REQUISE

# class to perform a simulated annealing
# must start with a set of nodes, all other parameters have defaults
class SimAnneal(object):
    def __init__(self, nodes, randomStep, k=4, T=-1, alpha=-1, stopping_T=-1, stopping_iter=-1):
        # set of nodes
        self.nodes = nodes
        # number of nodes
        self.N = len(nodes)
        # set the temperature T to sqrt(N) if not specified
        self.T = math.sqrt(self.N) if T == -1 else T
        # set alpha (rate at which the temperature is decreased)
        self.alpha = 0.995 if alpha == -1 else alpha
        # set stopping temprature
        self.stopping_temperature = 0.00000001 if stopping_T == -1 else stopping_T
        # set stopping iteration
        self.stopping_iter = 100000 if stopping_iter == -1 else stopping_iter
        # start at iteration 1
        self.iteration = 1

        # calculate the distances
        self.allDist = distDict(nodes)
        
        # start with greedy solution if randomStep is false,
        #  start with the random step solution if randomStep is true
        if (randomStep):
            self.cur_solution = random_step(nodes, k)
            self.improvementMessage = 'Improvement over random step solution: '
        else:
            self.cur_solution = greedy_solution(nodes)
            self.improvementMessage = 'Improvement over greedy solution: '
        
        # so far, the best solution is the one we have
        self.best_solution = list(self.cur_solution)

        # calculate fitness of the current solution
        self.cur_fitness = self.fitness(self.cur_solution)
        # initial fitness for initial solution
        self.initial_fitness = self.cur_fitness
        # best fitness so far
        self.best_fitness = self.cur_fitness
        # build the fitness list as we explore solutions
        self.fitness_list = [self.cur_fitness]


    def fitness(self, sol):
        """ Objective value of a solution """
        return totalDist(sol, self.allDist)

    # acceptance propability
    def p_accept(self, candidate_fitness):
        """
        Probability of accepting if the candidate is worse than current
        Depends on the current temperature and difference between candidate and current
        """
        return math.exp(-abs(candidate_fitness - self.cur_fitness) / self.T)

    def accept(self, candidate):
        """
        Accept with probability 1 if candidate is better than current
        Accept with probabilty p_accept(..) if candidate is worse
        """
        candidate_fitness = self.fitness(candidate)
        # test if fitness is smaller then the current one
        if candidate_fitness < self.cur_fitness:
            self.cur_fitness = candidate_fitness
            self.cur_solution = candidate
            # test if fitness is better than best so far, keep it as best if so
            if candidate_fitness < self.best_fitness:
                self.best_fitness = candidate_fitness
                self.best_solution = candidate

        # if solution is worst than the current one, there is still a possibility to pursue it
        else:
            if random.random() < self.p_accept(candidate_fitness):
                self.cur_fitness = candidate_fitness
                self.cur_solution = candidate

    def anneal(self):
        """
        Execute simulated annealing algorithm
        """
        # go through the temperature schedule
        print(self.T)
        print(self.stopping_temperature)
        while (self.T >= self.stopping_temperature) and (self.iteration < self.stopping_iter):
            # explore current solution
            candidate = list(self.cur_solution)
            # modify the solution to switch two cities
            # first chosen city between [2,N-1] - not changing the first city
            l = random.randint(2, self.N - 1)
            # second city between [0,N-1] Not sure why ??
            i = random.randint(0, self.N - l)
            # the chosen nodes are switch
            candidate[i:(i + l)] = reversed(candidate[i:(i + l)])
            # perform acceptance test 
            self.accept(candidate)
            # multiply the temperature by alpha (this will reduce it)
            self.T *= self.alpha
            self.iteration += 1
            
            # add current fitness to list (to be able to display)
            self.fitness_list.append(self.cur_fitness)

        print('Best fitness obtained: ', self.best_fitness)
        print(self.improvementMessage,
              round((self.initial_fitness - self.best_fitness) / (self.initial_fitness), 4))

        return self.best_solution
    
    def plot_learning(self):
        """
        Plot the fitness through iterations
        """
        plt.plot([i for i in range(len(self.fitness_list))], self.fitness_list)
        plt.ylabel('Fitness')
        plt.xlabel('Iteration')
        plt.show()


#### 7. Raffinement d'une solution avec recuit simulé

Avant de faire une modification, dans un algorithme de modification aléatoire tel que le recuit simulé, nous devons avoir une solution de départ. Une telle solution de départ peut être fournie par un algorithme glouton, ou si nous avons autre chose, comme l'algorithme étape aléatoire sur lequel nous avons travaillé dans les sections précédentes, nous pouvons l'utiliser aussi comme point de départ.

**(TO DO) Q7 - 2 points**  
Mettez des commentaires dans le code ci-dessous pour expliquer ce qu'il fait. Dans vos commentaires, expliquez quels sont les différents réglages des paramètres, lors de l'appel à SimAnneal. Exécutez-le également plusieurs fois. Cela vous montrera comment il peut y avoir une amélioration (ou non) de la solution gloutonne ou de la solution étape aléatoire à la solution de recuit simulé.

In [None]:
# RÉPONSE - Q7
# Include comments in the code

# 
firstSol = greedy_solution(moreCities)
distances = distDict(moreCities)
print('Solution {} takes a total of {}'.format(firstSol,totalDist(firstSol, distances)))
showPath(firstSol, moreCities)

# 
sa = SimAnneal(moreCities, False)
betterSol = sa.anneal()
showPath(betterSol, moreCities)

#
secondSol = random_step(moreCities, 4)
print('Solution {} takes a total of {}'.format(secondSol,totalDist(secondSol, distances)))
showPath(secondSol, moreCities)

#
sa2 = SimAnneal(moreCities, True, 4)
betterSol2 = sa2.anneal()
showPath(betterSol2, moreCities)

**8. Test à plus grande échelle**  
Le fichier *coord.txt* (que vous trouverez aussi sur Brightspace dans la section des Jupyter Notebooks), contient un ensemble de coordonnées. Ce fichier de données est aussi tiré du github https://github.com/chncyhn/simulated-annealing-tsp.  Voici le début du fichier.

1 0 0  
2 3 5  
3 2.5 9  
4 48 16  
5 48 17  
6 69 16  
...  

Nous utiliserons le chiffre de la première colonne comme étiquette de la ville (e.g. ville 0, ville 1, ...) et les deux autres colonnes comme les coordonnées.

Assurez-vous de mettre le fichier *coord.txt* dans le même répertoire que votre notebook (ou sinon changer le chemin d'accès dans le code ci-bas).

In [None]:
# reading the coordinates
manyCities = {}
with open('coord.txt','r') as f:
    i = 0
    for line in f.readlines():
        line = [float(x.replace('\n','')) for x in line.split(' ')]
        label = str(int(line[0]))
        manyCities[label] = (line[1], line[2])
        i += 1

Visualisons où sont les noeuds pour cet exemple.

In [None]:
showNodes(manyCities, size=(15,15), xLim=[-75,100], yLim=[-110,60])

Nous pouvons maintenant tester le processus de *recuit simulé* sur ce plus grand exemple.  Le code test est très similaire au code que vous avez commenté à la question (5) ci-haut.  Regarder l'étape supplémentaire, *plot_learning*, qui montre la valeur de la fonction de coût au fur et à mesure de la progression de l'algorithme. Exécutez-le plusieurs fois, c'est une approche probabiliste, donc le résultat peut être légèrement différent à chaque fois.

In [None]:
firstSol = greedy_solution(manyCities)
distances = distDict(manyCities)
print('Solution {} takes a total of {}'.format(firstSol,totalDist(firstSol, distances)))
showPath(firstSol, manyCities, size=(15,15), xLim=[-75,100], yLim=[-110,60])

sa = SimAnneal(manyCities, False)
betterSol = sa.anneal()
sa.plot_learning()
showPath(betterSol, manyCities, size=(15,15), xLim=[-75,100], yLim=[-110,60])

secondSol = random_step(manyCities, 3)
print('Solution {} takes a total of {}'.format(secondSol,totalDist(secondSol, distances)))
showPath(firstSol, manyCities, size=(15,15), xLim=[-75,100], yLim=[-110,60])

sa2 = SimAnneal(manyCities, True, 4)
betterSol2 = sa2.anneal()
sa2.plot_learning()
showPath(betterSol2, manyCities, size=(15,15), xLim=[-75,100], yLim=[-110,60])

**(TO DO) Q8 - 5 points**  
Comme nous l'avons vu dans les vidéos du cours et effectué à la question 6, l'évaluation des algorithmes qui incluent une composante aléatoire doit être effectuée en faisant la moyenne d'une série d'exécutions. Définissez et effectuez des tests dans lesquels vous comparerez, sur le grand exemple (manyCities) les trois algorithmes explorés dans ce cahier : recherche gloutonne, étape aléatoire, recuit simulé. Pour le recuit simulé, testez au moins 2 configurations (que vous avez vues en commentant le code en Q7). Après vos tests, discutez des résultats.

In [None]:
# RÉPONSE Q8 - Coding
# Each student should perform multiple runs of each algorithm and show results
# Greedy tests

# Random Step tests

# Simulated Annealing (configuration 1 tests)

# Simulated Annealing (configuration 2 tests)


RÉPONSE - Q8 - Partie discussion \
...


#### Signature

Je, -------VOTRE NOM--------------, déclare que les réponses inscrites dans ce notebook sont les miennes.