# Notebook 2 - Recherche de solutions

CSI4506 Intelligence Artificielle  
Automne 2021 \
Version 1 préparée par Joel Muteba, Julian Templeton et Caroline Barrière (2020).  Version 2 adaptée par Caroline Barrière (2021).

**INTRODUCTION**\
Ce notebook couvre la définition d'un espace d'états et des algorithmes de recherches.  Le code ci-bas est largement inspiré des ressources fournies avec le livre Artificial Intelligence, Foundations of Computational Agents (https://artint.info/2e/online.html).  En particulier, les ressources correspondant au chapitre 3, sur le thème de *Searching for Solutions*, se trouvent ici https://artint.info/AIPython/.

Il existe même un livre de Python complémentaire (en anglais) qui founi des explications du code, ainsi qu’un premier chapitre intitulé Python pour AI où ils donnent quelques notions de base sur Python. Voir https://artint.info/AIPython/aipython.pdf

Le code ci-bas est inspiré du code dans le fichier *searchProblem.py*.  Vous n'avez pas besoin de retourner à ce code.  Tout ce dont vous avez besoin pour votre travail est dans le présent notebook.  J'ai modifié le code du livre, et je le présente ici, par petits bouts, pour permettre à tous (surtout ceux et celles moins familiers avec python) de parcourir le code petit à petit. 

***DEVOIR***:  \
Parcourir le notebook, cellule par cellule.  
Lorsque vous voyez **(TO DO)**, faites les tâches demandées.  Lorsque vous avez terminé, soumettez votre notebook.  N'oubliez pas d'inscrire votre nom à la fin du Notebook, et aussi RENOMMER le fichier pour le personaliser NuméroEtudiant-NomFamille-Notebook-2.ipynb.

*Le notebook sera noté sur 20 points.   
Chaque **(TO DO)** montre le nombre de points associés.*
***

**1. Definition d'un graphe dirigé**  
Un graphe dirigé est construit à partir de noeuds et d'arcs.  La classe ci-bas permet de définir des arcs qui relient deux noeuds.  Les deux premiers paramètres donnent les deux noeuds.  Les deux autres paramètres donnnent le coût d'un arc (par défaut mis à 1) et une action d'un arc (par défaut à None).  La méthode *init* est le constructeur.  La méthode *assert* permet de valider que le coût d'un arc ne peut être négatif.

In [None]:
class Arc(object):
    """An arc has a from_node and a to_node node and a (non-negative) cost"""
    
    def __init__(self, from_node, to_node, cost=1, action=None):
        assert cost >= 0, ("Cost cannot be negative for"+
                           str(from_node)+"->"+str(to_node)+", cost: "+str(cost))
        self.from_node = from_node
        self.to_node = to_node
        self.action = action
        self.cost=cost

    def __repr__(self):
        """string representation of an arc"""
        if self.action:
            return str(self.from_node)+" --"+str(self.action)+"--> "+str(self.to_node)
        else:
            return str(self.from_node)+" --> "+str(self.to_node)

Voici un petit exemple de graphe dirigé acyclic (DAG -- Directed Acyclic Graph).
![Image1](./Image1.png)

Nous pouvons construire un DAG avec la classe Arc ci-haut définie.

In [None]:
# Defining a small dag
dag1 = [Arc('a','b'), Arc('b','c1'), Arc('c1','d'), Arc('b','c2'), Arc('c2','d')]

In [None]:
# print the dag
print(dag1)

Aucune classe ne définit un noeud.  Pour l'instant, nous supposons qu'un noeud est une chaîne de caractères (String).

**2. Espace de recherche (search space)**  
Plutôt que de définir un graphe par un ensemble d'arcs, nous pouvons définir plus formellement une classe représentant un espace de recherche qui contiendra non seulement une liste d'arcs, mais aussi une liste explicite de noeuds, un noeud initial, et un noeud final.  La classe contient aussi des méthodes pour obtenir de l'information sur les voisins d'un noeud, sur l'état d'un noeud (noeud final ou non).  La classe permet aussi de définir une fonction pour les heuristiques, ce que nous utiliserons plus tard.

In [None]:
class Search_problem_from_explicit_graph():
    """A search problem consists of:
    * a list or set of nodes
    * a list or set of arcs
    * a start node
    * a list or set of goal nodes
    * a dictionary that maps each node into its heuristic value.
    """

    def __init__(self, nodes, arcs, start=None, goals=set(), hmap={}):
        self.neighs = {}
        self.nodes = nodes
        for node in nodes:
            self.neighs[node]=[]
        self.arcs = arcs
        for arc in arcs:
            self.neighs[arc.from_node].append(arc)
        self.start = start
        self.goals = goals
        self.hmap = hmap

    def start_node(self):
        """returns start node"""
        return self.start
    
    def is_goal(self,node):
        """is True if node is a goal"""
        return node in self.goals

    def neighbors(self,node):
        """returns the neighbors of node"""
        return self.neighs[node]

    def heuristic(self,node):
        """Gives the heuristic value of node n.
        Returns 0 if not overridden in the hmap."""
        if node in self.hmap:
            return self.hmap[node]
        else:
            return 0
        
    def __repr__(self):
        """returns a string representation of the search problem"""
        res=""
        for arc in self.arcs:
            res += str(arc)+".  "
        return res

    def neighbor_nodes(self,node):
        """returns an iterator over the neighbors of node"""
        return (path.to_node for path in self.neighs[node])


Ci-bas, un exemple d'un espace de recherche à représenter. Le problème vise à aller du noeud 'a' au noeud 'h' (en jaune ci-bas). La définition de l'espace est présentée en dessous de l'image.

![Image2](./Image2.png)

In [None]:
# Defining a search space
problemSimple = Search_problem_from_explicit_graph(
    {'a','b','c','d','e', 'f', 'g', 'h', 'j'},
    [Arc('a','b',1), Arc('a','c',1), Arc('b','d',1), Arc('b','e',1),
     Arc('c','f',1), Arc('c', 'g'), Arc('d','h',1), Arc('e','h',1),
     Arc('f', 'e', 1), Arc('f','j',1)],
    start = 'a',
    goals = {'h'})

In [None]:
# Print some informations
print(problemSimple.neighbors('a'))

**(TO DO) Question 1 (2 points)**  
Afficher le noeud initial de l'espace *problemSimple*.  Tester si le noeud 'g' est son noeud final.  Passer au travers de tous les noeuds définis dans *problemSimple* pour trouver lequel est un noeud final.

In [None]:
# RÉPONDEZ ICI - Q1
# Print the start node. 
# 
# Test if node 'g' is a goal node. 
# 
# Go through the list of nodes to find which one is the goal.
# 

**(TO DO) Question 2 (2 points)**  
Compléter la définition de *problemTest* qui définit le graphe ci-bas. N'oubliez pas d'inscrire les coûts des arcs.

![Image3](./Image3.png)

In [None]:
# RÉPONDEZ ICI - Q2
# problemTest = Search_problem_from_explicit_graph(
#    {'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'j', 'k', 'm'},
#    .....
#    .....
#    )

**3. Definition d'une solution comme un chemin.**  
Une solution à un problème de recherche est un chemin, qui montre les noeuds visités pour se rendre du noeud initial au noeud final.  La classe ci-bas sert à définir un chemin. Pour l'instant, il faut voir qu'un chemin peut être un noeud (dans le cas du noeud initial) ou un chemin (définition récursive) suivi d'un arc. Ne vous inquiétez pas des détails d'implémentation.  Lorsque vos connaissances de python seront plus approfondies, vous comprendrez mieux.

In [None]:
# class to represent a path
class Path(object):
    """A path is either a node or a path followed by an arc"""
    
    def __init__(self,initial,arc=None):
        """initial is either a node (in which case arc is None) or
        a path (in which case arc is an object of type Arc)"""
        self.initial = initial
        self.arc=arc
        if arc is None:
            self.cost=0
        else:
            self.cost = initial.cost+arc.cost

    def end(self):
        """returns the node at the end of the path"""
        if self.arc is None:
            return self.initial
        else:
            return self.arc.to_node

    def nodes(self):
        """enumerates the nodes for the path.
        This starts at the end and enumerates nodes in the path backwards."""
        current = self
        while current.arc is not None:
            yield current.arc.to_node
            current = current.initial
        yield current.initial

    def initial_nodes(self):
        """enumerates the nodes for the path before the end node.
        This starts at the end and enumerates nodes in the path backwards."""
        if self.arc is not None:
            for nd in self.initial.nodes(): yield nd     # could be "yield from"
        
    def __repr__(self):
        """returns a string representation of a path"""
        if self.arc is None:
            return str(self.initial)
        elif self.arc.action:
            return (str(self.initial)+"\n   --"+str(self.arc.action)
                    +"--> "+str(self.arc.to_node))
        else:
            return str(self.initial)+" --> "+str(self.arc.to_node)

**4.  Definition d'un algorithme de recherche générique**  
Nous définissons une classe abstraite qui représente un algorithme de recherche générique.  La stratégie de gestion de la frontière sera raffinée dans les diverses classes plus spécifiques.

In [None]:
class GenericSearcher():
    """returns a searcher for a problem.
    Paths can be found by repeatedly calling search().
    This does depth-first search unless overridden
    """
    def __init__(self, problem):
        """creates a searcher from a problem
        """
        self.problem = problem
        self.initialize_frontier()

    def initialize_frontier(self):
        self.frontier = [Path(self.problem.start_node())]
        
    def empty_frontier(self):
        return self.frontier == []
       
    ### change the add_to_frontier method --- THIS METHOD NEEDS TO BE IMPLEMENTED FOR DIFFERENT SEARCH STRATEGIES
    def add_to_frontier(self,path):
        raise NotImplementedError
        
    def search(self):
        """returns (next) path from the problem's start node
        to a goal node. 
        Returns None if no path exists.
        """
        
        while not self.empty_frontier():
            # The next node explored is selected
            # It is implemented with a Pop, which actually removes from top of stack
            path = self.frontier.pop()            
            print(path)
            if self.problem.is_goal(path.end()):    # solution found
                self.solution = path                # store the solution found
                return path
            else:
                neighs = self.problem.neighbors(path.end())
                for arc in neighs: # Loop over neighbors arcs
                    self.add_to_frontier(Path(path,arc))              

**5. Implémentation des recherches aveugles.**  
En modifiant la méthode *add_to_frontier* de la recherche générique, nous pourrons implémenter les trois types de recherche aveugle vus en classe.  La recherche en profondeur, en largeur, et de moindre coût.  La recherche en largeur est implémentée ci-bas, et vous devrez implémenter les deux autres types de recherche aveugle. 

In [None]:
# (CB) extend the generic searcher to be a Breadth-first searcher.
class BreadthFirstSearcher(GenericSearcher):

    def __init__(self, problem):   
        super().__init__(problem)

    def add_to_frontier(self,path):
        # breadth
        self.frontier.insert(0,path)        # HERE, I insert in position 0 (bottom of stack), knowing that I want a FIFO

In [None]:
# Test breadth-first searcher
searcherBreadth = BreadthFirstSearcher(problemTest)  
print("Exploring nodes:")
foundPath = searcherBreadth.search();
print('Path found: {} with a cost of {}'.format(foundPath, foundPath.cost))

**(TO DO) Question 3 (2 points)**  
Modifier la méthode *add_fo_frontier* pour obtenir une recherche en profondeur.  Tester votre implémentation. 

In [None]:
# RÉPONDEZ ICI - Q3 - (UNE SEULE LIGNE A ÉCRIRE) (1 point)
# Depth-first searcher
class DepthFirstSearcher(GenericSearcher):
    def __init__(self, problem):   
        super().__init__(problem)

    def add_to_frontier(self,path):
        # depth - put code here
        # ...

In [None]:
# RÉPONDEZ ICI - Q3 - Part 2 (Test implementation) (1 point)
# Test
searcherDepth = ...
print("Exploring nodes:")
foundPath = ...
print('Path found: {} with a cost of {}'.format(foundPath, foundPath.cost))

**(TO DO) Question 4 (4 points)**  
Modifier la méthode *add_fo_frontier* pour obtenir une recherche de moindre coût.  Tester votre implémentation. 

In [None]:
# RÉPONDEZ ICI - Q4 - Part 1 (More complex, must sort so lowest-cost would be the one use in the "pop") (3 points)
# Lowest Cost searcher
class LowCostSearcher(GenericSearcher):
    def __init__(self, problem):   
        super().__init__(problem)

    def add_to_frontier(self,path):
        # Need to insert path p onto the frontier so the cost order is kept
        # low-cost search  - put code here...

In [None]:
# RÉPONDEZ ICI - Q4 - Part 2 (Test implementation) (1 point)
# Test
searcherLowCost = ...  
print("Exploring nodes:")
foundPath = ...
print('Path found: {} with a cost of {}'.format(foundPath, foundPath.cost))

**6. Recherche heuristique**  
Nous avons vu trois types de recherche heuristique en classe: locale (greedy), meilleur-chemin d'abord, et A\*. Les algorithmes meilleur-chemin d'abord et A\* sont des algorithmes d'heuristique globale.  Nous nous concentrons sur celles-ci.  Tout comme les recherches aveugles, nous pouvons les implémenter en modifiant la méthodes add_to_frontier de la recherche générique.

Dans ce notebook, pour obtenir l'heuristique d'un nœud, vous devez appeler la fonction self.problem.heuristic (...) où vous passez le nœud pour lequel vous voulez l'heuristique. 

Supposons que la fonction heuristique donne une distance optimiste de chaque noeud au noeud 'l'.  Ces distances sont encodées dans un dictionnaire appelé *hmap*, dans la définition ci-bas, qui est une extension au problemTest définit précédemment.

In [None]:
problemTestWithHeuristics = Search_problem_from_explicit_graph(
    {'a','b','c','d','e', 'f', 'g', 'h', 'j', 'k', 'l'},
    [Arc('a','b', 6), Arc('a','c', 5), Arc('a','d', 4), 
     Arc('b','e', 2), Arc('b','f', 4),
     Arc('e','h', 5), Arc('h','j', 8), Arc('j','l', 5),
     Arc('f','k', 12), Arc('k','l', 6),
     Arc('c','g', 3), Arc('g','k', 7),
     Arc('d','g', 6)],
    start = 'a',
    goals = {'l'},
     hmap = {'a':20, 'b':12, 'c':15, 'd':14, 'e':9, 'f':13, 'g':10, 'h':11, 'j':5, 'k':6})

**(TO DO) Question 5 - 4 points** <br> 
Vous devez implémenter et tester l'algorithme A\*.

In [None]:
# RÉPONDEZ ICI - Q5 - Part 1 (3 points)
# A* searcher
class AStarSearcher(GenericSearcher):
    """returns a searcher for a problem.
    Paths can be found by repeatedly calling search().
    """
    def __init__(self, problem):   
        super().__init__(problem)

    def getCostKey(self, path):
        return ...
    
    def add_to_frontier(self,path):
        """add path to the frontier with the appropriate cost"""
        # add path to the frontier 
        ...
        # sort frontier so that all the elements are ordered from most costly to least costly
        self.frontier.sort(key=self.getCostKey, reverse=True)

In [None]:
# RÉPONDEZ ICI - Q5 - Part 2 (1 point)
# Test
...

**(TO DO) Question 6 - 5 points** <br> 
Vous devez implémenter et tester l'algorithme du meilleur chemin d'abord best-first search.

In [None]:
# RÉPONDEZ ICI - Q6 - Part 1 (3 points)
# Best first searcher
class BestFirstSearcher(GenericSearcher):
    """returns a searcher for a problem.
    Paths can be found by repeatedly calling search().
    """

In [None]:
# RÉPONDEZ ICI - Q6 - Part 1 (1 point)
# Test
...

**(TO DO) Q7 - 2 points**\
Maintenant que vous avez implémenté 5 algorithmes (3 recherches aveugles + 2 recherches heuristique), discutez \
(a) entre les algorithmes profondeur d'abord et largeur d'abord, lequel a mieux performé (en terme de trouver le chemin de plus faible coût, et en terme de nombre de noeuds explorés) et est-ce que le résultat obtenu était aussi bas que l'algorithme "plus-petit-coût-d'abord"? et \
(b) parmi les 2 algorithmes de recherche heuristique, lequel a mieux performé (en terme de trouver le chemin de plus faible coût)?

RÉPONDEZ ICI - Q7   
(a)

(b)

***SIGNATURE:***
Mon nom est --------------------------.
Mon numéro d'étudiant(e) est -----------------.
Je certifie que je suis l'auteur(e) de ce devoir.