## Exercice 1

En se basant sur le code donné dans la cellule suivante implementé des classes dérivant de
la classe Problem pour modéliser les problemes suivants:
- Jeu du Taquin
- Problème du monde des blocs 
- Problème des missionnaires et des cannibales 

In [70]:


class Problem:
    """The abstract class for a formal problem. You should subclass
    this and implement the methods actions and result, and possibly
    __init__, goal_test, and path_cost. Then you will create instances
    of your subclass and solve them with the various search functions."""

    def __init__(self, initial=None, goal=None):
        """The constructor specifies the initial state, and possibly a goal
        state, if there is a unique goal. Your subclass's constructor can add
        other arguments."""
        self.initial = initial
        self.goal = goal

    def actions(self, state):
        """Return the actions that can be executed in the given
        state. The result would typically be a list, but if there are
        many actions, consider yielding them one at a time in an
        iterator, rather than building them all at once."""
        raise NotImplementedError

    def get_successors(self, state, action):
        """Return the state that results from executing the given
        action in the given state. The action must be one of
        self.actions(state)."""
        raise NotImplementedError

    def is_goal_state(self, state):
        """Return True if the state is a goal. The default method compares the
        state to self.goal or checks for state in self.goal if it is a
        list, as specified in the constructor. Override this method if
        checking against a single self.goal is not enough."""
        if isinstance(self.goal, list):
            return any(state == x for x in self.goal)
        else:
            return state == self.goal

    def path_cost(self, c, state1, action, state2):
        """Return the cost of a solution path that arrives at state2 from
        state1 via action, assuming cost c to get up to state1. If the problem
        is such that the path doesn't matter, this function will only look at
        state2. If the path does matter, it will consider c and maybe state1
        and action. The default method costs 1 for every step in the path."""
        return c + 1

    def cost_of_actions(self, actions):
        return len(actions)

    def value(self, state):
        """For optimization problems, each state has a value. Hill Climbing
        and related algorithms try to maximize this value."""
        raise NotImplementedError



Pour vous montrer les étapes à suivre pour réaliser ce TD prenant un exemple simple.

## Exemple Simple : Robot aspirateur
Les actions possible sont : L: Lift, R: Right, and S: Suck. 
Le problème consiste à nettoyer deux pièces A et B. Puisqu'un état du problème doit être constitué d'informations permettant de vérifier si l'objectif est atteint, on peut représenter un état par un tuple $(p, s_a, s_b)$ où pos: postion de l'asperateur (A ou B), $s_a, s_b$: deux boolean qui représent l'état de chaque pièce "propre ou non".

Donc, le graphe de l'espace d'état est illustré sur l'image suivante:
<img src="attachment:vacuum-world.png" width="400">  


## Modélisation du problème Robot aspirateur

La formulation du problème consiste à donner :
- l'état initial
- les actions possible sur un état
- la fonction successeur: donne les états qu'on peut atteidre à partire d'un état par application des actions possibles.
- la fonction teste objectif
- le cout de l'execution d'une action

On peut choisir comme état initial pour ce problème (1, False, False) qui signifier que le robot est dans la pièce A et les deux pièces sont sales. 

Le teste de l'object consiste à tester si l'état est dans la liste [(1, True, True), (2, True, True)]


La formalisation du problème en étendant la classe Problème est donnée dans la cellule suivante:


In [3]:
#test the converstion from/to tuple and list 
t = (1, True, False)
l=list(t)
print(l,   tuple(l))
print(tuple(l)==t)



[1, True, False] (1, True, False)
True


In [33]:
A, B = 1, 2
initial = (A, False, False)
goal = [(1, True, True), (2, True, True)]


class VacuumProblem(Problem):
    """ Trivial Vacuum Problem"""
    
    def __init__(self, initial=None, goal=None):
        Problem.__init__(self, initial, goal)
    
    def actions(self, state):
        actions=['S', 'L', 'R'] 
        for action in actions:
             yield action
        
        # A more efficient way :
        """
        actions=[]
        s = list(state)
        
        if not s[s[0]]: 
            return 'S' 
        elif s[0]==A:
            return 'R' 
        else:
            return 'L' 
        """
         
    def get_successors(self, state, action):
        """Return the state that results from executing the given
        action in the given state. The action must be one of
        self.actions(state)."""
        s = list(state) #first we converst state to list
        if action ==  'S': #if suck
            s[s[0]] = True
        elif action == 'R' and s[0] == 1:
            s[0] = 2
        elif action == 'L' and s[0] == 2:
            s[0] = 1
        return tuple(s)
            
           

    def path_cost(self, c, state1, action, state2):
        """Return the cost of a solution path that arrives at state2 from
        state1 via action, assuming cost c to get up to state1. If the problem
        is such that the path doesn't matter, this function will only look at
        state2. If the path does matter, it will consider c and maybe state1
        and action. The default method costs 1 for every step in the path."""
        if action=='S':
            c = c + 100
        else:
            c = c + 1
        return c

     # we don't have to redefine the other functions

    
p =VacuumProblem(initial, goal)

print([action for action in p.actions(initial)]) 
print(p.get_successors(initial, 'S'))
print(p.get_successors(initial, 'L'))
print(p.get_successors(initial, 'R'))


['S', 'L', 'R']
(1, True, False)
(1, False, False)
(2, False, False)



# Jeu du Taquin
Connu en anglais sous le nom de 15 Puzzle, le taquin est un jeu simple inventé dans les années 1870 aux États-Unis. Noyes Palmer Chapman, un receveur des postes de Canastota (état de New York), est probalement à l'origine du jeu, bien que le célèbre créateur de jeu Sam Loyd en ait lui aussi réclamé la paternité.
         
### Les règles du jeu

Dans sa version traditionnelle, le jeu se présente sous la forme d'une grille carrée de 16 cases (4 x 4). Quinze d'entre elles contiennent une séquence de chiffres, ou plus souvent une image découpée. La dernière case est, quant à elle, vide.

<center><img src="attachment:jeu-taquin.png" width="100"/>
</center>
    



### Exemple 8-Puzzle

<div><img src="attachment:8-puzzle.png" width="400"/></div>

### Taquin résolu
        
Le principe est simple : une fois les pièces mélangées, il suffit de faire glisser les cases une à une afin de reformer le puzzle original (but).



# Formulation

Le but du puzzle 3×3 est de transformer l'état montré à gauche de l'image ci-dessus en l'état montré à droite. Nous représentons les états comme des tuples de tuples. Par exemple, l'état affiché ci-dessus sur le côté gauche est représenté par le tuple suivant :
```
        ( (8, 0, 6),
          (5, 4, 7),
          (2, 3, 1)
        )
```
Si nous représentons les états de cette manière, étant donné un état `s`, l'expression `s[row][col]` renvoie la tuile dans la ligne et la colonne spécifiées.

Le problème avec cette formulation est que la position du vide (le zéro) n'est pas connue. Il nous faut donc écrire une méthode qui cherche la position du zéro.

La fonction `find_tile(tile, State)` cherche les coordonnés de la tuile numéro `til`` dans un état.  
Veuillez utiliser le converstion tuple <--> list
  
  
    

In [40]:
def find_tile(tile, state):
    s = [ list(t) for t in state ]
    for i in range(len(s)):
        for j in range(len(s[0])):
            if s[i][j] == tile:
                return i,j
            
        

state =  ( (8, 0, 6),
          (5, 4, 7),
          (2, 3, 1)
        )

print('find_tile(0, state) = ', find_tile(0, state))
print('find_tile(0, state) = ', find_tile(7, state))

find_tile(0, state) =  (0, 1)
find_tile(0, state) =  (1, 2)


In [61]:
# état initial
initial =  ( (8, 0, 6),
          (5, 4, 7),
          (2, 3, 1)
        )

In [59]:
# état but (goal)
goal=((0, 1, 2), 
      (3, 4, 5),
      (6, 7, 8))

In [71]:
D= 'Down'
U= 'Up'
L= 'Left'
R='Right'

class Puzzle3x3Problem(Problem):
    
    def __init__(self, initial, goal):
        Problem.__init__( self, initial, goal) 
        
    def actions(self, state):
        actions=[D, U, L, R]
        i, j= find_tile( 0, state)  
        if i==0: 
            actions.remove(U)
        if i==2:
            actions.remove(D)
        if j == 0:
            actions.remove(L)
        if j==2:
            actions.remove(R)
        return actions  
         
    def get_successors(self, state, action):
         
        s = [ list(t) for t in state]
        i, j= find_tile( 0, state)
        
        if action ==  U :
            s[i][j] = s[i-1][j]
            s[i-1][j]= 0
            
            
        elif action == D:
            s[i][j] = s[i+1][j]
            s[i+1][j]= 0
            
        elif action == L  :
            s[i][j] = s[i][j-1]
            s[i][j-1]= 0
            
        elif action == R:
            s[i][j] = s[i][j+1]
            s[i][j+1]= 0
        
        return  tuple([tuple(e) for e in s])
            
 
        
printPuzzle3x3State = lambda state: print('\n'.join(['\t'.join([str(e) for e in row]) for row in state]))

printPuzzle3x3State(initial)  
printPuzzle3x3State(goal) 

2	5	3
1	4



0	1	2
3	4	5
6	7	8


In [45]:
puzzle3x3Problem = Puzzle3x3Problem(initial, goal)
p.actions(initial)
p.get_successors(initial, 'Down')

((8, 4, 6), (5, 0, 7), (2, 3, 1))

# Problème du monde des blocs 
Considérons une version simple du problème du monde des blocks, 
dans laquelle il y a cinq blocs de forme et de taille identiques, 
numérotés de 1 à 5. La figure ci-dessous montre deux configurations 
possibles de tels blocs ; noter que la position relative des blocs 
n'a pas d'importance, donc la configuration de gauche est équivalente 
à celle au milieu. Chaque bloc peut être soit sur la table 
(il n'y a pas de contraintes sur le nombre de piles) ou au sommet d'un autre bloc. 
Le but est d'empiler les blocs en une seule pile, dans l'ordre indiqué dans 
le configuration la plus à droite de la figure,
à partir de n'importe quel ensemble de piles donné, 
en déplaçant le plus petit possible nombre de blocs.
Seuls les blocs en haut des piles actuelles peuvent être déplacés,
et ne peuvent être placés que sur la table ou sur une autre pile.
<div>
<img src="attachment:worldblock%20.png" width="400">
</div>

In [76]:
initial = ((2,5,3), (1,4),(),(),())

In [None]:
# for goal  we will redefine is_goal_state function

In [79]:
import copy  

class WorldBlockProblem1(Problem):
    def __init__(self, initial):
        Problem.__init(self,initial, None )
        
    def actions(self, state):
        return ['Move']
    
    def get_successors(self, state, action):
        seccessors= []
        s = [ list(t) for t in state]
        for i in range(len(s)):
            if len(s[i])> 0 :
                ns = copy.deepcopy(s) 
                block = ns[i][-1]
                del ns[i][-1]
                for j in range(len(s)):
                    if not i==j :
                        new_s = copy.deepcopy(ns) 
                        new_s[j].append(block)
                        seccessors.append(tuple([tuple(e) for e in new_s]))
        return seccessors
    
    def is_goal_state(self, state): 
        """Return True if the state is a goal. The default method compares the
        state to self.goal or checks for state in self.goal if it is a
        list, as specified in the constructor. Override this method if
        checking against a single self.goal is not enough."""
        for  block in state:
            if 0 < len(block) < 5: # if there is one stack with 
                return False
            if len(block) == 5 and block==(5, 4, 3, 2, 1):
                return True
            
    



Nous avons remarqué que le traitement éffectué par la méthode `get_successor` peut être imlémenté dans la fonction `action`.
voici la réimplémentation de la class `WorldBlock'.


In [105]:
import copy  

to_list  = lambda State: [list(row) for row in State]
to_tuple = lambda State: tuple(tuple(row) for row in State)


class WorldBlockProblem(Problem):
    
    def __init__(self, initial):
        Problem.__init__(self,initial )
        
    def actions(self, state):
        moves = []
        s = [ list(t) for t in state] 
        for i in range(len(s)):
            on_table = True # to put a block on table (in empty stack) only one time 
            if len(s[i])> 0 : 
                for j in range(len(s)):
                    if (not i==j)  and len(s[j])>0:
                         yield (i, j) # move from i to j
                    elif (not i==j)  and len(s[j])==0 and on_table : 
                        yield (i, j)# move from i to j
                        on_table = False # to put a block on table (in empty stack) only one time 
        #return moves
    
    def get_successors(self, state, action):
        i, j = action
        ns = to_list(state)
        block = ns[i][-1]
        del ns[i][-1]
        ns[j].append(block) 
        return to_tuple(ns)
 
    def is_goal_state(self, state): 
        """Return True if the state is a goal. The default method compares the
        state to self.goal or checks for state in self.goal if it is a
        list, as specified in the constructor. Override this method if
        checking against a single self.goal is not enough."""
        for  block in state:
            if 0 < len(block) < 5: # if there is one stack with 
                return False
            if len(block) == 5 and block==(5, 4, 3, 2, 1):
                return True
            

def world_block_action_to_str(action):
    return "From " + str(action[0])+ " to "+  str(action[1])
    
initial_world__block = ((2,5,3), (1,4),(),(),())
world_block_problem = WorldBlockProblem(initial_world__block)
for action in world_block_problem.actions(initial_world__block):
    print( world_block_action_to_str(action),  ": " , world_block_problem.get_successors(initial_world__block, action )) 


                
 
#test is_gool function
goal_world__block = ( (),(), (5, 4, 3, 2, 1) ,(),())
print("world_block_problem.is_goal_state(initial_world__block): " , world_block_problem.is_goal_state(initial_world__block))
print("world_block_problem.is_goal_state(goal_world__block): " , world_block_problem.is_goal_state(goal_world__block))



From 0 to 1 :  ((2, 5), (1, 4, 3), (), (), ())
From 0 to 2 :  ((2, 5), (1, 4), (3,), (), ())
From 1 to 0 :  ((2, 5, 3, 4), (1,), (), (), ())
From 1 to 2 :  ((2, 5, 3), (1,), (4,), (), ())
world_block_problem.is_goal_state(initial_world__block):  False
world_block_problem.is_goal_state(goal_world__block):  True


# Le problème des missionnaires et des cannibales 
On énonce habituellement le problème des missionnaires et des cannibales de la manière
suivante : trois cannibales et trois missionnaires sont du même côté d’une rivière à côté d’un bateau
qui ne peut contenir qu’une ou deux personnes. Trouver un moyen pour que tout le monde se trouve
sur l’autre rive sans que le nombre de missionnaires à un endroit donné ne soit jamais inférieur au
nombre de cannibales au même endroit.
<div>
<img src="attachment:missionaries-and-infidels.png" width="400">
</div> 

- $\texttt{not_allowed}(m, i)$ est `True` lorsqu'il a un problème sur un rive ou il y $m$ missionnaires et $i$ infidèles. Pour qu'un problème se pose,  le nombre $m$ de missionaires doit être  suppérieur à $0$ et inférieur au nombre $i$ des infidèles.

- $\texttt{allowed}(m, i)$ est `True` s'il n'y a pas de problème de part et d'autre.
$m$ et $i$ sont le nombre de missionnaires et d'infidèles sur la rive gauche.
Il y a donc $3-m$ missionnaires et $3-i$ infidèles sur la rive droite. 


In [121]:
not_allowed = lambda m, i: 0 < m < i



allowed = lambda m, i: not not_allowed(m, i) and not not_allowed(3 - m, 3 - i)


une état est représenté par un tuple.  le triple $(m, i, b)$ spécifiés qu'il y:
  - $m$ missionaires,
  - $i$ infidèles, et
  - $b$ barques


In [122]:
# initial state
initial = (3, 3, 1)

# objectif
goal  = (0, 0, 0)



#### Définissons quelques fonctions d'aide à l'affichage d'un état

In [123]:
def fillCharsRight(x, n):
    s = str(x)
    m = n - len(s)
    return s + m * " "

print("|"+fillCharsRight("M", 5)+"|")

|M    |


In [124]:
def fillCharsLeft(x, n):
    s = str(x)
    m = n - len(s)
    return m * " " + s

print("|"+fillCharsLeft("M", 5)+"|")

|    M|


In [125]:
def fillCharsBoth(x, n):
    s  = str(x)
    ml = (n     - len(s)) // 2
    mr = (n + 1 - len(s)) // 2
    return ml * " " + s + mr * " "

print("|"+fillCharsBoth("M", 5)+"|")

|  M  |


In [126]:

def printState(state):
     m, k, b = state
     print( fillCharsRight(m * "M", 6) + 
            fillCharsRight(k * "K", 6) + 
            fillCharsRight(b * "B", 3) + "    |~~~~~|    " + 
            fillCharsLeft((3 - m) * "M", 6) + 
            fillCharsLeft((3 - k) * "K", 6) + 
            fillCharsLeft((1 - b) * "B", 3) 
          )
    
print("initial state:\n")  
printState(initial)

print("\ngoal state:")  
printState(goal)

initial state:

MMM   KKK   B      |~~~~~|                   

goal state:
                   |~~~~~|       MMM   KKK  B


In [149]:

 
class MissionariesProblem(Problem):
    
    def __init__(self, initial, goal):
        Problem.__init__(self,initial, goal )
        
    def actions(self, state):
        '''Sur le rive ouest de la révière.  Ceci implique qu'il y  (3-m) missionaires, (3-i) infidèles, and (1 - b) barques 
         sur le rive est. La fonction actions prend un état donné state et calcule l'ensemble des actions qu'on peut executer 
         à partire de state par une seul traversée de la rivière.
        
        '''
        m, i, b = state
        actions = []
        if b == 1:
            for mb in range(m+1):# choose mb missionaries to get on the boat 
                 for ib in range(i+1): # choose mb infidels to get on the boat 
                    if 1 <= mb + ib <= 2 and allowed(m-mb, i-ib)   : # check if the remaining people are allowed
                        yield (mb,  ib) # # the position of the boat shouldn't be returned because it is stored in the state        
        else:
            for mb in range(3-m+1): # choose mb missionaries to get on the boat 
                for ib in range(3-i+1):  # choose mb infidels to get on the boat 
                    if 1 <= mb + ib <= 2 and allowed(m+mb, i+ib): # check if the resulting state is allowed
                         yield (mb,  ib) # the position of the boat shouldn't be returned because it is stored in the state  
        
                    
        
    def get_successors(self, state, action):
        m, i, b = state
        if b == 1:
            return (m-action[0], i-action[1], 0)
        else:
            return (m+action[0], i+action[1], 1)

  


In [150]:
missionaries_problem = MissionariesProblem(initial, goal)



In [151]:

for action in missionaries_problem.actions(initial):
    print("apply "+ str(action)+ " on state "+ str(initial) ,  " : " , str(missionaries_problem.get_successors(initial, action ))) 

          


apply (0, 1) on state (3, 3, 1)  :  (3, 2, 0)
apply (0, 2) on state (3, 3, 1)  :  (3, 1, 0)
apply (1, 1) on state (3, 3, 1)  :  (2, 2, 0)
