# Intelligence artificielle - Automne 2025 - Le laboratoire 06

## _Les algorithmes de recherche pour une prise de décision optimale_
## _en théorie des jeux et dans le domaine de l'IA_


## Introduction

Dans la théorie du jeu, le processus de prise de décision est fondé sur l'algorithme de recherche qui guide l'investigation de l'espace de recherche.
Le défi d'aujourd'hui fait de **l'algorithme MinMax** le personnage principal d'un jeu à deux joueurs.

En utilisant le tic-tac-toe comme exemple, l'algorithme devrait calculer le meilleur mouvement suivant en évaluant l'utilité du tableau.

## Des définitions au savoir-faire

In [2]:
# Useful libraries:
from collections import defaultdict
import random
import math
import functools 

La représentation mathématique du problème obtient une conception intuitive `class Board` tenant les états légaux et les mouvements possibles pour les positions admissibles.

En python, `class Board` remplace(_overrides_) la sous-classe intégrée `defaultdict` de `class collections`.

Pour gérer les champs vides ou pour attribuer les valeurs correspondantes à chaque position, la méthode `__missing__` from `defaultdict` représente une meilleure alternative que l'utilisation d'un dictionnaire traditionnel.

La structure du tableau est la suivante:
`{(coordinates_as_tuple) : attributes}`

Où l'élément `attributes` pourrait se trouver par:
* le joueur qui assigne un X ou un O sur le tableau;
* les dimensions de la table, données par la largeur et l'hauteur;
* mots-clés arguments pour stocker la **valeur d'utilité** signifiant la fonction d'évaluation pour ce problème.

### Tâche 0

Construisez le `class Board`.

In [3]:
class Board(defaultdict):
    empty = '.'
    used = '#'
    
    def __init__(self, width=8, height=8, current_player=None, **kwds):
        self.__dict__.update(width=width, height=height, current_player=current_player, **kwds)
 
    def __missing__(self, pos):
        """
        Given the position of a cell, verify if its coordinates are within the
        boundaries of the board and mark the cell as an empty square.
        Otherwise, the cell will be marked as `used`.
        """
        # TO DO       
            
    def __hash__(self): 
        """
        Hash method stores the instances in hash tables.
        """
        return hash(tuple(sorted(self.items()))) + hash(self.current_player)
    
    def __repr__(self):
        def row(y): 
            return ' '.join(self[x, y] for x in range(self.width))
        return '\n'.join(map(row, range(self.height))) +  '\n'
    
    def update_board(self, changes: dict, **kwds) -> 'Board':
        """
        Update the board with the new changes of each cell.
        """
        
        # TO DO
        
        return board

NameError: name 'Board' is not defined

Pour ce problème, la valeur d'utilité peut être:

* _-1_ si le joueur qui cherche à obtenir un minimum va gagner;
* _0_ s'il y a égalité;
* _1_ si le joueur qui cherche à obtenir un maximum va gagner.

La classe abstraite `class TicTacToe` reçoit un tableau de 3X3, où une partie se termine s'il:

* y a une victoire verticale ou,
* y une victoire sur la diagonale principale ou,
* y a une victoire sur la diagonale secondaire ou,
* y victoire horizontale,
* ne sont pas des places vides. 

Le paramètre k est chargé de compter le nombre de symboles similaires (_X_ or _O_) sont en ligne.

### Tâche 1

Trouver le nombre de _X_ or _O_ placés en ligne.

In [None]:
def k_in_row(board, player, square, k):
    """
    Helper function to count if the player has similar symbols in a line.
    The player variable represents the player we are counting for (X or O in this case).
    The square variable can be used to only check lines that contain a specific position.
    You can choose to remove the "square" parameter from the function definition.
    """
    
    # TO DO

### Tâche 2

Construisez le `class TicTacToe`:

In [None]:
class TicTacToe:
    
    def __init__(self, height=3, width=3, k=3):
        self.k = # TO DO
        self.squares = """
                       The set of all points within the board.
                       A set has a similar structure to a dictionary and
                       contains only the keys.
                      """
        self.initial = # The board where X plays first, and the utility value is 0.
 
    def actions(self, board):
        """
        Define the possible moves for the allowed positions.
        Hint: Remember that you have all the positions on the board in self.squares and
        all the occupied positions can be obtained from the board parameter. Set operations
        are easily handled by python.
        """
        return # TO DO

    def utility(self, board, player):
        """
        Compute the utility value for each player. Recall: 
            -1  - win
             0  - a tie
             1  - loss
        """
        board.utility = # TO DO
        return

    def make_move(self, board, square):
        """
        Update the board in case the current player (board.current_player) places their symbol in the given square. 
        Afterwards, update the board's utility function with the corresponding symbol for each player.
        """
        player = board.current_player
        return board
    
    def end(self, board):
        """
        Checks if the game came to an end (we have an utility value for the board or there is a draw).
        """
        return #TO DO
 
    def draw_board(self, board):
        print(board)

In [None]:
def random_player(game, state):
    """
    We define a player that always uses random moves.
    This will be the challenger for our algorithm.
    """
    return random.choice(list(game.actions(state)))

In [None]:
def player(search_algorithm):
    """
    We define a general player that uses a strategy (search algorithm).
    Given a search algorithm, the player uses the (game, state) values to return an optimal move.
    The search_algorithm function will give us: utility_value, action_to_take.
    We only return the chosen action.
    """
    return lambda game, state: search_algorithm(game, state)[1]

### Tâche 3

Pour définir les actions du problème, nous utilisons la fonction `play_game` qui reçoit le jeu actuel à jouer et une stratégie.
La stratégie elle-même se réduit à un dictionnaire avec la structure suivante:

```
{player_as_key : strategy_function}
```
Où `strategy_function` peut être appelé par: `strategy_function(state, game)`

Exemple:
```
X: random_player -> random_player(state, game)
O: player(minmax_search) -> minmax_search(game,state)[1] (returned by the above lambda expression)
```

La structure `strategy_function` renvoie l'action pour chaque tour et l'état actuel de chaque joueur.

In [1]:
def play_game(game, strategies: dict):
    
    # TO DO
    
    return state

## L'algorithme Min-Max

### Tâche 4

Construisez l'arbre de jeu de recherche pour déterminer le meilleur mouvement en utilisant:

* le `max_value(state)` fonction dans laquelle la stratégie de l'IA consiste à _maximiser_ son score tandis que le score de l'adversaire se minimise;
* le `min_value(state)` fonction dans laquelle la stratégie de l'homme consiste à _minimiser_ le score de l'IA.

In [None]:
# Set a value worse than the worst case:
infinity = math.inf

def minimax_search(game, state):
    player = state.current_player

    def max_value(state):
        """
        TO DO
        """

        return value, move

    def min_value(state):
        """
        TO DO
        """
        
        return value, move

    return max_value(state)

Le résultat du jeu doit ressembler à:

In [None]:
play_game(TicTacToe(), dict(X=random_player, O=player(minimax_search))).utility

Player X move: (1, 0)
. X .
. . .
. . .

Player O move: (1, 2)
. X .
. . .
. O .

Player X move: (0, 0)
X X .
. . .
. O .

Player O move: (2, 0)
X X O
. . .
. O .

Player X move: (2, 2)
X X O
. . .
. O X

Player O move: (1, 1)
X X O
. O .
. O X

Player X move: (0, 1)
X X O
X O .
. O X

Player O move: (0, 2)
X X O
X O .
O O X



-1