---

# Rapport du Projet Pacman – Partie II : Recherche Adversariale

---

## Introduction

Dans ce projet, nous implémentons des algorithmes de recherche adversariale dans le cadre du jeu Pacman. Contrairement à la première partie, Pacman doit cette fois gérer des adversaires (les fantômes), introduisant une dimension stratégique supplémentaire. L’objectif est d’utiliser trois algorithmes de recherche – Minimax, Alpha-Bêta et Expectimax – afin de guider Pacman vers les actions optimales tout en tenant compte des mouvements possibles des fantômes. Pour simplifier le processus, un squelette de code est fourni, ne nécessitant de travailler que sur le fichier `multiAgents.py` pour l’implémentation des algorithmes de recherche.

Les fantômes, modélisés comme des agents adverses, suivent différents comportements selon les hypothèses des algorithmes : certains sont supposés jouer de manière optimale, tandis que d’autres agissent de façon aléatoire. Le choix du meilleur mouvement de Pacman dépend de l’évaluation des conséquences de chaque action, en termes de score et de risque.

## Algorithmes de Recherche Adversariale

### 1. Algorithme Minimax

L'algorithme Minimax est utilisé pour les jeux à somme nulle avec deux agents qui s'affrontent : dans notre cas, Pacman (agent maximisant) et les fantômes (agents minimisants). L’objectif de cet algorithme est de prévoir les mouvements de Pacman ainsi que les réponses possibles des fantômes, afin de maximiser le gain de Pacman.

1. **Fonctionnement** : Minimax construit un arbre de décision, où les niveaux maximisant représentent les tours de Pacman, et les niveaux minimisants les tours des fantômes. À chaque niveau, Pacman choisit l’action qui maximise son gain, tandis que les fantômes tentent de minimiser le score de Pacman.
  
2. **Implémentation pour plusieurs fantômes** : Dans notre projet, Pacman doit souvent faire face à plusieurs fantômes. Dans ce cas, chaque fantôme agit successivement dans l’arbre de recherche, créant plusieurs niveaux minimisants.

3. **Profondeur d'exploration** : L'algorithme explore les possibilités jusqu'à une profondeur définie (`self.depth`). La profondeur augmente après que Pacman et tous les fantômes aient joué.

Minimax est une méthode exhaustive qui peut être coûteuse en temps de calcul, surtout avec une profondeur élevée et plusieurs agents adverses.

### 2. Algorithme Alpha-Bêta (Élagage)

L'algorithme Alpha-Bêta est une version optimisée de Minimax, qui élimine les branches de l’arbre de recherche qui n’affectent pas le résultat final. En ajoutant deux valeurs de seuil (α et β), l'algorithme réduit considérablement le nombre de nœuds explorés.

1. **Fonctionnement de l’élagage** : Pendant l’exploration de l’arbre, l’algorithme maintient une borne inférieure (α) et une borne supérieure (β) pour déterminer les valeurs maximales et minimales possibles de chaque action. Si un nœud atteint une valeur en dehors de ces bornes, l’exploration de cette branche est interrompue.

2. **Utilisation dans Pacman** : Dans notre cas, Pacman maximise son score tandis que les fantômes le minimisent. Lorsqu’une branche ne peut plus affecter la décision optimale, elle est élaguée pour économiser du temps de calcul, permettant à Pacman de réagir plus rapidement aux menaces des fantômes.

3. **Limitation** : Comme Minimax, cet algorithme ne considère que les actions optimales des fantômes, ce qui ne correspond pas toujours à leur comportement dans le jeu.

L'élagage Alpha-Bêta permet de garder les performances de Minimax tout en explorant moins de nœuds, ce qui est particulièrement utile pour des recherches à profondeur élevée.

### 3. Algorithme Expectimax

L'algorithme Expectimax est une variante du Minimax qui modélise des agents qui agissent de manière probabiliste. Il est particulièrement adapté aux situations où l’adversaire n’agit pas de manière optimale – comme c'est le cas des fantômes de Pacman, qui peuvent bouger de façon aléatoire.

1. **Fonctionnement** : L’algorithme combine des niveaux maximisants (pour Pacman) avec des niveaux d’**espérance de gain** pour les fantômes, en supposant une répartition uniforme des actions possibles des fantômes.

2. **Probabilités** : À chaque niveau d’attente (expect), on calcule la moyenne pondérée des scores obtenus par chaque action possible des fantômes. Cela modélise un comportement sous-optimal, qui reste plus réaliste pour des adversaires imprévisibles.

3. **Utilisation** : Expectimax permet de prendre en compte l’incertitude dans les mouvements des fantômes, et guide Pacman vers des choix sécurisés face à des adversaires aléatoires.

Cet algorithme donne de meilleurs résultats dans des environnements où les adversaires ne sont pas totalement optimisés.

## Fonction d’évaluation avancée

Enfin, une fonction d'évaluation avancée a été implémentée pour améliorer la prise de décision de Pacman en intégrant divers facteurs de l'état du jeu :

- **Distance à la nourriture** : Pacman est récompensé pour s'approcher de la nourriture la plus proche, maximisant l'efficacité de collecte.
- **Évitement des fantômes** : Les distances aux fantômes sont calculées pour pénaliser les actions qui rapprochent Pacman des fantômes non effrayés, tout en encourageant la chasse de fantômes effrayés.
- **Proximité des capsules** : Les capsules de puissance sont des objectifs stratégiques pour Pacman, car elles lui permettent de chasser les fantômes temporairement.
- **Score global de l’état** : Le score de base, qui comprend la nourriture collectée et les pénalités de proximité des fantômes, est utilisé en combinaison avec les autres facteurs pour une évaluation plus complète.

Cette fonction d'évaluation est ajustée pour diriger Pacman de manière équilibrée entre sécurité et collecte rapide de points.

### Résultats des tests

Les tests des algorithmes sur divers niveaux montrent des comportements distincts :

- **Minimax et Alpha-Bêta** : Ces algorithmes obtiennent des scores élevés dans des niveaux où les mouvements des fantômes sont limités et donc plus prévisibles.
- **Expectimax** : Dans les niveaux où les fantômes se déplacent de manière aléatoire, Expectimax performe mieux en anticipant l’incertitude.

La fonction d’évaluation avancée, en dirigeant Pacman de manière stratégique, a permis d’obtenir de meilleurs scores en moyenne et une meilleure adaptation aux fantômes.

## Conclusion

La recherche adversariale appliquée à Pacman avec les algorithmes Minimax, Alpha-Bêta et Expectimax permet de comprendre les stratégies de prise de décision dans un contexte incertain et compétitif. Alpha-Bêta améliore Minimax en efficacité sans sacrifier l’optimalité, tandis qu’Expectimax, en modélisant les incertitudes des adversaires, permet des choix mieux adaptés aux adversaires aléatoires. La fonction d’évaluation avancée contribue enfin à renforcer les performances de Pacman en considérant une multitude de paramètres d'état.