<img src="Images/Logo.png" alt="Logo NSI" style="float:right">

<h1 style="text-align:center">TP : Puissance 4 - 2eme Partie</h1>

Il faut écrire une autre classe, nommé `Player`, en relation avec le jeu de Puissance 4. Nous utiliserons donc la classe `Board` élaborée dans la première partie.

Il faut donc créer une classe `Player` qui analyse le plateau de jeu du Puissance 4 et décide ou jouer le prochain coup.

L'idée est la suivante :
* On regarde chacune des colonnes du plateau. Puis on attribue un score numérique pour chaque colonne :
    * `-1.0` représente une colone pleine (donc aucun n'est possible dans cette colonne)
    * `0.0` représente une colonne qui, si elle est choisie pour le prochain coup, entraînera la perte du joueur
    * `50.0` représente une colonne qui, si elle choisie au prochain coup, ne provoquera ni la victoire ni la perte de la partie (au moins à court terme)
    * `100.0` rreprésente une colonne qui, si elle choisie au prochain coup, entraînera la victoire du joueur
* Après avoir obtenu un tableau de score au format décrit précédemment (un score par colonne), l'ordinateur va choisir un coup en trouvant la colonne avec le score maximal et choisir cette colonne.  
En cas d'égalités (entre les scores de plusieurs colonnes), l'une des stratégies suivantes sera utilisée :
    * `LEFT` : choisit la colonne avec le plus grand score, la plus à gauche
    * `RIGHT` : choisit la colonne avec le plus grand score, la plus à droite
    * `RANDOM` : choisit aléatoirement la colonne avec le plus grand score

## La classe `Player`
La classe `Player` doit posséder, au moins, trois attributs :
* Un caractère représentant le jeton (soit `'X'` soit `'O'`) utilisé par le joueur du jeu.
* Une chaîne de caractère (soit `'LEFT'`, soit `'RIGHT'`, soit `'RANDOM'`) représentant le méthode choisie par le joueur lorsque plusieurs colonnes ont le même score (il s'agit du nom des stratégies détaillées plus haut).
* Un entier naturel représentant le nombre de futurs coups que le joueur va étudier afin d'évaluer les différents mouvements.

Voici quelques indication sur les méthodes

## La méthode  `__init__`
Le constructeur `__init__(self, ox, tbt, ply)` prend trois paramètres :
* Le premier `ox` est un caractère : soit `'X'` soit `'O'`.
* Le second `tbt` est une chaîne de caractères représentant la stratégie du joueur en cas d'égalité (*tiebreaking type*) : soit `'LEFT'`, soit `'RIGHT'`, soit `'RANDOM'`
* Le troisième `ply` sera un entier naturel représentant le nombre de futurs coups que le joueur va étudier. Sur ce point voici une [vidéo expliquant cette notion ](Fichiers/Explanation_of_Ply.mp4).

## La méthode `__repr__`
La méthode `__repr__(self)` renvoie une chaîne de caractère représentant l'objet `Player` qui l'appelle. Elle doit afficher les trois caractéristiques du joueur : le jeton, la stratégie en cas d'égalité, et le type d'anticipation.

Voici un code que vous pouvez utiliser :

In [None]:
class Player:
    """ an AI player for Connect Four """

    def __init__(self, ox, tbt, ply):
        """ the constructor """
        self.ox = ox
        self.tbt = tbt
        self.ply = ply

    def __repr__(self):
        """ creates an appropriate string """
        s = "Player for " + self.ox + "\n"
        s += "  with tiebreak type: " + self.tbt + "\n"
        s += "  and ply == " + str(self.ply) + "\n\n"
        return s

Voici une séquence de tests :

```
>>> p = Player('X', 'LEFT', 2)
>>> p
Player for X
  with tiebreak: LEFT
  and ply == 2

>>> p = Player('O', 'RANDOM', 0)
>>> p
Player for O
  with tiebreak: RANDOM
  and ply == 0
```

## La méthode `oppCh`
La méthode `oppCh(self)` renvoie le jeton opposé à celui du joueur, c'est-à-dire le jeton qui sera jouer par l'adversaire de `self`. Ainsi, si `self` joue avec `'X'`, la méthode renvoie `'O'` et vice-versa.

Voici une séquence de tests :

```
>>> p = Player('X', 'LEFT', 3)
>>> p.oppCh()
'O'
>>> Player('O', 'LEFT', 0).oppCh()
'X'
```

## La méthode `scoreBoard`
La méthode `scoreBoard(self, b)` renvoie **un seul** nombre flottant représentant le score du plateau `b`, qui est donc un objet de type `Board`. Elle renvoie `100.0`si le plateau `b` est gagnant pour `self`. Elle renvoie `50.0` si ce n'est ni gagnant, ni perdant pour `self` et il renvoie `0.0` si c'est perdant pour `self` (l'adversaire gagne donc).

Voici une séquence de tests :

```
>>> b = Board(7, 6)
>>> b.setBoard('01020305')
>>> b 

| | | | | | | |
| | | | | | | |
|X| | | | | | |
|X| | | | | | |
|X| | | | | | |
|X|O|O|O| |O| |
---------------
 0 1 2 3 4 5 6

>>> p = Player('X', 'LEFT', 0)
>>> p.scoreBoard(b)
100.0

>>> Player('O', 'LEFT', 0).scoreBoard(b)
0.0

>>> Player('O', 'LEFT', 0).scoreBoard(Board(7,6))
50.0
```

On remarque ici que la stratégie en cas d'égalité n'a pas d'effet sur cette méthode.  
On pourra utiliser la méthode `winFor` de la classe `Board`. La méthode `oppCh` pourra également être utile.

## La méthode `tiebreakMove`
La méthode `tiebreakMove(self, scores)`  prend en paramètre `scores` qui est une liste non vide de nombre flottants. 
* S'il n'y a qu'un seul score maximale dans la liste `scores`, la méthode renvoie le numéro de la colonne correspondante (le numéro de la colonne correspond à l'indice du score maximal dans la liste `scores`) 
* S'il y a plusieures colonnes possédant un score maximal, la méthode renvoie le numéro de la colonne ayant le plus grand score en fonction de la stratégie (en cas d'égalité) du joueur.

Ainsi, 
* si la stratégie (en cas d'égalité) est `'LEFT'`, alors `tiebreakMove` doit renvoyer la colonne ayant le plus grand score, située le plus à gauche.
* si la stratégie (en cas d'égalité) est `'RIGHT'`, alors `tiebreakMove` doit renvoyer la colonne ayant le plus grand score, située le plus à droite.
* si la stratégie (en cas d'égalité) est `'RANDOM'`, alors `tiebreakMove` doit renvoyeraléatoirement l'une des colonnes ayant le plus grand score.

Une possibilité pour écrire cette méthode est d'abord de créer une liste des indices pour lesquels `scores` contient ses éléments maximaux.  
Par exemple, si `scores` représente `[50, 50, 50, 50, 50, 50, 50]`, alors `maxIndices` serait `[0, 1, 2, 3, 4, 5, 6]`. Et si `scores` représente `[50, 100, 100, 50, 50, 100, 50]`, alors `maxIndices` serait `[1, 2, 5]`.


Voici une séquence de tests :

```
>>> scores = [0, 0, 50, 0, 50, 50, 0]
>>> p = Player('X', 'LEFT', 1)
>>> p2 = Player('X', 'RIGHT', 1)
>>> p.tiebreakMove(scores)
2
>>> p2.tiebreakMove(scores)
5
```

Remarque : il peut être utile de tout d'abord chercher le maximum de la liste (on pourra se servir de la fonction native `max`) puis chercher la colonne correspondant au maximum, en fonction de la stratégie du joueur.

## La méthode `scoresFor`
La méthode `scoresFor(self, b)` est le coeur de la classe `Player`. Elle renvoie une liste de scores, dans laquelle le `c`-ième score quantifie la valeur du plateau **après que le joueur choisisse la colonne `c`**. Et la valeur est mesurée par ce qui le déroulement du jeu après le choix `self.ply`.

Voici quelques indications :
1. Tout d'abord, la méthode crée une liste `scores` dont tous les éléments sont initialisés à `50.0`. La taille de la liste correspond au nombre de colonnes dans la plateau `b`. On pourra utiliser `[50.0] * b.width`.
2. Puis la méthode parcourt chacune des colonnes.
3. **Cas de base** : si une colonne est pleine, elle assigne le score `-1.0` à la colonne.
4. **Cas de base** : si le jeu a déjà été gagné par `self` ou son adversaire, il n'est pas nécessaire d'étudier d'autres coups. Il suffit donc d'évaluer le plateau et utiliser le score pour l'assigner à la colonne étudiée.
5. **Cas de base** : si la valeur de `ply` vaut `0`, aucun coup n'est effectué. Il faudra donc attribuer le score adéquat à la colonne.
6. **Cas récursif** : si la valeur de `ply` est plus grande que `0` et que le jeu n'est pas terminé, le code doit choisir la colonne considérée. On utilisera certaines méthodes de la classe `Board`. On pourra tester si le plateau résultant termine le jeu, si oui on attribuera la score approprié à la colonne.
7. Une fois que le coup est joué, si le jeu n'est pas terminé, il faut déterminer **le score obtenue par l'adversaire sur le plateau résultant**.
8. Cela signifie qu'il faut créer un adversaire (qui sera de la classe `Player`). On peut attribuer à cet adversaire la même stratégie (en cas d'égalité) que `self`. Une fois que cet adversaire est créé, il faut utiliser la récursivité pour déterminer les différents scores que cet adversaires obtiendra pour son prochain coup.
9. Les scores obtenus par l'adversaire **ne sont pas** les scores que `self` utilise : l'adversaire n'a pas le même objectif que `self`. On pourra calculer l'évaluation de `self` pour le plateau en se basant sur les scores de l'adversaire. Puis assigner le score résultant à la valeur du coup sur la colonne.
10. Il faut penser à effacer le jeton qui a été placé lors de l'évaluation de la colonne.
11. Une fois que tous les coups ont été évalués, la méthode `scoreFor` renvoie la liste complète des scores, un par colonne. Ainsi dans un jeu à colonnes, il y a aura sept nombres dans la liste renvoyé.

Voici une séquence de tests :

```
>>> b = Board(7, 6)
>>> b.setBoard('1211244445')
>>> b

| | | | | | | |
| | | | | | | |
| | | | |X| | |
| |O| | |O| | |
| |X|X| |X| | |
| |X|O| |O|O| |
---------------
 0 1 2 3 4 5 6

# 0-ply lookahead doesn't see threats
>>> Player('X', 'LEFT', 0).scoresFor(b)
[50.0, 50.0, 50.0, 50.0, 50.0, 50.0, 50.0]

# 1-ply lookahead sees immediate wins
# (if only it were 'O's turn!)
>>> Player('O', 'LEFT', 1).scoresFor(b)
[50.0, 50.0, 50.0, 100.0, 50.0, 50.0, 50.0]

# 2-ply lookahead sees possible losses
# ('X' better go to column 3)
>>> Player('X', 'LEFT', 2).scoresFor(b)
[0.0, 0.0, 0.0, 50.0, 0.0, 0.0, 0.0]

# 3-ply lookahead sees set-up wins
# ('X' sees that col 3 is a win!)
>>> Player('X', 'LEFT', 3).scoresFor(b)
[0.0, 0.0, 0.0, 100.0, 0.0, 0.0, 0.0]

# At 3-ply, 'O' does not see any danger 
#  if it moves to columns on either side
>>> Player('O', 'LEFT', 3).scoresFor(b)
[50.0, 50.0, 50.0, 100.0, 50.0, 50.0, 50.0]

# But at 4-ply, 'O' does see the danger!
# again, too bad it's not 'O's turn
>>> Player('O', 'LEFT', 4).scoresFor(b)
[0.0, 0.0, 0.0, 100.0, 0.0, 0.0, 0.0]

```

Le dernier test peut prendre quelques secondes.

Si besoin, on pourra s'aider de la [vidéo explicative de l'algorithme](Fichiers/scoresFor_Algorithm.mp4).

## La méthode `nextMove`
La méthode `nextMove(self, b)` prend en paramètre `b`, un objet de type `Board` et renvoie un entier correspondant au numéro de la colonne que l'objet (de type `Board`), appelant la méthode, choisit pour son coup. Il s'agit d'une interface pour `Player`, mais c'est surtout pour profiter de tout ce qui a été fourni par les autres méthodes, en particulier `scoresFor`. Ainsi, `nextMove` doit utiliser `scoresFor` et `tiebreakMove` pour renvoyer le coup choisi.

Voici une séquence de tests :

```
>>> b = Board(7, 6);
>>> b.setBoard('1211244445')
>>> b

| | | | | | | |
| | | | | | | |
| | | | |X| | |
| |O| | |O| | |
| |X|X| |X| | |
| |X|O| |O|O| |
---------------
 0 1 2 3 4 5 6

>>> Player('X', 'LEFT', 1).nextMove(b)
0

>>> Player('X', 'RIGHT', 1).nextMove(b)
6

>>> Player('X', 'LEFT', 2).nextMove(b)
3

# the tiebreak does not matter
# if there is only one best move
>>> Player('X', 'RIGHT', 2).nextMove(b)
3

# again, the tiebreak does not matter
# if there is only one best move
>>> Player('X', 'RANDOM', 2).nextMove(b)
3
```

## Pour conclure : la méthode `playGame`
On pourra s'inspirer de la méthode `hostGame` de la classe `Board` pour créer cette méthode.

La méthode `playGame(self, px, po)` appelle la méthode `nextMove` pour `px` et `po`, qui sont des objets de type `Player`, afin de jouer une partie.

On pourra ajouter la fonctionnalité suivante dans le cas ou soit `px`, soit `po` est la chaîne de caractères `'human'` plutôt qu'un objet de type `Player`. Dans ce cas, la méthode `playGame` doit simplement demander à l'utilisateur d'entrer la colonne pour choisir le coup à jouer (avec les vérification nécessaires sur le choix de la colonne, comme dans la méthode `hostGame`).

Voici quelques exemples, déterministes, pour tester la méthode :

* Exemple 1

```
>>> px = Player('X', 'LEFT', 0)
>>> po = Player('O', 'LEFT', 0)
>>> b = Board(7, 6)
>>> b.playGame(px, po)

# Lots of boards omitted

|O|O|O| | | | |
|X|X|X| | | | |
|O|O|O| | | | |
|X|X|X| | | | |
|O|O|O| | | | |
|X|X|X|X| | | |
---------------
 0 1 2 3 4 5 6

X wins!
```

* Exemple 2 (la partie termine plus rapidement)

```
>>> px = Player('X', 'LEFT', 1)
>>> po = Player('O', 'LEFT', 1)
>>> b = Board(7, 6)
>>> b.playGame(px, po)

# Lots of boards omitted

|O|O| | | | | |
|X|X| | | | | |
|O|O| | | | | |
|X|X| | | | | |
|O|O|O| | | | |
|X|X|X|X| | | |
---------------
 0 1 2 3 4 5 6

X wins!
```

* Exemple 3 (le joueur analysant le plus de coups ne gagne pas toujours!)

```
>>> px = Player('X', 'LEFT', 3)
>>> po = Player('O', 'LEFT', 2)
>>> b = Board(7,6)
>>> b.playGame(px, po)

# Lots of boards omitted

|O|O|X|X|O|O| |
|X|X|O|O|X|X| |
|O|O|X|X|O|O| |
|X|X|O|O|X|X| |
|O|O|X|O|O|O|O|
|X|X|X|O|X|X|X|
---------------
 0 1 2 3 4 5 6

O wins!
```