# Algorithme du minimax

Cet algorithme est souvent utilisé dans les jeux à deux joueurs, comme les échecs, les dames, le jeu de Go ou le morpion. Le but étant de déterminer le meilleur coup à joueur dans une position donnée.

Notre algorithme va commencer par représenter le jeu sous forme d'un arbre. Chaque noeud va représenter une position possible du jeu et chaque branche va représenter un coup qui est possible à joueur.

L'algorithme va ensuite alterner entre deux types de noeuds dans notre arbre. Les noeuds "MAX" et les noeuds "MIN".
- Les noeuds "MAX" représentent les positions où c'est au joueur dit MAX de joueur, celui-ci cherche à maximiser son score.
- Les noeuds "MIN" représente les positions où c'est au joueur dit MIN de joueur, celui-ci cherche à minimiser le score du joueur MAX (ce qui revient à maximiser le score du joueur MIN)

L'algorithme pour évaluer les feuilles de l'arbre va utiliser une fonction d'évaluation. Dans le cas des jeux par exemple, cette fonction attribue une valeur à chaque position finale du jeu. Par exemple +1 Si MAX gagne et -1 si MIN gagne et 0 pour un match nul. Les valeurs des feuilles sont propagées le long des branches de l'arbre jusqu'à la racine. A chaque noeud "MAX", la valeur maximale de ses fils est propagés vers le haut (on remonte l'arbre). En revanche à chaque noeud "MIN", c'est la valeur minimale de ses fils qui est propagé vers le haut. Pour choisir le meilleur coup quand toute les valeurs ont été propagé jusqu'à notre racine, on choisit le coup qui mène à la position avec la valeur maximale (la plus grande par exemple). Ce coup est considéré comme le meilleur coup à joueur dans la position actuelle.

## Créer l'algorithme du minimax 

Ici nous allons écrire notre algorithme en pseudo-code afin de mieux comprendre les étapes

```
    Fonction minimax(noeud, profondeur, joueur)
    Initialisation :
        valeur_meilleur = NIL
        valeur = NIL
    Début :
        Si le noeud est une feuille ou la profondeur max est atteinte alors
            retourner valeur du noeud
        Sinon si le joueur est MAX alors
            valeur_meilleur = - ∞
            Pour chaque fils du noeud
                valeur = minimax(fils, profondeur - 1, MIN)
                valeur_meilleur = max(meilleur_valeur, valeur)
            Fin Pour
            retourner valeur_meilleur
        Sinon
            valeur_meilleur = + ∞
            Pour chaque fils du noeud
                valeur = minimax(fils, profondeur - 1,MAX)
                valeur_meilleur = min(valeur_meilleur, valeur)
            Fin Pour
            retourner valeur_meilleur
        FinSi
    Fin

    Fonction meilleur_coup(noeud)
    Initialisation :
        valeur_meilleur = NIL
        coup_meilleur = NIL
        valeur = NIL
        profondeur_maximal =  ∞ # Choisir la valeur max de l'arbre (la profondeur max de l'arbre)
    Début :
        valeur_meilleur = - ∞
        Pour chaque fils du noeud
        valeur = minimax(fils, profondeur_maximal, MIN)
        Si valeur > valeur_meilleur
            valeur_meilleur = valeur
            coup_meilleur = fils
        FinPour
        retourner coup_meilleur
    Fin
```

- La fonction "minimax" prend en entrée un noeud de l'arbre ausin que la profondeur actuelle de l'arbre et le joueur en cours
- Si le noeud est une feuille ou si la profondeur max est atteinte, la fonction retourne la valeur du noeud actuel.
- Si le joueur est le joueur Max alors avec la fonction on va chercher la meilleur valeur parmi les fils du noeud en appelant récursivement notre algorithme du minimax pour chaque fils avec le joueur MIN
- Sinon la fonction cherche la plus petite valeur parmi les fils du noeud en appelant minimax récursivement pour chaque fils avec le joueur MAX

- La fonction "meilleur_coup" prend un noeud en entrée et cherche le meilleur coup possible en appelant minimax puis la fonction retourne le meilleur coup trouvé.

## Nous allons ici illustré un algorithme de minimax en python sur le jeu du puissance 4

Ici nous allons donc utiliser l'algo du minimax et du meilleur coup mais il ne faut pas oublier que l'on doit aussi penser à la création de l'arbre et aux règles du jeu.

In [15]:
import numpy as np
from copy import deepcopy

In [36]:
class puissance4(object):
    def __init__(self):
        self.plateau = np.empty((6,7), dtype=object)
        self.longueur = 7
        self.hauteur = 6
    
    def __str__(self):
        res = ""
        for i in range(self.hauteur):
            res += "\033[94m" + "\n+" + "".join(["---+" for _ in range(self.longueur)]) + "\n| " 
            for j in range(self.longueur):
                valeur = self.plateau[i][j]
                if valeur == "O":
                    res += "\033[93m" + "O" + "\033[94m | "
                elif valeur == "X":
                    res += "\033[91m" + "O" + "\033[94m | " 
                else:
                    res += "  | "
        res += "\033[94m" + "\n+" + "".join(["---+" for _ in range(self.longueur)]) + "\n "
        return res
    
    def joue(self, joueur, x):
        j=5
        while self.plateau[j][x] is not None and j>=0:
            j=j-1
        if j>=0:
            if joueur == "X":
                self.plateau[j][x]="X"
            else:
                self.plateau[j][x]="O"
            return True
        else:
            return False
        
    def colonne_est_pleine(self,x):
        i = 5
        while i >= 0:
            if self.plateau[i][x] is not None:
                i=i-1
            else:
                return False
        return True
        
    def est_non_vide(self):
        i = 0
        j = 0
        while i <self.hauteur:
            j=0
            while j < self.longueur:
                if self.plateau[i][j] is None :
                    return True
                j=j+1
            i=i+1
        return False
    
    def a_gagne(self, joueur):
        # Vérification des lignes
        for i in range(self.hauteur):
            for j in range(self.longueur-3):
                if all(self.plateau[i][j+k] == joueur for k in range(4)):
                    return True
        # Vérification des colonnes
        for j in range(self.longueur):
            for i in range(self.hauteur-3):
                if all(self.plateau[i+k][j] == joueur for k in range(4)):
                    return True
        # Vérification des diagonales montantes
        for i in range(3,self.hauteur):
            for j in range(self.longueur-3):
                if all(self.plateau[i-k][j+k] == joueur for k in range(4)):
                    return True
        # Vérification des diagonales descendantes
        for i in range(self.hauteur-3):
            for j in range(self.longueur-3):
                if all(self.plateau[i+k][j+k] == joueur for k in range(4)):
                    return True
        return False
    
    def evaluer(self, joueur):
        score = 0
        # Vérification des lignes
        for i in range(self.hauteur):
            for j in range(self.longueur-3):
                if all(self.plateau[i][j+k] == joueur for k in range(4)):
                    score += 100
                elif all(self.plateau[i][j+k] == joueur for k in range(3)):
                    score += 10
                elif all(self.plateau[i][j+k] == joueur for k in range(2)):
                    score += 1
        # Vérification des colonnes
        for j in range(self.longueur):
            for i in range(self.hauteur-3):
                if all(self.plateau[i+k][j] == joueur for k in range(4)):
                    score += 100
                elif all(self.plateau[i+k][j] == joueur for k in range(3)):
                    score += 10
                elif all(self.plateau[i+k][j] == joueur for k in range(2)):
                    score += 1
        # Vérification des diagonales montantes
        for i in range(3,self.hauteur):
            for j in range(self.longueur-3):
                if all(self.plateau[i-k][j+k] == joueur for k in range(4)):
                    score += 100
                elif all(self.plateau[i-k][j+k] == joueur for k in range(3)):
                    score += 10
                elif all(self.plateau[i-k][j+k] == joueur for k in range(2)):
                    score += 1
        # Vérification des diagonales descendantes
        for i in range(self.hauteur-3):
            for j in range(self.longueur-3):
                if all(self.plateau[i+k][j+k] == joueur for k in range(4)):
                    score += 100
                elif all(self.plateau[i+k][j+k] == joueur for k in range(3)):
                    score += 10
                elif all(self.plateau[i+k][j+k] == joueur for k in range(2)):
                    score += 1
        return score
    
    def minimax(self, joueur1, joueur2, moi, coups_possibles, racine, alpha=-float('inf'), beta=float('inf')):
        if self.a_gagne(joueur1):
            return 1 if moi else -1
        elif self.a_gagne(joueur2):
            return -1 if moi else 1
        elif not coups_possibles:
            return 0

        valeur = {}

        for coup in coups_possibles:
            newPos = deepcopy(self)
            newPos.joue(joueur1, coup)
            cp = deepcopy(coups_possibles)
            if newPos.colonne_est_pleine(coup):
                cp.remove(coup)
            valeur[coup] = newPos.evaluer(joueur1) if newPos.est_non_vide() else 0
            if moi:
                alpha = max(alpha, valeur[coup])
                if beta <= alpha:
                    break
            else:
                beta = min(beta, valeur[coup])
                if beta <= alpha:
                    break

        if moi:
            coupchoisi = coups_possibles[0]
            v = valeur[coups_possibles[0]]
            for coup in coups_possibles:
                if valeur[coup] > v:
                    coupchoisi = coup
                    v = valeur[coup]
            if racine:
                return coupchoisi
            else:
                return v
        else:
            coupchoisi = coups_possibles[0]
            v = valeur[coups_possibles[0]]
            for coup in coups_possibles:
                if valeur[coup] < v:
                    coupchoisi = coup
                    v = valeur[coup]
            if racine:
                return coupchoisi
            else:
                return v
    

In [37]:
if __name__ == "__main__":
    jeu = puissance4()
    
    for i in range(jeu.longueur):
        if i%2 == 1:
            jeu.plateau[5][i]="O"
            jeu.plateau[4][i]="O"
            jeu.plateau[3][i]="X"
        else:
            jeu.plateau[5][i]="X"
            jeu.plateau[4][i]="X"
            jeu.plateau[3][i]="O"
            
    print(jeu)
    
    humain = "O"
    ia = "X"
    
    coups_possibles = [0,1,2,3,4,5,6]
    
    while True:
        while True:
            case = int(input("Colonne ou placer le O"))
            if case in coups_possibles:
                break
        jeu.joue(humain,case)
        print(jeu)
        if jeu.a_gagne(humain):
            print("L'humain a gagné.")
            break
        if jeu.colonne_est_pleine(case):
            coups_possibles.remove(case)
        if coups_possibles == []:
            print("Match nul")
            break
        caseAjoueur = jeu.minimax(ia, humain, False, coups_possibles, True)
        print(ia + "joue a la colonne"+ str(caseAjoueur))
        jeu.joue(ia,caseAjoueur)
        print(jeu)
        if jeu.a_gagne(ia):
            print("L'ia a gagné.")
            break
        if jeu.colonne_est_pleine(caseAjoueur):
            coups_possibles.remove(caseAjoueur)
        

[94m
+---+---+---+---+---+---+---+
|   |   |   |   |   |   |   | [94m
+---+---+---+---+---+---+---+
|   |   |   |   |   |   |   | [94m
+---+---+---+---+---+---+---+
|   |   |   |   |   |   |   | [94m
+---+---+---+---+---+---+---+
| [93mO[94m | [91mO[94m | [93mO[94m | [91mO[94m | [93mO[94m | [91mO[94m | [93mO[94m | [94m
+---+---+---+---+---+---+---+
| [91mO[94m | [93mO[94m | [91mO[94m | [93mO[94m | [91mO[94m | [93mO[94m | [91mO[94m | [94m
+---+---+---+---+---+---+---+
| [91mO[94m | [93mO[94m | [91mO[94m | [93mO[94m | [91mO[94m | [93mO[94m | [91mO[94m | [94m
+---+---+---+---+---+---+---+
 
[94m
+---+---+---+---+---+---+---+
|   |   |   |   |   |   |   | [94m
+---+---+---+---+---+---+---+
|   |   |   |   |   |   |   | [94m
+---+---+---+---+---+---+---+
| [93mO[94m |   |   |   |   |   |   | [94m
+---+---+---+---+---+---+---+
| [93mO[94m | [91mO[94m | [93mO[94m | [91mO[94m | [93mO[94m | [91mO[94m | [93mO[94m | [94m
+---+-

ValueError: invalid literal for int() with base 10: ''