In [None]:
from outils import* # Lancer la cellule pour importer les outils nécessaires au notebook.
from complements import* # import de fonctions nécessaires au jeu

# <div style = "text-align : center;"><span style="border: 2px solid;padding:6px;color:dodgerblue;">L'algorithme MINIMAX / MAXIMIN</span></div> #

## <span style="text-decoration: underline;color:red;">I. Introduction :</span> ##
● Nous allons présenter cet algorithme de façon générale. Nous l'appliquerons ensuite au puissance 4.<br>
L'algorithme du MINIMAX est dû au mathématicien <i>John Von Neuman</i> (inventeur entre autre de l'architecture théorique d'un ordinateur).<br>
![alt text](mes_images/von_neumann.jpg)<br>
● Le principe est le suivant :<br>
L'<strong>ordinateur</strong> dispose d'une <strong>heuristique</strong> permettant <strong>d'évaluer</strong> chaque situation de jeu <strong>de son point de vue</strong>.<br>
<br>
<br><span style="text-decoration: underline;">Partant d'une situation initiale</span>, <span style="border: 2px solid;padding:6px;">où l'ordinateur doit jouer</span>, on crée un <strong>noeud</strong> RACINE <strong>attaquant</strong> (en blanc ici).<br>
<br>![alt text](mes_images/racine.png)<br>
● <strong>Chaque coup possible</strong> depuis cette situation engendre une <strong>nouvelle situation</strong>, donc autant de noeuds <strong>fils défenseurs</strong> (en noir ici).<br>
![alt text](mes_images/fils.png)<br>
<br>
![alt text](mes_images/defenseur.png)<br>
● <strong>Si l'ordinateur ne joue qu'à un coup de profondeur</strong>, il va donc choisir le coup qui l'amène au fils d'heuristique MAXIMALE.<br>
Mais on sait très bien, aux échecs par exemple, qu'un coup intéressant de prime abord, mais s'avérer catastrophique plus loin dans la partie...<br>
<br><span style="border: 2px solid;padding:6px;">Choisir le meilleur coup nécessite en effet de continuer à <strong>explorer l'arbre des coups</strong> en envisageant la réponse de chaque fils défenseur, etc...</span><br>
<br>● Il est en général impossible de développer l'arbre jusqu'au bout, car il est souvent trop grand!<br>
<br>
● Aussi sera-t-il nécessaire de fixer une <strong>profondeur de développement maximale</strong> et de se limiter <strong>au parcours</strong> de cet arbre.<br>
Par exemple, une profondeur de <strong>2</strong> revient à aller jusqu'aux <strong>petits-fils</strong> attaquants de la racine.<br>
Une profondeur de <strong>3</strong> jusqu'à ses arrière-petit-fils défenseurs. Etc.<br>
<div class="alert alert-block alert-info"> On retiendra donc que les noeuds où l'<strong>ORDINATEUR</strong> doit jouer sont les noeuds <strong>ATTAQUANTS</strong>.<br>Et que les noeuds où <strong>HUMAIN</strong> doit jouer correspondent aux noeuds <strong>DEFENSEURS</strong>.</div><br>


In [None]:
qcm.role_defenseur()

<span style="text-decoration: underline;font-style: italic;">Remarque :</span><br>
Vous comprenez à présent l'appellation <span style="font-family:Courier New;font-size: 100%;">MaxiMin</span> ou <span style="font-family:Courier New;font-size: 100%;">MiniMax</span> de cet algorithme.<br>
Un noeud attaquant MAXImise les MINinmum remontés par ses fils défenseurs.<br>
Alors qu'un noeud défenseur MINImise les MAXimums remontées par ses fils attaquants!
## <span style="text-decoration: underline;color:red;">II. Notion de score :</span> ##
### <span style="text-decoration: underline;color:green;">1. Définition :</span> ###
Pour choisir le meilleur coup possible, l'ordinateur va devoir calculer le <strong>score</strong> de chaque noeud.<br>
<br>
Voici la façon dont il est <strong>récursivement</strong> défini :<br>
&nbsp;&nbsp;&nbsp;&nbsp;→ <span style="text-decoration: underline;">cas de base</span> : si le noeud est une <strong>feuille</strong> <span style="text-decoration: underline;">ou</span> de <strong>profondeur maximale est atteinte</strong>, le score du noeud est égal à son heuristique.<br>
&nbsp;&nbsp;&nbsp;&nbsp;→ <span style="text-decoration: underline;">cas récursif</span>  : si le noeud est <strong>attaquant</strong>, son score est égal au <strong>maximum</strong> des scores fils<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;si le noeud est <strong>défenseur</strong>, son score est légal au <strong>minimum</strong> des score fils<br>
<br>
⚠️ Ne pas confondre <strong>heuristique</strong> et <strong>score</strong>. Il ne sont égaux que sur les feuilles de l'arbre (ou à la profondeur maximale).<br>


### <span style="text-decoration: underline;color:green;">2. Etudes de situations :</span> ###
#### <span style="text-decoration: underline;color:blue;">a. Situation n°1 :</span> ####
Considérons l'arbre des coups suivants :<br>
<img src="mes_images/situation_1.png"><br>
On a indiqué le score de chaque noeud feuille (cas de base) à l'aide d'une heuristique.<br>


In [None]:
question.profondeur_max_1()

In [None]:
question.score_1()

#### <span style="text-decoration: underline;color:blue;">b. Situation n°2 :</span> ####
Considérons l'arbre des coups suivants :<br>
![alt text](mes_images/situation_2.png)<br>


In [None]:
question.profondeur_max_2()

In [None]:
question.score_2()

In [None]:
qcm.parcours()

### <span style="text-decoration: underline;color:green;">3. Algorithme:</span> ###
Voici, dans le langage de la POO,  l'algorithme du MINIMAX qui permet de coder la méthode <span style="font-family:Courier New;font-size: 100%;">remonter&#95;score</span> depuis les noeuds enfants :<br>
<br>
<code>méthode remonter\_score :<br>&nbsp;&nbsp;&nbsp;&nbsp;si noeud est une feuille ou de profondeur maximale :<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;score\_noeud =  son heuristique<br>&nbsp;&nbsp;&nbsp;&nbsp;sinon:<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;si noeud est attaquant:<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;score\_noeud = - infini <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;pour chaque fils:<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;score\_fils = fils.remonter\_score()<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;score\_noeud = max(score\_noeud, score\_fils)<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;sinon: \# noeud est défenseur<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;score\_noeud = + infini <br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;pour chaque fils:<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;score\_fils = fils.remonter\_score()<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;score\_noeud = min(score\_noeud, score\_fils)<br>&nbsp;&nbsp;&nbsp;&nbsp;renvoyer score\_noeud<br></code><br>
<span style="text-decoration: underline;font-style: italic;">Remarque :</span><br>
Il sera intéressant de créer un attribut <span style="font-family:Courier New;font-size: 100%;">score</span> lors de l'implémentation pour converver le score de chaque noeud.<br>


## <span style="text-decoration: underline;color:red;">III. Application au puissance 4 :</span> ##
### <span style="text-decoration: underline;color:green;">1. Les fonctions nécessaires :</span> ###
COPIER-COLLEZ le code des fonctions <span style="font-family:Courier New;font-size: 100%;">grille&#95;vierge, grille&#95;complete, hauteur, jouer</span> et <span style="font-family:Courier New;font-size: 100%;">heuristique</span> codées dans le notebook précédent.<br>


In [None]:
# Code des fonctions nécessaires au jeu

### <span style="text-decoration: underline;color:green;">2. La classe <span style="font-family:Courier New;font-size: 100%;">Noeud</span> :</span> ###
Un noeud est caractérisé par les <strong>attributs</strong> suivants, <strong>fournis au constructeur</strong> :<br>
&nbsp;&nbsp;&nbsp;&nbsp;→ l'entier <span style="font-family:Courier New;font-size: 100%;">pion&#95;ordi = 1 ou 2</span>, afin de pouvoir calculer l'heuristique dans chaque situation<br>
&nbsp;&nbsp;&nbsp;&nbsp;→ le booléen <span style="font-family:Courier New;font-size: 100%;">attaquant</span> : <br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;si <span style="font-family:Courier New;font-size: 100%;">attaquant == True</span>, c'est un noeud <strong>attaquant</strong>, donc un noeud où l'ordinateur doit jouer.<br>
&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;si <span style="font-family:Courier New;font-size: 100%;">attaquant == False</span>, c'est un noeud <strong>défenseur</strong>, donc une situation où l'humain est simulé<br>
&nbsp;&nbsp;&nbsp;&nbsp;→ la liste des colonnes <br>
&nbsp;&nbsp;&nbsp;&nbsp;→ sa profondeur (0 par défaut pour le noeud racine)<br>
&nbsp;&nbsp;&nbsp;&nbsp;→ le dernier coup ayant permis d'arriver à lui (<span style="font-family:Courier New;font-size: 100%;">None</span> par défaut pour le noeud racine)<br>
<br>
Ce à quoi on ajoute un attribut <span style="font-family:Courier New;font-size: 100%;">fils</span> :  une liste de fils, initialement vide.<br>


In [None]:
class Noeud:

    def __init__(self, pion_ordi, lst_colonnes, attaquant = True , profondeur = 0, dernier_coup = None): 
        self.pion_ordi = pion_ordi # fixé en début de partie. Permet de calculer l'heuristique
        self.colonnes = lst_colonnes # état du jeu
        self.attaquant = attaquant # la racine est un noeud attaquant par défaut. Ses fils défenseurs, etc.
        self.profondeur = profondeur
        self.dernier_coup = dernier_coup
        # attributs ajoutés :
        self.pion_humain = 3 - self.pion_ordi
        self.pion_a_placer = self.pion_ordi if self.attaquant else self.pion_humain
        self.fils = []

    def est_feuille(self, profondeur_max):
        '''renvoie True s'il y a un vainqueur, ou si la grille est complète ou si le noeud est de profondeur profondeur_max'''
        pass

    def creer_fils(self, x, y):
        '''Crée un fils en jouant en colonne x hauteur y'''
        pass

    def remonter_score(self, profondeur_max):
        '''remonte les scores selon l'algorithme du minimax avec une profondeur_max d'exploration'''
        pass
        
        return self.score
            
    def meilleur_coup(self, profondeur_max):
        '''renvoie la colonne x permettant d'obtenir le meilleur score'''
        pass

### <span style="text-decoration: underline;color:green;">3. Méthode <span style="font-family:Courier New;font-size: 100%;">est&#95;feuille</span> :</span> ###
Complétez la méthode <span style="font-family:Courier New;font-size: 100%;">est&#95;feuille(self, profondeur&#95;max)</span>.<br>
On considèrera qu'un noeud est une feuille si l'heuristique vaut $\pm\infty$ <strong>ou</strong> si la profondeur du noeud est égal à <span style="font-family:Courier New;font-size: 100%;">profondeur&#95;max</span>.<br>


In [None]:
solution.est_feuille()

### <span style="text-decoration: underline;color:green;">4. Méthode <span style="font-family:Courier New;font-size: 100%;">creer&#95;fils</span> :</span> ###
Complétez la méthode <span style="font-family:Courier New;font-size: 100%;">est&#95;creer&#95;fils(self, x, y)</span>.<br>
Cette méthode <strong>renvoie</strong> et ajoute à la liste <span style="font-family:Courier New;font-size: 100%;">self.fils</span> l'instance <span style="font-family:Courier New;font-size: 100%;">MiniMax</span> obtenue en jouant en colonne d'index <span style="font-family:Courier New;font-size: 100%;">x</span> hauteur <span style="font-family:Courier New;font-size: 100%;">y</span>.<br>


In [None]:
# test de la méthode creer_fils :
from copy import deepcopy
lst_col = grille_vierge()
racine = Noeud(1, lst_col) # le noeud racine est attaquant.
for x in range(7):
    fils = racine.creer_fils(x, 0)
    afficher(racine.fils[x].colonnes)
    print("attaquant:", fils.attaquant)

In [None]:
solution.creer_fils()

### <span style="text-decoration: underline;color:green;">5. Méthode <span style="font-family:Courier New;font-size: 100%;">remonter&#95;score</span>:</span> ###
Complétez la méthode <span style="font-family:Courier New;font-size: 100%;">remonter&#95;score(self, profondeur&#95;max)</span>.<br>
Cette méthode :<br>
&nbsp;&nbsp;&nbsp;&nbsp;→ renvoie le score du noeud en appliquant l'algorithme du minimax<br>
&nbsp;&nbsp;&nbsp;&nbsp;→ ajoute un attribut <span style="font-family:Courier New;font-size: 100%;">score</span> au noeud égal à cette valeur<br>


In [None]:
lst_col = grille_vierge()
racine = Noeud(1, lst_col) # la racine est toujours un noeud attaquant
racine.remonter_score(2)
num_fils = 1
for fils in racine.fils:
    print("le score du fils n°", num_fils, "est :", fils.score)
    afficher(fils.colonnes)
    print("    obtenu en MINIMISANT les petits fils suivants :")
    num_petit_fils = 1
    for petit_fils in fils.fils:
        print("    score petit_fils n°", num_petit_fils, ":", petit_fils.score)
        afficher(petit_fils.colonnes)
        num_petit_fils += 1
    print("#" * 50)
    num_fils += 1
print("\nVoici la liste des scores fils de la racine :", [fils.score for fils in racine.fils])
print("La racine est un noeud attaquant qui les MAXIMISE, pour obtenir un score à un profondeur deux de :", racine.score)

In [None]:
assert racine.remonter_score(1) == 7, "si ordi commence à jouer, score max de 7 après un coup"
assert racine.remonter_score(2) == -3, "si ordi commence à jouer, score max de -3 après deux coup"
assert racine.remonter_score(3) == 9, "si ordi commence à jouer, score max de 9 après trois coup"
assert racine.remonter_score(4) == -2, "si ordi commence à jouer, score max de -2 après quatre coup"

In [None]:
solution.remonter_score()

### <span style="text-decoration: underline;color:green;">6. Méthode <span style="font-family:Courier New;font-size: 100%;">meilleur&#95;coup</span> :</span> ###
Complétez la méthode <span style="font-family:Courier New;font-size: 100%;">meilleur&#95;coup(self, profondeur&#95;max)</span>.<br>
Le principe est simple!<br>
On remonte les scores à la profondeur <span style="font-family:Courier New;font-size: 100%;">profondeur&#95;max</span><br>
On sait que le score du noeud père est égal, soit au maximum, soit au minimum de ses noeuds fils.<br>
En bouclant sur les noeuds fils, on renvoie alors le dernier coup du premier fils qui a un score égal à celui de son père!<br>
Cette méthode renvoie le la colonne <span style="font-family:Courier New;font-size: 100%;">x</span> qui correspond à la colonne où doit jouer l'ordinateur.<br>
<br>
⚠️ Le résultats ci-dessous dépendent évidemment de l'ordre dans lequel on parcourt les fils (de la colonne 0 à la colonne 6 dans notre cas)<br>


In [None]:
lst_col = grille_vierge()
racine = Noeud(1, lst_col)
assert racine.meilleur_coup(1) == 3, "A une profondeur de 1, le meilleur est en colonne 3"
assert racine.meilleur_coup(2) == 1, "A une profondeur de 2, le meilleur est en colonne 1"
assert racine.meilleur_coup(3) == 3, "A une profondeur de 3, le meilleur est en colonne 3"
assert racine.meilleur_coup(4) == 3, "A une profondeur de 2, le meilleur est en colonne 1"

In [None]:
solution.Noeud()

## <span style="text-decoration: underline;color:red;">IV. Match homme-IA:</span> ##
La fonction <span style="font-family:Courier New;font-size: 100%;">match</span> ci-dessous permet d'engager un match contre l'ordinateur.<br>
Testez votre IA!!!<br>


In [None]:
# Match homme - IA :
# Match homme - IA :
def match(prof_max, affichage = 1): # affichage = 1 pour pion de couleur ou 2 pour croix et rond
    pion_ordi = int(input("Qui commence? (Ordi : 1, humain : 2) :"))
    pion_humain = 3 - pion_ordi
    tour_humain = True
    if pion_ordi == 1:
        tour_humain = False
    lst_col = grille_vierge()
    num_joueur = 1
    dic_joueurs = {pion_ordi : "Ordinateur", pion_humain : "Humain"}
    x = None
    while True:
        effacer()
        afficher(lst_col, affichage)
        if x is not None and num_joueur == pion_humain: # on affiche toujours ou vient de jouer Ordi
            print(dic_joueurs[pion_ordi], "a joué en colonne", x)
        if num_joueur == pion_humain: # on interroge humain 
            while True: # on demande un coup valide à l'humain
                x = input("En quelle colonne souhaitez-vous jouer?")
                if x == "q":# On quitte le jeu
                    return
                try: # On détecte les choix invalides (colonne complète, invalide ou erreur de saisie)
                    x = int(x)
                    y = hauteur(x, lst_col)
                    if y != -1:
                        break
                except:
                    print("choix invalide")
            # on actualise la grille :
            lst_col = jouer(x, y, pion_humain, lst_col)
            
        else:
            # ordi joue
            racine = Noeud(pion_ordi, lst_col) # la racine est un noeud attaquant par défaut
            x = racine.meilleur_coup(prof_max)
            y = hauteur(x, lst_col)
            lst_col = jouer(x, y, pion_ordi, lst_col)
        # vainqueur ou nulle?
        if abs(heuristique(lst_col, pion_ordi)) == float("inf"):
            effacer()
            afficher(lst_col, affichage)
            print(dic_joueurs[num_joueur], "gagne!")
            return
        if grille_complete(lst_col):
            effacer()
            afficher(lst_col, affichage)
            print("match nul!")
            return
        num_joueur = 3 - num_joueur        
        
match(4) # match avec une profondeur max de 4