# MiniMax algoritmus - a tökéletesen játszó robot
* Megnézzük, mi az a MiniMax algoritmus?
* Megértjük, miért játszik tökéletesen.

In [1]:
from IPython.display import HTML, display
from tic_tac_toe.Tabla import Tabla, JatekEredmeny, X, O, URES
from tic_tac_toe.util import mutasd_meg, play_game, elo_jatek
from tic_tac_toe.VeletlentLepoRobot import VeletlentLepoRobot

tabla = Tabla()
player1 = VeletlentLepoRobot()
player2 = VeletlentLepoRobot()

result = play_game(tabla, player1, player2)
mutasd_meg(tabla)

if result == JatekEredmeny.X_NYERT:
    print("X nyert")
elif result == JatekEredmeny.O_NYERT:
    print("O nyert")
else:
    print("Döntetlen")

   0  1  2
0  o  x  o
1  x  x  x
2  o  o  x
X nyert


## Mi az a minimax algoritmus?

Röviden:  
Egy statisztikában, játékelméletben használatos döntési szabály / döntési elv.
Két szempontra épül, mi alapján döntünk egy lépés mellett:
* minimalizáljuk a maximális veszteséget
* maximalizáljuk a minimális nyereséget

In [None]:
pelda_allas = Tabla([X   , URES  , X,
                     O   , O     , X,
                     URES, URES  , O])
mutasd_meg(pelda_allas)

### Lehetséges folytatások (O következik)

![title](./Images/TicTacToe-MinMax-Example1.png)

### Felváltva lépünk, az én körömben maximalizálni szeretném a legrosszabb lépésem értékét, az ellenfél körében azt figyelem, hogy a lehető legrosszabb legyen a legjobb lépése:
![title](./Images/TicTacToe-MinMax-Example2.png)

Miután végigpásztáztuk a lehetséges folytatásokat, felcímkézzük a befejezett játékokat (ágakat) a saját szempontunkból (O-val vagyunk)
* 1 pont a győzelem
* -1 pont a veszteség
* 0 pont döntetlenért

![title](./Images/TicTacToe-MinMax-Example3.png)

Most pedig a MiniMax elv alapján "alulról felfelé" elkezdjük a számokat "felvinni" a középső sorba

![title](./Images/TicTacToe-MinMax-Example4.png)

Ismételjük a folyamatot, most a középső sorból a felső sorba visszük a számokat. Előző körben Maximalizáltunk, most Minimalizálni szeretnénk (mert ez az ellenfél köre)

![title](./Images/TicTacToe-MinMax-Example5.png)

Végül, a legfelső réteggel is ismételjük. Megint a maximum értékkel dolgozunk, mert ez a mi körünk

![title](./Images/TicTacToe-MinMax-Example6.png)

Megvan minden információ ahhoz, hogy tudjunk dönteni a lépések között:

* A legjobb kimenetel döntetlen, ha mindkét fél jól játszik (felső sorban a legnagyobb szám 0)

* A lehetőségek közül csak egy van, ami 0-hoz, azaz döntetlenhez vezet, ezért kénytelenek vagyunk azt lépni

## Próbáljuk ki működés közben
Két MiniMaxot használó robot programja már meg van írva a fentiek alapján:
* MiniMaxRobot: a fenti logikát alkalmazza, ha több azonos értékű lépés is van, az elsőt választja
* MiniMaxRobot2: a fenti logikát alkalmazza, ha több azonos értékű lépés is van, véletlenszerűen választ

Nézzünk meg egy-egy meccset, aztán versenyeztessük őket sok játékon át.

## MiniMaxRobot(X) vs. VéletlentLépő Robot(O)

In [None]:
from tic_tac_toe.MiniMaxRobot import MiniMaxRobot
from tic_tac_toe.VeletlentLepoRobot import VeletlentLepoRobot
from util import mutasd_meg, play_game, elo_jatek

elo_jatek(Tabla(), MiniMaxRobot(), VeletlentLepoRobot())

In [None]:
from tic_tac_toe.Jatekos import Jatekos
from ipywidgets import IntProgress
from IPython.display import display



def versenyezzenek_hatterben(player1: Jatekos, player2: Jatekos, num_games: int = 1000):
    f = IntProgress(min=0, max=num_games)
    display(f)
    tabla = Tabla()
    draw_count = 0
    cross_count = 0
    naught_count = 0
    for _ in range(num_games):
        f.value += 1
        result = play_game(tabla, player1, player2)
        if result == JatekEredmeny.X_NYERT:
            cross_count += 1
        elif result == JatekEredmeny.O_NYERT:
            naught_count += 1
        else:
            draw_count += 1

    print("{} játék után döntetlen: {}, X nyert: {}, és O nyert: {}.".format(num_games, draw_count,
                                                                                         cross_count, naught_count))

    print("Arányokban: döntetlen: {:.2%}, X: {:.2%}, O:  {:.2%}".format(
        draw_count / num_games, cross_count / num_games, naught_count / num_games))

versenyeztessük a MiniMax és a Véletlent Lépő robotot sokszor, és megszámoljuk ki hányszor nyer!

In [None]:
from tic_tac_toe.MiniMaxRobot import MiniMaxRobot

versenyezzenek_hatterben(MiniMaxRobot(), VeletlentLepoRobot())

Most fordítva, a Véletlent lépő kezd!

In [None]:
versenyezzenek_hatterben(VeletlentLepoRobot(), MiniMaxRobot())

A két MiniMax típusú játékos egymás ellen

In [None]:
from tic_tac_toe.MiniMaxRobot2 import MiniMaxRobot2

versenyezzenek_hatterben(MiniMaxRobot(), MiniMaxRobot2())

## Kérdés

Mennyire intelligens a MiniMax játékos?