# Metody hraní her
**Autor**: Jan Hrbotický

## Teorie

### Hra

Hru definujeme jako **strukturovanou formu aktivity** obvykle určenou pro pobavení, předvedení či vzdělávání.

## Historie

* Historicky byl obor hraní her (a teorie her obecně) založena v době válek pro různé simulace.
* Například simulace náletu pro analýzu proveditelnosti a rizika, simulace vylodění atp. 

# Metody hraní her v umělé inteligenci


Hraní her v oblasti umělé inteligence je velmi důležité a proti lidskému mozku má výpočetní technika velkou spoustu výhod.
* Počítač je totiž schopen řešit efektivně komplikované situace s velkým množstvím kombinací a vstupů
    * **příklad**: Mějme hru NIM. Ta spočívá v tom, že existuje zásoba sirek (v tomto případě například 12). Dva hráči poté střídavě odebírají sirky v množství 1-3, které si pro každý tah zvolí. Ten hráč, který sebere poslední sirku, **vyhrává**.  Hráč, který začíná (a předpokládáme, že v žádném svém tahu neudělá chybu), vždy vyhraje. Nyní si zkuste v hlavě představit a vydedukovat **co nejrychleji**, kolik sirek musíte v prvním tahu vzít abyste mohli na konci vyhrát. 
    * Jedná se o velmi triviální hru, a i tak není pro lidský mozek úplně snadné si představit všechny různé scénáře a vybrat z nich ten, který vede k vaší výhře. Toto počítač zvládne vyřešit ve zlomku sekundy.
* Počítač nerozhodí žádné vnější vlivy, které by rozhodily člověka (například stress)

Tak, jako všude jinde, jsou tady ovšem i nevýhody
* Počítač je hráčem, který pro každý svůj tah zkoumá co nejvíce možných scénářů (pokud to okolnosti umožňují, prozkoumá všechny možnosti) a snaží se vybrat ten, který je pro něj nejvhodnější. To je na jednu stranu obrovská výhoda, na druhou stranu, tato metodu funguje v případě, že jeho lidský protějšek hraje racionálně. Počítač totiž očekává, že soupeř bude hrát tak, že využije vždy pro něj nejlepší tah. Pokud to ovšem protihráč neudělá (ať už záměrně nebo nezáměrně), může stroj velmi snadno "překvapit".
* Má obvykle malou nebo žádnou znalost strategie. Bavíme-li se o hrách, kde počítač nemá možnost (ať už se jedná o nedostatek času nebo nedostatek výkonu) prozkoumat celý stavový prostor, volí svůj tah nejvýhodněji pro daný časový okamžik. Lidský protivník ovšem může razit strategii, která se nyní zdá jako velmi nevýhodná, v určité fázi hry ovšem může vést k vítězství.

## Algoritmy hraní her

Hraní her je úzce spjato s prohledáváním stavového prostoru.
Jak již bylo řečeno výše, počítač se obvykle snaží prozkoumat všechny různé varianty tahů tak, aby byl schopen si vybrat ten nejlepší, přičemž ve svých predikcích často "přemýšlí" o tom, jak v dané konstelaci hry zahraje soupeř. A dost podobně také hraje většina lidských soupeřů, tedy přemýšlí, jaká bude reakce soupeře pokud zvolí zrovna tento jeden tah.

### Rozdělení algoritmů

1. Algoritmy, které prohledávají **celý stavový prostor** do určité hloubky
    * Hloubka může být taktéž rovna výšce grafu, tedy prohledáváme celý stavový prostor.
    * Omezení hloubky má většinou za přičinu to, že stroj nemá dostatečný čas na to, aby mohl nasimulovat všechny možné tahy až do terminální fáze.
    * Vezmeme-li si například *královskou hru*, šachy, v jedné šachové partii je více možných tahů než je atomů v pozorovatelném vesmíru, konkrétně tedy asi 10^120 možných unikátních partií. V tomto případě je pro počítač nemožné v nějakém rozumném čase zjistit tah, který je úplně nejlepší.
2. Algoritmy prohledávající **jen vyhovující část** stavového prostoru.
    * Takový algoritmus samozřejmě musí mít informace o tom, že některé tahy v partii s největší pravděpodobností povedou k prohře a nemá smysl tuto část stavového prostoru dále prohledávat a vyhrazený čas je lepší použít na hlubší prozkoumání atraktivnějších tahů. Tyto znalosti může stroj získat například pozorováním partií dvou lidských hráčů či studiem specifik hry.
3. Cílově orientované algoritmy
    * Algoritmus hledá pouze jeden specifický cíl (slouží například jako podpůrný algoritmus pro jiný, který prohledává stavový prostor a za pomocí těchto dat lze jeho prohledávání optimalizovat)
    
    
### Klíčové otázky
#### 1. Je řešení dobré?
    * Chci kterékoli řešení?
        * Pokud mi stačí, že "vyhraji" a to jakkýmkoli způsobem, lze využít heuristiku a pomocí ní najít první nalezené řešení.
    * Chci nejlepší řešení?
        * Pokud chci z nějakého důvodu najít nejlepší řešení (například totální devastace protistrany pro ukázku síly), musím prohledat celý stavový prostor.
#### 2. Mohu vrátit tah?
    * Ano - například pro některé implementace hry 2048 (dáme možnost hráči během celé hry vrátit několik tahů)
    * Ne - například šachy, hra NIM
#### 3. Máme jistý vstup?
    * Ano - například šachy, hra NIM
    * Ne - poker

### Počítač versus člověk
* Jak již bylo zmíněno výše, počítač má řadu výhod, ale také řadu nevýhod, kterých dokáží lidé využít. S nárůstem výkonu počítačů jsou ovšem stroje schopné své výhody maximalizovat natolik, že lidský mozek prostě nemá šanci.
    * Dlouhou dobu byla hra **Go** považována za "poslední baštu" lidského umu v *jistých hrách*. V roce 2016 ovšem došlo k tomu, že počítačový program *AlphaGo* vyvinutý Googlem porazil lidského protivníka, mistra světa v této hře Lee Sedola drtivě 3:0. Počítač v této hře (stejně tak jako třeba v Šachu) nemůže používat brute force, zatím na to nemá dostatek výkonu. Program totiž využívá složitý algoritmus, který zapojuje strojové učení a analýzu předchozích her. Takto natrénový program poté nedal svému lidskému protivníkovi žádnou šanci.
    * Po této zkušenosti už zůstaly jen hry s nejistým vstupem. Douhou dobu se hovořilo o tom, že třeba takový Poker má tolik neurčitých vstupů a tak složité mimoherní mechanizmy (blafování, učení se od spoluhráčů, zkoumání chování, ...), že ještě dlouhou dobu nebude možné člověka porazit. Ani né o rok pozděj stroj Libratus zkontruovaný na univerzitě Corneige Mellon ve 20denním maratonu ve Philladelfii vydělal téměř 2 miliony dolarů tím, že se postavil proti 4 profesionálním hráčům a porazil je.


### Algoritmy prohledávání stavového prostoru pro hry dvou hráčů s úplnou informací
* Jedná se o hry, kde má každý z hráčů **všechny informace o hře a jejím současném stavu** (například výše zmíněná hra NIM)
* Taková informace se nazývá **pozice**. Obsahuje navíc údaj, který hráč je na tahu
* Abychom mohli informace o hře a možných tazích získat, potřebujeme znát pravidla. Pravidla určují všechny možné (přípustné) tahy pro hráče, který je právě na řadě. Pravidla by taktéž měla zajistit, aby nedošlo k nekonečné hře (pro každou pozici existuje cesta k závěrečné pozici)
* Krokem hry pak rozumíme činnost, při které si hráč, který je právě na řadě. Hráči se v krocích střídají tak dlouho, dokud se nedostaneme do **závěrečné pozice** (výhra hráče A, prohra hráče B či remíza)

#### Znázornění hry
* Hra je znázorněna stromem, kde
    * **uzel** reprezentuje jednotlivou pozici
    * **hrana** reprezentuje přípustný tah
    * **list** odpovídá koncovému stavu hry   
* Například
 ![Graf hry](./assets/images/graph.png)
 
 
### Výpočet ohodnocení
 * Volba heuristiky a výpočtu ohodnocení je velmi důležitá část implementace algoritmu. Je třeba volit takový výpočet, který bude reflektovat realitu a pravidla
 * Vezmeme-li si jako příklad hru Tic-Tac-Toe, což je ve své podstatě hra Piškvorky omezená na pole 3x3 (Dva hráči se střídají při vyplňování pole a cílem hráče je spojit symboly na diagonále, v řádku nebo ve sloupci), můžeme vzít pro výpočet ohodnocení:
 f(n) = počet kompletních řádků, sloupců a diagonál, které může hráč A ještě vyplnit - počet kompletních řádků, sloupců a diagonál, které může vyplnit hráč B
     * Například v situaci
     ![Tic-Tac-Toe hra](./assets/images/tic-tac-toe.png)
     * Má hráč A (kolečko) možnost vyplnit: 
         * První a poslední řádek, první a druhý sloupec, hlavní a vedlejší diagonálu = 6
     * Hráč B (křížek) má možnost vyplnit:
         * Druhý a poslední řádek, první a poslední sloupec, hlavní a vedlejší diagonálu = 6
     * Ohodnocení uzlu tedy bude **0**
                              
 
#### Minimax
 
 * Používá ohodnocení uzlů, které pak používá pro rozhodnutí, kterou cestou se vydat.
 * Ohodnocení uzlů může být určenou kteroukoli heuristikou, zpravidla se vyjadřuje pravděpodobnost, s jakou lze ve hře a tímto tahem dosáhnout vítězství či počet možných různých tahů vedoucí k vítězství.
 * Na úrovni hráče (říkejme mu hráč A) proto vybíráme **maximum** (hráč A chce co největší pravděpodobnost/ počet tahů vedoucí k vítězství)
 * Na úrovni protihráče (říkejme mu hráč B) proto vybíráme **minimum** (hráč B chce to nejmenší pravděpodobnost že hráč B vyhraje/ co nejmenší počet možných tahů pro jeho výhru)
 * Minimax můžeme omezit do určité hloubky (tedy vidí jen na X kroků dopředu)
 * **Pseudokód**
 
       function minimax(position, depth)
       if (position is leaf OR depth = 0)
           return leaf_value(position)
       else 
           value = -inf
           for all child of position do
               value = max(value, -minimax(child, depth -1)
           end for
           return value
       end if
       end function
       
       function leaf_value(position)
       if is_loss(position)
           return -MAX
       else if is_win(position)
           return MAX
       else
           // draw
           return 0
       end if
            
  * Například:
     ![Minimax graf](./assets/images/minimax.png)
  
##### Praktický příklad: Tic-Tac-Toe s minimaxem
     

In [1]:
import time

class Game:
    def __init__(self):
        self.initialize_game()

    def initialize_game(self):
        self.current_state = [[' ',' ',' '],
                              [' ',' ',' '],
                              [' ',' ',' ']]

        # Player X always plays first
        self.player_turn = 'X'

    def draw_board(self):
        print('X/Y| 0 | 1 | 2 |')
        print('----------------')
        for i in range(0, 3):
            print('', i, '|', end='')
            for j in range(0, 3):
                print(' {} |'.format(self.current_state[i][j]), end="")
            print()
            print('----------------')
        print()
    
    def is_valid(self, px, py):
        if px < 0 or px > 2 or py < 0 or py > 2:
            return False
        elif not self.current_state[px][py].isspace():
            return False
        else:
            return True
    
    def is_end(self):
        # Vertical win
        for i in range(0, 3):
            if (not self.current_state[0][i].isspace() and
                self.current_state[0][i] == self.current_state[1][i] and
                self.current_state[1][i] == self.current_state[2][i]):
                return self.current_state[0][i]

        # Horizontal win
        for i in range(0, 3):
            if (self.current_state[i] == ['X', 'X', 'X']):
                return 'X'
            elif (self.current_state[i] == ['O', 'O', 'O']):
                return 'O'

        # Diagonal win
        if (not self.current_state[0][0].isspace() and
            self.current_state[0][0] == self.current_state[1][1] and
            self.current_state[0][0] == self.current_state[2][2]):
            return self.current_state[0][0]

        # Reverse diagonal win check
        if (not self.current_state[0][2].isspace() and
            self.current_state[0][2] == self.current_state[1][1] and
            self.current_state[0][2] == self.current_state[2][0]):
            return self.current_state[0][2]

        # Full board
        for i in range(0, 3):
            for j in range(0, 3):
                # There is at least one more possibility to play
                if (self.current_state[i][j].isspace()):
                    return None

        # Tie
        return ' '
    
    def max(self):
        maxv = -2
        px = None
        py = None

        result = self.is_end()
        
        if result == 'X':
            return (-1, 0, 0)
        elif result == 'O':
            return (1, 0, 0)
        elif result is not None and result.isspace():
            return (0, 0, 0)

        for i in range(0, 3):
            for j in range(0, 3):
                # Simulating picking this field and call min
                if self.current_state[i][j].isspace():
                    self.current_state[i][j] = 'O'
                    (m, min_i, min_j) = self.min()
                    # If ve found better way
                    if m > maxv:
                        maxv = m
                        px = i
                        py = j
                    # Reverting move
                    self.current_state[i][j] = ' '
        return (maxv, px, py)
    
    def min(self):
        minv = 2
        qx = None
        qy = None

        result = self.is_end()

        if result == 'X':
            return (-1, 0, 0)
        elif result == 'O':
            return (1, 0, 0)
        elif result is not None and result.isspace():
            return (0, 0, 0)

        for i in range(0, 3):
            for j in range(0, 3):
                if self.current_state[i][j].isspace():
                    self.current_state[i][j] = 'X'
                    (m, max_i, max_j) = self.max()
                    if m < minv:
                        minv = m
                        qx = i
                        qy = j
                    self.current_state[i][j] = ' '

        return (minv, qx, qy)
    
    def play(self):
        while True:
            self.draw_board()
            self.result = self.is_end()

            if self.result != None:
                if self.result == 'X':
                    print('The winner is Human!')
                elif self.result == 'O':
                    print('The winner is AI!')
                elif self.result.isspace():
                    print("It's a tie!")
                else:
                    print("Error terminal state!")

                self.initialize_game()
                return

            # Player
            if self.player_turn == 'X':

                while True:

                    start = time.time()
                    (m, qx, qy) = self.min()
                    end = time.time()
                    print('Evaluation time: {}s'.format(round(end - start, 7)))
                    print('Recommended move: X = {}, Y = {}'.format(qx, qy))

                    px = int(input('Insert the X: '))
                    py = int(input('Insert the Y: '))

                    (qx, qy) = (px, py)

                    if self.is_valid(px, py):
                        self.current_state[px][py] = 'X'
                        self.player_turn = 'O'
                        break
                    else:
                        print('Invalid move')

            # AI
            else:
                (m, px, py) = self.max()
                self.current_state[px][py] = 'O'
                self.player_turn = 'X'
                
def main():
    g = Game()
    g.play()

if __name__ == "__main__":
    main()

X/Y| 0 | 1 | 2 |
----------------
 0 |   |   |   |
----------------
 1 |   |   |   |
----------------
 2 |   |   |   |
----------------

Evaluation time: 2.462707s
Recommended move: X = 0, Y = 0
Insert the X: 0


KeyboardInterrupt: Interrupted by user

##### Praktický příklad: hra NIM s minimaxem

In [None]:
class NimGame:
    def __init__(self, n):
        self.n = n

    def startState(self):
        return self.n

    def isEnd(self, state):
        return True if state == 0 else False

    def utility(self, state, player):
        if state == 0:
            if player == 1:
                # you lost
                return float('-inf')
            else:
                # you won!
                return float('+inf')

    def actions(self, state):
        if state >= 3:
            return [1,2,3]
        return range(1, state+1)

    def successor(self, state, action):
        if action > state:
            return 0
        return state - action


def minimax(game, state, player):
    def recurse(state, player):

        if game.isEnd(state) == True:
            return (game.utility(state, player), None)

        # Recursively loop after all children nodes and find best move
        choices = [(recurse(game.successor(state, action), -1*player)[0], action) for action in game.actions(state)]

        if player == +1:
            val = max(choices)
        else:
            val = min(choices)

        return val

    # Starting point
    value, action = recurse(state, player)
    return (value, action)


if __name__ == "__main__":
    while True:
        heapSize = int(input("How many sticks are on the heap? "))
        if heapSize > 1:
            break;
        print("Number of sticks has to be greater than 1. Try again")
        
    game = NimGame(heapSize)

    state = game.startState()
    while (state > 0):
        action = 0
        print("Current numbers of sticks on heap: {}".format(state))
        while True: 
            action = int(input("Choose action [1,2,3]: "))
            if (action in [1,2,3]) and state - action >= 0:
                break
            print("Invalid move. Try again.")

        state -= action
        if state == 0:
            print("You won!")
            break
        val, act = minimax(game, state, 1)
        state -= act
        print("AI takes {} stick(s) from heap. Current state is {}".format(act, state))
        if state == 0:
            print("You Lost!")


 #### Alfa-beta
 * Jedná se o obdobu minimaxu s tím rozdílem, že pokud víme, že některá větev je špatná (resp. horší než doposud nejlepší nalezená větev), nemusíme ji už procházet. Víme totiž, že pro nás není relevantní a soupeř by se jí (opět, budeme-li předpokládat racionální chování) mohl bez obtíží vyhnout.
 * Tím dojde k tomu, že ušetříme nějaký čas, který můžeme využít například k hlubšímu prohledávání stavového prostoru, což může mít za následek optimalizaci nejvhodnějšího tahu
 * **Pseudokód**
 
       function alphabeta(position, depth, apha, beta, maximizing)
       if (position is leaf OR depth = 0)
           return leaf_value(position)
       else if maximizing
           value = -inf
           for all child of position do
               value = max(value, alphabeta(child, depth -1, alpha, beta, false)
               alpha = max(alpha, value)
               if (alpha >= beta)
                   // beta cut
                   break 
                end if
            end for
            return value
       else 
           value = inf
           for all child of position do
               value = min(value, alphabeta(child, depth -1, alpha, beta, true)
               beta = min(beta, value)
               if (alpha >= beta)
                   // alpha cut
                   break 
                end if
            end for
            return value
        end if
       
               
  * Například:
     ![Alfabeta graf](./assets/images/alphabeta.png)
  * **POZOR**: To, že bude zpracování proti minimaxu optimálnější nemusí být vždy pravda. Předpokládejme, že ve výše zmíněném případě by byly uzly (a případně jejich potomci) přeskládani do jiného pořadí. Pak by v určité konstelaci nemuselo k žádnému řezu dojít a algoritmus alfa-beta by se choval stejně jako minimax. 
  

##### Praktický příklad: Tic-Tac-Toe s alfa-betou

In [2]:
import time

class Game:
    def __init__(self):
        self.initialize_game()

    def initialize_game(self):
        self.current_state = [[' ',' ',' '],
                              [' ',' ',' '],
                              [' ',' ',' ']]

        # Player X always plays first
        self.player_turn = 'X'
        
        self.beta_cut_count = 0
        self.alpha_cut_count = 0

    def draw_board(self):
        print('X/Y| 0 | 1 | 2 |')
        print('----------------')
        for i in range(0, 3):
            print('', i, '|', end='')
            for j in range(0, 3):
                print(' {} |'.format(self.current_state[i][j]), end="")
            print()
            print('----------------')
        print()
    
    def is_valid(self, px, py):
        if px < 0 or px > 2 or py < 0 or py > 2:
            return False
        elif not self.current_state[px][py].isspace():
            return False
        else:
            return True
    
    def is_end(self):
        # Vertical win
        for i in range(0, 3):
            if (not self.current_state[0][i].isspace() and
                self.current_state[0][i] == self.current_state[1][i] and
                self.current_state[1][i] == self.current_state[2][i]):
                return self.current_state[0][i]

        # Horizontal win
        for i in range(0, 3):
            if (self.current_state[i] == ['X', 'X', 'X']):
                return 'X'
            elif (self.current_state[i] == ['O', 'O', 'O']):
                return 'O'

        # Diagonal win
        if (not self.current_state[0][0].isspace() and
            self.current_state[0][0] == self.current_state[1][1] and
            self.current_state[0][0] == self.current_state[2][2]):
            return self.current_state[0][0]

        # Reverse diagonal win check
        if (not self.current_state[0][2].isspace() and
            self.current_state[0][2] == self.current_state[1][1] and
            self.current_state[0][2] == self.current_state[2][0]):
            return self.current_state[0][2]

        # Full board
        for i in range(0, 3):
            for j in range(0, 3):
                # There is at least one more possibility to play
                if (self.current_state[i][j].isspace()):
                    return None

        # Tie
        return ' '
    
    def max(self, alpha, beta):
        maxv = -2
        px = None
        py = None

        result = self.is_end()
        
        if result == 'X':
            return (-1, 0, 0)
        elif result == 'O':
            return (1, 0, 0)
        elif result is not None and result.isspace():
            return (0, 0, 0)

        for i in range(0, 3):
            for j in range(0, 3):
                # Simulating picking this field and call min
                if self.current_state[i][j].isspace():
                    self.current_state[i][j] = 'O'
                    (m, min_i, min_j) = self.min(alpha, beta)
                    # If ve found better way
                    if m > maxv:
                        maxv = m
                        px = i
                        py = j
                    # Reverting move
                    self.current_state[i][j] = ' '
                    
                    if maxv >= beta:
                        return (maxv, px, py)
                    else:
                        self.beta_cut_count += 1
                    
                    if maxv > alpha:
                        alpha = maxv
                        
        return (maxv, px, py)
    
    def min(self, alpha, beta):
        minv = 2
        qx = None
        qy = None

        result = self.is_end()

        if result == 'X':
            return (-1, 0, 0)
        elif result == 'O':
            return (1, 0, 0)
        elif result is not None and result.isspace():
            return (0, 0, 0)

        for i in range(0, 3):
            for j in range(0, 3):
                if self.current_state[i][j].isspace():
                    self.current_state[i][j] = 'X'
                    (m, max_i, max_j) = self.max(alpha, beta)
                    if m < minv:
                        minv = m
                        qx = i
                        qy = j
                    self.current_state[i][j] = ' '
                    
                    if minv <= alpha:
                        return (minv, qx, qy)
                    else:
                        self.alpha_cut_count += 1

                    if minv < beta:
                        beta = minv

        return (minv, qx, qy)
    
    def play(self):
        while True:
            self.draw_board()
            self.result = self.is_end()
            self.beta_cut_count = 0
            self.alpha_cut_count = 0

            if self.result != None:
                if self.result == 'X':
                    print('The winner is Human!')
                elif self.result == 'O':
                    print('The winner is AI!')
                elif self.result.isspace():
                    print("It's a tie!")
                else:
                    print("Error terminal state!")

                self.initialize_game()
                return

            # Player
            if self.player_turn == 'X':

                while True:

                    start = time.time()
                    (m, qx, qy) = self.min(-2, 2)
                    end = time.time()
                    print('Evaluation time: {}s'.format(round(end - start, 7)))
                    print('Recommended move: X = {}, Y = {}'.format(qx, qy))

                    px = int(input('Insert the X: '))
                    py = int(input('Insert the Y: '))

                    (qx, qy) = (px, py)

                    if self.is_valid(px, py):
                        self.current_state[px][py] = 'X'
                        self.player_turn = 'O'
                        break
                    else:
                        print('Invalid move')

            # AI
            else:
                (m, px, py) = self.max(-2, 2)
                self.current_state[px][py] = 'O'
                self.player_turn = 'X'
                
            print('Number of alpha cuts: {}, Number of beta cuts: {}'.format(self.alpha_cut_count, self.beta_cut_count))
                
def main():
    g = Game()
    g.play()

if __name__ == "__main__":
    main()

X/Y| 0 | 1 | 2 |
----------------
 0 |   |   |   |
----------------
 1 |   |   |   |
----------------
 2 |   |   |   |
----------------

Evaluation time: 0.121995s
Recommended move: X = 0, Y = 0
Insert the X: 0
Insert the Y: 0
Number of alpha cuts: 6138, Number of beta cuts: 3978
X/Y| 0 | 1 | 2 |
----------------
 0 | X |   |   |
----------------
 1 |   |   |   |
----------------
 2 |   |   |   |
----------------

Number of alpha cuts: 702, Number of beta cuts: 621
X/Y| 0 | 1 | 2 |
----------------
 0 | X |   |   |
----------------
 1 |   | O |   |
----------------
 2 |   |   |   |
----------------

Evaluation time: 0.0059996s
Recommended move: X = 0, Y = 1
Insert the X: 0
Insert the Y: 1
Number of alpha cuts: 361, Number of beta cuts: 138
X/Y| 0 | 1 | 2 |
----------------
 0 | X | X |   |
----------------
 1 |   | O |   |
----------------
 2 |   |   |   |
----------------

Number of alpha cuts: 22, Number of beta cuts: 23
X/Y| 0 | 1 | 2 |
----------------
 0 | X | X | O |
------------

## Existující knihovny v pythonu pro hraní her

### Nashpy
* https://nashpy.readthedocs.io/
* Jedná se o knihovnu, skrze kterou lze namodelovat složitější hry. Knihovna dovoluje dokonce i určitou formu **učení**, kdy se algoritmus sám zdokonaluje podle zkušeností, které získal z předchozích her
* Pro praktické úkázky jednoduchých algoritmů (minimax, alfa-beta) se ovšem nejedná o příliš vhodný nástroj. Algoritmy jsou tak jednoduché, že využívat na ně knihovny je zbytečné

### Gambit
* http://www.gambit-project.org/gambit15/pyapi.html
* Sata nástrojů pro teorii her. Obsahuje Python API pro využívání tohoto nástroje. 
* Tak, jako u Nashpy by pro naše jednoduché příklady bylo studium knihoven a nastavování všech potřebných součástí zdlouhavější než implementace jednoduchých algoritmů vlastní cestou

# Zdroje


* [1] [online]. Václav Matoušek, Dostupné z: https://www.kiv.zcu.cz/studies/predmety/uir/predn/P2/FThema2_hry.pdf
* [2] GitHub - derbedhruv/nimgame1: Simple 2-player nim game (subtraction game) using minmax algorithm. GitHub: Where the world builds software · GitHub [online]. Copyright © 2020 GitHub, Inc. [cit. 21.10.2020]. Dostupné z: https://github.com/derbedhruv/nimgame1
* [3] Minimax with Alpha-Beta Pruning in Python. Stack Abuse [online]. Copyright © 2020, [cit. 21.10.2020]. Dostupné z: https://stackabuse.com/minimax-and-alpha-beta-pruning-in-python/
* [4] Game theory - Wikipedia. [online]. Dostupné z: https://en.wikipedia.org/wiki/Game_theory
* [5] Minimax Algorithm in Game Theory | Set 1 (Introduction) - GeeksforGeeks. GeeksforGeeks | A computer science portal for geeks [online]. Dostupné z: https://www.geeksforgeeks.org/minimax-algorithm-in-game-theory-set-1-introduction/
* [6] Minimax Algorithm in Game Theory | Set 4 (Alpha-Beta Pruning) - GeeksforGeeks. GeeksforGeeks | A computer science portal for geeks [online]. Dostupné z: https://www.geeksforgeeks.org/minimax-algorithm-in-game-theory-set-4-alpha-beta-pruning/?ref=lbp