In [1]:
import copy

class Game:
    def __init__(self):
        self.initialize_game()
        
    # Inicijalizacija igre na pocetno stanje
    def initialize_game(self):
        self.current_state = [['.','.','.'],
                              ['.','.','.'],
                              ['.','.','.']]
        
        # Prvi igrac je na potezu
        self.player_turn = 'X'
        
        # samo radi poredjenja brzine sa alfa-beta, inace bespotrebno
        self.broj_poziva = 0
        
    def draw_board(self):
        
        for i in range(0, 3):
            for j in range(0, 3):
                # end se stavlja da ne bi ispisao novi red
                print('{}|'.format(self.current_state[i][j]), end =" ")
            print()        
        print()
        
    def valid(self, px, py):
        if px < 0 or px > 2 or py < 0 or py > 2:
            return False
        elif self.current_state[px][py] != '.':
            return False
        else:
            return True
     
    #ispitivanje da li se doslo do kraja igre
    def kraj(self):
        # jednaki po vertikali
        for i in range(0, 3):
            if (self.current_state[0][i] != '.' and 
                self.current_state[0][i] == self.current_state[1][i] and
                self.current_state[1][i] == self.current_state[2][i]):
                # vracamo ko je pobednik
                return self.current_state[0][i]
            
        #jednaki po horizontali
        for i in range(0, 3):
            # postoji horizontala sa X kao pobednikom
            if (self.current_state[i] == ['X', 'X', 'X']):
                return 'X'
            # ili postoji horizontala sa O kao pobednikom
            elif (self.current_state[i] == ['O', 'O', 'O']):
                return 'O'
            
        #jednaki po glavnoj dijagonali
        if (self.current_state[0][0] != '.' and
            self.current_state[0][0] == self.current_state[1][1] and
            self.current_state[0][0] == self.current_state[2][2]):
            # vracamo ko je pobednik
            return self.current_state[0][0]
        
        #jednaki po sporednoj dijagonali
        if (self.current_state[0][2] != '.' and
            self.current_state[0][2] == self.current_state[1][1] and
            self.current_state[0][2] == self.current_state[2][0]):
             # vracamo ko je pobednik
            return self.current_state[0][2]       
        
        #cela tabela je popunjena (ili postoje prazna polja)
        for i in range(0, 3):
            for j in range(0, 3):
                 # Postoji prazno polje, igra se nastavljam niko nije pobednik
                if (self.current_state[i][j] == '.'):
                    return None
               
        # Nereseno je 
        return '.'
    
    # igrac Max je 'O'
    def Max(self):
        # samo radi poredjenja brzine sa alfa-beta, inace bespotrebno
        self.broj_poziva += 1
        
        # moguce vrednosti su -1 (izgubio), 0 (nereseno) i 1 (pobedio). Najgora moguca vrednost za max je -1 
        # (pa je ovde postavljeno na jos goru, odnosno -2)
        maxv = -2
        px = None
        py = None
        
        rezultat = self.kraj()
        
        # ukoliko je kraj potrebno je da funkcija vrati evaluaciju kraja, 
        # a to moze biti -1 (izgubio), 0 (nereseno) i 1 (pobedio)
        if rezultat == 'X':
            return (-1, _, _)
        elif rezultat == 'O':
            return (1, _, _)
        elif rezultat == '.':
            return (0, _, _)
        
        for i in range(0, 3):
            for j in range(0, 3):
                if self.current_state[i][j] == '.':
                    # na praznom polju 'O' igrac napravi potez i pozove min, to je jedna grana stabla igre
                    self.current_state[i][j] = 'O'
                    m = self.Min()
                    # popravlja se max vrednost ako je potrebno
                    if m > maxv:
                        maxv = m
                        px = i
                        py = j
                    # Vracamo polje ponovo na prazno
                    self.current_state[i][j] = '.'
                    
        return (maxv, px, py)
    
    
    def Min(self):
        # samo radi poredjenja brzine sa alfa-beta, inace bespotrebno
        self.broj_poziva += 1
        
        # moguce vrednosti su -1 (izgubio), 0 (nereseno) i 1 (pobedio). Najgora moguca vrednost za min je 1 
        # (pa je ovde postavljeno na jos goru, odnosno 2)
        minv = 2
        
        rezultat = self.kraj()  
        
        # ukoliko je kraj potrebno je da funkcija vrati evaluaciju kraja, 
        # a to moze biti -1 (izgubio), 0 (nereseno) i 1 (pobedio)
        if rezultat == 'X':
            return -1
        elif rezultat == 'O':
            return 1
        elif rezultat == '.':
            return 0
        
        for i in range(0, 3):
            for j in range(0, 3):
                if self.current_state[i][j] == '.':
                    # na praznom polju 'X' igrac napravi potez i pozove max, to je jedna grana stabla igre
                    self.current_state[i][j] = 'X'
                    (m, max_i, max_j) = self.Max()
                    if m < minv:
                        minv = m
                    # Vracamo polje ponovo na prazno
                    self.current_state[i][j] = '.'
                    
        return minv
    
        
    def play(self):
        
        while True:
            self.draw_board()

            self.rezultat = self.kraj()

            # ukoliko je kraj ispisati odgovarajucu poruku
            if self.rezultat != None:
                if self.rezultat == 'X':
                    print('Pobedio je X')
                elif self.rezultat == 'O':
                    print('Pobedio je O')
                elif self.rezultat == '.':
                    print('Nereseno je')

                print('Broj poziva: {}'.format(self.broj_poziva))
                self.initialize_game()
                return 

            # ako je na potezu igrac X, odnosno covek
            if self.player_turn == 'X':

                while True:
                    px = int(input('Unesi x koordinatu: '))
                    py = int(input('Unesi y koordinatu: '))

                    if self.valid(px, py):
                        self.current_state[px][py] = 'X'
                        self.player_turn = 'O'
                        break;
                    else:
                        print('Potez nije validan')
             
            # ako je na potezu igrac O, odnosno masina
            else:
                (m, px, py) = self.Max()
                self.current_state[px][py] = 'O'
                self.player_turn = 'X'
                
    def Max_alfa_beta(self, alfa, beta):
        # samo radi poredjenja brzine sa alfa-beta, inace bespotrebno
        self.broj_poziva += 1
        
        maxv = -2
        px = None
        py = None
        
        rezultat = self.kraj()
        
        if rezultat == 'X':
            return (-1, _, _)
        elif rezultat == 'O':
            return (1, _, _)
        elif rezultat == '.':
            return (0, _, _)
        
        for i in range(0, 3):
            for j in range(0, 3):
                if self.current_state[i][j] == '.':
                    self.current_state[i][j] = 'O'
                    m = self.Min_alfa_beta(alfa, beta)
                    if m > maxv:
                        maxv = m
                        px = i
                        py = j
                    self.current_state[i][j] = '.'
                    
                    # naredna dva reda su jedine izmene u odnosu na minimax.
                    if maxv >= beta:
                        return (maxv, _, _)
                    
                    if maxv > alfa:
                        alfa = maxv
                    
        return (maxv, px, py)
    
    def Min_alfa_beta(self, alfa, beta):
        # samo radi poredjenja brzine sa alfa-beta, inace bespotrebno
        self.broj_poziva += 1
        
        minv = 2
        
        rezultat = self.kraj()  
        
        if rezultat == 'X':
            return -1
        elif rezultat == 'O':
            return 1
        elif rezultat == '.':
            return 0
        
        for i in range(0, 3):
            for j in range(0, 3):
                if self.current_state[i][j] == '.':
                    self.current_state[i][j] = 'X'
                    (m, max_i, max_j) = self.Max_alfa_beta(alfa, beta)
                    if m < minv:
                        minv = m
                    self.current_state[i][j] = '.'
                    
                    # naredna dva reda su jedine izmene u odnosu na minimax.
                    if minv <= alfa:
                        return minv
                    
                    if minv < beta:
                        beta = minv
                    
        return minv
                
    
    def play_alfa_beta(self):
        
        while True:
            self.draw_board()

            self.rezultat = self.kraj()

            if self.rezultat != None:
                if self.rezultat == 'X':
                    print('Pobedio je X')
                elif self.rezultat == 'O':
                    print('Pobedio je O')
                elif self.rezultat == '.':
                    print('Nereseno je')

                print('Broj poziva: {}'.format(self.broj_poziva))
                self.initialize_game()
                return 

            if self.player_turn == 'X':

                while True:
                    px = int(input('Unesi x koordinatu: '))
                    py = int(input('Unesi y koordinatu: '))

                    if self.valid(px, py):
                        self.current_state[px][py] = 'X'
                        self.player_turn = 'O'
                        break;
                    else:
                        print('Potez nije validan')
                        
            else:
                (m, px, py) = self.Max_alfa_beta(-2, 2)
                self.current_state[px][py] = 'O'
                self.player_turn = 'X'
                    
        

In [2]:
g = Game()
g.play()

.| .| .| 
.| .| .| 
.| .| .| 

Unesi x koordinatu: 0
Unesi y koordinatu: 0
X| .| .| 
.| .| .| 
.| .| .| 

X| .| .| 
.| O| .| 
.| .| .| 

Unesi x koordinatu: 1
Unesi y koordinatu: 0
X| .| .| 
X| O| .| 
.| .| .| 

X| .| .| 
X| O| .| 
O| .| .| 

Unesi x koordinatu: 0
Unesi y koordinatu: 1
X| X| .| 
X| O| .| 
O| .| .| 

X| X| O| 
X| O| .| 
O| .| .| 

Pobedio je O
Broj poziva: 60670


In [3]:
g.play_alfa_beta()

.| .| .| 
.| .| .| 
.| .| .| 

Unesi x koordinatu: 0
Unesi y koordinatu: 0
X| .| .| 
.| .| .| 
.| .| .| 

X| .| .| 
.| O| .| 
.| .| .| 

Unesi x koordinatu: 1
Unesi y koordinatu: 0
X| .| .| 
X| O| .| 
.| .| .| 

X| .| .| 
X| O| .| 
O| .| .| 

Unesi x koordinatu: 0
Unesi y koordinatu: 1
X| X| .| 
X| O| .| 
O| .| .| 

X| X| O| 
X| O| .| 
O| .| .| 

Pobedio je O
Broj poziva: 2518
