# Algoritmo MiniMax con Alfa-Beta Pruning

In [1]:
import time
import numpy as np

class Game:
    def __init__(self):
        self.initialize_game()

    def initialize_game(self):
        self.current_state = [['.','.','.'],
                              ['.','.','.'],
                              ['.','.','.']]

        # Il giocatore X gioca sempre per primo
        self.player_turn = 'X'

    def draw_board(self):
        for i in range(0, 3):
            for j in range(0, 3):
                print('{}|'.format(self.current_state[i][j]), end=" ")
            print()
        print()
        
        
    # Verifica se la mossa giocata è legale
    def is_valid(self, px, py):
        if px < 0 or px > 2 or py < 0 or py > 2:
            return False
        elif self.current_state[px][py] != '.':
            return False
        else:
            return True
    
    
    # Veifica se il gioco è terminato, e in tal caso restituisce il vincitore
    def is_end(self):
        
        # Vittoria su una colonna
        for i in range(0, 3):
            if (self.current_state[0][i] != '.' and
                self.current_state[0][i] == self.current_state[1][i] and
                self.current_state[1][i] == self.current_state[2][i]):
                return self.current_state[0][i]

        # Vittoria su una riga
        for i in range(0, 3):
            if (self.current_state[i] == ['X', 'X', 'X']):
                return 'X'
            elif (self.current_state[i] == ['O', 'O', 'O']):
                return 'O'

        # Vittoria sulla diagonale principale
        if (self.current_state[0][0] != '.' and
            self.current_state[0][0] == self.current_state[1][1] and
            self.current_state[0][0] == self.current_state[2][2]):
            return self.current_state[0][0]

        # Vittoria sulla diagonale secondaria
        if (self.current_state[0][2] != '.' and
            self.current_state[0][2] == self.current_state[1][1] and
            self.current_state[0][2] == self.current_state[2][0]):
            return self.current_state[0][2]

        # La scacchiera è piena?
        for i in range(0, 3):
            for j in range(0, 3):
                # C'è una casella vuota; il gioco può continuare.
                if (self.current_state[i][j] == '.'):
                    return None
        # E' patta
        return 'patta'
    
                
                
    def max_alpha_beta(self, alpha, beta):
        
        maxv = -np.inf
        px = None
        py = None

        result = self.is_end()

        if result == 'X':
            return (-1, 0, 0)
        elif result == 'O':
            return (1, 0, 0)
        elif result == 'patta':
            return (0, 0, 0)

        for i in range(0, 3):
            for j in range(0, 3):
                if self.current_state[i][j] == '.':
                    self.current_state[i][j] = 'O'
                    (m, min_i, min_j) = self.min_alpha_beta(alpha, beta)
                    if m > maxv:
                        maxv = m
                        px = i
                        py = j
                    self.current_state[i][j] = '.'

                    if maxv >= beta:
                        return (maxv, px, py)

                    if maxv > alpha:
                        alpha = maxv

        return (maxv, px, py)
    
    
    
    def min_alpha_beta(self, alpha, beta):

        minv = np.inf

        qx = None
        qy = None

        result = self.is_end()

        if result == 'X':
            return (-1, 0, 0)
        elif result == 'O':
            return (1, 0, 0)
        elif result == 'patta':
            return (0, 0, 0)

        for i in range(0, 3):
            for j in range(0, 3):
                if self.current_state[i][j] == '.':
                    self.current_state[i][j] = 'X'
                    (m, max_i, max_j) = self.max_alpha_beta(alpha, beta)
                    if m < minv:
                        minv = m
                        qx = i
                        qy = j
                    self.current_state[i][j] = '.'

                    if minv <= alpha:
                        return (minv, qx, qy)

                    if minv < beta:
                        beta = minv

        return (minv, qx, qy)
    
    
    def play_alpha_beta(self):
        while True:
            self.draw_board()
            self.result = self.is_end()

            if self.result != None:
                if self.result == 'X':
                    print('Il vincitore è X!')
                elif self.result == 'O':
                    print('Il vincitore è O!')
                elif self.result == 'patta':
                    print('La partita è patta!')
                return

            if self.player_turn == 'X':

                while True:
                    start = time.time()
                    (m, qx, qy) = self.min_alpha_beta(-2, 2)
                    end = time.time()
                    print('Evaluation time: {}s'.format(round(end - start, 7)))
                    print('Mossa raccomandata: X = {}, Y = {}'.format(qx, qy))

                    px = int(input('Inserisci l\'indice di riga: '))
                    py = int(input('Inserisci l\'indice di colonna: '))

                    if self.is_valid(px, py):
                        self.current_state[px][py] = 'X'
                        self.player_turn = 'O'
                        break
                    else:
                        print('La mossa non è valida! Prova ancora.')

            else:
                (m, px, py) = self.max_alpha_beta(-2, 2)
                self.current_state[px][py] = 'O'
                self.player_turn = 'X'    
    

In [2]:
g = Game()
g.play_alpha_beta()


.| .| .| 
.| .| .| 
.| .| .| 

Evaluation time: 0.092447s
Mossa raccomandata: X = 0, Y = 0
Inserisci l'indice di riga: 0
Inserisci l'indice di colonna: 2
.| .| X| 
.| .| .| 
.| .| .| 

.| .| X| 
.| O| .| 
.| .| .| 

Evaluation time: 0.0106308s
Mossa raccomandata: X = 0, Y = 0
Inserisci l'indice di riga: 0
Inserisci l'indice di colonna: 0
X| .| X| 
.| O| .| 
.| .| .| 

X| O| X| 
.| O| .| 
.| .| .| 

Evaluation time: 0.0007739s
Mossa raccomandata: X = 2, Y = 1
Inserisci l'indice di riga: 2
Inserisci l'indice di colonna: 1
X| O| X| 
.| O| .| 
.| X| .| 

X| O| X| 
O| O| .| 
.| X| .| 

Evaluation time: 8.61e-05s
Mossa raccomandata: X = 1, Y = 2
Inserisci l'indice di riga: 1
Inserisci l'indice di colonna: 2
X| O| X| 
O| O| X| 
.| X| .| 

X| O| X| 
O| O| X| 
.| X| O| 

Evaluation time: 1.57e-05s
Mossa raccomandata: X = 2, Y = 0
Inserisci l'indice di riga: 2
Inserisci l'indice di colonna: 0
X| O| X| 
O| O| X| 
X| X| O| 

La partita è patta!
