# **Actividad 5: Algoritmo Minimax**

## **Alumno: Phabel Antonio López Delgado** [<phabel2001@gmail.com>]

### *Ejercicio 4:* Implementar un algoritmo de búsqueda entre adversarios utilizando el algoritmo Minimax para un juego sencillo de tic-tac-toe.


In [None]:
# Importar librerias necesarias
import math

In [None]:
# Crear clase para jugar juego
class TicTacToe:

    # Constructor con tablero vacio
    def __init__(self):
        self.tablero = [["_", "_", "_"],
                        ["_", "_", "_"],
                        ["_", "_", "_"]]

    # Metodo para imprimir tablero por fila
    def imprimir_tablero(self):
        # Imprimir cada fila esteticamente
        for fila in self.tablero:
            print(" | ".join(fila))
            print("-" * 9)

    # Funcion para realizar alguna tirada o movimiento en el tablero
    def mover(self, fila, columna, jugador):
        # Revisar que la casilla este vacia
        if self.tablero[fila][columna] == "_":
            # Hacer jugada para el turno
            self.tablero[fila][columna] = jugador
            return True
        return False

    # Funcion para revisar si hubo un ganador en el turno
    def revisar_ganador(self):
        # Para cada una de las posibilidades
        for i in range(3):
            # Evaluar si hubo ganador en las filas
            if self.tablero[i][0] == self.tablero[i][1] == self.tablero[i][2] != "_":
                return self.tablero[i][0]
            # Evaluar si hubo ganador en las columnas
            if self.tablero[0][i] == self.tablero[1][i] == self.tablero[2][i] != "_":
                return self.tablero[0][i]
            # Evaluar si hubo ganador en la primera diagonal
            if self.tablero[0][0] == self.tablero[1][1] == self.tablero[2][2] != "_":
                return self.tablero[0][0]
            # Evaluar si hubo ganador en la segunda diagonal
            if self.tablero[0][2] == self.tablero[1][1] == self.tablero[2][0] != "_":
                return self.tablero[0][2]
        # No hubo ganador aun en el turno
        return None


    # Funcion para dar puntajes a las posible configuraciones del tablero
    def evaluar_tablero(self):
        # Puntaje inicial
        puntaje = 0
        # Evaluar puntajes de las filas
        for i in range(3):
            # Puntaje ganador
            if self.tablero[i][0] == self.tablero[i][1] == self.tablero[i][2] == "O":
                # Promover
                puntaje += 10
            # Puntaje perdedor
            elif self.tablero[i][0] == self.tablero[i][1] == self.tablero[i][2] == "X":
                # Penalizar
                puntaje -= 10
        # Evaluar puntajes de las columnas
        for i in range(3):
            # Puntaje ganador
            if self.tablero[0][i] == self.tablero[1][i] == self.tablero[2][i] == "O":
                # Promover
                puntaje += 10
            # Puntaje perdedor
            elif self.tablero[0][i] == self.tablero[1][i] == self.tablero[2][i] == "X":
                # Penalizar
                puntaje -= 10
        # Evaluar puntaje ganador en la primera diagonal
        if self.tablero[0][0] == self.tablero[1][1] == self.tablero[2][2] == "O":
            # Promover
            puntaje += 10
        # Evaluar puntaje perdedor en la primera diagonal
        elif self.tablero[0][0] == self.tablero[1][1] == self.tablero[2][2] == "X":
            # Penalizar
            puntaje -= 10
        # Evaluar puntaje ganador en la segunda diagonal
        if self.tablero[0][2] == self.tablero[1][1] == self.tablero[2][0] == "O":
            # Promover
            puntaje += 10
        # Evaluar puntaje perdedor en la segunda diagonal
        elif self.tablero[0][2] == self.tablero[1][1] == self.tablero[2][0] == "X":
            # Penalizar
            puntaje -= 10
        # Regresar puntaje del tablero
        return puntaje


    # Funcion para evaluar si el tablero ya esta lleno
    def tablero_lleno(self):
        # Recorrer cada fila
        for fila in self.tablero:
            # Evaluar si hay casillas vacias en la fila
            if "_" in fila:
                # Regresar que no esta lleno
                return False
        # Regresar que esta lleno
        return True

    # Funcion minimax con poda alpha-beta
    def minimax(self, profundidad, jugador_max, alpha, beta):
        # Si se llega a un nodo hoja
        if profundidad == 0:
            # Evaluar el resutado final con puntaje
            return self.evaluar_tablero()
        # Si hay ganador o hay empate
        elif self.revisar_ganador() is not None or self.tablero_lleno():
            # Asignar ganador
            ganador = self.revisar_ganador()
            # Evaluar ganador
            if ganador:
                # Caso en el que la computadora gana
                if ganador == "O":
                    # Promover
                    return 10 + profundidad
                # Caso en que la computadora pierde
                elif ganador == "X":
                    # Penalizar
                    return -10 - profundidad
                # Empate
                else:
                    return 0
            return 0
        # Caso para maximizar
        if jugador_max:
            # Empezar con el menor puntaje para un movimiento: -infinito
            max_puntaje = -math.inf
            # Recorrer las tres filas
            for i in range(3):
                # Recorrer las tres columnas
                for j in range(3):
                    # Eligir alguna casilla vacia
                    if self.tablero[i][j] == "_":
                        # Simular movimiento o jugada
                        self.tablero[i][j] = "O"
                        # Evaluar el puntaje de la jugada con minimax con poda
                        #   alpha-beta, minimizando el puntaje del usuario
                        #   para maximizar el de la computadora
                        puntaje = self.minimax(profundidad=profundidad-1,
                                               jugador_max=False,
                                               alpha=alpha,
                                               beta=beta)
                        # Regresar el tablero a su configuracion original; retroceder la jugada hecha
                        self.tablero[i][j] = "_"
                        # Elegir el mayor puntaje
                        max_puntaje = max(max_puntaje, puntaje)
                        # Actulizar alpha con el mayor puntaje
                        alpha = max(alpha, puntaje)
                        # Poda beta
                        if beta <= alpha:
                            # Poda
                            break
            # Regresar el mayor puntaje
            return max_puntaje
        # Caso para minimizar
        else:
            # Empezar con el mayor puntaje para un movimiento: -infinito
            min_puntaje = math.inf
            # Recorrer las tres columnas
            for i in range(3):
                # Recorrer las tres columnas
                for j in range(3):
                    # Eligir alguna casilla vacia
                    if self.tablero[i][j] == "_":
                        # Simular movimiento o jugada
                        self.tablero[i][j] = "X"
                        # Evaluar el puntaje de la jugada con minimax con poda
                        #   alpha-beta, maximizando el puntaje de la computadora
                        #   para minimizar el del usuario
                        puntaje = self.minimax(profundidad=profundidad-1,
                                               jugador_max=True,
                                               alpha=alpha,
                                               beta=beta)
                        # Regresar el tablero a su configuracion original; retroceder la jugada hecha
                        self.tablero[i][j] = "_"
                        # Elegir el menor puntaje
                        min_puntaje = min(min_puntaje, puntaje)
                        # Actulizar beta con el menor puntaje
                        beta = min(beta, puntaje)
                        # Poda alpha
                        if beta <= alpha:
                            # Poda
                            break
            # Regresar el menor puntaje
            return min_puntaje

    # Funcion para elegir el mejor movimiento
    def mejor_movimiento(self):
        # Empezar con el peor puntaje para un movimiento: -infinito
        mejor_puntaje = -math.inf
        # No prejuzgar ningun movimiento
        mejor_movimiento = None
        # Recorrer tres filas
        for i in range(3):
            # Recorrer tres columnas
            for j in range(3):
                # Eligir alguna casilla vacia
                if self.tablero[i][j] == "_":
                    # Simular movimiento o jugada
                    self.tablero[i][j] = "O"
                    # Evaluar el puntaje de la jugada con minimax con poda
                    #   alpha-beta, minimizando el puntaje del usuario
                    puntaje = self.minimax(profundidad=9,
                                           jugador_max=False,
                                           alpha=-math.inf,
                                           beta=math.inf)
                    # Regresar el tablero a su configuracion original; retroceder la jugada hecha
                    self.tablero[i][j] = "_"
                    # Evaluar puntaje
                    if puntaje > mejor_puntaje:
                        # Actulizar mejor puntaje
                        mejor_puntaje = puntaje
                        # Guardar el mejor movimiento asociado
                        mejor_movimiento = (i, j)
        # Regresar el mejor movimiento asociado
        return mejor_movimiento

    # Funcion para jugar al TicTacToe
    def jugar(self):
        # Definir al usuario como primer jugador
        jugador_actual = "X"
        # Empezar partida y jugar hasta el final
        while True:
            # Imprimir tablero al inicio del turno
            self.imprimir_tablero()
            # Turno del usuario
            if jugador_actual == "X":
                # Asegurarse de captar jugada
                while True:
                    # Pedir indice de las fila
                    fila = int(input("Jugador X, ingrese la fila (0, 1 o 2): "))
                    # Pedir indice de la columna
                    columna = int(input("Jugador X, ingrese la columna (0, 1 o 2): "))
                    # Realizar jugada
                    if self.mover(fila, columna, jugador_actual):
                        # Acabar turno
                        break
                    # Jugada no valida
                    else:
                        # Pedir una jugada válida
                        print("Movimiento inválido. Intente de nuevo.")
            # Turno de la computadora
            else:
                # Evaluar si el tablero ya esta lleno
                if self.tablero_lleno():
                    # Declarar empate
                    print("¡Empate!")
                    # Imprimir tablero final
                    self.imprimir_tablero()
                    # Termina juego
                    break
                # Indicar que es turno de la computadora
                print("Turno de la computadora...")
                # Elegir el mejor movimiento para la computadora
                fila, columna = self.mejor_movimiento()
                # Realzar el mejor movimiento
                self.mover(fila, columna, jugador_actual)
                # Revisar si la computadora hay ganador para el final del turno
                ganador = self.revisar_ganador()
                # Usuario gana
                if ganador == "X":
                    print("¡El jugador X gana!")
                    self.imprimir_tablero()
                    # Terminar juego
                    break
                # Computadora gana
                elif ganador == "O":
                    print("¡La computadora gana!")
                    self.imprimir_tablero()
                    # Terminar juego
                    break
                # Tablero lleno -> Empate tecnico
                elif self.tablero_lleno():
                    print("¡Empate!")
                    self.imprimir_tablero()
                    # Terminar juego
                    break
            # Cambiar jugador para el siguiente turno
            jugador_actual = "O" if jugador_actual == "X" else "X"


In [None]:
# Evaluar codigo principal
juego = TicTacToe()
juego.jugar()

_ | _ | _
---------
_ | _ | _
---------
_ | _ | _
---------
Jugador X, ingrese la fila (0, 1 o 2): 1
Jugador X, ingrese la columna (0, 1 o 2): 1
_ | _ | _
---------
_ | X | _
---------
_ | _ | _
---------
Turno de la computadora...
O | _ | _
---------
_ | X | _
---------
_ | _ | _
---------
Jugador X, ingrese la fila (0, 1 o 2): 2
Jugador X, ingrese la columna (0, 1 o 2): 2
O | _ | _
---------
_ | X | _
---------
_ | _ | X
---------
Turno de la computadora...
O | _ | O
---------
_ | X | _
---------
_ | _ | X
---------
Jugador X, ingrese la fila (0, 1 o 2): 0
Jugador X, ingrese la columna (0, 1 o 2): 1
O | X | O
---------
_ | X | _
---------
_ | _ | X
---------
Turno de la computadora...
O | X | O
---------
_ | X | _
---------
_ | O | X
---------
Jugador X, ingrese la fila (0, 1 o 2): 1
Jugador X, ingrese la columna (0, 1 o 2): 0
O | X | O
---------
X | X | _
---------
_ | O | X
---------
Turno de la computadora...
O | X | O
---------
X | X | O
---------
_ | O | X
---------
Jugador X, i