In [1]:
from datetime import datetime
from GameBoard import GameBoard
from Agent import Agent
from Random_Agent import RandomAgent
from Minimax_Agent import MinimaxAgent
from Expectimax_Agent import ExpectimaxAgent
import numpy as np

In [2]:
def check_win(board: GameBoard):
    return board.get_max_tile() >= 2048


int_to_string = ['UP', 'DOWN', 'LEFT', 'RIGHT']

### Random Agent

In [None]:
agent: Agent
board: GameBoard
agent = RandomAgent()
board = GameBoard()
done = False
moves = 0
board.render()
start = datetime.now()
while not done:
    action = agent.play(board)
    print('Next Action: "{}"'.format(
        int_to_string[action]), ',   Move: {}'.format(moves))
    done = board.play(action)
    done = done or check_win(board)
    board.render()
    moves += 1

print('\nTotal time: {}'.format(datetime.now() - start))
print('\nTotal Moves: {}'.format(moves))
if check_win(board):
    print("WON THE GAME!!!!!!!!")
else:
    print("BOOOOOOOOOO!!!!!!!!!")


Utilizamos la misma funcion de evaluacion para ambos algoritmos

La funcion de evaluacion o heuristica que programamos es una mezcla de las tres heuristicas que se recomendaban

Algunas heurisitcas posibles son:
- smooth:
    - Calcular el \"smoothness\" del tablero. Esto es porque cuanto mas \"smooth\" el tablero, mas facil es juntar fichas. Para ello debemos:
    - 
                - Aplicar la raiz cuadrada al tablero
                - Sumar la diferencia entre cada casilla y la de abajo
                - Sumar la diferencia entre cada casilla y la de la derecha
                - Elevar este resultado a un smoothness_weight a determinar
                - Multiplicar por -1
- valorT (valor tablero):
    - Calcular el valor del tablero. Esto es porque cuanto mas fichas grandes tengo, mas cerca de ganar estoy. Para ello debemos
    - 
                - Elevar el tablero al cuadrado
                - Sumar todos los valores que se encuentran en el tablero
- Empty
     - Calcular la cantidad de espacios vacios. Esto es porque cuanto mas espacios vacios tengo, menos chance de tener un mal estado. Para ello debemos:
     - 
                - Obtener la cantidad de celdas vacias
                - Multiplicar por un empty_weight (recomendable en el orden de las decenas de miles)

Utilizamos profundidad 3 para los arboles, que es como un look ahead de 3 niveles (2 jugadas de player y 1 de board). Ademas el play comienza con una jugada de board

Decidimos utilizar ambos para poder mostrar el resultado en ambos casos, basicamente asi se justifica solo el desempeño de cada algoritmo

# Con Agente Minimax 

In [3]:
agent: Agent
board: GameBoard
agent = MinimaxAgent()
board = GameBoard()
done = False
moves = 0
board.render()
start = datetime.now()
while not done:
    action = agent.play(board)
    print('Next Action: "{}"'.format(
        int_to_string[action]), ',   Move: {}'.format(moves))
    done = board.play(action)
    done = done or check_win(board)
    board.render()
    moves += 1

print('\nTotal time: {}'.format(datetime.now() - start))
print('\nTotal Moves: {}'.format(moves))
if check_win(board):
    print("WON THE GAME!!!!!!!!")
else:
    print("BOOOOOOOOOO!!!!!!!!!")

     0       0       0       0  
     0       0       0       0  
     0       4       0       0  
     0       2       0       0  

Next Action: "UP" ,   Move: 0
     2       4       0       0  
     0       2       0       0  
     0       0       0       0  
     0       0       0       0  

Next Action: "LEFT" ,   Move: 1
     2       4       0       0  
     2       0       0       0  
     0       2       0       0  
     0       0       0       0  

Next Action: "UP" ,   Move: 2
     4       4       0       0  
     0       2       0       2  
     0       0       0       0  
     0       0       0       0  

Next Action: "RIGHT" ,   Move: 3
     0       0       0       8  
     0       0       0       4  
     0       0       0       0  
     0       0       0       2  

Next Action: "UP" ,   Move: 4
     0       0       0       8  
     0       0       2       4  
     0       0       0       2  
     0       0       0       0  

Next Action: "LEFT" ,   Move: 5
     8       0 

Minimax: Podemos ver que demora 11:49 minutos en llegar a una celda 2048 en 986 movimientos

# Con Agente Expectimax

In [5]:
agent: Agent
board: GameBoard
agent = ExpectimaxAgent()
board = GameBoard()
done = False
moves = 0
board.render()
start = datetime.now()
while not done:
    action = agent.play(board)
    print('Next Action: "{}"'.format(
        int_to_string[action]), ',   Move: {}'.format(moves))
    done = board.play(action)
    done = done or check_win(board)
    board.render()
    moves += 1

print('\nTotal time: {}'.format(datetime.now() - start))
print('\nTotal Moves: {}'.format(moves))
if check_win(board):
    print("WON THE GAME!!!!!!!!")
else:
    print("BOOOOOOOOOO!!!!!!!!!")

     0       0       0       0  
     2       0       0       0  
     0       0       2       0  
     0       0       0       0  

Next Action: "RIGHT" ,   Move: 0
     0       0       0       0  
     0       0       0       2  
     0       0       2       2  
     0       0       0       0  

Next Action: "UP" ,   Move: 1
     0       0       2       4  
     0       2       0       0  
     0       0       0       0  
     0       0       0       0  

Next Action: "LEFT" ,   Move: 2
     2       4       0       0  
     2       0       2       0  
     0       0       0       0  
     0       0       0       0  

Next Action: "RIGHT" ,   Move: 3
     0       0       2       4  
     2       0       0       4  
     0       0       0       0  
     0       0       0       0  

Next Action: "RIGHT" ,   Move: 4
     0       2       2       4  
     0       0       2       4  
     0       0       0       0  
     0       0       0       0  

Next Action: "DOWN" ,   Move: 5
     0   

Queremos ahora conseguir el ratio de jugadas perdidas y ganadas de cada algoritmo. Jugaremos 20 veces y contaremos

Para minimax:

In [3]:
agent: Agent
board: GameBoard
agent = MinimaxAgent()
cant_win=0
cant_lost =0
plays = 20
for i in range(plays):
    board = GameBoard()
    done = False
    moves = 0
    while not done:
        action = agent.play(board)
        done = board.play(action)
        done = done or check_win(board)
        moves += 1
    if check_win(board):
        cant_win += 1
    else:
        cant_lost += 1
print("Wins: {}".format(cant_win))
print("Loses: {}".format(cant_lost))

Wins: 9
Loses: 11


260 min: 9/20 win, 11/20 lose

Para Expectimax:

In [4]:
agent: Agent
board: GameBoard
agent = ExpectimaxAgent()
cant_win=0
cant_lost =0
plays = 20
for i in range(plays):
    board = GameBoard()
    done = False
    moves = 0
    while not done:
        action = agent.play(board)
        done = board.play(action)
        done = done or check_win(board)
        moves += 1
    if check_win(board):
        cant_win += 1
    else:
        cant_lost += 1
print("Wins: {}".format(cant_win))
print("Loses: {}".format(cant_lost))

Wins: 16
Loses: 4


256 min: 16/20 wins, 4/20 lose