# <span style="color:blue"> *Torneio Alfabeta Tic Tac Chess*</span>
## Introdução à Inteligência Artificial (2024-25)
### Avaliação Contínua 3

<img src="Tic_Tac_Chec.jpg" alt="Drawing" style="width: 200px;"/>

## O jogo Tic Tac Chess

O Tic Tac Chess, também chamado Tic Tac Chec, é uma combinação entre o **jogo do galo**, o **quatro em linha** e o **xadrez** em que cada jogador tenta colocar as suas quatro peças (de xadrez) em linha (como no quatro em linha), numa grelha/tabuleiro limitado ao tamanho da linha (como no jogo do galo). É uma das muitas variantes de [mini-xadrez](https://en.wikipedia.org/wiki/Minichess) jogadas em tabuleiros mais pequenos do que o xadrez normal.


### Como funciona o jogo? 

<img src="TicTacChess_empty_pieces.png" alt="Drawing" align='left' style="border:20px solid white;width: 200px;"/>


#### Materiais e início do jogo:
O TicTac Chess é jogado por dois jogadores num tabuleiro de 4$\times$4 casas. Cada jogador tem quatro peças de uma cor, branco ou preto. Estas peças são as peças de xadrez Cavalo (*knight*), Bispo (*bishop*), Torre (*rook*) e Peão (*pawn*). No início do jogo, o tabuleiro está vazio e todas as peças estão fora do tabuleiro, como ilustrado na figura. O primeiro jogador seleciona uma casa do tabuleiro onde possa jogar e coloca nela uma peça da sua cor. Pode jogar em qualquer casa que esteja livre. A seguir joga o adversário. Nas primeiras 6 jogadas, apenas é permitido colocar peças no tabuleiro. Quando o tabuleiro já tem 6 peças, termina a fase inicial e os jogadores já podem escolher colocar mais uma peça ou movimentar uma das peças que já estão no tabuleiro. 

#### Jogada
Quando chega a sua vez, se o jogador escolhe movimentar uma peça deve selecionar qual e movê-la segundo as regras do xadrez:

* O Cavalo pode dar um salto em L (percorrendo 1+2 ou 2+1 casas, começando em qualquer direção vertical ou horizontal) para qualquer casa que esteja livre ou ocupada por uma peça do adversário;
* O Bispo pode mover-se na diagonal qualquer número de casas até se ver bloqueado por uma peça da sua cor ou pelo final do tabuleiro, ou até se posicionar numa casa ocupada por uma peça do adversário;
* A Torre move-se na horizontal ou vertical, em tudo o resto seguindo as mesmas regras que o bispo;
* O Peão pode mover-se para a casa em frente se esta estiver livre, ou em frente na diagonal (para um ou outro lado) se a casa estiver ocupada por uma peça do oponente. Quando se encontra no limite mais longínquo do tabuleiro, o peão inverte a direção e os próximos movimentos serão para trás até atingir novamente o limite do tabuleiro, e assim sucessivamente.

Quando uma peça se movimenta para uma casa ocupada pelo adversário, captura essa peça. Ao contrário do que acontece no xadrez, a peça capturada fica imediatamente disponível para que o adversário possa jogá-la novamente. Também ao contrário do que acontece no xadrez, não é permitido a um jogador fazer mais do que 3 capturas consecutivas.

#### Fim do jogo
O jogo termina quando um dos jogadores conseguir colocar as suas quatro peças em linha, seja na horizontal, vertical ou diagonal, vencendo assim o jogo. Num jogo real que esteja a demorar muito tempo, os jogadores podem concordar num empate. Na nossa implementação, o empate ocorre automaticamente ao fim de 500 jogadas sem vencedor.



## Objectivos do projecto
Pretende-se que, dada uma formulação e implementação do jogo, os grupos de alunos:
<br><br>
Criem um jogador, na forma de uma função de avaliação a ser usada pelo algoritmo alfabeta para qualquer profundidade, par ou ímpar. Aconselhamos que comecem por desenvolver um jogador simples para depois ser progressivamente melhorado, de modo a que tenham um jogador disponível na data de entrega limite. Desenvolvam e comparem o desempenho de vários jogadores, para diferentes limites de profundidade, e depois selecionem o melhor deles para entrega. Cada grupo só pode participar no torneio com um único jogador.
<br><br>
O jogador de cada grupo participará em torneios de todos contra todos, i.e., cada jogador irá jogar vários jogos contra os jogadores de todos os outros grupos, em diferentes níveis de profundidade. O nosso jogador também participará, o <span style="color:blue"> ***Tactic***</span>.

<img src="tactic_chess_nerd.jpeg" alt="Drawing" style="width: 300px;"/>

O Tactic sabe as regras do jogo e pouco mais. Quando imagina um tabuleiro que resultaria de uma possível jogada, sabe verificar se esse tabuleiro tem quatro peças em linha, o que significaria uma vitória (se as peças em linhas forem dele) ou uma derrota (se forem do adversário). Também sabe que, se não houver quatro peças em linha, a existência de *três* peças em linha também é importante. O desempenho do Tactic é a *baseline* que devem ultrapassar de forma a obterem 10 valores.


## Formulação do Tic Tac Chess em Python

<img src="python.gif" alt="Drawing" style="width: 150px;"/>

Vamos descrever de modo sumário como está modelizado o jogo do Tic Tac Chess, através das classes `EstadoTicTacChess` e `TicTacChess` que estão em `tictacchess.py`.

### O estado do jogo
Na classe `EstadoTicTacChess` temos cinco atributos principais:

* `to_move`: Indica quem é o próximo a jogar ('WHITE' se for o jogador das peças brancas, 'BLACK' se for o das peças pretas).
* `board`: Uma representação do tabuleiro sob a forma de um dicionário que guarda a informação sobre a localização das peças no tabuleiro. As chaves são as peças no tabuleiro ('C', 'B', 'T', 'P', 'c', 'b', 't', 'p') e os valores são as posições $(linha,coluna)$ das casas ocupadas (sendo a primeira linha a de cima e a primeira coluna a da esquerda). 'C' e 'c' são os cavalos branco e preto, respetivamente; 'B' e 'b' os bispos branco e preto; 'T' e 't' as torres; 'P' e 'p' os peões (jogador WHITE tem maiúsculas, jogador BLACK tem minúsculas).
* `n_jogadas`: Indica quantas jogadas foram feitas desde o início do jogo. Serve para determinar quando é que se pode movimentar peças já colocadas (depois de 6 jogadas) e para determinar um empate (depois de 500 jogadas sem vencedor).
* `n_capturas`: Uma lista de dois elementos em que o primeiro é o número de vezes seguidas em que o jogador 'WHITE' capturou uma peça e o segundo é o número de vezes seguidas em que o jogador 'BLACK' capturou uma peça. Nenhum dos jogadores pode fazer mais do que 3 capturas consecutivas.
* `pawn_direction`: Uma lista de dois elementos em que o primeiro indica a direção do peão branco e o segundo indica a direção do peão preto. Pode ser direção normal, para a frente (+1), ou inversa, para trás (-1). A direção de um peão que não está no tabuleiro é sempre para a frente (e pode ser imediatamente invertida se este for colocado no limite mais longínquo do tabuleiro). Para o peão branco, esse limite é na linha 0 (a linha de cima, na figura); para o peão preto é na linha 3 (a linha de baixo, na figura).
* `last_piece`: a última peça ('C', 'B', 'T', 'P', 'c', 'b', 't', 'p') que foi jogada pelo último jogador.

Temos também os métodos: 
    
* `player_pieces()`: Devolve os símbolos das peças, {'C', 'B', 'T', 'P'} ou {'c', 'b', 't', 'p'}, consoante o jogador dado.

* `used_pieces()`: Devolve os símbolos das peças que estão no tabuleiro (as chaves do dicionário board).

* `player_used_pieces()`: Devolve a lista das peças do jogador dado que estão no tabuleiro.

* `player_used_cells()`: Devolve as localizações das peças do jogador que estão no tabuleiro, assim como os seus símbolos.

* `empty_cells()`: Devolve as localizações de todas as casas vazias do tabuleiro.

* `next_state()`: Devolve um novo estado do jogo que resulta de uma jogada para uma determinada casa do tabuleiro.

* `possible_moves()`: Dada uma peça que está no tabuleiro, devolve uma lista com todas as casas para onde essa peça pode ser movida (sem ter em consideração o limite de 3 capturas consecutivas).
    
* `knight_possible_moves()`: Devolve uma lista com todas as casas para onde o Cavalo dado pode ser movido (sem ter em consideração o limite de 3 capturas consecutivas).

* `bishop_rook_possible_moves()`: Dada uma direção de movimento (diagonal ou não), devolve uma lista com todas as casas para onde o Bispo ou Torre pode ser movido (sem ter em consideração o limite de 3 capturas consecutivas).

* `pawn_possible_moves()`: Devolve uma lista com todas as casas para onde o Peão pode ser movido (sem ter em consideração o limite de 3 capturas consecutivas).

* `n_in_row()`: Devolve a indicação de qual dos jogadores (ou ambos, 'BOTH', ou nenhum, 'None') tem n peças em linha.
       
* `other()`: Devolve o outro jogador, dado quem joga a seguir: 'BLACK' se 'WHITE' ou 'WHITE' se 'BLACK'.

* `have_winner()`: Devolve o jogador que tem quatro em linha, ou None. 
    
* `display()`: Faz o display do tabuleiro em modo de texto. Consegue mostrar tabuleiros de várias dimensões, mas vamos usar sempre 4$\times$4.

Assim como as funções auxiliares `in_row()`, `is_diagonal()` e `is_line()`.

Vejamos agora alguns exemplos, após importarmos `tictacchess.py`.

In [2]:
from tictacchess import *

Criemos o estado inicial standard e observemos os seus atributos:

In [3]:
estado_inicial = EstadoTicTacChess(to_move='WHITE',board={},n_jogadas=0,n_capturas=[0,0],pawn_direction=[1,1],last_piece='None')
print("Próximo jogador:",estado_inicial.to_move)
print("Tabuleiro:",estado_inicial.board)
print("No.Jogadas:",estado_inicial.n_jogadas)
print("No.Capturas Seguidas (WHITE,BLACK):",estado_inicial.n_capturas)
print("Direção Peões (WHITE,BLACK):",estado_inicial.pawn_direction)

Próximo jogador: WHITE
Tabuleiro: {}
No.Jogadas: 0
No.Capturas Seguidas (WHITE,BLACK): [0, 0]
Direção Peões (WHITE,BLACK): [1, 1]


Agora observemos o tabuleiro em formato mais legível:

In [4]:
estado_inicial.display(4,4)

   _________
0 | . . . . | 
1 | . . . . | 
2 | . . . . | 
3 | . . . . | 
  |_________|
    0 1 2 3 


Vamos perguntar se temos quatro peças em linha (obviamente que não):

In [5]:
print(estado_inicial.n_in_row(4))

None


Vamos aplicar uma jogada e visualizar o tabuleiro resultante:

In [6]:
estado_inicial.next_state(('C',(2,3))).display(4,4)

   _________
0 | . . . . | 
1 | . . . . | 
2 | . . . C | 
3 | . . . . | 
  |_________|
    0 1 2 3 


### A classe `TicTacChess`, subclasse de `Game`
A classe `TicTacChess` (em `tictcchess.py`) é uma subclasse de `Game` (em `jogos.py`). 

O construtor gera o estado inicial do jogo com um tabuleiro de 4$\times$4 casas vazio, e o jogador 'WHITE' é o primeiro a jogar.

Temos também os métodos habituais:
* `actions`: Devolve a lista de acções possíveis (jogadas possíveis) para um determinado estado.
* `result`: Devolve o estado que resulta da aplicação de uma acção (jogada) a um outro estado.
* `terminal_test`: Verifica se o jogo acabou ou não.
* `utility`: Devolve +1 se ganhou o jogador, -1 se ganhou o adversário, 0 se empataram.
* `display`: Apresenta em modo de texto o estado do jogo, incluindo o tabuleiro e outras informações.

Vamos iniciar um jogo e verificar quais as jogadas possíveis para o primeiro jogador:

In [7]:
from tictacchess import *
jogo=TicTacChess()
jogo.display(jogo.initial)
print(jogo.initial.to_move,'pode fazer as jogadas',jogo.actions(jogo.initial))

   Jogadas feitas: 0
   Tabuleiro atual:
   _________
0 | . . . . | 
1 | . . . . | 
2 | . . . . | 
3 | . . . . | 
  |_________|
    0 1 2 3 
   Próximo jogador: WHITE
      Stock de peças:    ['P', 'C', 'T', 'B']    (black: ['c', 'b', 't', 'p'])
      Capturas seguidas: 0                       (black: 0                   )
      Movimento do peão: normal                  (black: normal              )

WHITE pode fazer as jogadas [('P', (0, 0)), ('P', (0, 1)), ('P', (0, 2)), ('P', (0, 3)), ('P', (1, 0)), ('P', (1, 1)), ('P', (1, 2)), ('P', (1, 3)), ('P', (2, 0)), ('P', (2, 1)), ('P', (2, 2)), ('P', (2, 3)), ('P', (3, 0)), ('P', (3, 1)), ('P', (3, 2)), ('P', (3, 3)), ('C', (0, 0)), ('C', (0, 1)), ('C', (0, 2)), ('C', (0, 3)), ('C', (1, 0)), ('C', (1, 1)), ('C', (1, 2)), ('C', (1, 3)), ('C', (2, 0)), ('C', (2, 1)), ('C', (2, 2)), ('C', (2, 3)), ('C', (3, 0)), ('C', (3, 1)), ('C', (3, 2)), ('C', (3, 3)), ('T', (0, 0)), ('T', (0, 1)), ('T', (0, 2)), ('T', (0, 3)), ('T', (1, 0)), ('T', (1, 1

### Jogadores
Em `jogos.py` temos vários tipos de jogadores e funções para correr jogos.

#### O jogador aleatório
O jogador aleatório escolhe ao acaso uma das jogadas possíveis.
Vamos ver um jogo entre dois jogadores aleatórios:

In [8]:
from tictacchess import *
jogo = TicTacChess()
jogo.jogar(random_player,random_player)

   Jogadas feitas: 0
   Tabuleiro atual:
   _________
0 | . . . . | 
1 | . . . . | 
2 | . . . . | 
3 | . . . . | 
  |_________|
    0 1 2 3 
   Próximo jogador: WHITE
      Stock de peças:    ['P', 'C', 'T', 'B']    (black: ['c', 'b', 't', 'p'])
      Capturas seguidas: 0                       (black: 0                   )
      Movimento do peão: normal                  (black: normal              )

   Jogadas feitas: 1
   Tabuleiro atual:
   _________
0 | . . . . | 
1 | C . . . | 
2 | . . . . | 
3 | . . . . | 
  |_________|
    0 1 2 3 
   Próximo jogador: BLACK
      Stock de peças:    ['c', 'b', 't', 'p']    (white: ['P', 'T', 'B']     )
      Capturas seguidas: 0                       (white: 0                   )
      Movimento do peão: normal                  (white: normal              )

   Jogadas feitas: 2
   Tabuleiro atual:
   _________
0 | . . . . | 
1 | C . p . | 
2 | . . . . | 
3 | . . . . | 
  |_________|
    0 1 2 3 
   Próximo jogador: WHITE
      Stock de peças:  

-1

O score final é +1(-1) se WHITE ganhou(perdeu), ou 0 se empataram (se ninguém ganhou ao fim de MAX_JOGADAS).
Se quisermos correr um jogo vendo só os scores finais, podemos usar a função `jogar()` em modo não verboso:

In [9]:
jogo=TicTacChess()
jogo.jogar(random_player,random_player,verbose=False)

-1

#### O jogador Alfabeta com profundidade limitada
No nosso torneio, os jogadores vão sempre usar o algoritmo Alfabeta. No jogo Tic Tac Chess, não é viável desenvolver a árvore até ao fim, por isso vamos usar o Alfabeta com profundidade limitada (função `alphabeta_cutoff_search_new` definida em `jogos.py`). Esta função recebe um estado, um jogo, a profundidade de procura, e uma função de avaliação. É a função de avaliação de cada jogador que vai determinar o seu desempenho.

Vamos equipar o jogador aleatório com uma função de avaliação. Ele continuará a escolher jogadas ao acaso, mas conseguirá reconhecer a situação em que o próximo jogador poderá ganhar o jogo (porque pode colocar/mover uma peça e fazer quatro-em-linha). Quando é detetado o final iminente do jogo, a função de avaliação deve devolver `infinity`/`-infinity` para maximixar o número de cortes que a função `alphabeta_cutoff_search_new` faz.

In [10]:
def func_gameover(estado,jogador) :
    clone=copy.deepcopy(estado) #boa prática de programação, para não arriscarem estragar o estado
    winner = clone.have_winner()
    if winner != None:
        return infinity if winner==jogador else -infinity
    return 0 #em qualquer outra situação que não seja vitória ou derrota

def jogador_random_plus_1(jogo,estado) :
    return alphabeta_cutoff_search_new(estado,jogo,1,eval_fn=func_gameover)


Vejamos a vantagem que traz esta função de avaliação. Reparem que o `jogador_random_plus_1` joga com uma profundidade de procura 1. Quer isto dizer que a procura não vai além da jogada imediata; nem sequer olha para qualquer possível jogada do adversário. Vamos fazer 10 jogos entre o `jogador_random_plus_1` e o jogador aleatório que não reconhece o final do jogo. <br><br>
Reportamos os scores resultantes de cada jogo, e no final a soma de todos os scores, que nos dá a pontuação do primeiro jogador, o `jogador_random_plus_1`. Esta pontuação será positiva(negativa) se o primeiro(segundo) jogador ganhou a maioria dos jogos, e será 0 se ambos os jogadores ganharem o mesmo número de jogos (ou se empatarem todos os jogos).

In [11]:
pontuacao=0
for i in range(100):
    resultado = jogo.jogar(jogador_random_plus_1,random_player,verbose=False)
    #print(resultado)
    pontuacao += resultado
print('Pontuação do jogador_random_plus_1:',pontuacao)

Pontuação do jogador_random_plus_1: 86


A vantagem é óbvia, não é? E torna-se ainda mais óbvia com profundidade maiores. Vejamos os resultados finais obtido em 100 jogos a profundidades 1, 2 e 3 (podem correr várias vezes, reparando como o tempo de execução aumenta com a profundidade):

In [12]:
def jogador_random_plus_p(jogo,estado) :
    return alphabeta_cutoff_search_new(estado,jogo,p,eval_fn=func_gameover)

for p in range(1,4):
    def jogador_random_plus_p(jogo,estado) :
        return alphabeta_cutoff_search_new(estado,jogo,p,eval_fn=func_gameover)
    print('Profundidade', p)
    quem_ganhou=0
    for i in range(100):
        resultado = jogo.jogar(jogador_random_plus_p,random_player,verbose=False)
        #print(resultado)
        quem_ganhou += resultado
    print(quem_ganhou)


Profundidade 1
90
Profundidade 2
98
Profundidade 3
100


### O Tactic
Vamos agora definir a função de avaliação do nosso jogador <span style="color:blue"> ***Tactic***</span>, chamada `func_tactic`. Como dito acima, o Tactic sabe reconhecer o final do jogo e sabe que fazer três em linha também é importante.

In [None]:
def func_tactic(estado,jogador) :
    clone=copy.deepcopy(estado)
    winner = clone.have_winner()
    if winner != None:
        return infinity if winner==jogador else -infinity
    # se não reconhece o final do jogo, verifica quem tem três em linha:
    almost_winner = clone.n_in_row(3)
    if almost_winner == None or almost_winner == 'BOTH':
        return 0
    return 1 if almost_winner==jogador else -1

Vamos verificar como é que esta função de avaliação avalia alguns estados: 

In [14]:
brd0={'C':(1, 1), 'c':(1, 2), 'P': (0, 1), 'b': (2, 2), 'T': (3, 0)}
brd1={'C':(1, 1), 'c':(1, 2), 'P': (0, 1), 'b': (2, 2), 'T': (3, 1), 't': (3, 0), 'B': (2,1)}
brd2={'T': (0, 0), 'C':(1, 1), 'c':(1, 2), 'P': (0, 1), 'b': (2, 2), 't': (3, 0), 'B': (2,1)}
brd3={'C':(1, 1), 'c':(1, 2), 'P': (0, 1), 'b': (2, 2), 'T': (3, 1), 't': (3, 0), 'b': (2,1)}
brd={'b': (2, 3), 'B': (3, 3), 'c': (2, 2), 'P': (0, 2), 't': (0, 3), 'C': (1, 2), 'T': (3, 2), 'p': (0, 0)}
est0=EstadoTicTacChess('WHITE',brd0,0,[0,0],[-1,1],'')
est1=EstadoTicTacChess('WHITE',brd1,0,[0,0],[-1,1],'')
est2=EstadoTicTacChess('BLACK',brd2,0,[0,0],[-1,1],'')
est3=EstadoTicTacChess('BLACK',brd3,0,[0,0],[1,1],'')
est=EstadoTicTacChess('WHITE',brd,0,[0,0],[1,1],'')
jogo=TicTacChess()
# Aqui ninguém ganhou nem fez 3-em-linha:
jogo.display(est0)
print('Avaliação segundo',est0.to_move,': ',func_tactic(est0,est0.to_move))
print('Avaliação segundo',est0.other(),': ',func_tactic(est0,est0.other()),'\n\n')
# Aqui WHITE ganhou:
jogo.display(est1)
print('Avaliação segundo',est1.to_move,': ',func_tactic(est1,est1.to_move))
print('Avaliação segundo',est1.other(),': ',func_tactic(est1,est1.other()),'\n\n')
# Aqui ninguém ganhou e WHITE tem 3-em-linha:
jogo.display(est2)
print('Avaliação segundo',est2.to_move,': ',func_tactic(est2,est2.to_move))
print('Avaliação segundo',est2.other(),': ',func_tactic(est2,est2.other()),'\n\n')
# Aqui ninguém ganhou e ambos têm 3-em-linha
jogo.display(est3)
print('Avaliação segundo',est3.to_move,': ',func_tactic(est3,est3.to_move))
print('Avaliação segundo',est3.other(),': ',func_tactic(est3,est3.other()),'\n\n')

   Jogadas feitas: 0
   Tabuleiro atual:
   _________
0 | . P . . | 
1 | . C c . | 
2 | . . b . | 
3 | T . . . | 
  |_________|
    0 1 2 3 
   Próximo jogador: WHITE
      Stock de peças:    ['B']                   (black: ['t', 'p']          )
      Capturas seguidas: 0                       (black: 0                   )
      Movimento do peão: inverso                 (black: normal              )

Avaliação segundo WHITE :  0
Avaliação segundo BLACK :  0 


   Jogadas feitas: 0
   Tabuleiro final:
   _________
0 | . P . . | 
1 | . C c . | 
2 | . B b . | 
3 | t T . . | 
  |_________|
    0 1 2 3 
   
FIM do jogo
   Ganhou BLACK

Avaliação segundo WHITE :  inf
Avaliação segundo BLACK :  -inf 


   Jogadas feitas: 0
   Tabuleiro atual:
   _________
0 | T P . . | 
1 | . C c . | 
2 | . B b . | 
3 | t . . . | 
  |_________|
    0 1 2 3 
   Próximo jogador: BLACK
      Stock de peças:    ['p']                   (white: []                  )
      Capturas seguidas: 0                      

Vamos definir o jogador <span style="color:blue"> ***Tactic***</span> e ver qual o seu desempenho ao jogar com o jogador random_plus com profundidades de procura 1, 2, 3 e 4. Fazemos só 10 jogos com cada profundidade, para não demorar muito. Mostramos também o resultado de cada jogo, para além da pontuação final.

In [15]:
jogo=TicTacChess()

def jogador_random_plus_p(jogo,estado) :
    return alphabeta_cutoff_search_new(estado,jogo,p,eval_fn=func_gameover)

def jogador_tactic_p(jogo,estado) :
    return alphabeta_cutoff_search_new(estado,jogo,p,eval_fn=func_tactic)

for p in range(1,4):
    def jogador_random_plus_p(jogo,estado) :
        return alphabeta_cutoff_search_new(estado,jogo,p,eval_fn=func_gameover)
    def jogador_tactic_p(jogo,estado) :
        return alphabeta_cutoff_search_new(estado,jogo,p,eval_fn=func_tactic)
    print('\nProfundidade:',p)
    pontuacao=0
    for i in range(10):
        resultado = jogo.jogar(jogador_tactic_p,jogador_random_plus_p,verbose=False)
        print(resultado)
        pontuacao += resultado
    print('Pontuação do Tactic:',pontuacao)



Profundidade: 1
1
1
1
1
1
1
1
1
1
1
Pontuação do Tactic: 10

Profundidade: 2
0
1
1
-1
1
1
1
1
1
-1
Pontuação do Tactic: 5

Profundidade: 3
1
1
1
1
1
-1
-1
-1
1
-1
Pontuação do Tactic: 2


Curiosamente, a estratégia do Tactic parece funcionar melhor a profundidades mais baixas, e chega mesmo a perder contra o jogador aleatório. Podemos também correr um jogo com o utilizador humano. Atenção: o jogador humano deve indicar sempre uma das jogadas possíveis, caso contrário o jogo não é válido. Tentem ganhar ao Tactic!

Podemos também correr um jogo com o utilizador humano. Atenção: o jogador humano deve indicar sempre uma das jogadas possíveis, caso contrário o jogo não é válido. Tentem ganhar ao Tactic!

In [16]:
jogo=TicTacChess()
#jogo.jogar(query_player,jogador_tactic_3) # descomentar para jogar

### Funções de avaliação compostas
Obviamente que o Tactic, mesmo sendo melhor (em média) do que o jogador aleatório, não é lá grande jogador. Fazer três em linha não traz grande vantagem se o adversário tiver liberdade para desfazer o alinhamento na jogada seguinte, ou se o próprio jogador não tiver condições para completar o alinhamento. Para obterem um bom jogador, poderão combinar vários critérios na mesma função de avaliação. Vamos dar como exemplo um jogador que usa o critério do três em linha (o mesmo que o Tactic usa) e um segundo critério que devolve a diferença entre o número de peças do jogador e o número de peças do adversário no tabuleiro. A função de avaliação composta é apenas a soma dos dois critérios. Este jogador será melhor que o Tactic? Vamos descobrir isso em 10 jogos com profundidade 3:

In [None]:
def func_pecas(estado,jogador) :
    clone=copy.deepcopy(estado)
    n_pecas_jogador = len(clone.player_used_pieces(clone.to_move))
    n_pecas_adversario = len(clone.player_used_pieces(clone.other()))
    return n_pecas_jogador - n_pecas_adversario

def func_tactic_e_pecas(estado,jogador):
    return func_tactic(estado,jogador) + func_pecas(estado,jogador)

def jogador_tactic_e_pecas_3(jogo,estado) :
    return alphabeta_cutoff_search_new(estado,jogo,3,eval_fn=func_tactic_e_pecas)

def jogador_tactic_3(jogo,estado) :
    return alphabeta_cutoff_search_new(estado,jogo,3,eval_fn=func_tactic)

pontuacao=0
for i in range(10):
    resultado = jogo.jogar(jogador_tactic_3,jogador_tactic_e_pecas_3,verbose=False)
    print(resultado)
    pontuacao += resultado
print('Pontuação do Tactic:',pontuacao)

1
1
-1
1
1
1
1
1
-1
1
Pontuação do Tactic: 6


Não é óbvio qual é o melhor jogador (corram várias vezes). O critério do número de peças será bom? Será que deve ser mais ou menos importante que o critério das casas? Podemos dar pesos diferentes a cada um? Podemos combinar outros critérios da mesma forma? Devemos combiná-los de outra forma?

Disponibilizamos uma função que combina várias funções de avaliação numa só, aceitando como argumentos os nomes das várias funções de avaliação e os pesos de cada uma:

In [18]:
def func_combina_com_pesos(estado,jogador,pesos,funcoes):
    """Função que devolve a combinação linear de várias funções de avaliação."""
    return sum([p*f(estado,jogador) for (p,f) in zip(pesos,funcoes)])

Recorrendo a esta função, definimos uma nova função de avaliação que dá mais importância ao três em linha do que ao número de peças (os pesos não têm de somar 1), e um novo jogador que a usa (reparem que se usa da mesma forma que as outras):

In [19]:
def nova_func_tactic_e_pecas(estado,jogador):
    return func_combina_com_pesos(estado,jogador,[2,0.5],[func_tactic,func_pecas])

def novo_jogador_tactic_e_pecas_3(jogo,estado) :
    return alphabeta_cutoff_search_new(estado,jogo,3,eval_fn=nova_func_tactic_e_pecas)

Podem combinar funções como quiserem, não tem de ser obrigatoriamente com pesos. Reparem que a função de avaliação do Tactic já é, só por si, uma combinação "hierárquica" de critérios: primeiro deteta se chegámos a um tabuleiro final e, se for esse o caso, atribui uma avaliação de final de jogo; se não for esse o caso, atribui uma avaliação ao tabuleiro com base nos três em linha.

### N Pares de jogos
Vejamos agora uma função que realiza $N$ pares de jogos entre dois jogadores, $N$ jogos com um deles a jogar primeiro, $N$ jogos com o outro a jogar primeiro. Devolve um tuplo com 4 elementos: o número de vitórias de cada um e de empates quando um deles joga primeiro; o número de vitórias de cada um e de empates quando o outro joga primeiro; o número total de vitórias de cada um e de empates; e finalmente o score de cada um. A pontuação depende da tabela de `scores`, que neste caso indica que a vitória vale $3$, a derrota $0$ e o empate $1$. É a mesma escala que iremos utilizar no torneio.

In [20]:
scores={'Vitoria': 3, 'Empate': 1}

def traduzPontos(tabela):
    tabelaScore={}
    empates=tabela['Empate']
    for x in tabela:
        if x != 'Empate':
            tabelaScore[x]=scores['Vitoria']*tabela[x]+scores['Empate']*empates
    return tabelaScore

def jogaNpares(jogo,n,jog1,jog2):
    name_jog1=jog1.__name__
    name_jog2=jog2.__name__
    tabelaPrim={name_jog1:0, name_jog2:0, 'Empate':0}
    tabelaSeg={name_jog1:0, name_jog2:0, 'Empate':0}
    tabela={}
    for _ in range(n):
        #_,_,vencedor=jogo.jogar(jog1,jog2,verbose=False)
        vencedor=jogo.jogar(jog1,jog2,verbose=False)
        if vencedor>0:
            vencedor=name_jog1
        elif vencedor<0:
            vencedor=name_jog2
        else:
            vencedor='Empate'
        tabelaPrim[vencedor]+=1
        vencedor=jogo.jogar(jog2,jog1,verbose=False)
        if vencedor>0:
            vencedor=name_jog2
        elif vencedor<0:
            vencedor=name_jog1
        else:
            vencedor='Empate'
        tabelaSeg[vencedor]+=1
    for x in tabelaPrim:
        tabela[x]=tabelaPrim[x]+tabelaSeg[x]
    return tabelaPrim,tabelaSeg,tabela,traduzPontos(tabela)

Façamos 5 pares de jogos entre o jogador_tactic_e_pecas_3 e o novo_jogador_tactic_e_pecas_3 e vejamos a pontuação final:

In [21]:
jogo=TicTacChess()
jogaNpares(jogo,5,jogador_tactic_e_pecas_3,novo_jogador_tactic_e_pecas_3)

({'jogador_tactic_e_pecas_3': 2,
  'novo_jogador_tactic_e_pecas_3': 3,
  'Empate': 0},
 {'jogador_tactic_e_pecas_3': 0,
  'novo_jogador_tactic_e_pecas_3': 5,
  'Empate': 0},
 {'jogador_tactic_e_pecas_3': 2,
  'novo_jogador_tactic_e_pecas_3': 8,
  'Empate': 0},
 {'jogador_tactic_e_pecas_3': 6, 'novo_jogador_tactic_e_pecas_3': 24})

### Torneio entre vários jogadores
Eis a função que realiza um torneio entre vários jogadores, em que cada um realiza um número $N$ de jogos contra todos os outros como primeiro jogador, e $N$ como segundo jogador:

In [22]:
def incorpora(tabela,tx):
    for jog in tx:
        if jog not in tabela:
            tabela[jog]=tx[jog]
        else:
            tabela[jog]+=tx[jog]

def torneio(n,jogadores):
    jogo=TicTacChess()
    tabela={}
    for i in range(len(jogadores)-1):
        jog1=jogadores[i]
        for j in range(i+1,len(jogadores)):
            jog2=jogadores[j]
            print(jog1.__name__,'vs',jog2.__name__)
            _,_,_,tabelaX = jogaNpares(jogo,n,jog1,jog2)
            incorpora(tabela,tabelaX)
    #return tabela
    print(dict(sorted(tabela.items(), key=lambda x: x[1],reverse=True)))

Fazemos agora um torneio com três dos jogadores que gerámos até agora, com 5 pares de jogos entre eles.<br> Os resultados são apresentados do melhor para o pior jogador:

In [23]:
torneio(5,[jogador_tactic_3, jogador_tactic_e_pecas_3, novo_jogador_tactic_e_pecas_3])

jogador_tactic_3 vs jogador_tactic_e_pecas_3
jogador_tactic_3 vs novo_jogador_tactic_e_pecas_3
jogador_tactic_e_pecas_3 vs novo_jogador_tactic_e_pecas_3
{'jogador_tactic_3': 33, 'novo_jogador_tactic_e_pecas_3': 30, 'jogador_tactic_e_pecas_3': 27}


E pronto, agora toca a derrotar o <span style="color:blue"> ***Tactic***</span>!

<img src="tactic_chess_nerd.jpeg" alt="Drawing" style="width: 200px;"/>


## Material a entregar
Devem entregar um ficheiro **IIA2425-proj3-jog-XX.py** (substituindo XX pelo número do grupo), com o código da vossa função de avaliação e todas as funções auxiliares que criarem.

<span style="color:red"> **Não alterem**</span> `tictacchess.py` nem `jogos.py` nem `utils.py` e **não os devem submeter!**
<br><span style="color:red">**Não redefinam**</span> funções com o mesmo nome das já existentes nestes ficheiros.

A função de avaliação do vosso jogador deverá ter o nome **func_XX(estado,jogador)** (substituindo XX pelo número do grupo) e deve devolver o valor estimado do `estado` na perspectiva do `jogador`. Não precisam de definir o vosso jogador, pois seremos nós a defini-lo com diferentes profundidades durante a execução do campeonato.

**Todas** as vossas funções devem ter o sufixo **_XX** (substituindo XX pelo número do grupo), para que não se partilhe nem se sobreponha código durante a avaliação.

## Avaliação
A nota do vosso projecto depende da pontuação final obtida no torneio *múltiplo*. 
   
**Torneios**: Cada jogador irá participar em torneios contra todos os outros, fazendo pelo menos dois jogos (um como primeiro jogador, outro como segundo jogador) contra cada um dos outros jogadores em cada torneio. Faremos torneios a diferentes profundidades, pelo menos profundidade 3 e profundidade 4. Se o tempo de execução o permitir, faremos mais jogos por torneio, e mais torneios a profundidades maiores. Caso o tempo de execução se torne mesmo problemático, poderemos ter de baixar o número máximo de jogadas para 250 ou mesmo para 100, o que significará um número maior de empates.

**Pontuação**: Nos torneios, vamos sempre incluir o nosso jogador <span style="color:blue"> ***Tactic***</span>. A pontuação obtida por cada grupo em cada torneio será a *soma dos pontos obtidos em todos os jogos* (em que cada vitória vale 3, cada empate vale 1, e cada derrota vale 0). A pontuação final será a soma das pontuações obtidas em todos os torneios.

**Nota**: Quem obtiver a mesma pontuação final que o <span style="color:blue"> ***Tactic***</span>, terá 10 valores. Quem tiver uma pontuação inferior ao Tactic terá nota menor do que 10. A nota será resultado da aplicação de uma função linear baseada na pontuação obtida, tanto acima do Tactic como para baixo. O grupo que ficar em primeiro lugar no torneio (naturalmente, acima do Tactic), terá 20 valores.

**Clones**: Qualquer jogador que seja um clone do <span style="color:blue"> ***Tactic***</span> ou de outro jogador aqui definido será desclassificado e ficará com nota 0. Jogadores que sejam cópias descaradas uns do outros também serão desclassificados. 

**Timeout**: Se um jogador ultrapassar o tempo limite para uma jogada, será também desclassificado. Usaremos bom senso para definir o que é o tempo considerado como limite: será o tempo acima do qual a execução do torneio fica comprometida.

**Ficheiros**: Se um grupo entregar ficheiros que não seguem as regras definidas acima (nomeadamente, no que respeita aos sufixos nos nomes das funções) sofrerá uma penalização na nota proporcional ao tempo necessário para resolver a situação. No limite, não será possível a sua participação no torneio e a nota será 0.

## Prazo de entrega

Até ao dia **15 de novembro** (6a feira) às 23:59
<br>Dúvidas para Sara Silva (sgsilva@fc.ul.pt).


In [None]:
from tictacchess import *

def func_247(state, player):
    """A player that chooses a legal move at random."""
    clone=copy.deepcopy(state)
    return func_winner(clone, player) + func_center(clone, player)

def func_center(state, player):
    center = [(1,1),(1,2),(2,1),(2,2)]
    return sum(1 for p in center if p in state.player_used_pieces(player))

def func_prev_capture(state, player):
    """Previne capturas excepto em casos criticos"""
    capturas = state.n_capturas[0] if player == 'WHITE' else state.n_capturas[1]
    if (state.n_in_row(3) == state.other())
        return 0
    return -capturas if capturas >= 3 else 0


def func_trio(state, player) :
    almost_winner = state.n_in_row(3)
    if almost_winner == player:
        return 1
    elif almost_winner == state.other():
        return -1
    return 0

def func_winner(state, player):
    winner = state.have_winner()
    if winner != None:
        return infinity if winner==player else -infinity
    return 0

def func_pecas(estado,jogador) :
    clone=copy.deepcopy(estado)
    n_pecas_jogador = len(clone.player_used_pieces(clone.to_move))
    n_pecas_adversario = len(clone.player_used_pieces(clone.other()))
    return n_pecas_jogador - n_pecas_adversario

def func_tactic(estado,jogador) :
    clone=copy.deepcopy(estado)
    winner = clone.have_winner()
    if winner != None:
        return infinity if winner==jogador else -infinity
    # se não reconhece o final do jogo, verifica quem tem três em linha:
    almost_winner = clone.n_in_row(3)
    if almost_winner == None or almost_winner == 'BOTH':
        return 0
    return 1 if almost_winner==jogador else -1

def func_tactic_e_pecas(estado,jogador):
    return func_tactic(estado,jogador) + func_pecas(estado,jogador)

def jogador_tactic_e_pecas_3(jogo,estado) :
    return alphabeta_cutoff_search_new(estado,jogo,3,eval_fn=func_tactic_e_pecas)

def jogador_tactic_247(jogo,estado) :
    return alphabeta_cutoff_search_new(estado,jogo,3,eval_fn=func_247)

pontuacao = 0
jogo=TicTacChess()
for i in range(10):
    resultado = jogo.jogar(jogador_tactic_247,jogador_tactic_e_pecas_3,verbose=False)
    ##print(resultado)
    pontuacao += resultado
print('Pontuação do Tactic:',pontuacao)

## -4 : winner e centro e peças
## 6 : winner(simple) e centro
## 0 : winner(compost) e peças



Pontuação do Tactic: 2
