# <span style="color:blue"> *Torneio Alfabeta Othello*</span>
## Sistemas Inteligentes (2023-24)
### 4º Projecto

<img src="Imagens\othello_disks.jpg" alt="Drawing" style="width: 200px;"/>

## O jogo Othello

**"*A minute to learn, a lifetime to master* "**

Baseado num jogo do século XIX chamado [Reversi](https://en.wikipedia.org/wiki/Reversi), o jogo Othello foi patenteado no Japão em 1971 por [Goro Hasegawa](https://en.wikipedia.org/wiki/Goro_Hasegawa_(game_designer)). O nome do jogo é inspirado na peça *Othello, the Moor of Venice* de William Shakespeare, simbolizando como o domínio do jogo se altera rapidamente com as dramáticas reviravoltas que o tabuleiro sofre.
<br>O jogo Othello é jogado por todo o mundo, inclusive em campeonatos mundiais. Curiosamente, só em 2023 é que o jogo foi "resolvido" (um [artigo](https://arxiv.org/abs/2310.19387) de Hiroki Takizawa demonstra que dois jogadores perfeitos vão sempre empatar num tabuleiro de 8$\times$8). 



### Como funciona o jogo? 

<img src="Imagens\how_to_play_othello_0.png" alt="Drawing" align='left' style="border:20px solid white;width: 200px;"/>


#### Materiais:
O Othello é jogado por dois jogadores num tabuleiro de 8$\times$8 casas. Cada jogador tem peças de uma cor, branco ou preto. Na verdade, as peças com que se joga são todas iguais, brancas de um lado e pretas do outro, e é a cor que está virada para cima que determina a que jogador pertencem. Virando-as ao contrário, passam a pertencer ao outro jogador.

#### Tabuleiro inicial
No tabuleiro inicial, existem quatro peças já colocadas, como ilustrado na figura.

#### Jogada
Quando chega a sua vez, o jogador seleciona uma casa do tabuleiro onde possa jogar e coloca nela uma peça da sua cor (com a sua cor virada para cima). Pode jogar em qualquer casa que esteja livre e que lhe permita fazer uma ou mais "pontes" sobre peças do adversário. Depois de colocar a sua peça, o jogador vira todas as peças do adversário que ficam debaixo das novas pontes, mudando assim a sua cor e tornando-as suas. A seguir, joga o adversário.

Se não existir nenhuma casa que permita ao jogador fazer uma ponte, o jogador tem de passar a vez ao adversário, sem colocar nenhuma peça. Em nenhuma outra situação é permitido passar a vez.

Uma casa permite fazer uma ponte se, colocando lá uma peça do jogador, todas as casas entre essa peça e outra qualquer peça do jogador estão preenchidas com peças do adversário. Só uma nova peça permite formar pontes; uma peça recém-virada em resultado de uma ponte *não* forma novas pontes. As pontes podem ser formadas em todas as direções, na horizontal, vertical e diagonal.

#### Fim do jogo
O jogo acaba quando já não existirem casas livres no tabuleiro ou quando nenhum dos jogadores conseguir colocar uma peça porque nenhuma das casas livres permite formar pontes.

#### O vencedor
Terminado o jogo, ganha o jogador que tiver mais peças da sua cor no tabuleiro (mais peças com a sua cor virada para cima). Pode acontecer um empate se ambos terminarem com o mesmo número de peças.

Eis as [regras oficiais do jogo](https://www.worldothello.org/about/about-othello/othello-rules/official-rules/english), na página da [World Othello Federation](https://www.worldothello.org/).



## Objectivos do projecto
Pretende-se que, dada uma formulação e implementação do jogo, os grupos de alunos:
<br><br>
Criem um jogador, na forma de uma função de avaliação a ser usada pelo algoritmo alfabeta para qualquer profundidade, par ou ímpar. Aconselhamos que comecem por desenvolver um jogador simples para depois ser progressivamente melhorado, de modo a que tenham um jogador disponível na data de entrega limite. Desenvolvam e comparem o desempenho de vários jogadores, para diferentes limites de profundidade, e depois selecionem o melhor deles para entrega. Cada grupo só pode participar no torneio com um único jogador.
<br><br>
O jogador de cada grupo participará em torneios de todos contra todos, i.e., cada jogador irá jogar vários jogos contra os jogadores de todos os outros grupos, em diferentes níveis de profundidade. O nosso jogador também participará, o <span style="color:blue"> ***Basílio***</span>.

<img src="Imagens\basilio.jpg" alt="Drawing" style="width: 200px;"/>

O Basílio sabe que há casas no tabuleiro mais apetecíveis do que outras. Por exemplo, as peças nos cantos do tabuleiro não podem ser capturadas pelo adversário e, por isso, os cantos valem mais do que as outras casas; por outro lado, as peças nas casas adjacentes aos cantos podem permitir ao adversário fazer pontes sobre elas e assim apanhar os cantos, por isso são casas que valem menos do que as outras; outras casas têm um valor diferente consoante a sua importância numa estratégia ganhadora. O desempenho do Basílio é a *baseline* que devem ultrapassar de forma a obterem a nota mínima.


## Formulação do Othello em Python

<img src="Imagens\python.gif" alt="Drawing" style="width: 150px;"/>

Vamos descrever de modo sumário como está modelizado o jogo do Othello, através das classes `EstadoOthello` e `Othello` que estão em `othello.py`.

### O estado do jogo
Na classe `EstadoOthello` temos três atributos principais:

* `to_move`: Indica quem é o próximo a jogar ('X' se for a cor preta, 'O' se for a cor branca).
* `board`: Uma representação do tabuleiro sob a forma de um dicionário que guarda a informação sobre as casas ocupadas. As chaves são as posições das casas ocupadas ($(linha,coluna)$, sendo a primeira linha a de cima e a primeira coluna a da esquerda) e os valores são os jogadores que as ocupam ('X' ou 'O').
* `last_move`: A última casa que foi ocupada. No início do jogo, é 'None'. Se não estamos no início do jogo e o último jogador não conseguiu colocar nenhuma peça, também é 'None'. Se o último jogador não colocou nenhuma peça e este jogador também não consegue, passa a ser 'NoneNone'; isso vai determinar o final do jogo, mesmo que o tabuleiro não esteja completamente preenchido.

Temos também os métodos: 
    
* `next_move()`: Devolve um novo estado do jogo que resulta de uma jogada para uma determinada casa do tabuleiro.
    
* `used_cells()`: Devolve as casas do tabuleiro já ocupadas (as chaves do dicionário board).

* `find_bridge()`: Devolve a casa já ocupada pelo jogador que faz ponte com a jogada pretendida, numa determinada direção. Devolve também a lista de peças do adversário a virar em resultado dessa ponte. Devolve 'None' caso não encontre nenhuma casa que faça ponte nessa direção.
    
* `legal_move()`: Usa o método find_bridge() para procurar uma ponte em todas as direções. Devolve a primeira que encontra, ou None caso nenhuma direção permita fazer uma ponte (o que significa que a jogada pretendida não é possível).
    
* `number_pieces()`: Devolve o número de peças no tabuleiro pertencentes ao jogador atual e ao adversário. 
       
* `other()`: Devolve o outro jogador, dado quem joga a seguir: 'X' se 'O' ou 'O' se 'X'.

* `the_end()`: Deteta se o estado atual é ou leva inevitavelmente ao final do jogo (por tabuleiro cheio ou incapacidade de ambos os jogadores jogarem). 

* `the_winner()`: Detetado o final inevitável do jogo, devolve o jogador que ganha ('X' ou 'O') ou 0 no caso de empate. 
    
* `display()`: Faz o display do tabuleiro em modo de texto.

É possível gerar tabuleiros de qualquer tamanho, e a maioria dos métodos lida bem com isso, mas vamos sempre jogar em tabuleiros 8$\times$8.

Vejamos agora alguns exemplos, após importarmos `othello.py`.

In [1]:
from othello import *

Criemos o estado inicial standard e observemos os seus atributos:

In [2]:
estado_inicial = EstadoOthello(to_move = 'X',board = {(4,4):'O',(5,5):'O',(4,5):'X',(5,4):'X'},last_move='None')
print("Próximo jogador:",estado_inicial.to_move)
print("Tabuleiro:",estado_inicial.board)
print("Última jogada:",estado_inicial.last_move)

Próximo jogador: X
Tabuleiro: {(4, 4): 'O', (5, 5): 'O', (4, 5): 'X', (5, 4): 'X'}
Última jogada: None


Agora observemos o tabuleiro em formato mais legível:

In [3]:
estado_inicial.display(8,8)

   _________________
1 | . . . . . . . . | 
2 | . . . . . . . . | 
3 | . . . . . . . . | 
4 | . . . O X . . . | 
5 | . . . X O . . . | 
6 | . . . . . . . . | 
7 | . . . . . . . . | 
8 | . . . . . . . . | 
  |_________________|
    1 2 3 4 5 6 7 8 


Vamos testar se a jogada '(3,3)', para o jogador 'X' (que é sempre o primeiro a jogar), é possível:

In [4]:
print(estado_inicial.legal_move((3,3)))

None


Não é possível fazer esta jogada, pois não faz nenhuma "ponte" com outra peça de 'X'.
Vamos testar se a jogada '(3,4)' é possível para este jogador:

In [5]:
print(estado_inicial.legal_move((3,4)))

((5, 4), [(4, 4)])


Sim, é possível pois faz ponte com a casa (5,4). As peças a virar em resultado desta ponte são apenas uma: (4,4).
Vamos aplicar esta jogada e visualizar o tabuleiro resultante:

In [6]:
estado_inicial.next_move((3,4)).display(8,8)

   _________________
1 | . . . . . . . . | 
2 | . . . . . . . . | 
3 | . . . X . . . . | 
4 | . . . X X . . . | 
5 | . . . X O . . . | 
6 | . . . . . . . . | 
7 | . . . . . . . . | 
8 | . . . . . . . . | 
  |_________________|
    1 2 3 4 5 6 7 8 


### A classe `Othello`, subclasse de `Game`
A classe `Othello` (em `othello.py`) é uma subclasse de `Game` (em `jogos.py`). 

O construtor gera o estado inicial do jogo com um tabuleiro de 8$\times$8 casas onde já existem quatro peças colocadas, ainda não se fez nenhuma jogada, e o jogador 'X' é o primeiro a jogar.

Temos também os métodos habituais:
* `actions`: Devolve a lista de acções possíveis (jogadas possíveis) para um determinado estado.
* `result`: Devolve o estado que resulta da aplicação de uma acção (jogada) a um outro estado.
* `terminal_test`: Verifica se o jogo acabou ou não.
* `utility`: Devolve um triplo com: número de peças do jogador dado como argumento; número de peças do adversário; +1 se ganhou o jogador, -1 se ganhou o adversário, 0 se empataram.
* `display`: Apresenta em modo de texto o estado do jogo.

Vamos iniciar um jogo e verificar quais as jogadas possíveis para o primeiro jogador:

In [7]:
jogo=Othello()
jogo.display(jogo.initial)
print(jogo.initial.to_move,'pode jogar em',jogo.actions(jogo.initial))

   Tabuleiro atual:
   _________________
1 | . . . . . . . . | 
2 | . . . . . . . . | 
3 | . . . . . . . . | 
4 | . . . O X . . . | 
5 | . . . X O . . . | 
6 | . . . . . . . . | 
7 | . . . . . . . . | 
8 | . . . . . . . . | 
  |_________________|
    1 2 3 4 5 6 7 8 
   Próximo jogador: X

X pode jogar em [(3, 4), (4, 3), (5, 6), (6, 5)]


### Jogadores
Em `jogos.py` temos vários tipos de jogadores e funções para correr jogos.

#### O jogador aleatório
O jogador aleatório escolhe ao acaso uma das jogadas possíveis.
Vamos ver um jogo entre dois jogadores aleatórios:

In [8]:
jogo = Othello()
jogo.jogar(random_player,random_player)

   Tabuleiro atual:
   _________________
1 | . . . . . . . . | 
2 | . . . . . . . . | 
3 | . . . . . . . . | 
4 | . . . O X . . . | 
5 | . . . X O . . . | 
6 | . . . . . . . . | 
7 | . . . . . . . . | 
8 | . . . . . . . . | 
  |_________________|
    1 2 3 4 5 6 7 8 
   Próximo jogador: X

   Tabuleiro atual:
   _________________
1 | . . . . . . . . | 
2 | . . . . . . . . | 
3 | . . . . . . . . | 
4 | . . X X X . . . | 
5 | . . . X O . . . | 
6 | . . . . . . . . | 
7 | . . . . . . . . | 
8 | . . . . . . . . | 
  |_________________|
    1 2 3 4 5 6 7 8 
   Próximo jogador: O

   Tabuleiro atual:
   _________________
1 | . . . . . . . . | 
2 | . . . . . . . . | 
3 | . . . . . . . . | 
4 | . . X X X . . . | 
5 | . . O O O . . . | 
6 | . . . . . . . . | 
7 | . . . . . . . . | 
8 | . . . . . . . . | 
  |_________________|
    1 2 3 4 5 6 7 8 
   Próximo jogador: X

   Tabuleiro atual:
   _________________
1 | . . . . . . . . | 
2 | . . . . . . . . | 
3 | . . . . . . . . | 
4 | . . X X X . .

(19, 45, -1)

Os scores finais são um triplo com: número de peças de X, número de peças de O, +1(-1) se X ganhou(perdeu), ou 0 se empataram.
Se quisermos correr um jogo vendo só os scores finais, podemos usar a função `jogar()` em modo não verboso:

In [9]:
jogo=Othello()
jogo.jogar(random_player,random_player,verbose=False)

(36, 28, 1)

#### O jogador Alfabeta com profundidade limitada
O nosso torneio vai usar sempre o algoritmo Alfabeta. No jogo Othello, não é viável desenvolver a árvore até ao fim, por isso vamos usar o Alfabeta com profundidade limitada (função `alphabeta_cutoff_search_new` definida em `jogos.py`, igual à função `alphabeta_cutoff_search_bombas` do guião de Procura em Jogos). Esta função recebe um estado, um jogo, a profundidade de procura, e uma função de avaliação. É a função de avaliação de cada jogador que vai determinar o seu desempenho.

Vamos equipar o jogador aleatório com uma função de avaliação. Ele continuará a escolher jogadas ao acaso, mas conseguirá reconhecer a situação em que nenhum dos jogadores vai conseguir colocar mais nenhuma peça (final do jogo inevitável), seja por falta de casas livres (tabuleiro cheio) ou porque nenhum deles consegue construir pontes sobre as peças do outro. Quando é detetado o final do jogo, a função de avaliação deve devolver `infinity`/`-infinity` para maximixar o número de cortes que a função `alphabeta_cutoff_search_new` faz.

In [10]:
def func_gameover(estado,jogador) :
    clone=copy.deepcopy(estado) #boa prática de programação, para não arriscarem estragar o estado
    if clone.the_end():
        #print('I see the end!')
        winner=clone.the_winner()
        if winner!=0:
            return infinity if winner==jogador else -infinity
    return 0 #em qualquer outra situação que não seja vitória ou derrota

def jogador_random_plus_1(jogo,estado) :
    return alphabeta_cutoff_search_new(estado,jogo,1,eval_fn=func_gameover)
    

Vejamos a vantagem que traz esta função de avaliação. Reparem que o `jogador_random_plus_1` joga com uma profundidade de procura 1. Quer isto dizer que a procura não vai além da jogada imediata; nem sequer olha para qualquer possível jogada do adversário. Vamos fazer 10 jogos entre o `jogador_random_plus_1` e o jogador aleatório que não reconhece o final do jogo. <br><br>
Reportamos os scores (os triplos) resultantes de cada jogo, e no final a soma dos últimos elementos de todos os triplos. Esta soma será positiva(negativa) se o primeiro(segundo) jogador ganhou a maioria dos jogos, e será 0 se ambos os jogadores ganharem o mesmo número de jogos (ou se empatarem todos os jogos).

In [17]:
quem_ganhou=0
for i in range(10):
    resultado = jogo.jogar(jogador_random_plus_1,random_player,verbose=False)
    print(resultado)
    quem_ganhou += resultado[2]
print(quem_ganhou)

(38, 26, 1)
(33, 31, 1)
(25, 39, -1)
(26, 38, -1)
(32, 32, 0)
(33, 31, 1)
(15, 49, -1)
(29, 35, -1)
(45, 19, 1)
(35, 29, 1)
1


Corram várias vezes. Não é óbvia a vantagem, pois não? Isso é porque a capacidade de reconhecer o final do jogo só é útil quando o jogador consegue procurar com alguma profundidade, caso contrário não vai influenciar as suas decisões *antes* do final do jogo.<br><br> A vantagem torna-se visível com profundidade 2. Vejamos o resultado final obtido em 100 jogos:

In [12]:
def jogador_random_plus_2(jogo,estado) :
    return alphabeta_cutoff_search_new(estado,jogo,2,eval_fn=func_gameover)
        
quem_ganhou=0
for i in range(100):
    resultado = jogo.jogar(jogador_random_plus_2,random_player,verbose=False)
    #print(resultado)
    quem_ganhou += resultado[2]
print(quem_ganhou)

10


### O Basílio
Vamos agora definir a função de avaliação do nosso jogador <span style="color:blue"> ***Basílio***</span>, chamada `func_basilio`. Como dito acima, o Basílio sabe que há casas no tabuleiro que são mais ou menos valiosas do que as outras. Consegue também reconhecer o final do jogo.

In [13]:
tabela_casas_basilio = {(1,1) : 100, (1,2) : -25, (1,3) : 10, (1,4) : 5, (1,5) : 5, (1,6) : 10, (1,7) : -25, (1,8) : 100,
                        (2,1) : -25, (2,2) : -25, (2,3) : 1, (2,4) : 1, (2,5) : 1, (2,6) : 1, (2,7) : -25, (2,8) : -25,
                        (3,1) : 10, (3,2) : 1, (3,3) : 5, (3,4) : 2, (3,5) : 2, (3,6) : 5, (3,7) : 1, (3,8) : 10,
                        (4,1) : 5, (4,2) : 1, (4,3) : 2, (4,4) : 1, (4,5) : 1, (4,6) : 2, (4,7) : 1, (4,8) : 5,
                        (5,1) : 5, (5,2) : 1, (5,3) : 2, (5,4) : 1, (5,5) : 1, (5,6) : 2, (5,7) : 1, (5,8) : 5,
                        (6,1) : 10, (6,2) : 1, (6,3) : 5, (6,4) : 2, (6,5) : 2, (6,6) : 5, (6,7) : 1, (6,8) : 10,
                        (7,1) : -25, (7,2) : -25, (7,3) : 1, (7,4) : 1, (7,5) : 1, (7,6) : 1, (7,7) : -25, (7,8) : -25,
                        (8,1) : 100, (8,2) : -25, (8,3) : 10, (8,4) : 5, (8,5) : 5, (8,6) : 10, (8,7) : -25, (8,8) : 100}
    
def func_basilio_aux(estado,jogador,tabela) :
    clone=copy.deepcopy(estado)
    if clone.the_end():
        winner=clone.the_winner()
        if winner!=0:
            return infinity if winner==jogador else -infinity
        return 0 # em caso de empate
    # se não reconhecemos o final do jogo:
    soma = 0
    for p,j in clone.board.items() :
        if j == jogador:
            soma += tabela[p]
        else :
            soma -= tabela[p]
    return soma

func_basilio = lambda estado, jogador: func_basilio_aux(estado,jogador,tabela_casas_basilio)

A avaliação de um estado não terminal é feita somando os valores de todas as casas pertencentes ao jogador (`tabela[p]`) e subtraindo os valores de todas as casas pertencentes ao adversário (`-tabela[p]`). Reparem que, quando um jogador tem casas de valor negativo (as casas que queremos evitar), isso representa uma vantagem (valor positivo) para o adversário.
<br><br>Vamos verificar como é que esta função de avaliação avalia alguns estados: 

In [14]:
brd0={(4, 4): 'O', (5, 5): 'O', (4, 5): 'X', (5, 4): 'X'}
brd1={(4, 4): 'O', (5, 5): 'X', (4, 5): 'O', (5, 4): 'O', (3, 4): 'X', (3, 3): 'O', (3, 2): 'X', (2, 2): 'X', (4, 3): 'X', (4, 2): 'O', (5, 6): 'O', (3, 5): 'X', (4, 1): 'X', (6, 7): 'X', (1, 1): 'X', (1, 2): 'X', (1, 3): 'X', (5, 2): 'X', (2, 1): 'X', (6, 4): 'O', (5, 1): 'X', (3, 1): 'O', (6, 3): 'O', (6, 2): 'X', (2, 3): 'X', (2, 4): 'X', (5, 7): 'X', (4, 6): 'O', (7, 8): 'O', (6, 6): 'O', (1, 5): 'O', (4, 8): 'O', (7, 4): 'O', (6, 8): 'O', (3, 6): 'O', (3, 7): 'O', (5, 8): 'O', (8, 8): 'O', (7, 6): 'X', (1, 4): 'O', (6, 1): 'X', (7, 2): 'X', (5, 3): 'X', (8, 5): 'O', (2, 8): 'O', (4, 7): 'O', (2, 5): 'X', (7, 7): 'X', (2, 7): 'O', (7, 3): 'X', (7, 5): 'O', (6, 5): 'X', (8, 2): 'O', (1, 8): 'O', (1, 7): 'O', (8, 3): 'O', (8, 7): 'X', (8, 1): 'O', (7, 1): 'X', (3, 8): 'O', (2, 6): 'O', (1, 6): 'O', (8, 4): 'O'}
brd2={(4, 4): 'O', (5, 5): 'X', (4, 5): 'O', (5, 4): 'O', (3, 4): 'X', (3, 3): 'O', (3, 2): 'X', (2, 2): 'X', (4, 3): 'X', (4, 2): 'O', (5, 6): 'O', (3, 5): 'X', (4, 1): 'X', (6, 7): 'X', (1, 1): 'X', (1, 2): 'X', (1, 3): 'X', (5, 2): 'X', (2, 1): 'X', (6, 4): 'X', (5, 1): 'X', (3, 1): 'O', (6, 3): 'O', (6, 2): 'X', (2, 3): 'X', (2, 4): 'X', (5, 7): 'X', (4, 6): 'O', (7, 8): 'O', (6, 6): 'O', (1, 5): 'O', (4, 8): 'O', (7, 4): 'O', (6, 8): 'O', (3, 6): 'O', (3, 7): 'O', (5, 8): 'O', (8, 8): 'O', (7, 6): 'X', (1, 4): 'O', (6, 1): 'X', (7, 2): 'X', (5, 3): 'X', (8, 5): 'O', (2, 8): 'O', (4, 7): 'O', (2, 5): 'X', (7, 7): 'X', (2, 7): 'O', (7, 3): 'X', (7, 5): 'X', (6, 5): 'X', (8, 2): 'O', (1, 8): 'O', (1, 7): 'O', (8, 3): 'O', (8, 7): 'X', (8, 1): 'O', (7, 1): 'X', (3, 8): 'O', (2, 6): 'O', (1, 6): 'O', (8, 4): 'O', (8, 6): 'X'}
est0=EstadoOthello('X',brd0,'None')
est1=EstadoOthello('X',brd1,(8,4))
est2=EstadoOthello('O',brd2,(8,6))
jogo=Othello()
jogo.display(est0)
print('Avaliação segundo',est0.to_move,': ',func_basilio(est0,est0.to_move))
print('Avaliação segundo',est0.other(),': ',func_basilio(est0,est0.other()),'\n\n')
jogo.display(est1)
print('Avaliação segundo',est1.to_move,': ',func_basilio(est1,est1.to_move))
print('Avaliação segundo',est1.other(),': ',func_basilio(est1,est1.other()),'\n\n')
jogo.display(est2)
print('Avaliação segundo',est2.to_move,': ',func_basilio(est2,est2.to_move))
print('Avaliação segundo',est2.other(),': ',func_basilio(est2,est2.other()),'\n\n')

   Tabuleiro atual:
   _________________
1 | . . . . . . . . | 
2 | . . . . . . . . | 
3 | . . . . . . . . | 
4 | . . . O X . . . | 
5 | . . . X O . . . | 
6 | . . . . . . . . | 
7 | . . . . . . . . | 
8 | . . . . . . . . | 
  |_________________|
    1 2 3 4 5 6 7 8 
   Próximo jogador: X

Avaliação segundo X :  0
Avaliação segundo O :  0 


   Tabuleiro atual:
   _________________
1 | X X X O O O O O | 
2 | X X X X X O O O | 
3 | O X O X X O O O | 
4 | X O X O O O O O | 
5 | X X X O X O X O | 
6 | X X O O X O X O | 
7 | X X X O O X X O | 
8 | O O O O O . X O | 
  |_________________|
    1 2 3 4 5 6 7 8 
   Próximo jogador: X

Avaliação segundo X :  -314
Avaliação segundo O :  314 


   Tabuleiro final:
   _________________
1 | X X X O O O O O | 
2 | X X X X X O O O | 
3 | O X O X X O O O | 
4 | X O X O O O O O | 
5 | X X X O X O X O | 
6 | X X O X X O X O | 
7 | X X X O X X X O | 
8 | O O O O O X X O | 
  |_________________|
    1 2 3 4 5 6 7 8 
   
FIM do jogo
   X conseguiu 31
   O 

Vamos definir o jogador <span style="color:blue"> ***Basílio***</span> e ver qual o seu desempenho ao jogar com o jogador random_plus com uma profundidade de procura 3.

In [15]:
jogo=Othello()
def jogador_basilio_3(jogo,estado) :
    return alphabeta_cutoff_search_new(estado,jogo,3,eval_fn=func_basilio)

def jogador_random_plus_3(jogo,estado) :
    return alphabeta_cutoff_search_new(estado,jogo,3,eval_fn=func_gameover)

quem_ganhou=0
for i in range(10):
    resultado = jogo.jogar(jogador_basilio_3,jogador_random_plus_3,verbose=False)
    print(resultado)
    quem_ganhou += resultado[2]
print(quem_ganhou)


(41, 23, 1)
(31, 33, -1)
(42, 22, 1)
(29, 35, -1)
(41, 23, 1)
(46, 18, 1)
(58, 6, 1)
(53, 11, 1)
(42, 22, 1)
(23, 41, -1)
4


Podemos também correr um jogo com o utilizador humano. Atenção: o jogador humano deve indicar sempre uma das jogadas possíveis, caso contrário o jogo não é válido; se a lista de jogadas possíveis tiver apenas 'None', o jogador humano deve escrever exatamente 'None' (incluindo as pelicas) como jogada. <br>Tentem ganhar ao Basílio!

In [16]:
jogo=Othello()
#jogo.jogar(query_player,jogador_basilio_3) #descomentar para jogar

### Funções de avaliação compostas
Obviamente que o Basílio, mesmo sendo melhor que o jogador aleatório (em média), não é lá grande jogador. É importante saber a importância relativa das diferentes casas do tabuleiro, sim, mas isso não chega. Para obterem um bom jogador, terão de combinar vários critérios na mesma função de avaliação. Vamos dar como exemplo um jogador que usa o critério da importância das casas (o mesmo que o Basílio usa) e um segundo critério que é a diferença entre o número de peças do jogador e o número de peças do adversário. Simplesmente soma os valores dos dois critérios. Este jogador será melhor que o Basílio? Vamos descobrir isso em 10 jogos com profundidade 3:

In [17]:
def func_pecas(estado,jogador) :
    clone=copy.deepcopy(estado)
    resultado=clone.number_pieces(jogador)
    return resultado[0]-resultado[1]

def func_casas_e_pecas(estado,jogador):
    return func_basilio(estado,jogador) + func_pecas(estado,jogador)

def jogador_casas_e_pecas_3(jogo,estado) :
    return alphabeta_cutoff_search_new(estado,jogo,3,eval_fn=func_casas_e_pecas)

quem_ganhou=0
for i in range(10):
    resultado = jogo.jogar(jogador_basilio_3,jogador_casas_e_pecas_3,verbose=False)
    print(resultado)
    quem_ganhou += resultado[2]
print(quem_ganhou)

(28, 36, -1)
(33, 31, 1)
(37, 27, 1)
(18, 46, -1)
(30, 34, -1)
(34, 30, 1)
(41, 23, 1)
(30, 34, -1)
(24, 40, -1)
(23, 41, -1)
-2


Não é óbvio qual é o melhor jogador (corram várias vezes). O critério do número de peças será bom? Será que deve ser mais ou menos importante que o critério das casas? Podemos dar pesos diferentes a cada um? Podemos combinar outros critérios da mesma forma? Devemos combiná-los de outra forma? Os diferentes critérios terão a mesma importância relativa em todas as fases do jogo?

Disponibilizamos uma função que combina várias funções de avaliação numa só, aceitando como argumentos os nomes das várias funções de avaliação e os pesos de cada uma:

In [18]:
def func_combina_com_pesos(estado,jogador,pesos,funcoes):
    """Função que devolve a combinação linear de várias funções de avaliação."""
    return sum([p*f(estado,jogador) for (p,f) in zip(pesos,funcoes)])

Recorrendo a esta função, definimos uma nova função de avaliação que dá mais importância ao número de peças do que à importância relativa das casas (os pesos não têm de somar 1), e um novo jogador que a usa (reparem que se usa da mesma forma que as outras):

In [19]:
def nova_func_casas_e_pecas(estado,jogador):
    return func_combina_com_pesos(estado,jogador,[0.5,2],[func_basilio,func_pecas])

def novo_jogador_casas_e_pecas_3(jogo,estado) :
    return alphabeta_cutoff_search_new(estado,jogo,3,eval_fn=nova_func_casas_e_pecas)

Podem combinar funções como quiserem, não tem de ser obrigatoriamente com pesos. Reparem que a função de avaliação do Basílio já é, só por si, uma combinação de critérios: primeiro deteta se chegámos a um tabuleiro final e, se for esse o caso, atribui uma avaliação de final de jogo; se não for esse o caso, atribui uma avaliação ao tabuleiro.

### N Pares de jogos
Vejamos agora uma função que realiza $N$ pares de jogos entre dois jogadores, $N$ jogos com um deles a jogar primeiro, $N$ jogos com o outro a jogar primeiro. Devolve um tuplo com 4 elementos: o número de vitórias de cada um e de empates quando um deles joga primeiro; o número de vitórias de cada um e de empates quando o outro joga primeiro; o número total de vitórias de cada um e de empates; e finalmente o score de cada um. A pontuação depende da tabela de `scores`, que neste caso indica que a vitória vale $3$, a derrota $0$ e o empate $1$. É a mesma escala que iremos utilizar no torneio.

In [20]:
scores={'Vitoria': 3, 'Empate': 1}

def traduzPontos(tabela):
    tabelaScore={}
    empates=tabela['Empate']
    for x in tabela:
        if x != 'Empate':
            tabelaScore[x]=scores['Vitoria']*tabela[x]+scores['Empate']*empates
    return tabelaScore

def jogaNpares(jogo,n,jog1,jog2):
    name_jog1=jog1.__name__
    name_jog2=jog2.__name__
    tabelaPrim={name_jog1:0, name_jog2:0, 'Empate':0}
    tabelaSeg={name_jog1:0, name_jog2:0, 'Empate':0}
    tabela={}
    for _ in range(n):
        _,_,vencedor=jogo.jogar(jog1,jog2,verbose=False)
        if vencedor>0:
            vencedor=name_jog1
        elif vencedor<0:
            vencedor=name_jog2
        else:
            vencedor='Empate'
        tabelaPrim[vencedor]+=1
        _,_,vencedor=jogo.jogar(jog2,jog1,verbose=False)
        if vencedor>0:
            vencedor=name_jog2
        elif vencedor<0:
            vencedor=name_jog1
        else:
            vencedor='Empate'
        tabelaSeg[vencedor]+=1
    for x in tabelaPrim:
        tabela[x]=tabelaPrim[x]+tabelaSeg[x]
    return tabelaPrim,tabelaSeg,tabela,traduzPontos(tabela)

Façamos 5 pares de jogos entre o jogador_casas_e_pecas_3 e o novo_jogador_casas_e_pecas_3 e vejamos a pontuação final:

In [21]:
jogo=Othello()
jogaNpares(jogo,5,jogador_casas_e_pecas_3,novo_jogador_casas_e_pecas_3)

({'jogador_casas_e_pecas_3': 5,
  'novo_jogador_casas_e_pecas_3': 0,
  'Empate': 0},
 {'jogador_casas_e_pecas_3': 3,
  'novo_jogador_casas_e_pecas_3': 2,
  'Empate': 0},
 {'jogador_casas_e_pecas_3': 8,
  'novo_jogador_casas_e_pecas_3': 2,
  'Empate': 0},
 {'jogador_casas_e_pecas_3': 24, 'novo_jogador_casas_e_pecas_3': 6})

### Torneio entre vários jogadores
Eis a função que realiza um torneio entre vários jogadores, em que cada um realiza um número $N$ de jogos contra todos os outros como primeiro jogador, e $N$ como segundo jogador:

In [22]:
def incorpora(tabela,tx):
    for jog in tx:
        if jog not in tabela:
            tabela[jog]=tx[jog]
        else:
            tabela[jog]+=tx[jog]
    
def torneio(n,jogadores):
    jogo=Othello()
    tabela={}
    for i in range(len(jogadores)-1):
        jog1=jogadores[i]
        for j in range(i+1,len(jogadores)):
            jog2=jogadores[j]
            print(jog1.__name__,'vs',jog2.__name__)
            _,_,_,tabelaX = jogaNpares(jogo,n,jog1,jog2)
            incorpora(tabela,tabelaX)
    #return tabela
    print(dict(sorted(tabela.items(), key=lambda x: x[1],reverse=True)))

Fazemos agora um torneio com três dos jogadores que gerámos até agora, com 5 pares de jogos entre eles.<br> Os resultados são apresentados do melhor para o pior jogador:

In [23]:
torneio(5,[jogador_basilio_3,jogador_casas_e_pecas_3,novo_jogador_casas_e_pecas_3])

jogador_basilio_3 vs jogador_casas_e_pecas_3
jogador_basilio_3 vs novo_jogador_casas_e_pecas_3
jogador_casas_e_pecas_3 vs novo_jogador_casas_e_pecas_3
{'jogador_basilio_3': 37, 'jogador_casas_e_pecas_3': 33, 'novo_jogador_casas_e_pecas_3': 19}


O que se conclui destes resultados? Hmmm... o Basílio será assim tão fácil de derrotar?

<img src="Imagens\basilio.jpg" alt="Drawing" style="width: 150px;"/>


## Material a entregar
Devem entregar um ficheiro **SI2324-proj4-jog-XX.py** (substituindo XX pelo número do grupo), com o código da vossa função de avaliação e todas as funções auxiliares que criarem.

<span style="color:red"> **Não alterem**</span> `othello.py` nem `jogos.py` nem `utils.py` e **não os devem submeter!**
<br><span style="color:red">**Não redefinam**</span> funções com o mesmo nome das já existentes nestes ficheiros.

A função de avaliação do vosso jogador deverá ter o nome **func_XX(estado,jogador)** (substituindo XX pelo número do grupo) e deve devolver o valor estimado do `estado` na perspectiva do `jogador`. Não precisam de definir o vosso jogador, pois seremos nós a defini-lo com diferentes profundidades durante a avaliação.

**Todas** as vossas funções devem ter o sufixo **_XX** (substituindo XX pelo número do grupo), para que não se partilhe nem se sobreponha código durante a avaliação.

## Avaliação
A nota do vosso projecto depende da pontuação final obtida no torneio *múltiplo*. 
   
**Torneios**: Cada jogador irá participar em torneios contra todos os outros, fazendo pelo menos dois jogos (um como primeiro jogador, outro como segundo jogador) contra cada um dos outros jogadores em cada torneio. Faremos torneios a diferentes profundidades, pelo menos profundidade 3 e profundidade 4. Se o tempo de execução o permitir, faremos mais jogos por torneio, e mais torneios a profundidades maiores.

**Pontuação**: Nos torneios, vamos sempre incluir o nosso jogador <span style="color:blue"> ***Basílio***</span>. A pontuação obtida por cada grupo em cada torneio será a *soma dos pontos obtidos em todos os jogos* (em que cada vitória vale 3, cada empate vale 1, e cada derrota vale 0). A pontuação final será a soma das pontuações obtidas em todos os torneios.

**Nota**: Quem obtiver a mesma pontuação final que o <span style="color:blue"> ***Basílio***</span>, terá 10 valores. Quem tiver uma pontuação inferior ao Basílio terá negativa (nota menor do que 10) nesta componente. A nota será resultado da aplicação de uma função linear baseada na pontuação obtida, tanto acima do Basílio como para baixo. O grupo que ficar em primeiro lugar no torneio (naturalmente, acima do Basílio), terá 20 valores.

**Clones**: Qualquer jogador que seja um clone do <span style="color:blue"> ***Basílio***</span> ou de outro jogador aqui definido será desclassificado e ficará com nota 0. Jogadores que sejam cópias descaradas uns do outros também serão desclassificados. 

**Timeout**: Se um jogador ultrapassar o tempo limite para uma jogada, será também desclassificado. Usaremos bom senso para definir o que é o tempo considerado como limite: será o tempo acima do qual a execução do torneio fica comprometida.

**Ficheiros**: Se um grupo entregar ficheiros que não seguem as regras definidas acima (nomeadamente, no que respeita aos sufixos nos nomes das funções) sofrerá uma penalização na nota proporcional ao tempo necessário para resolver a situação. No limite, não será possível a sua participação no torneio e a nota será 0.

## Prazo de entrega

Até ao dia **19 de Maio** (domingo) às 23:59
<br>Dúvidas só até dia 17 de Maio (6a feira) às 23:59 (sgsilva@fc.ul.pt), depois disso já não serão respondidas.
