#  Jogo dos Rastros
## Projeto nº 2
### Introdução à Inteligência Artificial edição 2020/21


## Grupo: XX

### Elementos do Grupo

Nome: João Cotralha

Número: 51090

Nome: João Vieira

Número: 45677

Nome: Miguel Cruz

Número: 43266

In [45]:
from rastros import *
import time    
 
# Corre n jogos entre player1 e player2    
def teste(player1, player2, n):
    score_p1 = 0
    score_p2 = 0
    i = 0
    start = time.time()
    print("------INICIO DE TESTE------")
    ##########################################
    for x in range(n//2):
        jogo = jogaRastros11(player1, player2)
        if jogo[1] > 0:
            score_p1 += 1
        else:
            score_p2 += 1
        i+=1
        print("Status: ", (i/n)*100, "%")
        jogo = jogaRastros11(player2, player1)
        if jogo[1] > 0:
            score_p2 += 1
        else:
            score_p1 += 1
        i+=1
        print("Status: ", (i/n)*100, "%")
    print("----------RESULTS----------")
    print("Time: ", time.strftime("%H:%M:%S",time.gmtime(time.time()-start)))
    print("Games processed: ", n)
    print("Score ",player1.nome,": ",score_p1)
    print("Score ",player2.nome,": ",score_p2)
    print(player1.nome," winrate: ", (score_p1/n)*100, "%")

# Representa o tabuleiro num grafo
def graph(estado) :
    graph = {}
    
    for i in range(1,9):
        for j in range(1,9):
            graph[(i,j)] = dict.fromkeys([p for p in [(i+a, j+b) for a in [-1,0,1] for b in [-1,0,1]]
                           if p not in estado.blacks and p != (i,j) and p in estado.fullboard], 1)
            
    return graph   

# Encontra o caminho mais curto entre dois pontos de um grafo
def bfs_shortest_path(graph, start, goal):
    explored = []
    queue = [[start]]
 
    while queue:
        path = queue.pop(0)
        point = path[-1]
        if point not in explored:
            adjacent = graph[point]
            
            for adj in adjacent:
                new_path = list(path)
                new_path.append(adj)
                queue.append(new_path)
      
                if adj == goal:
                    return new_path
 
            explored.append(point)
 
    return []

# Funcao de avaliacao heuristica
def fun_aval_XX(estado, jogador):
    if estado.terminou == 1:
        return 999 if jogador == "S" else -999
    elif estado.terminou == -1:
        return 999 if jogador == "N" else -999     
    else:
        obj = (8, 1) if jogador == "S" else (1, 8)
        res = 0
        for p in bfs_shortest_path(graph(estado), estado.white, obj):
            res += 1
        return res + len(estado.blacks)

### Explicação da função e sua lógica

A nossa função de avaliação de heurísticas consiste em várias fases. Para cada estado ponderado pelo algoritmo __alphabeta__ (cada nó da árvore criada por este), são aplicadas as seguintes regras:

Primeiro, verifica se o estado atual é de vitória ou derrota para o jogador atual quer seja por atingir um dos dois objetivos, ou por bloquei. Caso seja vitória retorna o valor mais alto possível nesta funço, e caso contrário retorna o valor mínimo.

Se o estado atual não é término, a função de avaliação vai criar um __grafo__ representativo do estado, ou seja, o grafo vai representar o tabuleiro que por sua vez é representado pela estrutura de dados _estado_.

O grafo no fundo é um dicionário, em que as chaves são todos os pontos do tabuleiro que não estejam indisponíveis (casas pretas). O valor dessas chaves será outro dicionário, em que as chaves são as casas disponíveis (não pretas) adjacentes, e o valor dessa chave será 1, o número de jogadas para ir de um ponto a outro ponto adjacente.

Com esta representação do estado podemos agora correr um algoritmo de __breadth first search__, que irá pegar no ponto inicial, no nosso caso o ponto da peça branca no estado, e irá percorrer todos os seus pontos adjacentes e consequentemente os pontos adjacentes desses mesmos até chegar ao ponto defenido como objetivo, que no nosso caso ou é (8,1) para o jogador _S_, ou (1,8) caso contrário. Então, o nosso algoritmo de breadth first search cria uma árvore em que cada ramo é um caminho possível (ou não) desde a casa da peça branca até ao objetivo, e retorna o caminho mais curto, ou seja, o caminho que requer menos jogadas para alcançar.

Temos então o custo de levar a peça branca ao objetivo para este estado. A este valor, somamos o custo de chegar a este estado a partir do estado inicial (por outras palavras, o número de peças pretas no estado). O resultado desta soma é então, a maneira como a função avalia a heurística de um estado não término.

Concluímos então a implementação de um algoritmo _best-first search __A*___  ou "__A-star search__". 


### Demonstração

Para mostrar a sua eficiência em relação ao jogo, podemos começar por realizar 4 jogos contra o jogador Basilio, e ver o seu resultado. Utilizamos a função auxiliar __teste()__ que faz n jogos entre jogador1 e jogador2. A primeira jogada é alternada entre ambos jogadores. 

Definimos primeiro o jogador alfabeta que irá utilizar esta função e de seguida analisamos o resultado do teste:

In [44]:
#Definicao do jogador
babujo = Jogador("Babujo",
                  lambda game, state:
                  alphabeta_cutoff_search_new(state,game,5,eval_fn=fun_aval_XX))

#Realizacao dos 4 jogos
teste(babujo, basilio, 4)

------INICIO DE TESTE------
Status:  25.0 %
Status:  50.0 %
Status:  75.0 %
Status:  100.0 %
----------RESULTS----------
Time:  00:00:24
Games processed:  4
Score  Babujo :  4
Score  Basilio :  0
Babujo  winrate:  100.0 %


Podemos observar a lógica da função ao analisar uma estratégia de abertura de jogo frequentemente adotada por esta:

<img src="open2.png" alt="Drawing"/>


Neste caso, o jogador alfabeta fez a primeira jogada.
Como podemos observar, se escolhermos adotar a estratégia imediatamente intuitiva de jogar para a casa mais perto do nosso objetivo, o jogador alfabeta responde de maneira a maximizar a nossa distância do objetivo bloqueando-o com peças pretas. Se não alterarmos de estratégia, a casa objetivo ficará bloqueada.

Após isto, as próximas jogadas do jogador alfabeta vão pouco a pouco preenchendo o tabuleiro de forma a que não sofra bloqueio total do adversário, até chegar ao seu objetivo ou bloquear o adversário.

Podemos observar este caso exemplificado num jogo contra o jogador basilio, em que o jogador alfabeta teve a primeira jogada:


<img src="game2.png" alt="Drawing"/>

Apesar de lenta, podemos ver que esta estratégia adotada pela função é eficiente.

Para a realização de mais testes contra o basilio de, por exemplo 100 jogos, está em baixo o comando:

In [None]:
# ATENCAO: pode levar algum tempo 
# por exemplo, 100 jogos demoram 10 minutos em um i5-6400
# os jogadores ou o número de jogos podem ser alterados
teste(babujo, basilio, 100)