# Resolvendo Pacman

O objetivo deste trabalho é de resolver o jogo Pacman, de forma estática, utilizando os algoritmos de busca aprendidos nas aulas de MC906/MO416.

Matheus Silva Capeletti RA 203587

João Paulo Soubihe RA 151106

Lucas RA 182371

Karol Daniela Cala Pinzón RA 264308

Johana Marisol Saravia Bulla 264319 RA 

## Algoritmos utilizados
1. Breadth first search
2. Depth first search
3. Greedy Best First search
4. A*
5. Hill climbing search


## Representação do problema e seus estados

Como forma de facilitar nosso trabalho, usamos a estrutura da ferramenta AIMA, dada como auxílio para o desenvolvimento do nosso projeto. Aproveitamos a classe **__Node__** para armazenar o estado, que nada mais seria que as coordenadas (x, y) descrevendo a posição no maze.

Essa classe contém alguns métodos que nos serão muito úteis, como o método *path*, que nos dá o caminho percorrido até ali pela busca, ou o *expand* que nos retorna uma lista de nós que podemos seguir a partir das ações disponíveis.

Quanto aos métodos de busca, por estarmos aproveitando a estrutura dada também seguiu a mesma lógica do AIMA.

Abaixo é possível ver a definição do problema:

In [None]:
from Problem import Node

class PacmanProblem(Problem):
    def __init__(self, initial, goal, maze=None):
        self.initial = initial
        self.goal = goal
        if maze == None:
            self.maze, self.mazeY, self.mazeX = rM.readMaze()
        else:
            self.maze, self.mazeY, self.mazeX = rM.readMaze(maze)
    
    # para uma determinada posição retorna as posições adjacentes que são caminhos cinza
    def adjacent(self, position):
        adjacent = []
        # left
        if self.maze[position[0], position[1]-1] == 2:
            if position[1] -1 < 0:
                adjacent.append((position[0], self.mazeX -1))
            else:
                adjacent.append((position[0], position[1]-1))
        # right
        if position[1] + 1 == self.mazeX and self.maze[position[0], 0] == 2:
            adjacent.append((position[0], 0))
        elif position[1] + 1 < self.mazeX and self.maze[position[0], position[1]+1] == 2:
            adjacent.append((position[0], position[1]+1))
                
        # up
        if self.maze[position[0]-1, position[1]] == 2:
            if position[0] -1 < 0:
                adjacent.append((self.mazeY-1, position[1]))
            else:
                adjacent.append((position[0]-1, position[1]))
        # down
        if position[0] + 1 == self.mazeY and self.maze[0, position[1]] == 2:
            adjacent.append((0, position[1]))
        elif position[0] + 1 < self.mazeY and self.maze[position[0]+1, position[1]] == 2:
            adjacent.append((position[0]+1, position[1]))
        
        return adjacent

     # retorna os possíveis estados filhos para o estado especificado
    def actions(self, state):
        return self.adjacent(state)

    # o objetivo será alcançado se todas as posições alcançáveis através do estado inicial estiverem na solução 
    # e a primeira e a última posição na solução são a posição inicial e a posição do objetivo
    def goal_test(self, states):
        return states[-1] == self.goal and states[0] == self.initial
    
    def result(self, state, action):
        return action
    
    def path_cost(self, c, position1, action, position2):
        # Se as posicoes n forem adjacentes entao nao ha um caminho direto de pos1 pra pos2
        if abs(position1[0] - position2[0]) > 1 or abs(position1[1] - position2[1]) > 1:
            return math.inf
        return c+1

    # Retorna uma lista com todas as posicoes alcancaveis a partir da posicao dada, inclusive essa posicao
    def reachable_positions(self, startPosition):
        positions = []
        queue = [startPosition]

        while queue:
            position = queue.pop(0)
            positions.append(position)
            actions = self.adjacent(position)

            for action in actions:
                alreadyVisited = False
                for item in positions:
                    if item == action:
                        alreadyVisited = True
                        break

                if alreadyVisited == False:
                    queue.append(action)

        return set(positions)


    def h(self, node):
        return self.distance(node.state, self.goal)

    def g(self, node):
        return node.path_cost
    
    def h2(self, node):
        return self.euclidean_distance(node.state, self.goal)
    
    def euclidean_distance(self, position1, position2):
        #Detalhada mais abaixo no relatório
    
       # Calcula a distancia entre duas posicoes, valido apenas para posicoes que fazem parte da sol
    @functools.lru_cache(maxsize=4096)
    def distance(self, position1, position2, lim=100000):
        if position1 == position2:
            return 0
   # dicicionario com formato { item: [distancia, visitado (0 = nao, 1 = sim)], ... }
        d = dict.fromkeys(self.reachable_positions(position1), [math.inf, 0])
        d[position1] = [0, 0]

        i = 0
        while min({l[1] for l in d.values()}) == 0 and i < lim:
            m = math.inf
            current = None
            for k, v in d.items():
                if v[1] == 0 and v[0] < m:
                    current = k
                    m = v[0]

            d[current] = [m, 1]

            neighbors = self.adjacent(current)
            for neighbor in neighbors:
                if d[neighbor][1] == 0 and m + 1 < d[neighbor][0]:
                    d[neighbor] = [m + 1, 0]
                    if neighbor == position2:
                        return m + 1

            current = None
            i = i + 1

        try:
            return d[position2][0]
        except KeyError:
            return math.inf

A função adjacente retorna para uma dada posição áreas cinzas adjacentes para as quais é possível se movimentar, não criamos uma abstração do tipo 'left', 'right', 'up', 'down' pois não consideramos necessário para a resolução do problema.

Definimos o *goal_test* como: dada uma sequência de posições a primeira posição da sequência é a posição inicial do problema e a última posição é a posição de objetivo do problema, não verificamos se os itens intermediários são de fato adjacentes pois isso seria custoso nos algoritmos de busca.

A função *reachable_positions* retorna uma lista de posições que podem ser alcançadas a partir de uma posição dada como argumento.

O algoritmo *distance* acima calcula a **distância** entre dois pontos, se eles puderem ser atingidos um a partir do outro.
Inicialmente, ele checa se os pontos passados se referem a mesma posição, em caso positivo, já temos nossa resposta! (e nos poupa um bom processamento). Em caso negativo *distance* usa uma função auxiliar (*reachable_positions*) que nos retorna um dicionário onde dada a chave (coordenadas da respectiva posição) temos um valor (uma lista (distancia, visitado)).
Enquanto não existir elementos ainda não visitados, avaliamos o **mais próximo** dentre estes,  da posição corrente da nossa busca.

Com esse nó avaliado no loop, para cada posição adjacente não avaliada, incrementa-se a distância respectiva.

Esse processo continua até que se visite a posição dada por _position2_ 

Ou seja, em resumo, simulamos os passos a serem dados para nosso agente chegar de um ponto A (*position1*) a um ponto B (*position2*) e projetamos o menor caminho possível, sustentado pela estratégia de que iniciamos cada uma das "buscas parciais" do nó com a menor distância, nos termos de manhattan, a cada iteração.

## Como executar uma busca e limitações

Ao criar uma instância do problema é necessário especificar a posição inicial e final desejadas, as posições são tuplas de inteiros no formato *(x,y)*; o nome da Maze é um parâmetro opcional, se não for especificada o programa procura no diretório em que está contido a pasta *mazes* e dentro dela o arquivo *Maze1*.

O formato da maze de entrada deve ser:
numLinhas numColunas
1 2 1 2 1 1 1 2 2 ...
2 1 2 1 2 3 2 1 2 ...
...

As dimensões da Maze devem ser fornecidas, numLinhas representa a altura da maze, o arquivo de entrada não precisa ter a definição em múltiplas linhas; numColunas representa a largura da maze. Portanto após numLinhas e numColunas deve haver numLinhas * numColunas números, separados por espaços (inclusive numLinhas e numColunas).

0s representam os espaços em branco (podem ser atravessados porém não fazem parte do objetivo);

1s representam as paredes;

2s representam o caminho cinza;

3s representam os fantasmas.

Nosso problema possui a limitação de não considerar os espaços em branco como áreas atravessáveis, e não há distinção entre espaços em branco, paredes e fantasmas, as decisões no problema se basearam apenas em "é um espaço cinza ou não?"

Exemplo de execução do programa para cada um dos algoritmos de busca:

In [None]:
pacman_problem1 = PacmanProblem((1, 1), (8, 11))

iterations, all_node_colors, node = astar_search_graph(pacman_problem1)
iterations, all_node_colors, node = greedy_best_first_search(pacman_problem1)
iterations, all_node_colors, node = breadth_first_search(pacman_problem1)
iterations, all_node_colors, node = depth_first_graph_search(pacman_problem1)
iterations, all_node_colors, node = hill_climbing_search(pacman_problem1)

## Goal Test

Simplesmente é passado o path contendo o novo node a ser avaliado e, como estrutura do problema, nosso goal.
Caso o goal esteja contido no path achamos nosso objetivo! O agente então poderá agir.

Aqui é importante lembrar que nosso agente realiza somente buscas offline, ou seja, antes de realizar uma ação, a busca é executada e uma solução é encontrada.

### 1. Breadth first search

**Completo:** Sim.

**Ótimo:** Não.

**Complexidade de tempo:** Toda vez que é feita uma expansão até 3 novos nós são adicionados à fila de prioridade, portanto **O**($3^{d+1}$), onde d+1 é a profundidade da solução mais rasa (mais próxima do estado inicial).

**Complexidade de memória:** O algoritmo armazena os nós expandidos em uma fila de prioridade e os visitados em uma lista, poranto **O**($3^{d+1}$), igual à complexidade de tempo.

**Resultados:**

*Problema1:* Tempo de execução: 0.01 segundos, iterações: 136, posições distintas visitadas: 14

<p align="center">
  <img width="550" height="550" src="Images/Problem1BFSFinalState.png">
</p>

*Problema2:* Tempo de execução: 0.01 segundos, iterações: 159, posições distintas visitadas: 23

<p align="center">
  <img width="550" height="550" src="Images/Problem2BFSFinalState.png">
</p>

*Problema3:* Tempo de execução: 0.003 segundos, iterações: 66, posições distintas visitadas: 14

<p align="center">
  <img width="550" height="550" src="Images/Problem3BFSFinalState.png">
</p>

In [None]:
from search import Node

def tree_breadth_search_for_vis(problem, iterLim=100000):
    """Search through the successors of a problem to find a goal.
    The argument frontier should be an empty queue.
    Don't worry about repeated paths to a state. [Figure 3.7]"""

    # we use these two variables at the time of visualisations
    iterations = 0
    all_node_colors = []
    node_colors = {k: 'white' for k in set(problem.reachable_positions(problem.initial))}

    # Adding first node to the queue
    frontier = deque([Node(problem.initial)])

    node_colors[Node(problem.initial).state] = "orange"
    iterations += 1
    all_node_colors.append(dict(node_colors))

    explored = []
    while frontier:
        # Popping first node of queue
        node = frontier.popleft()
        explored.append(node.state)
        # modify the currently searching node to red
        node_colors[node.state] = "red"
        iterations += 1
        all_node_colors.append(dict(node_colors))

        if problem.goal_test([node.state for node in node.path()]):
            # modify goal node to green after reaching the goal
            node_colors[node.state] = "green"
            iterations += 1
            all_node_colors.append(dict(node_colors))
            return (iterations, all_node_colors, node)

        for n in node.expand(problem):
            if n.state not in explored and n not in frontier:
                frontier.append(n)
                node_colors[n.state] = "orange"
                iterations += 1
                all_node_colors.append(dict(node_colors))

        # modify the color of explored nodes to gray
        node_colors[node.state] = "gray"
        iterations += 1
        all_node_colors.append(dict(node_colors))

    return None

### 2. Depth first search

**Completo:** Sim.

**Ótimo:** Não.

**Complexidade de tempo:** Toda vez que é feita uma expansão até 3 novos nós são adicionados à fila de prioridade, portanto **O**($3^{d+1}$), onde d+1 é a profundidade da solução mais rasa (mais próxima do estado inicial).

**Complexidade de memória:** O algoritmo armazena os nós expandidos em uma fila de prioridade e os visitados em uma lista, poranto **O**($3^{d+1}$), igual à complexidade de tempo.

**Resultados:**

*Problema1:* Tempo de execução: 0.009 segundos, iterações: 317, posições distintas visitadas: 24

<p align="center">
  <img width="550" height="550" src="Images/Problem1DFSFinalState.png">
</p>

*Problema2:* Tempo de execução: 0.01 segundos, iterações: 348, posições distintas visitadas: 27

<p align="center">
  <img width="550" height="550" src="Images/Problem2DFSFinalState.png">
</p>

*Problema3:* Tempo de execução: 0.002 segundos, iterações: 94, posições distintas visitadas: 18

<p align="center">
  <img width="550" height="550" src="Images/Problem3DFSFinalState.png">
</p>

In [None]:
from search import Node

def tree_depth_search_for_vis(problem, iterLim=100000):
    """Search through the successors of a problem to find a goal.
    The argument frontier should be an empty queue.
    Don't worry about repeated paths to a state. [Figure 3.7]"""

    # usamos essas duas variáveis ​​no momento das visualizações
    iterations = 0
    all_node_colors = []
    node_colors = {k : 'white' for k in set(problem.reachable_positions(problem.initial))}

    # Adicionando o primeiro nó na pilha
    frontier = [Node(problem.initial)]

    node_colors[Node(problem.initial).state] = "orange"
    iterations += 1
    all_node_colors.append(dict(node_colors))

    explored = []
    while len(frontier) > 0 and iterations < iterLim:
        # Popping first node of stack
        node = frontier.pop()

        explored.append(node.state)
        # modify the currently searching node to red
        node_colors[node.state] = "red"
        iterations += 1
        all_node_colors.append(dict(node_colors))

        if problem.goal_test([node.state for node in node.path()]):
            # modify goal node to green after reaching the goal
            node_colors[node.state] = "green"
            iterations += 1
            all_node_colors.append(dict(node_colors))
            return (iterations, all_node_colors, node)

        for n in node.expand(problem):
            if n.state not in explored and n not in frontier:
                frontier.append(n)
                node_colors[n.state] = "orange"
                iterations += 1
                all_node_colors.append(dict(node_colors))
            

        # modificar a cor dos nós explorados para cinza
        node_colors[node.state] = "gray"
        iterations += 1
        all_node_colors.append(dict(node_colors))

    return (iterations, all_node_colors, node)

## Heurísticas

As Heurísticas elaboradas foram determinantes, principalmente para os Informed Search Algorithms, onde seu resultado h(n) é contabilizado juntamente do path cost   g(n) para o agente decidir o próximo passo a ser avaliado. Podendo ou não indicar a melhor solução.

Para o problema do Pacman nossas heurísticas estão voltadas para achar o menor caminho possível para nosso agente chegar ao *goal*, não foram parametrizados as moedas espalhadas pelo mapa.

Com uma busca pela bibliografia e na internet achamos duas heurísticas bastante utilizadas em problemas desse tipo.

### Distância

Baseado na real distância que o agente irá percorrer. Considera o número de passos que serão dados, o número de ações que serão tomadas.

O processamento é um pouco mais custoso do que o normal, devido a essa metodologia.



### Distância Euclideana


In [None]:
def euclidean_distance(self, position1, position2):
        if self.reachable(position1, position2) is False:
            return math.inf
        
        deltaX1 = (position2[0] - position1[0])**2
        deltaY1 = (position2[1] - position1[1])**2
        return (deltaX1 + deltaY1)**0.5

Essa heurística é bem mais direta em termos de lógica. 

A distância euclidiana avalia simplesmente, a distância em linha reta, do ponto A ao ponto B, que no caso de nosso algoritmo de busca seriam o ponto de avaliação atual ao goal.

Em primeiro lugar, checamos se os dois pontos são alcançáveis. Se sim, calculamos a distância segundo a fórmula de Euclides:

$\sqrt{(x2 - x1)² + (y2 - y1)²)}$

Com a recorrência de sempre projetarmos o sucessor do estado analisado como o que nos dá o menor custo, sempre teremos respeitado o fato que o custo de n ao goal, não será maior que o custo de seu sucessor ao mesmo goal mais o passo de n a esse sucessor. De uma forma explicativa, na pior das hipóteses o agente deverá fazer um "desvio" no caminho, caso faça uma escolha não ótima, por exemplo.


### 3. Greedy Best first search

O _Greedy Best First Search Algoritm_ funciona de maneira muito parecida com o _A* Search_. A partir de um nó inicial, avalia-se o custo f(n) do caminho a cada um de seus possíveis destinos, de acordo com as ações que poderão ser tomadas.

Onde,

  f(n) = g(n) + h(n) 
 
  g(n) é o custo do caminho tomado e h(n) é o custo segundo a heurística adotada para a avaliação.


Seu nome greedy (ganancioso) se dá pelo fato de que após uma ação tomada, não faz mais parte da avaliação (até que se comprove que o caminho não se dá até o goal) os custos perantes as demais ações possíveis, os outros nós adjacentes no nosso caso.

<p align="center">
  <img width="400" height="400" src="Greedy.png">
</p>

Acima vemos uma imagem que ilustra o comportamento do algoritmo, vemos claramente a preferência pelo caminho mais barato ali naquele momento, sem levar em consideração outros passos.

**Completo:** Não.

**Ótimo:** Não.

**Complexidade de tempo:** O(b^m). 

**Complexidade de memória:** O(b^m).

Em ambos b é a quantidade de nós que a atual posição pode expandir e m refere-se à profundidade da busca.
Mas é importante ressaltar que em alguns casos, a situação pode favorecer e se tornar um algoritmo bem eficiente, como vimos através dos resultados obtidos.
O grande problema da greedy solution é o fato de não ter controle em situações de espaço infinito, ou em caminhos sem solução, por exemplo com loops (que acabarão por "prender" nosso agente num ciclo infinito). Outra situação ruim é que nem sempre optará pelo caminho menos custoso, o que no nosso caso não chegou a ser um problema, mas em situações de maior escala podem vir a ser um grande problema.

Rodamos os mesmos casos considerando primeiro a heurística da distância (h) e depois a da distância euclidiana (h2), como forma de uma melhor análise no impacto que a sua escolha pode trazer para o problema.

Abaixo seguem dados e imagens dos problemas 1, 2 e 3 (rodando h) e dos problemas 4, 5 e 6 (rodando h2).

**Resultados:**

*Problema1:* Tempo de execução: 0.003 segundos, iterações: 47, posições distintas visitadas: 14

<p align="center">
  <img width="550" height="550" src="Images/Problem1GreedyFinalState.png">
</p>


*Problema2:* Tempo de execução: 0.004 segundos, iterações: 77, posições distintas visitadas: 23

<p align="center">
  <img width="550" height="550" src="Images/Problem2GreedyFinalState.png">
</p>

*Problema3:* Tempo de execução: 0.001 segundos, iterações: 47, posições distintas visitadas: 14

<p align="center">
  <img width="550" height="550" src="Images/Problem3GreedyFinalState.png">
</p>


*Problema4:* Tempo de execução: 0.065 segundos, iterações: 65, posições distintas visitadas: 18

<p align="center">
  <img width="550" height="550" src="Images/Problem4GreedyH2.png">
</p>


*Problema5:* Tempo de execução: 0.161 segundos, iterações: 106, posições distintas visitadas: 27

<p align="center">
  <img width="550" height="550" src="Images/Problem5GreedyH2.png">
</p>


*Problema6:* Tempo de execução: 0.040 segundos, iterações: 47, posições distintas visitadas: 14

<p align="center">
  <img width="550" height="550" src="Images/Problem6GreedyH2.png">
</p>

Após a obtenção dos dados, mesmo que em um espaço amostral pequeno, conseguimos ver que muitas vezes o caminho resultante é até parecido, mas a partir da segunda heurística vemos uma diferença de tempo bem relevante em comparação com a execução usando a primeira heurística. Um pouco surpreendente, mas talvez o que possa explicar é o fato de que o cálculo seja pesado em termos de processamento. Outro fator é de que em alguns casos foi necessário a exploração de mais nós, para chegar na solução, ou seja, uma heurística não ótima. 

Mesmo em um exemplo pequeno, já notamos uma diferença no desempenho do modelo. Em larga escala, esse comportamento deve seguir o padrão, mostrando mais uma vez a importância de uma boa escolha da heurística a ser utilizada.


In [None]:
def greedy_best_first_search(problem, h=None):
    if h == None:
        h = problem.h2
    iterations, all_node_colors, node = best_first_graph_search_for_vis(problem, lambda n: h(n))
    return (iterations, all_node_colors, node)

### 4. A*

Abaixo segue a definição da busca A*, o método usa também outro método de busca chamado *best_first_graph_search_for_vis*, que será exibido depois:

**Completo:** Sim.

**Ótimo:** Não.

**Complexidade de tempo:** Toda vez que é feita uma expansão até 3 novos nós são adicionados à fila de prioridade, portanto **O**($3^{d+1}$), onde d+1 é a profundidade da solução mais rasa (mais próxima do estado inicial).

**Complexidade de memória:** O algoritmo armazena os nós expandidos em uma fila de prioridade e os visitados em uma lista, poranto **O**($3^{d+1}$), igual à complexidade de tempo.

**Resultados:**

*Problema1:* Tempo de execução: 0.13 segundos, iterações: 156, posições distintas visitadas: 18

<p align="center">
  <img width="550" height="550" src="Images/Problem1AstarFinalState.png">
</p>

*Problema2:* Tempo de execução: 0.21 segundos, iterações: 182, posições distintas visitadas: 23

<p align="center">
  <img width="550" height="550" src="Images/Problem2AstarFinalState.png">
</p>

*Problema3:* Tempo de execução: 0.02 segundos, iterações: 47, posições distintas visitadas: 14

<p align="center">
  <img width="550" height="550" src="Images/Problem3AstarFinalState.png">
</p>

In [None]:
def astar_search_graph(problem, h=None, g=None):
    if h is None:
        h = problem.h
    if g is None:
        g = problem.g
    iterations, all_node_colors, node = best_first_graph_search_for_vis(problem, lambda n: g(n) + h(n))
    return iterations, all_node_colors, node

### 5. Hill climbing search

Foi escolhido este método de busca local para encontrar mínimos da função distância (a distância entre o nó atual e o nó destino). Espera-se que o único mínimo encontrado seja o próprio nó destino pois é o ponto em que a função tem o seu mínimo global (0), além de que não é esperado mais nenhum mínimo local.

**Completo:** Não. Foram encontrados casos em que o algoritmo se entrou em um caminho sem saída e determinou que este era o mínimo (o objetivo) pois não podia sair de lá, sendo que ele chegou a este lugar pois era a posição mais próxima ao nó destino dentre os vizinhos do nó anterior.

**Ótimo:** Não

**Complexidade de tempo:** No melhor dos casos o algoritmo implementado atravessaria uma reta até o objetivo se este existir, no pior dos casos ele pode precisar se mover pelo tabuleiro todo, sendo este delimitado apenas pelas circunstâncias do tabuleiro, devido à natureza do problema.

**Complexidade de memória:** O algoritmo armazena todos os nós expandidos a partir do nó atual, para este problema, o número de nós adjacentes é limitado à 8, logo são armazenados até no máximo 9 nós ao mesmo tempo.

**Resultados:**

*Problema1:* Tempo de execução: 0.11 segundos, iterações: 12, posições distintas visitadas: 11

<p align="center">
  <img width="550" height="550" src="Images/Problem1HillClimbingFinalState.png">
</p>


*Problema2:* Tempo de execução: 0.01 segundos, iterações: 2, posições distintas visitadas: 1

<p align="center">
  <img width="550" height="550" src="Images/Problem2HillClimbingFinalState.png">
</p>


*Problema3:* Tempo de execução: 0.07 segundos, iterações: 15, posições distintas visitadas: 14

<p align="center">
  <img width="550" height="550" src="Images/Problem3HillClimbingFinalState.png">
</p>


In [None]:
def hill_climbing_search(problem):
    """
    Search for a local minimum following a certain optimization function
    The function used for this problem was the distance function from the
    actual point to the goal point. Which is the same used for our second heuristics informed search.
    """
    # we use these two variables at the time of visualisations
    iterations = 0
    all_node_colors = []
    node_colors = {k : 'white' for k in set(problem.reachable_positions(problem.initial))}
    
    frontier = [(Node(problem.initial))]
    explored = set()
    
    # modify the color of frontier nodes to orange
    node_colors[Node(problem.initial).state] = "orange"
    iterations += 1
    all_node_colors.append(dict(node_colors))
    
    while True:
        # Popping first node of stack
        node = frontier.pop()

        # modify the currently searching node to red
        node_colors[node.state] = "red"
        iterations += 1
        all_node_colors.append(dict(node_colors))
        
        neighbors = node.expand(problem)
        if not neighbors:
            break
        # find the minimum between the neighbors
        neighbor = argmin_random_tie(neighbors, key=lambda node: problem.h2(node))
        
        # trying to find minimum 
        if problem.h2(neighbor) > problem.h2(node):
            # node is already the local minimum
            node_colors[node.state] = "green"
            all_node_colors.append(dict(node_colors))
            return iterations, all_node_colors, node
        
        # expand only for painting
        frontier.extend(child for child in node.expand(problem)
                        if child.state not in explored and
                        child not in frontier)
        
        for n in frontier:
            # modify the color of frontier nodes to orange
            node_colors[n.state] = "orange"
            all_node_colors.append(dict(node_colors))
        
        frontier.clear()
        frontier.append(neighbor) # append the last
            
        explored.add(node.state)

        # modify the color of explored nodes to gray
        node_colors[node.state] = "gray"
        
    return None

Abaixo segue a definição do método *best_first_graph_search_for_vis*:

In [None]:
def best_first_graph_search_for_vis(problem, f):
    iterations = 0
    all_node_colors = []
    node_colors = {k: 'white' for k in set(problem.reachable_positions(problem.initial))}

    node = Node(problem.initial)

    node_colors[node.state] = "red"
    iterations += 1
    all_node_colors.append(dict(node_colors))

    frontier = PriorityQueue()
    frontier.append(node, f(node))

    node_colors[node.state] = "orange"
    iterations += 1
    all_node_colors.append(dict(node_colors))

    explored = set()
    while not frontier.isEmpty():
        node = frontier.pop()

        node_colors[node.state] = "red"
        iterations += 1
        all_node_colors.append(dict(node_colors))

        if problem.goal_test([node.state for node in node.path()]):
            node_colors[node.state] = "green"
            iterations += 1
            all_node_colors.append(dict(node_colors))
            return (iterations, all_node_colors, node)

        explored.add(node.state)
        for child in node.expand(problem):
            if child.state not in explored and child not in frontier:
                frontier.append(child, f(child))
                node_colors[child.state] = "orange"
                iterations += 1
                all_node_colors.append(dict(node_colors))
            elif child in frontier:
                incumbent = frontier[child]
                if f(child) < f(incumbent):
                    del frontier[incumbent]
                    frontier.append(child, f(child))
                    node_colors[child.state] = "orange"
                    iterations += 1
                    all_node_colors.append(dict(node_colors))

        node_colors[node.state] = "gray"
        iterations += 1
        all_node_colors.append(dict(node_colors))
    return iterations, all_node_colors, node

O método utiliza uma fila de prioridade, itens com menor valor saem primeiro da fila e a função que dá valor a cada estado deve ser dada como parâmetro, as buscas A* e Greedy Best utilizam funções distintas para dar valor a cada estado