# Problemas de Busca em IA

No campo da inteliigência artificial, os problemas de busca podem ser definidos como aqueles em que um agente é inserido num ambinete no qual pode tomar ações para atingir um objetivo. Consideramos a configuração do ambiente como estados, e conhecmos o modelo de transição de estados do problema, isto é, para um dado estado atual e uma ação possível, qual o próximo estado atingível. 
Como base nisso, temos as seguintes definições:
- **Estados (espaço de estados):** descrevem possíveis situações no ambiente. O espaço de estados é o conjunto de todos os possíveis estados.
- **Transições ou Ações:** possíveis ações que levam de um estado ao outro. Apenas são consideradas transições diretas entre estados.
- **Custos:** valor relacionado a cada ação que identifica o quanto ela é “custosa” em algum sentido. Geralmente os algoritmos de busca tentam minimizar o custo.

Os problemas de busca possuem esse nome pois o objetivo do agente é buscar no mapeamento do espaço de estados do problema qual a melhor sequência de ações a ser tomada para atingir seu objetivo.

- **Um grafo de espaço de estados** relaciona todos os possíveis estados do ambiente atingíveis a partir do estado inicial com uma função de sucessão, que indica o próximo estado no caso de cada ação.
- Exemplo: grafo de estados de um robô aspirador onde as ações são “go Left”, “go Right”, “Suck”.

![image.png](attachment:image.png)

- **Caminho:** qualquer sequência de estados conectados por uma sequência de ações.
- **Solução:** um caminho que leve do estado inicial ao estado objetivo.
- **Solução ótima:** uma solução em que o custo total do caminho é o mínimo possível.

Os algoritmos de solução de problemas de busca são baseados em algoritmos de busca em árvore. Isso porque, no processo de expansão do grafo do espaço de estados através das ações, pode-se criar uma árvore onde os nós são os estados, e dois nós sucessivos são ligados por uma ação que faz com o sistema passe do estado representado pelo nó pai para o representado pelo nó filho. Cada nó na árvore de busca não representa porém apenas o estado atingido, mas sim todo o caminho (sequência de ações) percorrido para chegar a ele.

![image.png](attachment:image.png)

Para estudar os algoritmos de busca, esse notebook usa o recurso de labirintos. Labirintos podem ser facilmente relacionados com grafos de espaço de estados de problemas de busca, onde cada célula representa um estado: o estado de partida é a célula de "entrada" do labirinto, e o estado objetivo é a célula de "saída" do labirinto. Além disso, para cada estado, são conhecidas as ações possíveis de serem tomadas e seus estados resultante. Exemplo: se estou no estado representado pela célula $(1,2)$ e realizo a ação $\downarrow$, o estado resultante será $(1,3)$.

![image.png](attachment:image.png)

### Breve introdução à biblioteca PyAmaze

Para criar os labirintos que serão usados nos problemas de busca, vamos usar a biblioteca pronta PyAmaze. Abaixo há alguns exemplos básicos de como utilizá-la.

In [1]:
from pyamaze import maze, agent, COLOR

In [None]:
#Criação do labirinto 
m =  maze(5,5)
m.CreateMaze()

#Criação de um agente 
a=agent(m,5,5, filled=True, footprints=True)

#Movimentação do agente no labirinto ao lonfo de um caminho
m.tracePath({a:m.path})
m.run()

Para todos os algoritmos de busca que serão estudados, o processo será o seguinte:

1. Definir uma função que corresponde ao algoritmo de busca, que recebe o labirinto (espaço de estados do problema) e devolve um caminho até o objetivo.

`def searchAlgorithm(m):
    #algoritmo de busca
    return path`

2. Utilizar o caminho encontrado para mover o agente ao longo do labirinto criado.

## Algoritmos de Busca Não Informada

Algoritmos de busca não informada são aqueles em que o agente realiza a busca sem dispor de qualquer informação adicional sobre o problema, apenas seu grafo de espaço de estados.


### Depth-First Search (DFS)

O algoritmo de busca DFS é aquele onde a busca através da árvore resultante da expansão do grafo do espaço de estados é feita de modo a primeiramente esgotar completamente um ramo da árvore até encontrar um nó folha, para depois retroceder e explorar demais ramos.

![image.png](https://i.giphy.com/media/ii2FtzyirI4MXpoxX4/giphy.gif)

Veja que no algoritmo DFS precisamos definir uma direção preferencial de busca. No caso da árvore, se exploramos primeiro os ramos da esquerda ou da direita. Para o caso do labirinto, essa definição diz respeito a qual direção tentar seguir primeiro. Vamos adotar a ordem Oeste, Norte, Sul e Leste $(W,N,S,E)$

Para criar esse algoritmo, precisamos definir duas pilhas muito importantes:
- **Fronteira**: pilhando contendo as células que são listadas como "a exemplorar", por serem nós filhos de célular visitadas
- **Visitadas**: como o nome diz, é uma pilhas das células que já foram visitadas.

O algorimto consiste basicamente de, para cada estado atual, adicionar os próximos estados (células) possíveis de serem explorados por ações viáveis na pilha de fronteira, desde que esses estados não tenham sido visitados ainda. Então, depois disso decidimos explorar o último elemento da pilha. Repetimos isso até encontrar o objeto, ou um nó folha, onde retornamos para o último nó com possibilidades de ações ainda não exploradas.

Com essas definições, vamos criar o algoritmo:

In [None]:
def DFS(m, start, goal):
    startState = start 
    frontier = [startState]
    explored = []
    DFSBackPath = {}
    map = m.maze_map

    while len(frontier)>0:
        currentState = frontier.pop()
        explored.append(currentState)
        if currentState == goal:
            break
        for direction in 'ESNW':
            if map[currentState][direction] == True: #verifica se uma ação de movimentação na direção é viável
                if direction == 'E':
                    childState = (currentState[0], currentState[1]+1)
                elif direction == 'S':
                    childState = (currentState[0]+1, currentState[1])
                elif direction == 'W':
                    childState = (currentState[0], currentState[1]-1)
                elif direction == 'N':
                    childState = (currentState[0]-1, currentState[1])
                
                if childState not in explored:
                    frontier.append(childState)
                    DFSBackPath[childState]=currentState

    DFSForwardPath = {}
    pathState = goal
    while pathState != startState:
        DFSForwardPath[DFSBackPath[pathState]]=pathState
        pathState = DFSBackPath[pathState]

    return DFSForwardPath

In [None]:
m = maze(10,10)
m.CreateMaze(loopPercent=50)
path = DFS(m, (10,10), (1,1))
a = agent(m, footprints=True)
m.tracePath({a:path})
m.run()

Implementação alternativa que inclui visualização da sequência de busca do algoritmo:

In [None]:
def VisualizerDFS(m, start, goal):
    startState = start 
    frontier = [startState]
    explored = []
    DFSBackPath = {}
    dSearch = []
    map = m.maze_map

    while len(frontier)>0:
        currentState = frontier.pop()
        dSearch.append(currentState)
        explored.append(currentState)

        if currentState == goal:
            break
        poss = 0
        for direction in 'ESNW':
            if map[currentState][direction] == True: #verifica se uma ação de movimentação na direção é viável
                if direction == 'E':
                    childState = (currentState[0], currentState[1]+1)
                elif direction == 'S':
                    childState = (currentState[0]+1, currentState[1])
                elif direction == 'W':
                    childState = (currentState[0], currentState[1]-1)
                elif direction == 'N':
                    childState = (currentState[0]-1, currentState[1])
                
                if childState not in explored:
                    poss += 1
                    frontier.append(childState)
                    DFSBackPath[childState]=currentState
        if poss>1:
            m.markCells.append(currentState)

    DFSForwardPath = {}
    pathState = goal
    while pathState != startState:
        DFSForwardPath[DFSBackPath[pathState]]=pathState
        pathState = DFSBackPath[pathState]

    return dSearch, DFSBackPath, DFSForwardPath

In [None]:
m = maze(25,25)
m.CreateMaze(loopPercent=25)
start = (25,25)
goal = (1,1)
dSearch, Bpath, Fpath = VisualizerDFS(m, start, goal)
a=agent(m,25,25,goal=goal,footprints=True,shape='square',color=COLOR.green)
m.tracePath({a:dSearch},showMarked=True,delay=10)

b=agent(m,1,1,goal=start,footprints=True,filled=True)
m.tracePath({b:Bpath}, delay=10)

c=agent(m,25,25,footprints=True,color=COLOR.yellow)
m.tracePath({c:Fpath}, delay=10)

m.run()

### Breadth-First Search (BFS)

O algoritmo de busca BFS é aquele onde a busca através da árvore resultante da expansão do grafo do espaço de estados é feita de modo a visitar primeiramente todos os nós filhos do nó de um determinado estado, para depois seguir para a "próxima geração" de filhos. Isso signfica que um nível da árvore de busca é visitado completamente antes de de partir para o próximo nível.

![BFS GIF](https://i.giphy.com/media/iD6qdVmNOZH9frN6J4/giphy.gif)

Essa característica nos fornece uma propriedade importante do algoritmo BFS: ele sempre retorna o menor caminho possível até o objetivo, pois o caminho mais curto sempre está nos níveis superiores da árvore e eles são visitados primeiro.

A implementação do algoritmo é muito semelhante. Ele também conta as estruturas de dados que armazenam a fronteira e os nós visitados, e também precisa de uma direção preferencial de busca (ações a serem investigadas primeiro).

A principal diferença está no fato de que **enquanto a fronteira no DFS é implementada como uma Pilha, no BFS é implementada como uma fila.**

Isso signfica que os nós inseridos na lista de busca primeiro serão investigados primeiro, o que corresponde ao comportamento desejado de investigar um nível completo primeiro.

Baseado nisso, temos a seguinte implementação para o BFS:

In [None]:
def BFS(m, start, goal):
    startState = start 
    frontier = [startState]
    explored = []
    BFSBackPath = {}

    while len(frontier)>0:
        currentState = frontier.pop(0)
        explored.append(currentState)
        if currentState == goal:
            break
        for direction in 'ESNW':
            if m.maze_map[currentState][direction] == True: #verifica se uma ação de movimentação na direção é viável
                if direction == 'E':
                    childState = (currentState[0], currentState[1]+1)
                elif direction == 'S':
                    childState = (currentState[0]+1, currentState[1])
                elif direction == 'W':
                    childState = (currentState[0], currentState[1]-1)
                elif direction == 'N':
                    childState = (currentState[0]-1, currentState[1])
                
                if childState not in explored:
                    frontier.append(childState)
                    BFSBackPath[childState]=currentState

    BFSForwardPath = {}
    pathState = goal
    while pathState != startState:
        BFSForwardPath[BFSBackPath[pathState]]=pathState
        pathState = BFSBackPath[pathState]

    return BFSForwardPath

In [None]:
m = maze(10,10)
m.CreateMaze(loopPercent=50)
path = DFS(m, (10,10), (1,1))
a = agent(m, footprints=True)
m.tracePath({a:path})
m.run()

Implementação alternativa que inclui a visualização da sequência de busca do algoritmo:

In [None]:
def VisualizerBFS(m, start, goal):
    startState = start 
    frontier = [startState]
    explored = []
    BFSBackPath = {}
    dSearch = []

    while len(frontier)>0:
        currentState = frontier.pop(0)
        dSearch.append(currentState)
        explored.append(currentState)

        if currentState == goal:
            break
        for direction in 'ESNW':
            if m.maze_map[currentState][direction] == True: #verifica se uma ação de movimentação na direção é viável
                if direction == 'E':
                    childState = (currentState[0], currentState[1]+1)
                elif direction == 'S':
                    childState = (currentState[0]+1, currentState[1])
                elif direction == 'W':
                    childState = (currentState[0], currentState[1]-1)
                elif direction == 'N':
                    childState = (currentState[0]-1, currentState[1])
                
                if childState not in explored:
                    frontier.append(childState)
                    BFSBackPath[childState]=currentState

    BFSForwardPath = {}
    pathState = goal
    while pathState != startState:
        BFSForwardPath[BFSBackPath[pathState]]=pathState
        pathState = BFSBackPath[pathState]

    return dSearch, BFSBackPath, BFSForwardPath

In [None]:
m = maze(25,25)
m.CreateMaze(loopPercent=25)
start = (25,25)
goal = (1,1)
dSearch, Bpath, Fpath = VisualizerBFS(m, start, goal)
a=agent(m,25,25,goal=goal,footprints=True,shape='square',color=COLOR.green)
m.tracePath({a:dSearch},showMarked=True,delay=10)

b=agent(m,1,1,goal=start,footprints=True,filled=True)
m.tracePath({b:Bpath}, delay=10)

c=agent(m,25,25,footprints=True,color=COLOR.yellow)
m.tracePath({c:Fpath}, delay=10)
m.run()

## Algoritmos de Busca Informada

Ao contrário do métodos de busca anteriores, onde o agente conhece apenas os estados inicial, final e o grafo de espaço de estados do problema, as estratégias de busca informada tentam melhorar a eficiência dos algoritmos fornecendo dicas sobre a “desejabilidade” de diferentes estados.

Essa desejabilidade geralmente é ditada por um função dependente do estado que chama **heurística**, e pode ser entendida como um custo estimado para atingir o objetivo a partir daquele estado.

Assim, os algoritmos de busca informada em geral tentam expandir a busca com prioridade para aqueles estados de menor valor de heurística, que em tese estão "mais próximos" em termos de custo do caminho restante até o objetivo.

### Algoritmo A*

O algoritmo de busca informada A* (A-star) busca expandir sua busca para um estado vizinho que minimize o valor da expressão:
$$ f(n) = g(n) + h(n) $$
Onde $g(n)$ é o custo do caminho percorrido do estado inicial até aquele estado, e $h(n)$ é a heurística daquele estado, ou seja, o custo estimado dele até o estado final.

Para o tipo de problema que estamos trabalhando, de labirintos, as definições das funções são simples:
- $g(n)$: o número de passos dados até chegar na célula $n$
- $h(n)$:  distância Manhattan  entre a célula $n$ e a célula final, isto é, a soma das distâncias horizontal e vertical (poderia ser a Euclidiana).

O resumo do algoritmo então é:
1. Em cada estado, atualizar a função $f(n)$ para todos os estados vizinhos possíveis (alcançáveis por ações)
2. Se o valor de $f(n)$ atualizado for menor que um valor anteriormente calculado, considera-se esse como o novo valor.
3. Expande a busca para o estado com menor valor de $f(n)$

Para implementar, precisamos de uma estrutura de dados chamada **fila de prioridade**, onde os primeiros elementos a serem retirados da fila são aqueles com maior (ou menor) valor de prioridade.


In [2]:
from queue import PriorityQueue

In [3]:
#Definição da função de Heurística com a Distância Manhattan
def h(state, goal):
    x1, y1 = state
    x2, y2 = goal
    return abs(x1-x2) + abs(y1-y2)

#Algoritmo A*
def AStar(m, start, goal):
    startState = start 
    g_scores = {state:float('inf') for state in m.grid}
    g_scores[start] = 0
    f_scores = {state:float('inf') for state in m.grid}
    f_scores[start] = h(start, goal)

    to_visit = PriorityQueue()
    to_visit.put((h(start, goal), h(start, goal), start))
    AStarBackPath = {}

    while not to_visit.empty():
        currentState = to_visit.get()[2]
        if currentState == goal:
            break
        
        for direction in 'ESNW':
            if m.maze_map[currentState][direction] == True: #verifica se uma ação de movimentação na direção é viável
                if direction == 'E':
                    childState = (currentState[0], currentState[1]+1)
                elif direction == 'S':
                    childState = (currentState[0]+1, currentState[1])
                elif direction == 'W':
                    childState = (currentState[0], currentState[1]-1)
                elif direction == 'N':
                    childState = (currentState[0]-1, currentState[1])

                temp_g_score = g_scores[currentState]+1
                temp_f_score = temp_g_score + h(childState, goal)

                if temp_f_score < f_scores[childState]:
                    g_scores[childState] = temp_g_score
                    f_scores[childState] = temp_f_score
                    to_visit.put((temp_f_score, h(childState, goal), childState))
                    AStarBackPath[childState]=currentState

    

    AStarForwardPath = {}
    pathState = goal
    while pathState != startState:
        AStarForwardPath[AStarBackPath[pathState]]=pathState
        pathState = AStarBackPath[pathState]

    return AStarForwardPath


In [None]:
m = maze(10,10)
m.CreateMaze(loopPercent=50)
path = AStar(m, (10,10), (1,1))
a = agent(m, footprints=True)
m.tracePath({a:path})
m.run()

Implementação alternativa que inclui a visualização da sequência de busca do algoritmo:

In [4]:
def VisualizerAStar(m, start, goal):
    startState = start 
    g_scores = {state:float('inf') for state in m.grid}
    g_scores[start] = 0
    f_scores = {state:float('inf') for state in m.grid}
    f_scores[start] = h(start, goal)

    to_visit = PriorityQueue()
    to_visit.put((h(start, goal), h(start, goal), start))
    AStarBackPath = {}
    dSearch = []

    while not to_visit.empty():
        currentState = to_visit.get()[2]
        if currentState == goal:
            break

        dSearch.append(currentState)
        for direction in 'ESNW':
            if m.maze_map[currentState][direction] == True: #verifica se uma ação de movimentação na direção é viável
                if direction == 'E':
                    childState = (currentState[0], currentState[1]+1)
                elif direction == 'S':
                    childState = (currentState[0]+1, currentState[1])
                elif direction == 'W':
                    childState = (currentState[0], currentState[1]-1)
                elif direction == 'N':
                    childState = (currentState[0]-1, currentState[1])

                temp_g_score = g_scores[currentState]+1
                temp_f_score = temp_g_score + h(childState, goal)

                if temp_f_score < f_scores[childState]:
                    g_scores[childState] = temp_g_score
                    f_scores[childState] = temp_f_score
                    to_visit.put((temp_f_score, h(childState, goal), childState))
                    AStarBackPath[childState]=currentState

    

    AStarForwardPath = {}
    pathState = goal
    while pathState != startState:
        AStarForwardPath[AStarBackPath[pathState]]=pathState
        pathState = AStarBackPath[pathState]

    return (dSearch, AStarBackPath, AStarForwardPath)

In [5]:
m = maze(100,100)
m.CreateMaze(loopPercent=75)
start = (100,100)
goal = (1,1)
dSearch, Bpath, Fpath = VisualizerAStar(m, start, goal)
a=agent(m,100,100,goal=goal,footprints=True,shape='square',color=COLOR.green)
m.tracePath({a:dSearch},showMarked=True,delay=10)

b=agent(m,1,1,goal=start,footprints=True,filled=True)
m.tracePath({b:Bpath}, delay=10)

c=agent(m,100,100,footprints=True,color=COLOR.yellow)
m.tracePath({c:Fpath}, delay=10)
m.run()