# Introdução

## Motivação

Grafos são estruturas de dados não lineares muito usadas para resolver problemas computacionais.

Nessa estrutura, os dados são representados por nós ou vértices que possuem conexões entre si, por meio de arestas.

Uma rede social, uma malha rodoviária, conexões entre cidades são exemplos clássicos do uso dessa estrutura.

<div>
    <img src="../images/graph-sample.jpg" width="50%" heigth="50%"/>
</div>

## Objetivos

Ao final dessa aula o aluno deverá conhecer:

- O que é um grafo.
- As principais formas de representar essa estrutura de dados.
- Meios de percorrer um grafo.

## Definições

Um grafo G é representado por um par ordenado de um conjunto V de vértices e um conjunto E (i.e. edges) de arestas, dado como G = (V,E).

<div>
    <img src="../images/graph-1.png" width="40%" heigth="40%"/>
</div>

- Nó ou vértice

    Um ponto ou um nó em grafo é chamado de vértice. No diagrama acima, os nós A, B, C, D e E são os vértices do grafo.

- Aresta (Edge)

    É a conexão entre dois nós. A linha conectando A e B é um exemplo de aresta no grafo acima.

- Loop

    Quando uma aresta de um nó sai e chega nele mesmo, formando um loop.

- Grau do vértice

    O número total de arestas que chegam em um vértice. Por exemplo, o grau do vértice B na figura acima é 4.

- Adjacência

    Refere-se a conexão entre os nós, assim, se existe uma conexão entre 2 vértices ou nós, então dizemos que eles são adjacentes. Por exemplo, C é adjacente ao nó A.

- Caminho

    Uma sequência de arestas entre 2 nós representa um caminho entre eles. Por exemplo, CABE representa um caminho partindo de C e chegando em E.

- Vértice folha

    Um vértice ou nó é chamado de folha quando ele tem grau 1.

- Grafo não-direcionado

    Quando as arestas são não direcionadas, ou seja, quando elas apenas representam uma conexão entre dois vértices sem mais informações. Por exemplo, o grafo acima é não direcionado.
    
- Grafo direcionado

    Quando as arestas são direcionadas, ou seja, uma aresta (A,B) é diferente de uma aresta (B,A), pois existe uma direção. Por exemplo, o grafo abaixo é direcionado.
    
<div>
    <img src="../images/graph-2.png" width="30%" heigth="30%"/>
</div>
    
- Grafo ponderado

    Quando as arestas carregam alguma informação numérica, um peso. Essa informação pode se referir a um custo associado àquela aresta. 
    
    Por exemplo, se um grafo representa a conexão entre cidades, as arestas poderiam carregar a informação de distância entre elas. 
    
    No exemplo abaixo, o caminho ABCD leva 25 minutos.
    
<div>
    <img src="../images/graph-3.png" width="30%" heigth="30%"/>
</div>

## Lista de Adjacências

Um grafo pode ser representado por meio de uma lista de adjacências. Uma lista de adjacências armazena os nós e suas conexões imediatas.

Para isso, utilizamos uma lista, onde cada índice representa um nó do grafo. Para cada nó, ou elemento da lista, armazenamos uma lista contendo seus nós adjacentes.

Considerando o grafo a seguir:

<div>
    <img src="../images/graph-4.png" width="30%" heigth="30%"/>
</div>

Sua representação por meio de lista de adjacências seria:

<div>
    <img src="../images/graph-5.png" width="40%" heigth="40%"/>
</div>

Vantagens: Estrutura dinâmica. Boa representação para um grafo esparso. 

Desvantagens: Custo extra para armazenar os ponteiros da lista de adjacências.

In [40]:
graph_list = [['B', 'C'], ['E','C', 'A'], ['A', 'B', 'E','F'], ['B', 'C'], ['C']]

# better, with label
graph = dict()
graph['A'] = ['B', 'C'] 
graph['B'] = ['E','C', 'A'] 
graph['C'] = ['A', 'B', 'E','F'] 
graph['E'] = ['B', 'C'] 
graph['F'] = ['C']

## Matriz de Adjacências

Uma alternativa à lista de adjacências seria uma matriz de adjacências. 

A ideia é armazenar os valores 0 ou 1 nas células da matriz dependendo da existência ou não de uma aresta conectando dois vértices.

Por exemplo:

<div>
    <img src="../images/graph-6.png" width="40%" heigth="40%"/>
</div>

Vantagem: Boa representação para um grafo denso.

Desvantagem: Armazenamento estático.

In [6]:
matrix_elements = sorted(graph.keys()) 
cols = rows = len(matrix_elements)

adjacency_matrix = [[0 for x in range(rows)] for y in range(cols)]
adjacency_matrix

[[0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0]]

In [7]:
edges_list = []
for key in matrix_elements: 
    for neighbor in graph[key]: 
        edges_list.append((key, neighbor))
edges_list

[('A', 'B'),
 ('A', 'C'),
 ('B', 'E'),
 ('B', 'C'),
 ('B', 'A'),
 ('C', 'A'),
 ('C', 'B'),
 ('C', 'E'),
 ('C', 'F'),
 ('E', 'B'),
 ('E', 'C'),
 ('F', 'C')]

In [8]:
for edge in edges_list:     
    index_of_first_vertex = matrix_elements.index(edge[0]) 
    index_of_second_vertex = matrix_elements.index(edge[1]) 
    adjacency_matrix[index_of_first_vertex][index_of_second_vertex] = 1 
adjacency_matrix

[[0, 1, 1, 0, 0],
 [1, 0, 1, 1, 0],
 [1, 1, 0, 1, 1],
 [0, 1, 1, 0, 0],
 [0, 0, 1, 0, 0]]

## Busca em largura (BFS)

Na busca em largura, partindo de um nó qualquer, percorremos os nós imediatamente conectados primeiro, até visitarmos todos os vértices do grafo.

Para isso devemos utilizar uma estrutura de dados conhecida: Fila.

Pensando em uma rede social, essa forma de atravessar o grafo visita os amigos de grau 1 primeiro, em seguida os de grau 2, e assim por diante.

Dessa forma podemos utilizar essa forma de atravessar o grafo para descobrir o grau de amizade entre pessoas em uma rede social e, assim, sugerir novos amigos por exemplo.

<div>
    <img src="../images/graph-bfs.png" width="60%" heigth="60%"/>
</div>

A complexidade de tempo do algoritmo BFS é O(|V| + |E|), onde |V| é o número de vértices e |E| é o número de arestas.

In [47]:
from queue import Queue

def bfs(root, graph):
    visited = list()
    to_visit_queue = Queue()
    to_visit_queue.put(root)

    while(to_visit_queue.empty() is False):
        curr_node = to_visit_queue.get()
        visited.append(curr_node)
        for n in sorted(graph[curr_node]):
            if n not in visited and n not in list(to_visit_queue.queue):
                to_visit_queue.put(n)

    return list(visited)

bfs('A', graph)

['A', 'B', 'C', 'E', 'F']

## Busca em profundidade (DFS)

O algoritmo de busca em profundidade inicia a partir de um nó e explora um caminho em profundidade até um vértice folha antes de retornar e percorrer outro caminho passando por nós ainda não visitados.

Para isso devemos utilizar uma estrutura de dados conhecida: Pilha.

Em uma rede social, esse algoritmo pode determinar a existência de uma conexão entre duas pessoas, bem como o grau de amizade entre elas.

Vamos estudar esse algoritmo a partir do grafo abaixo:

<div>
    <img src="../images/graph-dfs-1.png" width="30%" heigth="30%"/>
</div>

<div>
    <img src="../images/graph-dfs-2.png" width="80%" heigth="80%"/>
</div>

In [95]:
graph = dict() 
graph['A'] = ['B', 'S'] 
graph['B'] = ['A'] 
graph['S'] = ['A','G','C'] 
graph['D'] = ['C'] 
graph['G'] = ['S','F','H'] 
graph['H'] = ['G','E'] 
graph['E'] = ['C','H'] 
graph['F'] = ['C','G'] 
graph['C'] = ['D','S','E','F']

from queue import LifoQueue

def dfs(root, graph):
    visited = list()
    to_visit_stack = LifoQueue()
    to_visit_stack.put(root)
    
    while(to_visit_stack.empty() is False):
        curr_node = to_visit_stack.get()
        visited.append(curr_node)
        adj_list = sorted(graph[curr_node], reverse=True)
        print(f'--->{adj_list}')
        for adj in adj_list:
            if adj not in visited and adj not in to_visit_stack.queue:
                print(f'------>{adj}')
                to_visit_stack.put(adj)
    return visited

dfs('A', graph)

--->['S', 'B']
------>S
------>B
--->['A']
--->['G', 'C', 'A']
------>G
------>C
--->['S', 'F', 'E', 'D']
------>F
------>E
------>D
--->['C']
--->['H', 'C']
------>H
--->['G', 'E']
--->['G', 'C']
--->['S', 'H', 'F']


['A', 'B', 'S', 'C', 'D', 'E', 'H', 'F', 'G']

In [96]:
def dfs_rec(visited, graph, node):
    if node not in visited:
        print(node)
        visited.add(node)
        if node not in graph.keys():
            return
        for neighbour in sorted(graph[node]):
            dfs_rec(visited, graph, neighbour)

visited = set()
dfs_rec(visited, graph, 'A')

A
B
S
C
D
E
H
G
F


## Exercícios

1. Resolver os desafios da lista sobre <a href="www.hackerrank.com/trees-1637755298">árvores e grafos</a> do HackerRank.

2. Adapte o algoritmo de busca em profundidade para exibir o caminho percorrido por ele partindo de todos os elementos do grafo dado que ainda não foram visitados

- Entrada

O arquivo de entrada contém muitos casos de teste. A primeira linha do arquivo de entrada contém um inteiro N que representa a quantidade de casos de teste que se seguem. Cada um dos N casos de teste contém, na primeira linha, duas informações: (1 ≤ V ≤ 20) e E (1 ≤ E ≤ 20), que são respectivamente a quantidade de vértices e arestas do gráfico. Siga E linhas contendo informações sobre todas as arestas deste gráfico.

- Saída

Para cada caso de teste, uma saída deve ser impressa que representa uma pesquisa em profundidade para todos os nós, com respeito à hierarquia de cada um deles. O caractere b significa um espaço em branco. Veja o seguinte exemplo:
bb0-2
bbbb2-1
bbbb2-4
bbbbbb4-1

<div>
    <img src="../images/graph-exe.png" width="60%" heigth="60%"/>
</div>

<i>Inspirado no exercício <a href="https://www.beecrowd.com.br/judge/en/problems/view/1081">1081</a> do Beecrowd</i>