# Aula 4 - Grafos 1

Na aula de hoje, vamos explorar os seguintes tópicos em Python:

- 1) Grafos

_________

## 1) Grafos / Graph

Um grafo é um par de conjuntos, `G = (V, E)`, sendo um deles o conjunto de **vértices** `V` e o outro um conjunto de **arestas** (edges) `E`, onde cada aresta é um par de vértices.

Os vértices, muitas vezes também chamados de **nós**, são os itens de interesse do que se quer modelar, e as arestas são as conexoes ou relações entre estes itens.

Por exemplo, em uma aplicação logística, poderíamos modelar cada **local de entrega** como um vértice do grafo e as arestas indicariam se existe um **caminho conectando estes dois pontos diretamente**.

<img src="https://algoritmosempython.com.br/images/algoritmos-python/algoritmos-grafos/ModelagemGrafosExemplo.png" width=200>

As arestas podem ser direcionadas (mão única) ou não direcionadas (mão dupla).

<img src="https://www.ime.usp.br/~pf/algoritmos_para_grafos/aulas/figs/Sedgewick-Wayne/TinyNetworkOnly.png" width=200>

Além disso, as arestas podem ter um rótulo associado à elas, indicando por exemplo o custo de percorrer um caminho, ou a distância entre dois pontos de interesse. Chamamos este rótulo de "peso" ou "custo".

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/a/a8/Prim_Algorithm_0.svg/250px-Prim_Algorithm_0.svg.png" width=200>

Quando existe uma aresta conectando um vértice `u` à um vértice `v` (`u-v`), dizemos que `v` é vizinho de `u`.

Em grafos direcionados, é comum usarmos a nomenclatura de árvores e dizer que `u` é pai de `v` caso exista uma aresta direcionada `u -> v`

### Ciclicidade de um grafo

É possível termos vértices que têm uma aresta que liga ele a si mesmo, e até mesmo vértices desconectados. Veja:

<img src=https://s3-sa-east-1.amazonaws.com/lcpi/c5b98cc3-2c85-4d9a-b1e8-aaa4b1aba9b3.png width=300>

Isso leva a uma importante definição:

> Um grafo é chamado de **cíclico** se nele há ao menos um **ciclo**, que se caracteriza por um "loop" em que pode-se sair de um vértice e voltar a ele, percorrendo determinado caminho. Se não há ciclo algum no grafo, ele é chamado de **acíclico**.

Alguns exemplos:


<img src="https://image.slidesharecdn.com/slides-mav-grafos-110529200045-phpapp01/95/treinamento-para-competies-de-programao-do-infufg-grafos-parte-1-turma-iniciantes-15-728.jpg?cb=1306710526" width=600>

<img src=https://www.codingeek.com/wp-content/uploads/2016/11/cyclic.png width=500>

Dada a definição acima, podemos agora dizer com segurança que:

### Árvores são grafos direcionados acícliclos!

Agora entendemos o porquê :)

___________

### Um resumo legal das propriedades de grafos:
<br>
<img src=https://dist.neo4j.com/wp-content/uploads/20181121091034/graph-properties-graph-algorithms-2.png width=600>

_________

**Esparso**: vazio, que não tem mta informação, que tem vários 0s...

**Denso**: tem muitas conexões, tem mta informação, etc


### 1.1) Como representar um grafo no computador?

Existem diferentes maneiras de se representar um grafo no computador, e cada uma pode ser mais ou menos indicada dependendo do problema que se quer resolver ou da forma como se decidiu modelá-lo.
Vamos falar das duas maneiras mais comuns de representação.

#### Matriz de adjacência

Uma das maneiras mais simples de representar um grafo é utilizando uma **matriz de adjacência**.

Vemos um exemplo de visualização dessa estrutura na figura abaixo.

Para criar um grafo como uma matriz de adjacências, definimos uma matriz `M` de dimensões `n x n`, sendo `n` a quantidade de vértices.

Inicializamos a matriz com zeros, e "marcamos" `M[u][v]` com um valor diferente de zero caso exista uma aresta conectando o vértice `u` ao vértice `v`.

<img src="https://s3-sa-east-1.amazonaws.com/lcpi/1f5e0fd3-572c-479a-8a53-74d8212c5e5c.jpg" width=500>

No exemplo da figura acima vemos um grafo **não direcionado** e por isso temos a matriz **diagonalmente simétrica** (`M[u][v] == M[v][u]`). 

> Ou seja, a aresta `u-v` é "de mão dupla".

__________

Mas com essa estrutura também é possivel modelar grafos direcioinados, basta não impor a simetria.

**OPERACIONAL: flecha sai da linha e vai pra coluna, ou seja, o nó de "origem" é o que está na linha `u`, e o nó de "destino", é o que está na colunva `v`.**

<img src="https://algoritmosempython.com.br/images/algoritmos-python/algoritmos-grafos/GrafoMatrizAdjacencia.png" width=400>

__________

In [6]:
m = [[0, 1, 0, 0, 0],
     [0, 0, 1, 1, 0],
     [0, 1, 0, 0, 1],
     [1, 0, 0, 0, 0],
     [0, 1, 0, 0, 0]]

In [2]:
# conexão do nó 1 pro nó 2?
m[1][2]

1

In [5]:
# conexão do nó 4 pro nó 3?
m[4][3]

0

Essa estrutura também permite representar arestas com peso, basta utilizar o valor do peso para marcar a aresta no lugar da constante 1 que utilizamos.

<img src="https://www.researchgate.net/profile/Paula-Gabrielly-Rodrigues/publication/326722760/figure/fig5/AS:654507780345864@1533058223380/Figura-4-7-Grafo-nao-ponderado-A-e-ponderado-B-com-suas-respectivas-matrizes-de.png" width=500>

__________

#### Lista de adjacências

Embora a matriz de adjacências seja uma maneira simples e flexível para representação dos grafos, podemos ver que, principalmente para **grafos esparsos (grafos com poucas arestas)**, ela tende a gerar um desperdício de espaço (armazenando um monte de zeros para as conexões que não existem no grafo).

Uma alternativa que mitiga esse desperdício de espaço é a **lista de adjacêcias**.

Nessa representação, cada vértice está associado a uma lista com seus vizinhos.

Assim, não gastamos espaço representando a ausência de arestas.

<img src="https://s3-sa-east-1.amazonaws.com/lcpi/9775dad0-c900-42e9-87fa-41d78b73444c.jpg" width=500>

Mas e se o grafo tiver uma grande quantidade de arestas? Ainda estariamos economizando espaço?

#### Comparação das estruturas

Para um grafo `G=(V,E)` composto de vértices `V` e arestas `E`, listamos a complexidade das operações mais básicas.

|                            	| Matriz de Adj. 	| Lista de Adj.  	|
|----------------------------	|----------------	|----------------	|
| inserir aresta             	| O(1)           	| O(1)           	|
| remover aresta             	| O(1)           	| O(grau_max(G)) 	|
| verificar adj. de dois nós 	| O(1)           	| O(grau_max(G)) 	|
| listar vizinhos de um nó   	| O(len(V))         	| O(grau_max(G)) 	|
| espaço de armazenamento    	| O(len(V)^2 )      	| O(len(V) + len(E))  |

Obs: O **grau** de um vértice, é a **quantidade de arestas que incide sobre esse vértice.** O grau máximo de um grafo `G` é o maior grau dentre todos os vértices de `G`.

Será que faz sentido dizer que uma representação é melhor que a outra?
Em que situações seria melhor usar a matriz? E a lista?

_________

### 1.2) Implementação

Abaixo vemos um exemplo de implementação de grafo como **matriz de adjacência**.

In [7]:
m = [[0, 1, 0, 0, 0],
     [0, 0, 1, 1, 0],
     [0, 1, 0, 0, 1],
     [1, 0, 0, 0, 0],
     [0, 1, 0, 0, 0]]

In [8]:
n = 4

[0]*n

[0, 0, 0, 0]

In [16]:
n = 4

# isso inicializa uma matriz nxn cheia de zeros
[[0]*n for _ in range(n)]

[[0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0]]

In [41]:
print(*[[0]*n for _ in range(n)], sep="\n")

[0, 0, 0, 0]
[0, 0, 0, 0]
[0, 0, 0, 0]
[0, 0, 0, 0]


In [17]:
ma = [[0]*n for _ in range(n)]

In [18]:
ma

[[0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0]]

In [21]:
"\n".join(['a', 'b', 'c'])

'a\nb\nc'

In [24]:
print("[0, 0, 0, 0]\n[0, 0, 0, 0]\n[0, 0, 0, 0]\n[0, 0, 0, 0]")

[0, 0, 0, 0]
[0, 0, 0, 0]
[0, 0, 0, 0]
[0, 0, 0, 0]


In [34]:
ma

[[0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0], [0, 0, 0, 0]]

In [33]:
[str(x) for x in ma]

['[0, 0, 0, 0]', '[0, 0, 0, 0]', '[0, 0, 0, 0]', '[0, 0, 0, 0]']

In [30]:
print("\n".join([str(x) for x in ma]))

[0, 0, 0, 0]
[0, 0, 0, 0]
[0, 0, 0, 0]
[0, 0, 0, 0]


In [63]:
class GrafoMA:
    
    def __init__(self, n):
        
        # isso inicializa uma matriz (lista de listas) nxn cheia de zeros
        self.ma = [[0]*n for _ in range(n)]
        
    
    def __repr__(self):
        
        return "\n".join([str(x) for x in self.ma])
    
    
    def add_edge(self, origem, destino, direcionado, peso):
        
        self.ma[origem][destino] = peso
        
        if not direcionado:
            
            self.ma[destino][origem] = peso
            
            
    # implemente tirar conexões; listar vizinhos, checar se é vizinho
        

In [98]:
g1 = GrafoMA(n=4)

g1

[0, 0, 0, 0]
[0, 0, 0, 0]
[0, 0, 0, 0]
[0, 0, 0, 0]

In [99]:
g1.add_edge(1, 2, direcionado=True, peso=1)
g1.add_edge(0, 3, direcionado=True, peso=5)

g1

[0, 0, 0, 5]
[0, 0, 1, 0]
[0, 0, 0, 0]
[0, 0, 0, 0]

Podemos também implementar a **lista de adjacência**:

In [100]:
la = {i : [] for i in range(n)}

In [101]:
txt = ""

txt = txt + "abc"

txt

'abc'

In [102]:
txt = ""

for k, v in la.items():
    
    txt = txt + f"{k} : {v}\n"
    
print(txt)

0 : []
1 : []
2 : []
3 : []



In [109]:
class GrafoLA:
    
    def __init__(self, n):
        
        self.la = {i : [] for i in range(n)}
        
        
    def __repr__(self):
        
        txt = ""

        for k, v in self.la.items():

            txt = txt + f"{k} : {v}\n"
            
        return txt
    

    def add_edge(self, origem, destino, direcionado, peso):
        
        self.la[origem].append([destino, peso])
        
        if not direcionado:
            
            self.la[destino].append([origem, peso])

In [110]:
g2 = GrafoLA(4)

g2

0 : []
1 : []
2 : []
3 : []

In [111]:
g2.add_edge(1, 2, direcionado=True, peso = 1)
g2.add_edge(0, 3, direcionado=False, peso = 5)

g2

0 : [[3, 5]]
1 : [[2, 1]]
2 : []
3 : [[0, 5]]

Pergunta: como armazenar grafos ponderados com lista de adjacência?

In [None]:
# conforme fizemos acima, apendando à lista de adjacencia algo como
# (nó, peso) --> como é tupla, é imutável
# [nó, peso] --> como é lista, é mutável.

Uma outra opção, com ligações de mão dupla, mas pesos diferentes:

In [108]:
g3 = GrafoMA(4)

g3.add_edge(1, 2, direcionado=True, peso=1)
g3.add_edge(0, 3, direcionado=True, peso=5)
g3.add_edge(3, 0, direcionado=True, peso=42)

g3

[0, 0, 0, 5]
[0, 0, 1, 0]
[0, 0, 0, 0]
[42, 0, 0, 0]

_________

### 1.3) Percurso

Quando utilizamos um grafo para modelar um problema, muitas vezes temos o interesse de **percorrer** esse grafo (Graph Traversal ou Search).

Percorrer um grafo é passar por cada nó "visitando" o nó apenas uma vez.

Muitas vezes o interesse está não na visita em si, mas no **caminho percorrido para se chegar a esse nó**, ou na **ordem em que estes nós são visitados** (veremos mais abaixo como um destes algoritmos de percurso pode ser usado para encontrar o menor caminho entre dois nós, por exemplo).

E é por isso que os algoritmos de percurso precisam respeitar as arestas do grafo e não podem simplesmente percorrer a lista de vértices.


Veremos, abaixo, os principais algoritmos de percurso!

<img src="https://miro.medium.com/max/1280/0*miG6xdyYzdvrB67S.gif" width=450>

#### Busca em profundidade (DFS - Depth First Search)

Uma das maneiras de se percorrer um grafo é a busca em profundidade, que pode ser facilmente implementada de maneira recursiva.

Sempre que a DFS encontra **um vértice não visitado** ela segue por esse vértice.

Ela tem esse nome pois ao percorrer o grafo ela "verticaliza".

Ou seja, ao escolher um "ramo" do grafo, segue por esse ramo até que ele termine.

Abaixo temos um exemplo de como a busca em profundidade percorreria esse grafo partindo do nó 0.

<img src="https://s3-sa-east-1.amazonaws.com/lcpi/0084b080-e980-46d0-8694-55895333a3e7.jpg" width=600>

#### Busca em largura (BFS - Breadth First Search)

A BFS visita os nós do grafo em "camadas" partindo da origem, cada camada está uma aresta a mais de distância da origem em relação a camada anterior.
Ou seja, partindo de um nó origem `s` os nós diretamente conectados a `s` (seus vizinhos) são visitados primeiro antes dos nós conectados aos vizinhos de `s` (seus "vizinhos de segundo grau").

A figura abaixo mostra um exemplo gráfico desse comportamento em camadas.

<img src="https://s3-sa-east-1.amazonaws.com/lcpi/a67dd98f-8578-4bda-a710-903d7de9ceb6.jpg" width=600>

Note que a ordem de visitação imposta pela BFS é parcial.
Existem diferentes ordenações possíveis que qualificam como percurso BFS, o importante é respeitar as camadas.
Por exemplo, não importa se 1 foi visitado antes do 3 ou se o 3 foi visitado antes do 1 desde que ambos tenham sido visitados antes de 2, 4 e 5.


_________

### 1.4) Menor caminho

Uma das aplicações mais comuns em grafos é o cálculo do menor caminho entre vértices.

Aqui veremos o problema conhecido como **Single Source Shortest Path**, posto da seguinte forma: 

Dado um grafo `G` e um **vértice origem** `s`, encontre o **menor caminho** partindo de `s` até **cada vértice** `v` pertencente a `G`.
 
Vamos começar com o caso de grafos sem peso (ou peso constante = 1) nas arestas, ou seja, o menor caminho nesse caso é o **caminho com menos arestas**.

> Considere a busca em largura (BFS).

Já sabemos que um nó que está a uma aresta de distância da origem será visitado na primeira camada, um nó que está a duas arestas da origem será visitado na segunda, e assim por diante.

Ou seja, os nós já são visitados na ordem de menor caminho e a camada dá o custo desse caminho!!




#### Menor caminho para grafos com peso nas arestas

Grafos sem custo nas arestas são muito utilizados e nesses casos a BFS modificada será suficiente para encontrar o menor caminho.

Porém, muitas aplicações precisam levar em conta custos diferentes para cada aresta.

Por exemplo a **distância entre duas cidades** ou o **custo de pedágio** para se utilizar determinada rodovia.

A figura abaixo mostra um grafo com custos nas aretas.

Note que a BFS indicaria que o menor caminho de 0 a 1 seria simplesmente 0->1, mas podemos ver que 0->2->1, embora utilize mais arestas, tem um custo menor. E agora?

<img src="https://s3-sa-east-1.amazonaws.com/lcpi/bafb6b0b-7d19-47d8-8b93-293e84b7a7cd.jpg" width=800>

Existem diferentes algoritmos para encontrar o menor caminho entre todos os vértices e um vértice origem (*Single Source Shortest Path Problem*).



## Algoritmo de Dijkstra

Aqui vamos utilizar o algoritmo de Dijkstra por ser um dos mais famosos.

Este algoritmo calcula **a menor distância entre um nó e todos os outros nós no grafo**.

Considere o grafo a seguir:

<img src="https://www.codingame.com/servlet/fileservlet?id=14497257275137" width=300>

Vamos calcular o menor caminho entre o nó **C** e todos os outros nó do grafo!!

Durante o algoritmo, vamos marcar todos os nós **com a menor distância entre este nó e o nó C**.

A distância entre o nó C e ele mesmo é 0.

Inicialmente, a distância entre todos os nós é $\infty$. Já já vai ficar claro o porquê.

A cada iteração, vamos também focar em um único nó, o **nó atual**, que será marcado por um ponto vermelho.

<img src="https://www.codingame.com/servlet/fileservlet?id=14497265537633" width=300>

Nós vamos também criar listas para os menores caminhos! Isso vai permitir termos não somente o comprimento dos menores caminhos entre os nós e **C**, como também o caminho em si!

Inicialmente, temos:

```
Caminho entre C e A = []
Caminho entre C e B = []
Caminho entre C e C = [C]
Caminho entre C e D = []
Caminho entre C e E = []
```

As listas serão alteradas toda vez que atualizarmos as distâncias mínimas, de modo que as listas finais expressarão o menor caminho!

Vamos ver o passo a passo:

### Nó atual: C

<img src="https://www.codingame.com/servlet/fileservlet?id=14497279927597" width=300>

<img src="https://www.codingame.com/servlet/fileservlet?id=14497284902206" width=300>

<img src="https://www.codingame.com/servlet/fileservlet?id=14497297264677" width=300>

<img src="https://www.codingame.com/servlet/fileservlet?id=14497301316895" width=300>

```
Caminho entre C e A = [C, A]
Caminho entre C e B = [C, B]
Caminho entre C e C = [C]
Caminho entre C e D = [C, D]
Caminho entre C e E = []
```

### Nó atual: A

<img src="https://www.codingame.com/servlet/fileservlet?id=14497311165233" width=300>

<img src="https://www.codingame.com/servlet/fileservlet?id=14497327460640" width=300>

```
Caminho entre C e A = [C, A]
Caminho entre C e B = [C, A, B]
Caminho entre C e C = [C]
Caminho entre C e D = [C, D]
Caminho entre C e E = []
```

### Nó atual: D

<img src="https://www.codingame.com/servlet/fileservlet?id=14497330975308" width=300>

```
Caminho entre C e A = [C, A]
Caminho entre C e B = [C, A, B]
Caminho entre C e C = [C]
Caminho entre C e D = [C, D]
Caminho entre C e E = [C, D, E]
```

### Nó atual: B

<img src="https://www.codingame.com/servlet/fileservlet?id=14497346742885" width=300>

```
Caminho entre C e A = [C, A]
Caminho entre C e B = [C, A, B]
Caminho entre C e C = [C]
Caminho entre C e D = [C, D]
Caminho entre C e E = [(C, B), E] = [C, A, B, E]
```

### Nó atual: E

<img src="https://www.codingame.com/servlet/fileservlet?id=14497350226741" width=300>

### FIM

<img src="https://www.codingame.com/servlet/fileservlet?id=14497361633811" width=300>

```
Caminho entre C e A = [C, A]
Caminho entre C e B = [C, A, B]
Caminho entre C e C = [C]
Caminho entre C e D = [C, D]
Caminho entre C e E = [C, A, B, E]
```

Esquematicamente, temos o algoritmo:


- 1: Marque o nó de origem com distância zero, e os demais nós com distância $\infty$

- 2: Atribua aos nós não visitados a menor entre as distâncias atuais entre o nó C

- 3: Para cada vizinho V do nó C: adicione a distância atual de C com o peso da aresta conectando C-V. Se for menor que a distância atual de N, mude a distância atual para este valor.

- 4: Marque o nó atual C como visitado.

- 5: Se ainda houver nós não visitados, volte para o passo 2.

__________

Tirei as imagens acima [deste post](https://www.codingame.com/playgrounds/1608/shortest-paths-with-dijkstras-algorithm/dijkstras-algorithm). Vale a leitura!

_________

## Na aula que vem: [NetworkX!](https://networkx.org/)

Conheceremos algumas funcionalidades desta biblioteca para a análise de grafos/redes em Python!

<img src="https://networkx.org/_static/networkx_logo.svg">

In [1]:
# !pip install networkx

___________