# Cap 1: Grafos e redes

In [None]:
# importa networkx
import networkx as nx

# importa matplotlib
import matplotlib.pyplot as plt

# import pandas
import pandas as pd

## 1.3 Métricas Globais de Redes

### 1.3.1 Densidade

Seja uma rede $G=(V,E)$, com $|V|=n$ e $|E|=m$. 

Então, a densidade da rede, $\mathrm{dens}(G)$, é 
- igual a $\dfrac{2m}{n(n-1)}$, se a rede for não direcionada, e 
- igual a $\dfrac{m}{n(n-1)}$ se a rede for direcionada.

In [None]:
# grafo do clube do karate
karate = nx.karate_club_graph()

# cria uma figura e um conjunto de subplots
fig, ax = plt.subplots(figsize=(12,8))

# imprime o grafo g (karate club)
nx.draw(karate, node_size=500, with_labels = True)

# mostra as figuras 
plt.show()

In [None]:
# círculo com 6 nós
gci = nx.circulant_graph(6 ,[1])

# cria uma figura e um conjunto de subplots
fig, ax = plt.subplots(figsize=(12,8))

# imprime o grafo
nx.draw(gci, node_size=500, with_labels = True)

plt.show()

In [None]:
# grafo regular com 6 nós e 3 arestas por nó
gre = nx.random_regular_graph(3,6)

fig, ax = plt.subplots(1,1,figsize=(12,8))

# gera um grafo regular com 6 nós e 3 arestas por nó
gre = nx.random_regular_graph(3, 6)

# grafico do grafo gre
nx.draw(gre, node_size=800, with_labels = True)

plt.show()

In [None]:
# grafo completo com 6 nós
gco = nx.complete_graph(6)

# creates a figure and a grid of subplots
fig, ax = plt.subplots(1,1,figsize=(12,8))

# gera um grafo completo com 6 nós
gco = nx.complete_graph(6)

# grafico do grafo gco
nx.draw(gco, node_size=800, with_labels = True)

plt.show()

In [None]:
fig, ax = plt.subplots(1,1,figsize=(12,8))

# gera um grafo direcionado gfa
GFA = nx.DiGraph()

# adcionar nós ao grafo gfa
GFA.add_nodes_from([0,1,2,3,4,5])

# adicionar arestas ao grafo gfa
GFA.add_edge(0,2) 
GFA.add_edge(1,2) 
GFA.add_edge(2,4) 
GFA.add_edge(2,5) 
GFA.add_edge(3,4) 
GFA.add_edge(3,5) 

# definindo a posição dos nos
pos = {} 
pos[0] = [-1 ,0]
pos[1] = [+0 ,0]
pos[2] = [-0.5,-0.5]
pos[3] = [+1.5,-0.5]
pos[4] = [+0.0,-1.0]
pos[5] = [+1.0,-1.0]

# grafico do grafo gfa
nx.draw(GFA, pos=pos, node_size=1000, with_labels=True, arrows=True)

plt.show()

In [None]:
# imprime a densidade do grafo g (karate club)
print(f"dens(karate) = {nx.density(karate)}")

In [None]:
# imprime a densidade do grafo gre (grafo regular com 6 nós e 3 arestas por nó)
print(f"dens(gre) = {nx.density(gre)}")

In [None]:
# imprime a densidade do grafo gco (grafo completo com 6 nós)
print(f"dens(gco) = {nx.density(gco)}")

### 1.3.2 Comprimento médio e caminho

**Diâmetro**: maior distância geodésica(shortest path) entre dois nós em uma mesma componente.

**Comprimento médio dos caminhos**: média de todas as distâncias geodésicas entre dois nós que são conectados na rede.

In [None]:
for path in nx.all_simple_paths(karate, source=0, target=3, cutoff=3):
    print(path)

In [None]:
paths = nx.all_simple_paths(karate, source=0, target=3, cutoff=5)
for path in map(nx.utils.pairwise, paths):
    print(list(path))

In [None]:
# imprime o shortest path de 3 a 20 do grafo karate club
print(f"caminho de 3 a 20 = {nx.shortest_path(karate, 3, 20)}")

In [None]:
# imprime o tamanho do shortest path de 3 a 20 do grafo karate club
print(f"tamanho do caminho de 3 a 20 = {nx.shortest_path_length(karate,3,20)}")

In [None]:
# calcula o comprimento médio dos caminhos geodesicos de g (karate club)
print(f"comprimento médio de g = {nx.average_shortest_path_length(karate)}")

In [None]:
# imprime o diâmetro de g (karate club)
print(f"diâmetro de g = {nx.diameter(karate)}")

### 1.3.3 Distribuição de graus

- O grau de um certo vértice de uma rede não direcionada consiste de quantas arestas envolvem este vértice na
rede, ou seja, 
$$d(i) = \displaystyle\sum_{j \in V} A(i,j)$$

- Vértices com alto grau são aqueles que conseguem acessar imediatamente um grande número de vértices.

- Em redes direcionadas, existem dois tipos de grau que dependem da direção das arestas: o grau de saída (out-degree), $d^{out}(i)$, e o grau de entrada (in-degree), $d^{in}(i)$.
$$
d^{out}(i) = \displaystyle\sum_{j \in V} A(i,j)

\text{ e }

d^{in}(i) = \displaystyle\sum_{j \in V} A(j,i)
$$




In [None]:
# imprime o grau do nó 0 do grafo g (karate club)
print(f"grau do nó 0: {karate.degree(0)}")

In [None]:
# imprime lista com o grau dos nós 0, 1 e 2 do grafo g(karate club)
print(f"graus dos nós 0, 1 e 2: {list(karate.degree([0,1,2]))}")

In [None]:
# imprime lista com as frequências de ocorrência de graus: #grau0, #grau1, etc
print(f"frequências de ocorrência dos graus: {nx.degree_histogram(karate)}")

In [None]:
for i in GFA.nodes():
    print(f"in degree node {i}: {GFA.in_degree(i)}")

In [None]:
for i in GFA.nodes():
    print(f"in degree node {i}: {GFA.out_degree(i)}")

### 1.3.4 Coesão e agrupamento

Redes complexas possuem uma característica de coesão em que nós vizinhos a um certo nó tem uma maior chance de serem vizinhos entre si.

Existem algumas formas de mensurar essa característica, por exemplo, através do conceito de cliques.

Uma **clique** em um grafo não-direcionado é um conjunto de vértices dois a dois adjacentes. 

Em outras palavras, um conjunto C de vértices é uma clique se tiver a seguinte propriedade: 
para todo par (v, w) de vértices distintos em C, existe uma aresta com pontas v e w.

**Exemplo:** Para qualquer vértice v, o conjunto {v} é uma clique. 

**Exemplo:** Se o grafo tem alguma aresta com pontas v e w então o conjunto {v,w} é uma clique.

Uma clique C é maximal se não existe clique C' que seja subconjunto próprio de C. 

Uma clique C é máxima se não existe clique C' que seja maior que C. 

Uma maneira de analisar a coesão de uma rede seria analisar a distribuição dos cliques, ou seja, quantas cliques de cada tamanho existem no grafo.

Cliques são muito sensíveis a remoção de um nó, assim outras medidas foram propostas para analisar o grau de coesão ou agrupamento da rede. 

O **coeficiente de agrupamento total** é dado pela proporção de vezes que dois vértices j e k que são vizinhos de um mesmo vértice i também são vizinhos entre si

$$
cl(G)=
\dfrac{\sum\limits_{(i,j,k):j\ne i,k\ne i,k\ne j}A(i,j)A(i,k)A(j,k)}{\displaystyle\sum\limits_{(i,j,k):j\ne i,k\ne i,k\ne j}A(i,j)A(i,k)}
$$


In [None]:
# grafo do clube do karate
karate = nx.karate_club_graph()

# cria uma figura e um conjunto de subplots
fig, ax = plt.subplots(figsize=(12,8))

# imprime o grafo g (karate club)
nx.draw(karate, node_size=500, with_labels = True)

# mostra as figuras 
plt.show()

In [None]:
clqs = nx.enumerate_all_cliques(karate) # iterator com todos as cliques

list_clqs = []
for i in clqs:
    list_clqs.append(i)

list_clqs

In [None]:
list_tam_clqs = []
for i in list_clqs:
    list_tam_clqs.append(len(i))

list_tam_clqs

df_tam_clqs = pd.DataFrame(list_tam_clqs)
df_tam_clqs.value_counts()

In [None]:
clqs_max = nx.find_cliques(karate) # iterator com todos os cliques maximais

list_clqs_max = []
for i in clqs_max:
    list_clqs_max.append(i)

list_clqs_max

In [None]:
list_tam_clqs_max = []
for i in list_clqs_max:
    list_tam_clqs_max.append(len(i))

df_freq_tam_clqs_max = pd.DataFrame(list_tam_clqs_max)
df_freq_tam_clqs_max.value_counts()

In [None]:
# find the maximum clique
nx.approximation.max_clique(karate)

In [None]:
for i in list_clqs_max:
    if len(i) == 5:
        print(i)

In [None]:
# calculo do tamanho médio dos cliques
iter_clqs = nx.enumerate_all_cliques(karate)

list_clqs = []
for i in iter_clqs:
    list_clqs.append(i)

soma = 0
k = len(list_clqs)
for i in list_clqs :
    soma = soma + len(i)
lonmedia = soma / k

print(f"Tamanho médio das cliques: {lonmedia}")

In [None]:
# imprime o coeficiente de agrupamento total(cl) do grafo g (karate club) 
print(f"cl(g) = {nx.transitivity(karate)}")

In [None]:
# imprime o cl do grafo gci () 
print(f"cl(gci) = {nx.transitivity(gci)}")

In [None]:
# imprime o cl do grafo gre () 
print(f"cl(gre) = {nx.transitivity(gre)}")

In [None]:
# imprime o cl do grafo gco () 
print(f"cl(gco) = {nx.transitivity(gco)}")

### 1.3.5 Reciprocidade

Em redes direcionadas, uma medida de interesse é saber qual a fração de arestas que ocorrem em ambas as direções.

**Reciprocidade**: fração de arestas que ocorrem em ambas as direções.

Fórmula para o cálculo da reciprocidade:
$$
rc(G)=
\dfrac{\displaystyle\sum\limits_{i,j}A(i,j)A(j,i)}{\displaystyle\sum\limits_{i,j}A(i,j)}.
$$

In [None]:
# gerando o grafo direcionado GD
GD = nx.DiGraph ()
GD.add_nodes_from([1,2,3])
GD.add_edges_from([(1,2),(2,1),(2,3),(3,1)])

In [None]:
fig, ax = plt.subplots(1,1,figsize=(10,8))

# grafico do grafo gdi
nx.draw(GD, node_size=800, with_labels = True)

plt.show()

In [None]:
# imprime a reciprocidade de GD
print(f"re(GD) = {nx.reciprocity(GD)}")

In [None]:
#A = nx.adjacency_matrix(GD)
A = nx.to_scipy_sparse_array(GD).toarray()
A