## Métricas centralidade - parte 2

In [None]:
# import das bibliotecas

import numpy as np
import networkx as nx

import pandas as pd

import matplotlib as mpl
import matplotlib.pyplot as plt
from matplotlib.pyplot import figure
import matplotlib.patches as mpatches

### Instâncias

In [None]:
# binomial_tree

BTG = nx.binomial_tree(4)
# Returns the Binomial Tree of order 4.

# network
G = BTG

n = nx.number_of_nodes(G)
m = nx.number_of_edges(G)

print("numero de vertices:", n)
print("numero de arestas:", m)

print("O grafo é conexo:", nx.is_connected(G))


In [None]:
# grafico binomial_tree

fig, ax = plt.subplots(1,1,figsize=(15,10))

# network
G = BTG

# layout position
pos = nx.kamada_kawai_layout(G)

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G,
                               node_size=1000,
                               pos=pos, 
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos, 
                        font_color='white', 
                        ax=ax)

plt.axis("off")
#plt.savefig('BTG.png', transparent=True, dpi=300)
plt.show()

In [None]:
# karate_club_graph

KCG = nx.karate_club_graph()
# Returns Zachary's Karate Club graph.

# network
G = KCG

n = nx.number_of_nodes(G)
m = nx.number_of_edges(G)

print("numero de vertices:", n)
print("numero de arestas:", m)

print("O grafo é conexo:", nx.is_connected(G))

In [None]:
# gráfico karate_club_graph

fig, ax = plt.subplots(1,1,figsize=(15,10))

# network
G = KCG

# layout position
pos = nx.kamada_kawai_layout(G)

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G,
                               node_size=1000,
                               pos=pos, 
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos, 
                        font_color='white', 
                        ax=ax)

plt.axis("off")
#plt.savefig('BTG.png', transparent=True, dpi=300)
plt.show()

In [None]:
# DiGraph
GD = nx.DiGraph()

GD.add_nodes_from (['a', 'b', 'c', 'd', 'e', 'f'])

GD.add_edge('a', 'c')
GD.add_edge('b', 'c')
GD.add_edge('c', 'e')
GD.add_edge('c', 'f')
GD.add_edge('d', 'e')
GD.add_edge('d', 'f')

pos = nx.circular_layout(GD)
pos['a'] = [-1 ,0]
pos['b'] = [+0 ,0]
pos['c'] = [-0.5,-0.5]
pos['d'] = [+1.5,-0.5]
pos['e'] = [+0.0,-1.0]
pos['f'] = [+1.0,-1.0]

n = nx.number_of_nodes(GD) # número de vértices
m = nx.number_of_edges(GD) # número de arestas

print("numero de vertices:", n)
print("numero de arestas:", m)

In [None]:
# grafico DiGraph

nx.draw(GD, 
        pos=pos, 
        node_size=1000, 
        with_labels=True, 
        arrows=True)

In [None]:
# Graph

GND = nx.Graph()

GND.add_edge('a', 'b')
GND.add_edge('a', 'c')
GND.add_edge('a', 'e')
GND.add_edge('b', 'c')
GND.add_edge('b', 'd')
GND.add_edge('b', 'e')
GND.add_edge('b', 'f')
GND.add_edge('c', 'd')

pos = nx.circular_layout(GND)
pos['a'] = [-1 ,0]
pos['b'] = [+0 ,0]
pos['c'] = [-0.5,-0.5]
pos['d'] = [+1.5,-0.5]
pos['e'] = [+0.0,-1.0]
pos['f'] = [+1.0,-1.0]


# network
G = GND

n = nx.number_of_nodes(G)
m = nx.number_of_edges(G)

print("numero de vertices:", n)
print("numero de arestas:", m)

print("O grafo é conexo:", nx.is_connected(G))

In [None]:
# gráfico Graph

nx.draw(GND, 
        pos=pos, 
        node_size=1000, 
        with_labels=True)

In [None]:
# random_internet_as_graph

IG = nx.random_internet_as_graph(100)
# Generates a random undirected graph resembling the Internet AS network

# network
G = IG

n = nx.number_of_nodes(G)
m = nx.number_of_edges(G)

print("numero de vertices:", n)
print("numero de arestas:", m)

print("O grafo é conexo:", nx.is_connected(G))

In [None]:
# gráfico random_internet_as_graph

fig, ax = plt.subplots(1,1,figsize=(15,10))

# network
G = IG

# layout position
pos = nx.kamada_kawai_layout(G)

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G,
                               node_size=1000,
                               pos=pos, 
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos, 
                        font_color='white', 
                        ax=ax)

plt.axis("off")
plt.show()

In [None]:
# connected_watts_strogatz_graph

CWSG = nx.connected_watts_strogatz_graph(100, 25, 0.25, tries=100, seed=None)

# Returns a connected Watts–Strogatz small-world graph.
# Attempts to generate a connected graph by repeated generation of Watts–Strogatz small-world graphs. 
# An exception is raised if the maximum number of tries is exceeded.

#Parameters
#n int The number of nodes
#k int Each node is joined with its k nearest neighbors in a ring topology.
#p float The probability of rewiring each edge
#tries int Number of attempts to generate a connected graph.
#seed integer, random_state, or None (default) Indicator of random number generation state.

# network
G = CWSG

n = nx.number_of_nodes(G)
m = nx.number_of_edges(G)

print("numero de vertices:", n)
print("numero de arestas:", m)

print("O grafo é conexo:", nx.is_connected(G))

In [None]:
# grafico connected_watts_strogatz_graph

fig, ax = plt.subplots(1,1,figsize=(15,10))

# network
G = CWSG

# layout position
pos = nx.kamada_kawai_layout(G)

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G,
                               node_size=1000,
                               pos=pos, 
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos, 
                        font_color='white', 
                        ax=ax)

plt.axis("off")
plt.show()

In [None]:
# erdos_renyi_graph

# nx.erdos_renyi_graph(n, p, seed=None, directed=True)
ERG = nx.erdos_renyi_graph(50,0.1,seed=1234, directed=False)

# Returns a  random graph, also known as an Erdős-Rényi graph or a binomial graph.
# The model chooses each of the possible edges with probability 

#Parameters
# n int The number of nodes.
# p float Probability for edge creation.
# seed integer, random_state, or None (default) Indicator of random number generation state.
# directed bool, optional (default=False)
# If True, this function returns a directed graph.

# network
G = CWSG

n = nx.number_of_nodes(G)
m = nx.number_of_edges(G)

print("numero de vertices:", n)
print("numero de arestas:", m)

print("O grafo é conexo:", nx.is_connected(G))

In [None]:
# grafico erdos_renyi_graph

fig, ax = plt.subplots(1,1,figsize=(15,10))

# network
G = ERG

# layout position
pos = nx.kamada_kawai_layout(G)

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G,
                               node_size=1000,
                               pos=pos, 
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos, 
                        font_color='white', 
                        ax=ax)

plt.axis("off")
plt.show()

In [None]:
# barabasi_albert_graph

BAG = nx.barabasi_albert_graph(100, 8, seed=None, initial_graph=None)

# Returns a random graph using Barabási–Albert preferential attachment
# A graph of $n$ nodes is grown by attaching new nodes each with $m$ edges that are preferentially attached to existing nodes with high degree.

# Parameters
# n : int Number of nodes
# m : int Number of edges to attach from a new node to existing nodes
# seed : integer, random_state, or None (default) Indicator of random number generation state

# network
G = BAG

n = nx.number_of_nodes(G)
m = nx.number_of_edges(G)

print("numero de vertices:", n)
print("numero de arestas:", m)

print("O grafo é conexo:", nx.is_connected(G))

In [None]:
# grafico barabasi_albert_graph

fig, ax = plt.subplots(1,1,figsize=(15,10))

# network
G = BAG

# layout position
pos = nx.kamada_kawai_layout(G)

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G,
                               node_size=1000,
                               pos=pos, 
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos, 
                        font_color='white', 
                        ax=ax)

plt.axis("off")
plt.show()

### High school in Marseille

- schoolfriends_vertices.csv and schoolfriends_edgelist.csv data sets 

- This data set represents friendships reported between schoolchildren in a high school in Marseille, France in 2013. 

- The vertex set provides the ID, class and gender of each child, and the edgelist has two types of relationships. 

- The first type is a reported friendship where the from ID reported the to ID as a friend. 

- The second type is a known Facebook friendship between the two IDs

In [None]:
schoolfriends_edgelist = pd.read_csv("data/schoolfriends/schoolfriends_edgelist.csv")
schoolfriends_vertices = pd.read_csv("data/schoolfriends/schoolfriends_vertices.csv")

In [None]:
# create undirected facebook graph

schoolfriends_fb = nx.from_pandas_edgelist(
  df = schoolfriends_edgelist[
    schoolfriends_edgelist.type == 'facebook'
  ],
  source = "from",
  target = "to"
)


pos = nx.spring_layout(schoolfriends_fb)
betCent = nx.betweenness_centrality(schoolfriends_fb, normalized=True, endpoints=True)
node_color = [20000.0 * schoolfriends_fb.degree(v) for v in schoolfriends_fb]
node_size =  [v * 10000 for v in betCent.values()]
plt.figure(figsize=(20,20))
nx.draw_networkx(schoolfriends_fb, 
                 #pos=pos, 
                 #with_labels=False,
                 #node_color=node_color,
                 #node_size=node_size 
                 )
plt.axis('off')
plt.show()

In [None]:
# create directed reported graph

schoolfriends_rp = nx.from_pandas_edgelist(
  df = schoolfriends_edgelist[
    schoolfriends_edgelist.type == 'reported'
  ],
  source = "from",
  target = "to",
  create_using=nx.DiGraph()
)

pos = nx.spring_layout(schoolfriends_rp)
betCent = nx.betweenness_centrality(schoolfriends_rp, normalized=True, endpoints=True)
node_color = [20000.0 * schoolfriends_rp.degree(v) for v in schoolfriends_rp]
node_size =  [v * 10000 for v in betCent.values()]
plt.figure(figsize=(20,20))
nx.draw_networkx(schoolfriends_rp, 
                 #pos=pos, 
                 #with_labels=False,
                 #node_color=node_color,
                 #node_size=node_size 
                 )
plt.axis('off')
plt.show()

In [None]:
# facebook network

_path = r'data/facebook/facebook_combined.txt.gz'
G_fb = nx.read_edgelist(_path, create_using = nx.Graph(), nodetype=int)

pos = nx.spring_layout(G_fb)
betCent = nx.betweenness_centrality(G_fb, normalized=True, endpoints=True)
node_color = [20000.0 * G_fb.degree(v) for v in G_fb]
node_size =  [v * 10000 for v in betCent.values()]
plt.figure(figsize=(20,20))
nx.draw_networkx(G_fb, pos=pos, with_labels=False,
                 node_color=node_color,
                 node_size=node_size )
plt.axis('off')
plt.savefig("G_fb.png", format="PNG")
plt.show()

### Centralidade de Autovetor

- A centralidade de autovetor é uma medida que leva em conta não somente a quantidade de vizinhos que um vértice possui, mas também a importância destes vizinhos.

- Seja $C_{eg}^{0} = ( C_{eg}^{0}(1), C_{eg}^{0}(2), \ldots, C_{eg}^{0}(n) )$ um vetor não negativo com valor inicial associado a importância de cada nó na rede.

- Podemos atualizar a importância do nó $i$ da rede, somando a importância dos seus vizinhos, ou seja,
$
C_{eg}^{1} (i) = \sum_{j=1}^{n} A(i,j) C_{eg}^{0}(j).
$

- Temos que $C_{eg}^{1} = A C_{eg}^{0}$, e repetindo $x$ vezes temos $C_{eg}^{x} = A^{x} C_{eg}^{0}$.

- Considere $C_{eq}^{0} = \sum_{i=1}^{n} b_i v_i$, onde $v_i$ é o autovetor $i$ da matriz $A$. Temos
\begin{align*}
C_{eg}^{x} & = A^{x} \sum_{i} b_{i} v_{i} \\
& = \sum_{i} b_i A^{x} v_i \\
& = \sum_{i} b_i (\lambda_i)^{x} v_{i} \\
& = (\lambda_{1})^{x} \sum_{i} b_i \left( \dfrac{\lambda_{i}}{\lambda_{1}} \right)^{x} v_{i}
\end{align*}
onde $\lambda_1 = \max_{i} { |\lambda_{i}|}$ 

- A centralidade de autovetor pode ser definida como um vetor que satisfaz $AC_{eg} = \lambda_{1} C_{eg}$.

- Temos que $C_{eg}(i) = \dfrac{1}{\lambda_{1}} \sum_{j=1}^{n} A(i,j) C_{eg} (j)$ para cada nó $i$ da rede.

- **nx.eigenvector_centrality_numpy()**: função do **networkx** que retorna a centralidade de autovetor dos nós de uma rede.


In [None]:
# graus dos nós da rede BGT

graus = dict(nx.degree(BTG))

for k, val in graus.items():
    print("node",k,":", val)

In [None]:
# conjuntos associados aos graus do BTG

G = BTG

graus = dict(nx.degree(G))

set_graus = set(graus.values())
print("set_graus =", set_graus)

for i in set_graus:
    tmp = []
    for key, value in graus.items():
        if i == graus[key]:
            tmp.append(key)
    print(i, "=", set(tmp))

In [None]:
# rank dos graus dos nós da rede BGT

graus = dict(nx.degree(BTG))

ranks = [(k, v) for k, v in sorted(graus.items(), key=lambda item: -item[1])]

# os k melhores 
k = 5
ranks[0:k]

In [None]:
# centralidade de autovetor da rede BTG

# network
G = BTG

cev = nx.eigenvector_centrality_numpy(G)

for k, val in cev.items():
    print("node",k,":", val)

In [None]:
# rank em relacao a centralidade de autovetor

# network
G = BTG

cev = nx.eigenvector_centrality_numpy(G)

ranks = [(k, v) for k, v in sorted(cev.items(), key=lambda item: -item[1])]

# os k melhores
k = 5
ranks[0:k]

In [None]:
# grafico da centralidade de autovetor

# network
G = BTG

cev = nx.eigenvector_centrality_numpy(G)
cev = list(cev.values())

fig, ax = plt.subplots(1,1,figsize=(15,10))

# layout position
pos = nx.kamada_kawai_layout(G)

# color of nodes
color = cev

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G, 
                               pos=pos, 
                               node_size=1000,
                               node_color=color,
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos,
                        font_color='white', 
                        ax=ax)

plt.axis("off")
plt.colorbar(nodes)
plt.show()

In [None]:
G = BTG

cev = nx.eigenvector_centrality_numpy(G)

set_cev = set(cev.values())
print("set_cev =", set_cev)

for i in set_cev:
    tmp = []
    for key, value in graus.items():
        if i == cev[key]:
            tmp.append(key)
    print(i, "=", set(tmp))

In [None]:
# graus dos nós do IG

G = IG

graus = dict(nx.degree(IG))

ranks = [(k, v) for k, v in sorted(graus.items(), key=lambda item: -item[1])]

# os k melhores
k = 5
ranks[0:k]

In [None]:
# centralidade de autovetor do IG

# network
G = IG

cev = nx.eigenvector_centrality_numpy(G)

ranks = [(k, v) for k, v in sorted(cev.items(), key=lambda item: -item[1])]

# os k melhores
k = 5
ranks[0:k]

In [None]:
G = IG

cev = nx.eigenvector_centrality_numpy(G)

set_cev = set(cev.values())
print("set_cev =", set_cev)

for i in set_cev:
    tmp = []
    for key, value in graus.items():
        if i == cev[key]:
            tmp.append(key)
    print(i, "=", set(tmp))

In [None]:
# grafico da centralidade de autovetor do IG

# network
G = IG

cev = nx.eigenvector_centrality_numpy(G)
cev = list(cev.values())

fig, ax = plt.subplots(1,1,figsize=(15,10))

# layout position
pos = nx.kamada_kawai_layout(G)

# color of nodes
color = cev

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G, 
                               pos=pos, 
                               node_size=1000,
                               node_color=color,
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos,
                        font_color='white', 
                        ax=ax)

plt.axis("off")
plt.colorbar(nodes)
plt.show()

Em redes direcionadas:

- Nós que possuem grau de entrada nulo possuem centralidade de autovetor nula, pois este vértice não recebe a importância de nenhum outro nó.

- Se todos os vizinhos que acessam um nó, possuem grau de entrada nulo, todos eles terão centralidade de autovetor nula e, portanto, o nó que só contém estes vizinhos também terá centralidade de autovetor nula.

In [None]:
# centralidade de autovetor da rede GD

G = GD
cev = nx.eigenvector_centrality_numpy(G)

for k, val in cev.items():
    print("node",k,":", val)

In [None]:
# centralidade de autovetor da rede GD

# network
G = GD

cev = nx.eigenvector_centrality_numpy(G)

cev = list(cev.values())

fig, ax = plt.subplots(1,1,figsize=(15,10))

# layout position
pos = nx.circular_layout(G)
pos['a'] = [-1 ,0]
pos['b'] = [+0 ,0]
pos['c'] = [-0.5,-0.5]
pos['d'] = [+1.5,-0.5]
pos['e'] = [+0.0,-1.0]
pos['f'] = [+1.0,-1.0]

# color of nodes
color = cev

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G, 
                               pos=pos, 
                               node_size=1000,
                               node_color=color,
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos,
                        font_color='white', 
                        ax=ax)

plt.axis("off")
plt.colorbar(nodes)
plt.show()

In [None]:
# centralidade de autovetor

G = schoolfriends_rp
cev = nx.eigenvector_centrality_numpy(G)

for k, val in cev.items():
    print("node",k,":", val)

In [None]:
# centralidade de autovetor da rede GD

# network
G = schoolfriends_rp

cev = nx.eigenvector_centrality_numpy(G)

cev = list(cev.values())

fig, ax = plt.subplots(1,1,figsize=(25,20))


# layout position
pos = nx.kamada_kawai_layout(G)

# color of nodes
color = cev

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G, 
                               pos=pos, 
                               node_size=1000,
                               node_color=color,
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos,
                        font_color='white', 
                        ax=ax)

plt.axis("off")
plt.colorbar(nodes)
plt.show()

In [None]:
# centralidade de autovetor do IG

# network
G = schoolfriends_rp

cev = nx.eigenvector_centrality_numpy(G)

ranks = [(k, v) for k, v in sorted(cev.items(), key=lambda item: -item[1])]

# os k melhores
k = 5
ranks[0:k]

### Centralidade de Katz

- Na **centralidade de Katz** é adicionado um valor de centralidade para todos os nós da rede, usando a fórmula

$$
C_K(i)=\alpha\sum_{j\ne i} A(i,j)C_K(j) +\beta,
$$
onde $\alpha$ e $\beta$ são constantes positivas. 

- $\beta$ é o valor de centralidade que os nós de grau nulo possuem e $\alpha< 1/\lambda_1$ em que $\lambda_1$ é o maior autovalor de $A$. 

e
$$
C_K=\beta(I-\alpha A)^{-1}\overline{1}
$$

- **nx.katz_centrality_numpy()**: função do **networkx** que retorna a **centralidade de Katz** dos nós de uma rede.

In [None]:
# centralidade de katz do BTG

# network
G = BTG

ck1 = nx.katz_centrality_numpy(G, alpha=0.08,beta=1)
ck2 = nx.katz_centrality_numpy(G, alpha=0.01,beta=1)
ck3 = nx.katz_centrality_numpy(G, alpha=0.08,beta=2)

In [None]:
for k1, val1 in ck1.items():
    print("node",k1,":", val1)

In [None]:
for k, val in ck2.items():
    print("node",k,":", val)

In [None]:
for k, val in ck3.items():
    print("node",k,":", val)

In [None]:
# centralidade de katz do BTG

# network
G = BTG

# katz
ck = list(ck1.values())

fig, ax = plt.subplots(1,1,figsize=(15,10))

# layout position
pos = nx.kamada_kawai_layout(G)

# color of nodes
color = ck

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G, 
                               pos=pos, 
                               node_size=1000,
                               node_color=color,
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos,
                        font_color='white', 
                        ax=ax)

plt.axis("off")
plt.colorbar(nodes)
plt.show()

Para redes direcionadas temos que:
$$
C_K(i)=\alpha\sum_{j\ne i} A(j,i)C_K(j) +\beta,
$$
ou
$$
C_K^T=\beta\overline{1}^T(I-\alpha A)^{-1}.
$$

In [None]:
# centralidade de katz do GD

# network
G = GD

ck1 = nx.katz_centrality_numpy(G, alpha=0.08,beta=1)
ck2 = nx.katz_centrality_numpy(G, alpha=0.01,beta=1)
ck3 = nx.katz_centrality_numpy(G, alpha=0.08,beta=2)

In [None]:
for k1, val1 in ck1.items():
    print("node",k1,":", val1)

In [None]:
# centralidade de katz do GD

# network
G = GD

# katz
ck = list(ck1.values())

fig, ax = plt.subplots(1,1,figsize=(15,10))

# layout position
pos = nx.circular_layout(G)
pos['a'] = [-1 ,0]
pos['b'] = [+0 ,0]
pos['c'] = [-0.5,-0.5]
pos['d'] = [+1.5,-0.5]
pos['e'] = [+0.0,-1.0]
pos['f'] = [+1.0,-1.0]

# color of nodes
color = ck

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G, 
                               pos=pos, 
                               node_size=1000,
                               node_color=color,
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos,
                        font_color='white', 
                        ax=ax)

#nx.draw(GD, 
#        pos=pos, 
#        node_size=1000, 
#        with_labels=True, 
#        arrows=True)

plt.axis("off")
plt.colorbar(nodes)
plt.show()

### PageRank

- O **pagerank** assume que a importância de um nó é dividida igualmente entre os seus vizinhos e tem a fórmula
$$
C_{PR}(i)=(1-\alpha)+\alpha\sum_{j\ne i}\frac{A(j,i)C_{PR}(j)}{d^{out}(j)},
$$
em que $\alpha\in (0,1)$. 

- O valor $\alpha$ pode ser pensado como a probabilidade de um usuário continuar navegando entre páginas através dos links. 

- Para um vértice $j$ com $d^{out}(j) = 0$, como $j$ não contribui para a importância de nenhum outro nó, adota-se a convenção de que $d^{out}(j) = 1$ na fórmula acima.

- Em termos matriciais, temos:
$$
C_{PR}^T=(1-\alpha)\overline{1}^T+\alpha C_{PR}^T DA ,
$$
onde $D$ é uma matriz diagonal tal que $D(i,i)=\min(\frac{1}{d^{out}(i)},1)$. 

- Portanto,
$$
C_{PR}^T=(1-\alpha)\overline{1}^T(I-\alpha DA)^{-1}.
$$

- No **networkx**, os valores dos **pagerank** são normalizados para que a soma deles dê igual a 1.

In [None]:
# calculo do pagerank do BTG

# network
G = BTG

cpr1 = nx.pagerank(G, alpha=0.85)
cpr2 = nx.pagerank(G, alpha=0.65)
cpr3 = nx.pagerank(G, alpha=0.25)

In [None]:
soma = 0
for k, val in cpr1.items():
    print("node",k,":", val)
    soma += val

print("Soma = ", soma)

In [None]:
# centralidade de pagerank

# network
G = BTG

# pagerank
cpr = list(cpr1.values())

fig, ax = plt.subplots(1,1,figsize=(15,10))

# layout position
pos = nx.kamada_kawai_layout(G)

# color of nodes
color = cpr

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G, 
                               pos=pos, 
                               node_size=1000,
                               node_color=color,
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos,
                        font_color='white', 
                        ax=ax)

plt.axis("off")
plt.colorbar(nodes)
plt.show()

In [None]:
# calculo do pagerank do GD

# network
G = GD

cpr1 = nx.pagerank(G, alpha=0.85)
cpr2 = nx.pagerank(G, alpha=0.65)
cpr3 = nx.pagerank(G, alpha=0.25)

In [None]:
for k, val in cpr1.items():
    print("node",k,":", val)

In [None]:
# centralidade de katz do GD

# network
G = GD

# pagerank
cpr = list(cpr1.values())

fig, ax = plt.subplots(1,1,figsize=(15,10))

# layout position
pos = nx.circular_layout(G)
pos['a'] = [-1 ,0]
pos['b'] = [+0 ,0]
pos['c'] = [-0.5,-0.5]
pos['d'] = [+1.5,-0.5]
pos['e'] = [+0.0,-1.0]
pos['f'] = [+1.0,-1.0]

# color of nodes
color = cpr

# draw edges
nx.draw_networkx_edges(G,
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G, 
                               pos=pos, 
                               node_size=1000,
                               node_color=color,
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos,
                        font_color='white', 
                        ax=ax)

plt.axis("off")
plt.colorbar(nodes)
plt.show()

### Coeficiente de agrupamento local

- Permite avaliar o quanto os nós são capazes de proporcionar interação entre os seus vizinhos. 

- O coeficiente de agrupamento local de um nó $i$ é dado por:

$$
cl(i)=\frac{\sum\limits_{(j,k):j\ne i,k\ne i,k\ne j}A(i,j)A(i,k)A(j,k)}{\sum\limits_{(j,k):j\ne i,k\ne i,k\ne j}A(i,j)A(i,k)}.
$$

- Vértices que possuem grau 0 ou 1 possuem coeficiente de agrupamento local nulo. 

- Pode-se definir o coeficiente de agrupamento local médio:

$$
\overline{cl}(G)=\frac{1}{n}\sum\limits_{i=1}^ncl(i).
$$

- **nx.clustering()**: função do **networkx** que retorna o coeficiente de agrupamento local.

- **nx.average_clustering()**: função do **networkx** que retorna o coeficiente de agrupamento médio.

- **nx.transitivity()**: função do **networkx** que retorna o coeficiente de agrupamento total.

In [None]:
# clustering do KCG

# network
G = KCG

cal = nx.clustering(G)

for k, val in cal.items():
    print("node",k,":", val)

In [None]:
# average_clustering do KCG

# network
G = KCG

cam = nx.average_clustering(G)

print(cam)

In [None]:
# average_clustering do KCG

# network
G = KCG

cat = nx.transitivity(G)

print(cat)

In [None]:
#clustering KCG

# network
G = KCG

cal = nx.clustering(G)

ranks = [(k, v) for k, v in sorted(cal.items(), key=lambda item: -item[1])]

# os k melhores
k = 5
ranks[0:5]

In [None]:
set_cal = set(cal.values())
print(set_cal)

for i in set_cal:
    tmp = []
    for key, value in cal.items():
        if i == cal[key]:
            tmp.append(key)
    print(i, "=", set(tmp))

In [None]:
# network karate club graph

G = KCG

cal = list(cal.values())

fig, ax = plt.subplots(1,1,figsize=(15,10))

# layout position
pos = nx.kamada_kawai_layout(G)

# color of nodes
color = cal

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G, 
                               pos=pos, 
                               node_size=1000,
                               node_color=color,
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos,
                        font_color='white', 
                        ax=ax)

plt.axis("off")
plt.colorbar(nodes)
plt.show()

In [None]:
# clustering GND

# network
G = GND

cal = nx.clustering(G)

for k, val in cal.items():
    print("node",k,":", val)

In [None]:
# network
G = GND

cal = list(cal.values())

fig, ax = plt.subplots(1,1,figsize=(15,10))

# layout position
pos = nx.kamada_kawai_layout(G)

# color of nodes
color = cal

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G, 
                               pos=pos, 
                               node_size=1000,
                               node_color=color,
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos,
                        font_color='white', 
                        ax=ax)

plt.axis("off")
plt.colorbar(nodes)
plt.show()

### Homofilia

- Uma das informações importantes em redes complexas é saber se os nós possuem alguma tendência se ligar mais a nós similares a si mesmo, o que é conhecido como homofilia ou associatividade. 

- Considere um grafo particionado em grupos $\{V^1,V^2,\ldots,V^a\}$ de acordo com atributos que esses nós possuam. 

- O índice EI mede a homofilia através de uma razão que envolve a quantidade de ligações entre nós de grupos distintos ($EL$) e a quantidade de ligações entre nós do mesmo grupo ($IL$). 

- O índice EI pode ser calculado para um subconjunto qualquer de nós da rede.

- Dada a partição dos nós, defina uma função indicadora $\delta: V\times V\rightarrow \{0,1\}$
$$
\delta(i,j)=
\begin{cases}
1, & \; se \; \exists \; k \; tal \; que \; i,j\in V^k,\\
0, & \; caso \; contrário.
\end{cases}
$$

- Seja $V'\subseteq V$, então podemos encontrar o número de ligações internas e externas envolvendo os nós em $V'$, respectivamente, por

$$
IL(V')=\sum_{i\in V'}\sum_{j\notin V' \; ou \; j>i}A(i,j)\delta(i,j)
$$
e
$$
EL(V')=\sum_{i\in V'}\sum_{j\notin V' \; ou \; j>i}A(i,j)(1-\delta(i,j))
$$


$$
EI(V')=\frac{EL(V')-IL(V')}{EL(V')+IL(V')}
$$

- O valor do índice EI varia no intervalo $[-1,1]$, em que um índice EI igual a -1 (resp., 1) indica um subconjunto de nós que só possui ligações internas (resp., externas).

### Três tipos de assortatividade: 

- Os nós estão particionados em uma quantidade finita de grupos de atributos. 

- Os atributos dos nós são caracterizados por valores escalares, tais como idade, PIB, índice h, etc. 

- O atributo utilizado para avaliar a homofilia é a própria centralidade de grau dos nós.


### Assortatividade - Atributos Categóricos

- Considere um conjunto V de vértices de um grafo possa ser particionado em grupos $\{V^1, V^2, \ldots, V^a\}$.

- A fração de arestas que ligam um nó no conjunto $V^i$ a um nó no conjunto $V^j$:
$$
e_{ij}=\frac{1}{c}\sum_{k_1\in V^i}\sum_{k_2\in V^j}A(k_1,k_2),
$$
em que $c=m$ ou $c=2m$ se a rede é direcionada ou não-direcionada, respectivamente.

- A fração de arestas que iniciam (resp., terminam) em vértices do conjunto $V_i$ é dada, respetivamente, por $a_i=\sum_j e_{ij}$, $b_i=\sum_j e_{ji}$.

-  Em redes não direcionadas, temos que $e_{ij}=e_{ji}$ e $a_i=b_i$. 

- Se as ligações da rede fossem formadas aleatoriamente mantidas as frequências das arestas incidentes em nós de cada grupo, a fração esperada de ligação entre nós pertencentes a um grupo $V^i$ seria igual a $a_ib_i$.

- O coeficiente de assortatividade é dado por:
$$
As^c(G)=\frac{\sum_{i=1}^ae_{ii}-\sum_{i=1}^{a}a_ib_i}{1-\sum_{i=1}^{a}a_ib_i},
$$

### Assortatividade - Atributos Escalares

- Seja $x_i$ o atributo escalar do no $i$. Então, como o nó $i$ possui $d(i)$ arestas ligadas a ele, o valor médio dos atributos escalares ao longo das arestas é dado por:
$$
\overline{x}=\frac{\sum_i d(i)x_i}{\sum_i d(i)}=\frac{1}{2m}\sum_i d(i)x_i.
$$

- A covariância ao longo das arestas dos atributos de suas extremidades é:
$$
\frac{\sum_{ij}A(i,j)(x_i-\overline{x})(x_j-\overline{x})}{\sum_{ij}A(i,j)} = \frac{1}{2m}\left(\sum_{ij}A(i,j)x_ix_j\right) - \overline{x}^2 =
\frac{1}{2m}\left[\sum_{ij}\left(A(i,j) - \frac{d(i)d(j)}{2m}\right)x_ix_j\right].
$$

- Para garantir que a rede com homofilia perfeita em que só existam ligações entre nós com exatamente o mesmo atributo escalar tenha coeficiente de assortatividade igual a 1, a covariância é normalizada dividindo pelo seu maior valor possível.

- O coeficiente de assortatividade para atributos escalares é calculado como o coeficiente de correlação de Pearson.

- O coeficiente de assortatividade é:
$$
As^e(G) = 
\frac{\frac{1}{2m}\sum_{ij}\left(A(i,j)x_ix_j\right) -  \overline{x}^2}{\frac{1}{2m}\sum_{ij}\left(A(i,j)x_i^2\right) -  \overline{x}^2}\nonumber = 
\frac{\sum_{ij}\left(A(i,j) - \frac{d(i)d(j)}{2m}\right)x_ix_j}{\sum_{i}d(i)x_i^2 - \frac{1}{2m}\left(\sum_i d(i)x_i\right)^2}
$$

### Assortatividade de grau

- Um caso especial de assortatividade com atributo escalar que é bastante utilizado é quando o atributo escalar é a própria centralidade de grau, ou seja, $x_i=d(i)$.

- Esta assortatividade mede se na rede existe uma tendência de nós muito conectados estarem conectados entre si e nós pouco conectados estarem ligados entre si.

### Funções

- **nx.attribute_assortativity_coefficient**: função do **netorkx** que retorna a assortatividade relacionada com atributos categóricos.

- **nx.numeric_assortativity_coefficient()**: função do **networkx** que retorna a assortatividade relacionada com atributos numéricos. 

- **nx.degree_assortativity_coefficient()**: função do **networkx*** que retorna a assortatividade para o atributo igual ao grau. 

In [None]:
def carregarlivro(livro):
    atri = pd.read_csv('data/harrypotter/hpattributes.txt', sep='\t')
    livros = pd.read_csv('data/harrypotter/hpbook{:1d}.txt'.format(livro), sep=' ', header=None)
    nome = pd.read_csv('data/harrypotter/hpnames.txt', sep='\t')

    PG = nx.DiGraph ()
    
    n = atri.shape[0]

    for k in range(n):
        PG.add_node(
            k,
            nome = nome['name'][k], 
            ano = atri['schoolyear'][k], 
            gen = atri['gender'][k], 
            casa = atri['house'][k])
    
    # Construímos a rede
    for k in range(n):
        for m in range(n) :
            if livros.values[k][m] == 1:
                PG.add_edge(k,m)

    gen_ = nx.attribute_assortativity_coefficient(PG, "gen")
    casa_ = nx.attribute_assortativity_coefficient(PG, "casa")
    ano_ = nx.numeric_assortativity_coefficient(PG.to_undirected(), "ano")
    grau_ = nx.degree_assortativity_coefficient(PG.to_undirected(), "grau")

    return gen_, casa_, ano_, grau_

In [None]:
livros = list(range(1,7))

n = len(livros)
gen_ = np.zeros(n)
casa_ = np.zeros(n)
ano_ = np.zeros(n)
grau_ = np.zeros(n)


for k in range(n):
    print("livro ", k, end = ": ")
    gen_[k], casa_[k], ano_[k], grau_[k] = carregarlivro(livros[k])
    print("gen =", gen_[k], "; casa =", casa_[k], "; ano =", ano_[k], "; grau =", grau_[k])

In [None]:
fig = plt.subplots(1,1,figsize=(15,10))

plt.plot(livros, gen_, '-o', label = 'genero')
plt.plot(livros, casa_, '-s', label = 'casa')
plt.plot(livros, ano_, '-*', label = 'ano')
plt.plot(livros, grau_, '-^', label = 'grau')
plt.legend()

plt.xlabel('livros')
plt.ylabel('assortatividade')
plt.show()

In [None]:
# add class vertex attribute to both graphs

class_attr = dict(zip(schoolfriends_vertices['id'], schoolfriends_vertices['class']))
gender_attr = dict(zip(schoolfriends_vertices['id'], schoolfriends_vertices['gender']))

nx.set_node_attributes(schoolfriends_fb, name = "class", values = class_attr)
nx.set_node_attributes(schoolfriends_fb, name = "gender", values = gender_attr)

In [None]:
nx.attribute_assortativity_coefficient(schoolfriends_fb, "class")

In [None]:
nx.degree_assortativity_coefficient(schoolfriends_fb)

In [None]:
nx.attribute_assortativity_coefficient(schoolfriends_fb, "gender")