## Métricas centralidade - parte 2

- Coeficiente de agrupamento local
- Homofilia (Assortatividade)

In [None]:
# import das bibliotecas

import numpy as np
import networkx as nx

import pandas as pd

import matplotlib as mpl
import matplotlib.pyplot as plt
from matplotlib.pyplot import figure
import matplotlib.patches as mpatches

from numpy import linalg as LA

import fractions

### Instâncias

In [None]:
# binomial_tree

BTG = nx.binomial_tree(4)
# Returns the Binomial Tree of order 4.

# network
G = BTG

n = nx.number_of_nodes(G)
m = nx.number_of_edges(G)

print(f"numero de vertices: {n}")
print(f"numero de arestas: {m}")

print(f"O grafo é conexo: {nx.is_connected(G)}")

In [None]:
# grafico binomial_tree

fig, ax = plt.subplots(1,1,figsize=(15,10))

# network
G = BTG

# layout position
pos = nx.kamada_kawai_layout(G)

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G,
                               node_size=1000,
                               pos=pos, 
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos, 
                        font_color='white', 
                        ax=ax)

plt.axis("off")
#plt.savefig('BTG.png', transparent=True, dpi=300)
plt.show()

In [None]:
# Zachary's Karate Club graph.

KCG = nx.karate_club_graph()

# network
G = KCG

n = nx.number_of_nodes(G)
m = nx.number_of_edges(G)

print(f"numero de vertices: {n}")
print(f"numero de arestas: {m}")

print(f"O grafo é conexo: {nx.is_connected(G)}")

In [None]:
# grafico karate_club_graph

fig, ax = plt.subplots(1,1,figsize=(15,10))

# network
G = KCG

# layout position
pos = nx.kamada_kawai_layout(G)

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G,
                               node_size=1000,
                               pos=pos, 
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos, 
                        font_color='white', 
                        ax=ax)

plt.axis("off")
#plt.savefig('BTG.png', transparent=True, dpi=300)
plt.show()

In [None]:
# Graph
# Exemplo 2.14

GND = nx.Graph()

GND.add_nodes_from([0,1,2,3,4,5])
GND.add_edges_from([(0,1),(0,2),(0,4),(1,2), (1,3), (1,4), (1,5), (2,3)])

pos = {}
pos[0] = [-1,-1]
pos[1] = [0,0]
pos[2] = [-1,1]
pos[3] = [0,1]
pos[4] = [0,-1]
pos[5] = [2,0]

# network
G = GND

n = nx.number_of_nodes(G)
m = nx.number_of_edges(G)

print(f"numero de vertices: {n}")
print(f"numero de arestas: {m}")

print(f"O grafo é conexo: {nx.is_connected(G)}")

In [None]:
# gráfico Graph

nx.draw(GND, pos=pos, node_size=1000, with_labels=True)

In [None]:
GCI = nx.wheel_graph(int(5))

pos = nx.circular_layout(GCI)

nx.draw(GCI, node_size=1000, with_labels=True)

In [None]:
# random_internet_as_graph

IG = nx.random_internet_as_graph(20)
# Generates a random undirected graph resembling the Internet AS network

# network
G = IG

n = nx.number_of_nodes(G)
m = nx.number_of_edges(G)

print(f"numero de vertices: {n}")
print(f"numero de arestas: {m}")

print(f"O grafo é conexo: {nx.is_connected(G)}")

In [None]:
# gráfico random_internet_as_graph

fig, ax = plt.subplots(1,1,figsize=(15,10))

# network
G = IG

# layout position
pos = nx.kamada_kawai_layout(G)

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G,
                               node_size=1000,
                               pos=pos, 
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos, 
                        font_color='white', 
                        ax=ax)

plt.axis("off")
plt.show()

In [None]:
# grafo aleatório de Erdö-Rényi com 1000 nós
GER = nx.gnp_random_graph (100,0.01)
graus = dict(nx.degree(GER)).values ()

# network
G = GER

n = nx.number_of_nodes(G)
m = nx.number_of_edges(G)

print(f"numero de vertices: {n}")
print(f"numero de arestas: {m}")

print(f"O grafo é conexo: {nx.is_connected(G)}")

In [None]:
# gráfico GER

fig, ax = plt.subplots(1,1,figsize=(15,10))

# network
G = GER

# layout position
pos = nx.kamada_kawai_layout(G)

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G,
                               node_size=1000,
                               pos=pos, 
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos, 
                        font_color='white', 
                        ax=ax)

plt.axis("off")
plt.show()

### Coeficiente de agrupamento local

- Considere um grafo $G = (V,E)$. 

- O coeficiente de agrupamento local permite avaliar o quanto os nós são capazes de proporcionar interação entre os seus vizinhos. 

- O coeficiente de agrupamento local($cal$) de um nó $i$ é dado por:

$$
cal(i)=\frac{\sum\limits_{j \in V \atop j \ne i} \sum\limits_{k \in V \atop k \ne i, \ k \ne j} \left( A(i,j) \cdot A(i,k) \cdot A(j,k) \right)}{\sum\limits_{j \in V : \atop j \ne i} \sum\limits_{k \in V : \atop k \ne i,k \ne j} \left( A(i,j) \cdot A(i,k) \right) }.
$$

- Vértices que possuem grau 0 ou 1 possuem coeficiente de agrupamento local nulo. 

- O coeficiente de agrupamento local médio($calm$) é definido por:

$$
calm(G)=\frac{1}{n}\sum\limits_{i \in V}^ncl(i).
$$
onde $n = |V|$.

O coeficiente de agrupamento total é dado pela proporção de vezes que dois vértices $j$ e $k$ que são vizinhos de um mesmo vértice $i$ também são vizinhos entre si
$$
cat(G)=\frac{\sum\limits_{i} \sum\limits_{j: \atop j \ne i} \sum\limits_{k: \atop k \ne i, k \ne j} A(i,j) \cdot A(i,k) \cdot A(j,k)}{\sum\limits_{i} \sum\limits_{j: \atop j \ne i} \sum\limits_{k: \atop k \ne i, k \ne j} A(i,j) \cdot A(i,k)}.
$$


### Funções do networkx

- **clustering()**: retorna o coeficiente de agrupamento local.

- **average_clustering()**: retorna o coeficiente de agrupamento médio.

- **transitivity()**: retorna o coeficiente de agrupamento total. 


In [None]:
adj_A = nx.to_scipy_sparse_array(GND).toarray()
print(f"adjacency : \n {adj_A}")

In [None]:
# cat GND

cat = 0
somaf = 0
soman = 0
somad = 0
for i in GND:
    for j in GND:
        for k in GND:
            if ((i!=j) and (i!=k) and (j!=k)):
                aij = adj_A[i,j]
                aik = adj_A[i,k]
                ajk = adj_A[j,k]
                soman += (aij*aik*ajk)
                somad += (aij*aik)
somaf = soman/somad
cat = somaf

print(f"cat do GND = {cat}")

In [None]:
grau_node = dict(nx.degree(GND))

cal = {}
for i in GND:
    if ((grau_node[i] == 0) | (grau_node[i] == 1)):
        cal[i] = 0
        continue

    somaf = 0
    soman = 0
    somad = 0
    for j in GND:
        for k in GND:
            if ((i!=j) and (i!=k) and (j!=k)):
                aij = adj_A[i,j]
                aik = adj_A[i,k]
                ajk = adj_A[j,k]
                soman += (aij*aik*ajk)
                somad += (aij*aik)
    somaf = soman/somad
    cal[i] = somaf

print(f"cal do GND")
for k, val in cal.items():
    print(f"node {k}: {val}")

In [None]:
calm = 0
n = nx.number_of_nodes(GND)
for i in GND:
    calm += cal[i]
calm = calm/n
print(f"calm do GND = {calm}")

In [None]:
# cat usand network

# network
G = GND

cat = nx.transitivity(G)

print(f"cat GND = {cat}")

In [None]:
# cal do GND usando network

# network
G = GND

cal = nx.clustering(G)

print(f"cal do GND")
for k, val in cal.items():
    print(f"node {k}: {val}")

In [None]:
# calm usando networkx

# network
G = GND

calm = nx.average_clustering(G)

print(f"calm do GND = {calm}")

In [None]:
# grafic com cal para GND

G = GND

cal = list(cal.values())

fig, ax = plt.subplots(1,1,figsize=(15,10))

# layout position
pos = nx.kamada_kawai_layout(G)

# color of nodes
color = cal

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G, 
                               pos=pos, 
                               node_size=1000,
                               node_color=color,
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos,
                        font_color='white', 
                        ax=ax)

plt.axis("off")
plt.colorbar(nodes)
plt.show()

In [None]:
# cal para KCG

# network
G = KCG

cal = nx.clustering(G)

print(f"cal do GND")
for k, val in cal.items():
    print(f"node {k}: {val}")

In [None]:
# calm do KCG

# network
G = KCG

calm = nx.average_clustering(G)

print(f"calm do KCG = {calm}")

In [None]:
# cat do KCG

# network
G = KCG

cat = nx.transitivity(G)

print(f"cat do GND = {cat}")

In [None]:
# conjuntos associados ao coeficiente de agrupamento local

# network
G = KCG

cal = nx.clustering(G)

set_cal = set(cal.values())
print(set_cal)

for i in set_cal:
    tmp = []
    for key, value in cal.items():
        if i == cal[key]:
            tmp.append(key)
    print(i, "=", set(tmp))

In [None]:
# network karate club graph

G = KCG

cal = list(cal.values())

fig, ax = plt.subplots(1,1,figsize=(15,10))

# layout position
pos = nx.kamada_kawai_layout(G)

# color of nodes
color = cal

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G, 
                               pos=pos, 
                               node_size=1000,
                               node_color=color,
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos,
                        font_color='white', 
                        ax=ax)

plt.axis("off")
plt.colorbar(nodes)
plt.show()

In [None]:
# network

G = KCG

grau_node = dict(nx.degree(G)).values()
cal = list(nx.clustering(G).values())

plt.figure(figsize=(15,10))
plt.plot (graus ,cal ,'o')
plt.xlabel('grau')
plt.ylabel('agrupamento')

plt.show()

In [None]:
# network

G = nx.gnp_random_graph(1000,0.01)

grau_node = dict(nx.degree(G)).values()
cal = list(nx.clustering(G).values())

plt.figure(figsize=(15,10))
plt.plot (grau_node ,cal ,'o')
plt.xlabel('grau')
plt.ylabel('agrupamento')

plt.show()

### Homofilia

- Homofilia ou assortatividadesão são informações contidas em redes complexas que nos proporcionam saber se nós similares tendem a se ligarem entre si. 

- Considere um grafo $G=(V,E)$ e o particinamento de $V$ nos grupos $P = \{V^1,V^2,\ldots,V^a\}$ de acordo com atributos que esses nós possuam. 

- O índice $EI$, que pode ser calculado para qualquer $V' \subset V$, mede a homofilia através de 
    - uma razão que envolve a quantidade de ligações entre nós de grupos distintos($EL$) e 
    - a quantidade de ligações entre nós do mesmo grupo($IL$). 

- Considerando a partição $P$ temos uma função indicadora $\delta: V \times V \rightarrow \{0,1\}$ definida por
$$
\delta(i,j)=
\begin{cases}
1, & \text{se existe } k, \text{ tal que } i, j \in V^k,\\
0, & \text{caso contrário}.
\end{cases}
$$

- Seja $V'\subseteq V$, podemos encontrar o número de ligações internas e externas envolvendo os nós em $V'$, respectivamente, por

$$
IL(V') = \sum_{i \in V'} \sum_{j \notin V' \atop \text{ ou } j>i} \left( A(i,j) \cdot \delta(i,j) \right)
$$
e
$$
EL(V') = \sum_{i \in V'} \sum_{j \notin V' \atop \text{ ou } j>i} \left( A(i,j) \cdot (1-\delta(i,j)) \right)
$$

- Então a homofilia de $V'$ é dada por 
$$
EI(V')=\frac{EL(V')-IL(V')}{EL(V')+IL(V')}
$$

- O valor do índice EI varia no intervalo $[-1,1]$, em que um índice EI igual a -1 (resp., 1) indica um subconjunto de nós que só possui ligações internas (resp., externas).

### EXemplo
Considere o grafo $GND$

In [None]:
adj_A = nx.to_scipy_sparse_array(GND).toarray()
#print(f"adjacency do GND : \n {adj_A}")

In [None]:
# particao
P = {0: [0,4], 1 : [1,2,3,5]}

In [None]:
n = nx.number_of_nodes(GND)
delta = np.zeros((n, n))

for i in GND:
    for j in GND:
        if ((i in P[0]) and (j in P[1])):
            delta[i,j] = 1
        if ((i in P[1]) and (j in P[1])):
            delta[i,j] = 1

print(f"delta = \n {delta}")

In [None]:
somaIL = 0
for i in GND:
    for j in GND:
        if j>i:
            somaIL += adj_A[i,j]*delta[i,j]

print(f"IL = {somaIL}")


somaEL = 0
for i in GND:
    for j in GND:
        if j>i:
            somaEL += adj_A[i,j]*(1 - delta[i,j])

print(f"EL = {somaEL}")


somaf = (somaEL-somaIL)/(somaEL+somaIL)
print(f"EI = {somaf}")

## Três tipos de assortatividade: 

- Os nós estão particionados em uma quantidade finita de grupos de atributos. 

- Os atributos dos nós são caracterizados por valores escalares, tais como idade, PIB, índice h, etc. 

- O atributo utilizado para avaliar a homofilia é a própria centralidade de grau dos nós.


### Assortatividade com atributos categóricos

- Considere um conjunto V de vértices de um grafo possa ser particionado em grupos $\{V^1, V^2, \ldots, V^a\}$.

- A fração de arestas que ligam um nó no conjunto $V^i$ a um nó no conjunto $V^j$:
% $$
% e_{ij} = \frac{1}{c} \sum_{l \in V^i} \sum_{k \in V^j} A(l, k),
% $$ 
%onde $c=m$($c=2m$) se a rede é direcionada(não-direcionada).

$$
e_{ij} = \frac{\sum_{l \in V^i} \sum_{k \in V^j} A(l, k)}{\sum_{l \in V} \sum_{k \in V} A(l, k)},
$$

Observe que $\sum_{l \in V} \sum_{k \in V} A(l, k) = 2 \cdot m$, onde $m$ é o número de arestas da rede não direcionada.

Assim temos para uma rede não direcionada
$$
e_{ij} = \frac{1}{2 \cdot m} \left( \sum_{l \in V^i} \sum_{k \in V^j} A(l, k) \right)
$$ 
e para uma rede direcionada
$$
e_{ij} = \frac{1}{m} \sum_{l \in V^i} \left( \sum_{k \in V^j} A(l, k) \right)
$$ 

- A fração de arestas que iniciam(terminam) em vértices do conjunto $V^i$ é dada por $a_i = \sum_j e_{ij}$ ($b_i = \sum_j e_{ji}$).

-  Em redes não direcionadas, temos que $e_{ij}=e_{ji}$ e $a_i=b_i$. 

- O coeficiente de assortatividade é dado por:
$$
As^c(G) = \frac{\sum_{i=1}^a e_{ii} - \sum_{i=1}^{a} (a_i \cdot b_i)}{1 - \sum_{i=1}^{a} (a_i \cdot b_i)},
$$
onde a normalização no denominador garante que no caso de todas as arestas ligarem nós do mesmo grupo, homofilia perfeita, o coeficiente de assortatividade tenha valor igual a 1.

In [None]:
adj_A = nx.to_scipy_sparse_array(GND).toarray()
#print(f"adjacency : \n {adj_A}")

P = {0:[0,4], 1:[1,2,3,5] }

n = nx.number_of_nodes(GND)
m = nx.number_of_edges(GND)
#print(f"m = {m}")

eij = np.zeros((n, n))

somad = 0
for l in GND:
    for k in GND:
        somad += adj_A[l,k]
#print(f"2*m = {somad}")

PK = list(P.keys())

for i in PK:
    for j in PK:
        soman = 0
        somad = 0
        for l in P[i]:
            for k in P[j]:
                soman += adj_A[l,k]
        eij[i,j] = soman/(2*m)
        print(f"e[{i},{j}] = {eij[i,j]}")


In [None]:
a = np.zeros(2)
b = np.zeros(2)

for i in PK:
    soma = 0
    for j in [0,1]:
        soma += eij[i,j]
    a[i] = soma

for i in PK:
    soma = 0
    for j in [0,1]:
        soma += eij[j,i]
    b[i] = soma

print(f"a = {a}")
print(f"b = {b}")

In [None]:
cac = 0

soma0 = 0
for i in [0,1]:
    soma0 += eij[i,i]

soma1 = 0
for i in [0,1]:
    soma1 += a[i]*b[i]

soman = soma0-soma1
somad = 1 - soma1

cac = soman/somad
print(f"cac do GND = {cac}")


### Assortatividade com atributos numéricos

- Seja $x_i$ o atributo escalar do no $i$, como o nó $i$ possui grau $d_i$, o valor médio dos atributos escalares ao longo das arestas é dado por:
$$
\overline{x} = \frac{\sum_{i \in V} d_i \cdot x_i}{\sum_{i \in V} d_i} = \frac{1}{2m} \sum_{i \in V} d_i \cdot x_i.
$$

- O coeficiente de assortatividade numérico é:
$$
\begin{align} \notag
As^e(G) & = 
\frac{\frac{1}{2m} \left( \sum_{(i,j)} \left( A(i,j) \cdot x_i \cdot x_j \right) \right) -  \overline{x}^2}{ \frac{1}{2m} \left( \sum_{(i,j)} \left( A(i,j) \cdot x_i^2 \right) \right) - \overline{x}^2} \\
\end{align}
$$

### Assortatividade de grau

- Um caso especial de assortatividade com atributo numérico que é bastante utilizado é quando o atributo é a própria centralidade de grau, ou seja, $x_i = d_i$.

- Esta assortatividade mede se na rede existe uma tendência de nós muito conectados estarem conectados entre si e nós pouco conectados estarem ligados entre si.

- Seja $d_i$ o grau do nó $i \in V$, o valor médio dos atributos de grau ao longo das arestas é dado por:
$$
\overline{x} = \frac{\sum_{i \in V} (d_i \cdot d_i)}{\sum_{i \in V} d_i} = \frac{1}{2m} \left( \sum_{i \in V} d_i \cdot d_i \right).
$$

- O coeficiente de assortatividade de grau é:
$$
As^g(G) = 
\frac{\frac{1}{2m} \left( \sum_{(i,j)} \left( A(i,j) \cdot d_i \cdot d_j \right) \right) - \overline{x}^2}{ \frac{1}{2m} \left( \sum_{(i,j)} \left( A(i,j) \cdot d_i^2 \right) \right) - \overline{x}^2}
$$

In [None]:
adj_A = nx.to_scipy_sparse_array(GND).toarray()
#print(f"adjacency : \n {adj_A}")

P = {0:[0,4], 1:[1,2,3,5] }

n = nx.number_of_nodes(GND)
m = nx.number_of_edges(GND)
#print(f"m = {m}")

dic_grau = dict(nx.degree(GND))
#val_grau = list(dic_grau.values())

sgrau2 = 0
for i in GND:
    sgrau2 += dic_grau[i]*dic_grau[i]
#print(sgrau2)
media = sgrau2/(2*m)

print(f"valor médio dos atributos numéricos = {media}")

In [None]:
soma = 0 
for i in GND:
    for j in GND:
        soma += adj_A[i,j]*dic_grau[i]*dic_grau[j]
soma = soma/(2*m)
soman = soma - media*media
#print(soman)

soma = 0 
for i in GND:
    for j in GND:
        soma += adj_A[i,j]*dic_grau[i]*dic_grau[i]
soma = soma/(2*m)
somad = soma - media*media
#print(soma)

cag = soman/somad
print(f"cag do GND = {cag}")

### Funções do networkx

- **attribute_assortativity_coefficient**: retorna a assortatividade relacionada com atributos categóricos.

- **numeric_assortativity_coefficient()**: retorna a assortatividade relacionada com atributos numéricos. 

- **degree_assortativity_coefficient()**: retorna a assortatividade para o atributo de grau. 

### Exemplo
Considere o exemplo do estudo das redes sociais dos personagens dos primeiros seis livros da saga Harry Potter.

In [None]:
def carregarlivro(livro):
    atri = pd.read_csv('../../data/harrypotter/hpattributes.txt', sep='\t')
    livros = pd.read_csv('../../data/harrypotter/hpbook{:1d}.txt'.format(livro), sep=' ', header=None)
    nome = pd.read_csv('../../data/harrypotter/hpnames.txt', sep='\t')

    PG = nx.DiGraph ()
    
    n = atri.shape[0]

    for k in range(n):
        PG.add_node(
            k,
            nome = nome['name'][k], 
            ano = atri['schoolyear'][k], 
            gen = atri['gender'][k], 
            casa = atri['house'][k])
    
    # Construímos a rede
    for k in range(n):
        for m in range(n) :
            if livros.values[k][m] == 1:
                PG.add_edge(k,m)

    gen_ = nx.attribute_assortativity_coefficient(PG, "gen")
    casa_ = nx.attribute_assortativity_coefficient(PG, "casa")
    ano_ = nx.numeric_assortativity_coefficient(PG.to_undirected(), "ano")
    grau_ = nx.degree_assortativity_coefficient(PG.to_undirected(), "grau")

    return gen_, casa_, ano_, grau_

In [None]:
livros = list(range(1,7))

n = len(livros)
gen_ = np.zeros(n)
casa_ = np.zeros(n)
ano_ = np.zeros(n)
grau_ = np.zeros(n)

for k in range(n):
    print(f"livro {k}",end=": ")
    gen_[k], casa_[k], ano_[k], grau_[k] = carregarlivro(livros[k])
    print(f"gen={round(gen_[k],4)}; casa={round(casa_[k],4)}; ano={round(ano_[k],4)}; grau={round(grau_[k],4)}")

In [None]:
fig = plt.subplots(1,1,figsize=(15,10))

plt.plot(livros, gen_, '-o', label = 'genero')
plt.plot(livros, casa_, '-s', label = 'casa')
plt.plot(livros, ano_, '-*', label = 'ano')
plt.plot(livros, grau_, '-^', label = 'grau')
plt.legend()

plt.xlabel('livros')
plt.ylabel('assortatividade')
plt.show()

### Exemplo
Considere o ***"data sets correspond to the contacts and friendship relations between students in a high school in Marseilles, France, in December 2013"***.

In [None]:
## High school in Marseille
# schoolfriends_vertices.csv and schoolfriends_edgelist.csv data sets 
# This data set represents friendships reported between schoolchildren in a high school in Marseille, France in 2013. 
# The vertex set provides the ID, class and gender of each child, and the edgelist has two types of relationships. 
# The first type is a reported friendship where the from ID reported the to ID as a friend. 
# The second type is a known Facebook friendship between the two IDs
# http://www.sociopatterns.org/datasets/high-school-contact-and-friendship-networks/
# https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0136497

schoolfriends_edgelist = pd.read_csv("../../data/schoolfriends/schoolfriends_edgelist.csv")
schoolfriends_vertices = pd.read_csv("../../data/schoolfriends/schoolfriends_vertices.csv")

In [None]:
# High school in Marseille: undirected facebook graph

schoolfriends_fb = nx.from_pandas_edgelist(
  df = schoolfriends_edgelist[schoolfriends_edgelist.type == 'facebook'],
  source = "from",
  target = "to"
)

pos = nx.spring_layout(schoolfriends_fb)
#betCent = nx.betweenness_centrality(schoolfriends_fb, normalized=True, endpoints=True)
degCent = dict(nx.degree(schoolfriends_fb))
node_color = [20000.0 * schoolfriends_fb.degree(v) for v in schoolfriends_fb]
#node_size =  [v * 10000 for v in betCent.values()]
#node_size =  [v * 100 for v in degCent.values()]

plt.figure(figsize=(20,15))


dic_grau = dict(nx.degree(schoolfriends_fb))
val_grau = dic_grau.values()
color = list(dic_grau.values())

nx.draw_networkx(schoolfriends_fb, 
                 pos=pos, 
                 #with_labels=False,
                 node_color=node_color,
                 #node_color=color,
                 node_size=900 
                 )

plt.axis('off')
#plt.colorbar(color)
plt.show()

In [None]:
# grafico com graus

fig, ax = plt.subplots(1,1,figsize=(20,15))

G = schoolfriends_fb

# layout position
#pos = nx.kamada_kawai_layout(G)
pos = nx.spring_layout(G)

# define a cor do nos
color = list(dic_grau.values())

# draw edges
nx.draw_networkx_edges(G, 
                       pos=pos, 
                       alpha=0.4, 
                       ax=ax)

# draw nodes
nodes = nx.draw_networkx_nodes(G,
                               node_size=900,
                               pos=pos,
                               node_color=color,
                               cmap=plt.cm.jet,
                               ax=ax)

# draw labels
nx.draw_networkx_labels(G, 
                        pos=pos, 
                        font_color='white', 
                        ax=ax)

plt.axis("off")
plt.colorbar(nodes)
plt.show()

In [None]:
# High school in Marseille: directed reported graph

schoolfriends_rp = nx.from_pandas_edgelist(
  df = schoolfriends_edgelist[schoolfriends_edgelist.type == 'reported'],
  source = "from",
  target = "to",
  create_using=nx.DiGraph()
)

pos = nx.spring_layout(schoolfriends_rp)
#betCent = nx.betweenness_centrality(schoolfriends_rp, normalized=True, endpoints=True)
node_color = [20000.0 * schoolfriends_rp.degree(v) for v in schoolfriends_rp]
#node_size =  [v * 10000 for v in betCent.values()]

# color of nodes
color = nx.degree(schoolfriends_fb)

plt.figure(figsize=(20,20))

nx.draw_networkx(schoolfriends_rp, 
                 pos=pos, 
                 #with_labels=False,
                 node_color=node_color,
                 node_size=900 #node_size 
                 )

plt.axis('off')

plt.show()

In [None]:
# add class vertex attribute to both graphs

class_attr = dict(zip(schoolfriends_vertices['id'], schoolfriends_vertices['class']))
gender_attr = dict(zip(schoolfriends_vertices['id'], schoolfriends_vertices['gender']))

nx.set_node_attributes(schoolfriends_fb, name = "class", values = class_attr)
nx.set_node_attributes(schoolfriends_fb, name = "gender", values = gender_attr)

In [None]:
gender_attr

In [None]:
class_attr

In [None]:
nx.attribute_assortativity_coefficient(schoolfriends_fb, "class")

In [None]:
nx.degree_assortativity_coefficient(schoolfriends_fb)

In [None]:
nx.attribute_assortativity_coefficient(schoolfriends_fb, "gender")