<h1 style='font-size:40px'>Influence Measures and Network Centralization </h1>

<h2 style= 'font-size:30px'> Degree and Closeness Centrality</h2>

<div> 
    <ul style='font-size:20px'> 
        <li> 
            Como medir o grau de importância de um nó? Tudo depende do contexto em que nossa pesquisa está inserida. Por isso, estudaremos diversas métricas sobre importância de pontos nos próximos vídeos.
        </li>
    </ul>
</div>

<h3 style='font-size:30px;font-style:italic'> Degree Centrality</h3>
<div> 
    <ul style='font-size:20px'> 
        <li> 
            Sua suposição é a de que nós importantes estão ligados a vários pontos.
        </li>
        <li> 
            Para redes bidirecionais, sua fórmula é $C=\frac{d}{N-1}$ em que d é o degree do nó e N, a quantidade total de nós na rede.
        </li>
    </ul>
</div>

In [5]:
import networkx as nx

# Medindo a Degree Centrality pertencente a um nó aleatório do clube de karatê.
G = nx.karate_club_graph()
G = nx.convert_node_labels_to_integers(G, first_label=1)

# Veja que o NetworkX mede todas as DC's dos nós e as armazena em um dicionário.
nx.degree_centrality(G)[34]

0.5151515151515151

<div> 
    <ul style='font-size:20px'> 
        <li> 
            Quando tratamos de redes unidirecionais, podemos medir tanto com o in-degree, quanto com o out-degree (quantidade de conexões recebidas ou feitas pelo nó).
        </li>
    </ul>
</div>

In [11]:
# Criando uma rede unidirecional.
G = nx.DiGraph()
G.add_edges_from([('A', 'B'), ('B', 'D'), ('D', 'A'), ('D', 'B'), ('D', 'E'), ('B', 'E'), ('E', 'B'), ('F', 'A')])

# Qual é a In-degree Centrality do nó 'A'?
print(nx.in_degree_centrality(G)['A'])

# Qual é a Out-degree Centrality de 'A'?
nx.out_degree_centrality(G)['A']

0.5


0.25

<h3 style='font-size:30px;font-style:italic'> Closeness Centrality</h3>
<div> 
    <ul style='font-size:20px'> 
        <li> 
            Sua suposição é a de que nós importantes estão mais próximos a todos os outros nós.
        </li>
        <li> 
            Essa métrica é calculada com a fórmula $C=\frac{N-1}{\sum{d(v,u)}}$, em que d(v,u) é a distância do nó v a cada um dos outros pontos.
        </li>
    </ul>
</div>

In [12]:
G = nx.karate_club_graph()
G = nx.convert_node_labels_to_integers(G, first_label=1)

# Qual a Closeness do nó 34 do Clube de Karatê?
nx.closeness_centrality(G)[34]

0.55

<h4 style='font-size:30px;font-style:italic;text-decoration:underline'> Disconnected Graphs</h4>
<div> 
    <ul style='font-size:20px'> 
        <li> 
            Para redes em que os nós podem não se conectar totalmente (como é o caso das unidirecionais), a fórmula passa a ser $C=\frac{|R(L)|}{|N-1|}\frac{|R(L)|}{|\sum{d(L,u)}|}$, em que R(L) é o conjunto de nós alcançáveis para o ponto L.
        </li>
    </ul>
</div>

In [20]:
G = nx.DiGraph()
G.add_edges_from([('A', 'B'), ('B', 'D'), ('D', 'A'), ('D', 'B'), ('D', 'E'), ('B', 'E'), ('E', 'B'), ('F', 'A')])

# Quando souber que a rede não é totalemente ligada, normalize a Closeness Centrality.
# No NetworkX do curso, o argumento é 'normalized', mas aqui ele se chama 'wf_improved'.
nx.closeness_centrality(G, wf_improved=True)

{'A': 0.5714285714285714,
 'B': 0.8,
 'D': 0.5,
 'E': 0.5714285714285714,
 'F': 0.0}

In [27]:
G = nx.DiGraph()
G.add_edges_from([('A', 'B'), ('B', 'C'), ('C', 'D')])
nx.closeness_centrality(G, wf_improved=True)

{'A': 0.0, 'B': 0.3333333333333333, 'C': 0.4444444444444444, 'D': 0.5}

<div> 
    <hr>
    <h2 style='font-size:30px'> Betweenness Centrality</h2>
</div>

<div> 
    <ul style='font-size:20px'> 
        <li> 
            A Betweenness é uma métrica cuja suposição estipula que nós importantes conectam outros nós.
        </li>
        <li> 
            Para um nó v, sua Betweenness é $C{btw}=\sum{\frac{\sigma{s,t}(v)}{\sigma{s,t}}}$, em que $\sigma{s,t}$ é o número de shortest paths entre cada par de nós da rede (s,t) e $\sigma{s,t}(v)$ é a quantidade desses paths que passam por v.
        </li>
        <li> 
            Um dos dilemas desse cálculo é se devemos ou não considerar os paths que se originam com o próprio nó v.
        </li>
    </ul>
</div>

<h3 style='font-size:30px;font-style:italic'> Betweenness Centrality Normalizada</h3>
<div> 
    <ul style='font-size:20px'> 
        <li> 
            O problema da fórmula mostrada é que ela providencia Betweennesses maiores para redes grandes e menores para aquelas com menos nós. Para consertarmos isso, podemos dividir as pontuações obtidas por $\frac{1}{2}(|N|-1)(|N|-2)$ para gráficos bidirecionais e $(|N|-1)(|N|-2)$ para os unidimensionais, em que N é a quantidade de pontos na rede.
        </li>
    </ul>
</div>

In [30]:
G = nx.Graph()
G.add_edges_from([('A', 'B'), ('B', 'C'), ('A', 'C'), ('C', 'D'), ('D', 'E'), ('E', 'F'), ('E', 'G'), ('F', 'G')])

# Medindo as Betweennesses da sociedade. Use 'normalized' para normalizar o cálculo e 'endpoints' para considerar os paths
# que se originam no ponto sob análise.
nx.betweenness_centrality(G)

{'A': 0.0,
 'B': 0.0,
 'C': 0.5333333333333333,
 'D': 0.6,
 'E': 0.5333333333333333,
 'F': 0.0,
 'G': 0.0}

<p style='color:red'> Betweenness Centrality (10:20)