# 2 - Centralidade Betweenness

In [6]:
import netpixi
import graph_tool_extras as gte

from graph_tool import centrality

## Motivação

Na rede abaixo, os vértices são famílias da elite da Florença no século XV e as arestas representam relações de casamento ou negócio [[1](#medici), [2](#duality)].

In [None]:
netpixi.render('../../../Datasets/florentine-families-clean.net.gz');

Particularmente no tutorial de closeness, vimos que faz sentido extrair métricas dessa rede para entender a influência política de cada família, pois informações podiam passar de uma para outra através das relações de casamento ou negócio.

Este tutorial, em particular, busca responder à seguinte pergunta: *como calcular o quão importante uma família era para essa passagem de informações?*

## Intuição

Podemos observar na rede acima que algumas famílias eram *intermediadoras,* ou seja, necessárias para que uma informação chegasse de uma família a outra. Para que a família Barbadori recebesse uma informação sobre a família Salviati, por exemplo, era necessário que ela passasse pela família Medici.

Por outro lado, outras famílias *nunca* eram necessárias para que uma informação chegasse. A família Lamberteschi, por exemplo.

A partir dessas observações, vamos considerar a seguinte ideia: *para cada família, calcular a quantidade relativa de caminhos que passam por ela.*

## Definição

Seja $n$ o número de vértices.

Seja $g(u, w)$ o número de geodésicas de um vértice $u$ a outro vértice $w$.

Seja $g(u, v, w)$ o número de geodésicas de $u$ a $w$ que passam por um vértice $v$ tal que $u \neq v$ e $w \neq v$.

Seja $p$ um número tal que

$$
p = \frac{(n - 1) \cdot (n - 2)}{2}\textrm{ se o grafo é não-dirigido}
\hspace{4em}
p = (n - 1) \cdot (n - 2)\textrm{ se o grafo é dirigido}
$$

A **centralidade betweenness** de $v$ é dada por

$$\sum_{u \neq v, w \neq v} \frac{g(u, v, w)}{p \cdot g(u, w)}.$$

Ou seja, para todo par $(u, w)$, contamos o número de geodésicas de $u$ a $w$ que passam por $v$ e dividimos pelo número total de geodésicas de $u$ a $w$.

A divisão por $p$ garante que a soma está entre $0$ e $1$, pois esse número é o total de pares.

## Cálculo

Para calcular a centralidade betweenness, podemos chamar a função `betweenness` da [graph-tool](https://graph-tool.skewed.de/).

Essa função devolve uma propriedade de vértice. Podemos adicionar essa propriedade ao grafo passando ela como segundo parâmetro do método `add_vp`.

In [7]:
g = gte.load('movies_reposicionado2.net.gz')

# Na verdade, o método devolve duas propriedades,
# mas estamos interessados apenas na primeira.
c, _ = centrality.betweenness(g)

g.add_vp('betweenness', c)

## Visualização

Lembre que, para visualizar a rede modificada, precisamos salvar ela em um novo arquivo.

In [8]:
gte.save(g, 'betweenness_twomode.net.gz')

Como a rede não é muito grande, vamos desconsiderar o tutorial de visualização em larga escala e rodar uma segunda visualização.

In [None]:
r = netpixi.render('betweenness_twomode.net.gz')

Nessa visualização, podemos chamar o método `vertex_scale` para usar o betweenness como tamanho dos vértices.

Esse método recebe três parâmetros: o primeiro é o nome da propriedade, o segundo é o tamanho mínimo e o terceiro é o tamanho máximo.

In [10]:
r.vertex_scale('betweenness', 10, 30)

Note que um vértice pode ter alto closeness e alto betweenness ao mesmo tempo, mas não necessariamente. No [tutorial anterior](2%20-%20Centralidade%20Closeness.ipynb), vimos que as famílias Medici, Ridolfi e Tornabuoni têm closeness alto. Neste tutorial, vemos que a família Medici tem betweenness alto, mas as famílias Ridolfi e Tornabuoni têm betweenness baixo.

## Referências

[<a name="medici">1</a>] J. F. Padgett e C. K. Ansell. *Robust action and the rise of the Medici, 1400-1434.* American Journal of Sociology, 98(6), 1993.

[<a name="duality">2</a>] R. L. Breiger e P. E. Pattison. *Cumulated social roles: the duality of persons and their algebras.* Social Networks, 8(3), 1986.

<div class="alert alert-block alert-info">
   <strong>DICA:</strong> Você pode clicar na aba
   <img style="vertical-align: middle" src="attachment:b28e3c8b-7c50-44fc-8c53-ea5ad22e8edb.png" alt"toc.png">
   à esquerda para navegar por seção.
</div>