# Redes Complexas: graus e transitividade


## Grau

* Grau de um vértice = número de conexões

Para calcular o grau de um vértice de uma matriz, é fácil através da representação de uma matriz de adjacências.

|   | a | b | c | d |
|---|---|---|---|---|
| a | 0 | 1 | 1 | 0 |
| b | 1 | 0 | 0 | 1 |
| c | 1 | 0 | 0 | 0 |
| d | 1 | 1 | 0 | 0 |

Para achar o grau de um vértice, basta somar a quantidade de valores não nulos na linha referente a ele.

$$ k_i = \sum_{j=1}^{N}{A_{ij}}$$

### Grau médio

**Grau médio** = a esperança de $k$.
* Neste caso, seria a média aritmética de $k$.

$$ E[k] = \frac{1}{N}\sum_{j=1}^{N}{k_i} $$

O grau médio quantifica a quantidade de conexões de uma rede.

### Grau médio em redes dirigidas

Separados em **grau de entrada** (número de conexões que chegam a um vértice) e **graus de saída** (conexões que saem).

$P(k)$ = probabilidade de selecionar um vértice com grau k.

### Distribuição do grau

* Rede aleatória: a distribuição do número de conexões segue uma distribuição de Poisson. -> $P(k) = \frac{e^{-\lambda} \lambda^k}{k!}$

* Rede sem escala: a distribuição do número de conexões segue uma lei de potência. -> $P(k) \approx k^{-\gamma}$. A chance de selecionar um nó de grau baixo é muito maior que a chance de se selecionar um nó de grau alto (que são chamados de _hubs_)


### Lei de potência

#### Universalidade
Por mais diferentes que sejam as redes, o coeficiente $\gamma$ das leis de potência das redes é aproximadamente o mesmo ($\approx 2.3$)
As redes sem escala são **robustas**: a chance de selecionar um hub é muito baixa. Na natureza, a evolução moldou que diversas coisas se organizassem de tal forma justamente por sua robustez.

### Complexidade

* **Coeficiente de complexidade**: quanto maior o segundo momento, mais complexas (maior variabilidade de hubs)
   $$\alpha = \frac{\langle k^2\rangle}{\langle k \rangle} $$
  
* **Entropia de Shannon**: máxima para uma distribuição uniforme de graus: se todos os graus tiverem a mesma probabilidade, a rede possui uma quantidade muito alta de informação, portanto a entropia **máxima**. Se todos os vértices tiverem o mesmo grau, entretanto, a entropia é **mínima**.

$$H = - \sum_{k=0}^\infty{P(k)logP(k)}$$
   

## Transitividade

* **Transitividade**: quantificar a ocorrência de triângulos em uma rede.

### Coeficiente de agrupamento (Clustering coefficient)
O número de triplas (conexões entre três vértices)
Em cada triângulo, ocorrem três triplas.
Portanto, o coeficiente é:

$$ C = \frac{3 \cdot \text{nº de triângulos}}{\text{nº de triplas de vértices conectados}} $$

Com esta medida, somos capazes de quantificar o quão conectados são os vizinhos de cada vértice.

Matematicamente falando, o problema pode ser representado, a partir de uma matriz de adjacências, da seguinte forma:

$$ C = \frac{3\sum^N_{i=1}\sum^N_{j>i}\sum^N_{k>j>i}A_{ij}A_{ik}A_{jk}}{\sum^N_{i=1}\sum^N_{j>i}\sum^N_{k>j>i}A_{ij}A_{jk} + A_{ik}A_{jk} + A_{ij}A_{ik}} $$

Porém, isto é computacionalmente muito caro. Compensa mais fazer uma busca na rede.

### Coeficiente de agrupamento local
Se refere aos vizinhos de um vértice que possuem conexões entre si.

$$ C_i = \frac{e_i}{k_i(k_i-1)/2} = \frac{2e_i}{k_i(k_i-1)} $$

No caso acima, $k_i$ se refere ao número de vizinhos que o vértice possui, e $e_i$ se refere ao número de conexões entre eles (lembrando que a conexão entre o vértice em questão e seu vizinho não é contabilizada). $k_i(k_i-1)$ equivale ao número de conexões possíveis (é dividido pela metade pois desconsidera orientação).

$$ C_L = \sum^N_{i=1}{\frac{C_i}{N}}$$

O coeficiente de agrupamento local costuma ser baixo para hubs: a chance dos vizinhos de um hub estarem conectados entre si é muito baixa. Uma função de $C_L$ em função do número de hubs cai seguindo uma lei de potência.

* No caso de coeficiente **global**, consideramos todos os _triângulos_ têm o mesmo peso. Mais adequada para redes com **considerável** presença de hubs.

* No caso de coeficiente **local**, todos os _vértices_ têm o mesmo peso. Esta medida é mais adequada para redes **mais homogêneas**, com baixa presença de hubs.