# APS 2

Antonio Fonseca, Ellen Shen e Luiza Valezim

Esta APS consiste em analisar o cálculo de métricas locais de vértices e a interpretação sobre essas redes e essas métricas. O dataset escolhido foi: https://snap.stanford.edu/data/facebook-large-page-page-network.html. Esse dataset tem como objetivo ver se há uma relação entre o conteúdo / assunto de cada página com suas curtidas em outras páginas.

Análise inicial dos dados:
- **O que os vértices da rede representam?** Eles representam as páginas que existem na rede social Facebook.
- **O que as arestas da rede representam?** As arestas são as curtidas dadas entre as páginas.
- **O que os grupos formados pela tarefa 4 representam?** Os grupos formados podem ser consideradas páginas que produzem conteúdo sobre assuntos semelhantes.

In [11]:
import netpixi
import numpy as np
from netpixi.integration.gt import *
from regression.integration.gt import *
from graph_tool import centrality

colocar imagem 

In [12]:
#utilizando o grafo da APS1
grafo = gt_load('facebook.net.gz')

###  Redução a um componente

### O que os vértices da rede representam?
Os vertices da rede reprensentam paginas verificadas no Facebook, de instituições governamentais, figuras do meio politico e veiculos de noticias.

### O que as arestas da rede representam? /
As arestas representam interaçoes mutuas entre as plataformas (troca de likes)

### O que os grupos formados pela tarefa 4 representam?
O grupos são bolhas de troca de informação, onde podemos assumir que todos os vertices (paginas) serão expostos aos posts dos demais membros da rede

In [4]:
grafo = gt_clean(grafo)

m = gt_draw.sfdp_layout(grafo)
gt_move(grafo, m)
gt_save(grafo, 'exemplo.net.gz')
# r = netpixi.render('exemplo.net.gz', infinite = True)

KeyboardInterrupt: 

## Métricas de Centralidade

Essas métricas permitem a avaliação da importância de um nó dentro da rede.

### Degree

A centralidade de degree representa o número de ligações que um nó possui, dividido pelo número de ligações possíveis, ou seja, a quantidade de arestas do vértices.  Esta métrica é usada para identificar os nós que têm o maior número de ligações.

In [None]:
#calculando a centralidade degree
degree = gt_total_degree(grafo)
grafo.add_vp('degree', degree)

In [None]:
gt_data(grafo).sort_values("degree", ascending = False)

In [None]:
# r = netpixi.render('facebook.net.gz', infinite = True, aspect = 1);

In [None]:
# r.vertex_set_key('id')
r.vertex_unset_key()
r.vertex_scale('degree', 1, 10)

**Ter um degree alto:** Pode significar algumas coisas. Se for direcionado ao site, significa que o site tem alto engajamento, simbolizando que muitas pessoas curtem o seu conteúdo. Porém, se sair do site e for direcionado a um outro site, simboliza que o site engaja em outros sites. Esse engajamento, no nosso caso, pode ser traduzido por interesses em comum.

**Ter um degree baixo:** Significa que ele é ausente na rede social ou que ele não traz engajamento sobre o seu conteúdo.

relacionar aos dados 

---

### Betweenness

A centralidade de betweeness representa a quantidade de geodésicas (caminhos com menor comprimento possível) que passam pelo vértice. Esta métrica permite analisar o potencial de comunicação de um ator dentro da rede.

In [None]:
#calculando a centralidade betweenness
betweenness, _ = centrality.betweenness(grafo)
grafo.add_vp('betweenness', betweenness)

In [None]:
gt_data(grafo).sort_values("betweenness", ascending = False)

In [None]:
r = netpixi.render('facebook.net.gz', infinite = True, aspect = 1)

In [None]:
#r.vertex_set_key('id')
r.vertex_scale('betweenness', 1, 20)

**Ter betweenness alto:** Significa que há maior probabilidade de o site ter o conteúdo similar aos que são interligados por outro site intermediador.

**Ter betweenness baixo:** Significa que há menor probabilidade desses conteúdos serem parecidos.

relacionar aos dados 

---

### Closeness

A centralidade de closeness representa a proximidade (inverso da distância) média do vértice para os outros vértices da rede. Esta métrica indica a capacidade de alcance de um nó dentro da rede.

In [None]:
#calculando a centralidade closeness
closeness = centrality.closeness(grafo)
grafo.add_vp('closeness', closeness)

In [None]:
gt_data(grafo).sort_values("closeness", ascending = False)

In [None]:
r = netpixi.render('facebook.net.gz', infinite = True, aspect = 1)

In [None]:
#r.vertex_set_key('id')
r.vertex_scale('closeness', 0.5, 3)

**Ter closeness alto:** Quando temos dois sites próximos, podemos concluir que os seus conteúdos são parecidos, pois provavelmente fazem parte do mesmo grupo de assuntos.


**Ter closeness baixo:** Quando temos dois sites distantes, supomos que os seus conteúdos tratam de assuntos bem diferentes, mas que devem ter alguma conexão, dado o engajamento.

relacionar aos dados 

---

### Clustering coefficient

*explicacao*

In [None]:
from graph_tool import clustering

clustering_coef = clustering.local_clustering(grafo)
grafo.add_vp('clustering', clustering_coef)

In [None]:
gt_data(grafo).sort_values("clustering", ascending = False)

In [None]:
r = netpixi.render('facebook.net.gz', infinite = True, aspect = 1)

In [None]:
r.vertex_scale('clustering', 10, 30)

**Ter Clustering coefficient alto:** Nesse caso, acreditamos que confirma a nossa hipótese inicial de que, quando há uma conexão (nesse caso, likes) entre sites, o seu conteúdo é similar ao do site curtido, pois sites parecidos tem mais probabilidade de curtirem um ao outro.

**Ter Clustering coefficient baixo:** Nos faz questionar a nossa hipótese, visto que talvez tenha sido um like sem querer ou um site que seja muito generalista e aborde vários assuntos

relacionar aos dados 

---

### Lacunas estruturais

Na teoria de *lacunas estruturais,* a existência de uma aresta $(u, v)$ pode ser interpretada como um *investimento* que $u$ faz para manter uma relação com $v$, esperando que essa relação lhe dê acesso a informações e outros recursos.

In [None]:
lacunas = gt_effective_size(grafo)
grafo.add_vp('effsize', lacunas)

In [None]:
gt_data(grafo).sort_values("effsize", ascending = False)

In [None]:
r = netpixi.render('facebook.net.gz', infinite = True, aspect = 1)

In [None]:
r.vertex_scale('effsize', 10, 30)

### constraint

In [13]:
es = gt_constraint(grafo)
grafo.add_vp('constraint', es)

In [14]:
gt_data(grafo).sort_values("constraint", ascending = False)

Unnamed: 0_level_0,constraint
id,Unnamed: 1_level_1
16357,1.006944
12713,1.006944
20987,1.006944
14237,1.006944
20039,1.006944
...,...
1259,0.005049
308,0.004119
30,0.003540
32,0.003535


In [15]:
r = netpixi.render('facebook.net.gz', infinite = True, aspect = 1)

In [16]:
r.vertex_scale('constraint', 10, 30)