# Lacunas Estruturais

### Filipe Borba e Martim José

A atividade de Lacunas Estruturais tem por objetivo verificar a interferência de indivíduos numa rede. Nela, estabelecemos dois comportamentos bem definidos: openers e closers. Os agentes chamados de openers buscam aumentar suas conexões e preferem conexões indiretas dentro da rede. Por sua vez, para os closers, foi dado um comportamento que será explicado num segundo momento deste notebook.

A definição de Lacuna Estrutural é "uma relação não-redundante entre dois agentes", ou seja, uma relação indireta entre duas pessoas que não se relacionam diretamente. Com isso, fica evidente que os openers buscam criar lacunas estruturais nos seus relacionamentos, visto que desejam criar relações indiretas. 

Por um lado, estar mais num centro de um grupo possui as vantagens de apoio entre os indivíduos, rápida transmissão de informações, manutenção de confiança, etc. Por outro lado, quando um agente se se torna uma ponte entre dois grupos, possui certas vantagens como a importância na intermediação de informações e recursos de fontes desconectadas, privilégio de possuir informações de dois ou mais grupos diferentes, tendo maior potencial de inovação, entre outros.



Importando bibliotecas:

In [1]:
import pandas as pd
import networkx as nx
import socnet as sn

from random import shuffle
from itertools import combinations

Configurando bibliotecas:

In [2]:
sn.node_size = 5

sn.edge_width = 1
sn.edge_color = (191, 191, 191)

Definindo constantes:

In [3]:
FRAC_CLOSERS = 0.3

NUM_NODES = 25

DENSITY = 0.5

OPENER = 0
CLOSER = 1

OPENER_COLOR = (0, 255, 0)
CLOSER_COLOR = (0, 0, 255)

##### Importante
A constante FRAC_CLOSERS indica a proporção de closers em relação a openers. Para um valor de FRAC_CLOSERS = 0., 30% dos agentes serão closers e os outros 70% openers.

Exemplo de grafo:

(esse grafo representa o *ambiente* do modelo)

In [4]:
def build_graph():
    g = nx.erdos_renyi_graph(NUM_NODES, DENSITY)

    sn.reset_node_colors(g)
    sn.reset_edge_colors(g)

    return g


g = build_graph()

sn.reset_positions(g)

sn.show_graph(g)

Exemplo de distribuição de tipos de nó:

(esses tipos representam os *agentes* do modelo)

In [5]:
def set_types(g, num_closers=0):
    nodes = list(g.nodes)
    shuffle(nodes)

    for n in nodes[num_closers:]:
        g.nodes[n]['type'] = OPENER

    for n in nodes[:num_closers]:
        g.nodes[n]['type'] = CLOSER

    for n in g.nodes:
        if g.nodes[n]['type'] == OPENER:
            g.nodes[n]['color'] = OPENER_COLOR
        else:
            g.nodes[n]['color'] = CLOSER_COLOR


set_types(g, int(NUM_NODES / 2))

sn.show_graph(g)

Custo de manter uma relação do nó $n$:

$$c_n = \left\{\begin{array}{cl}
0             & \textrm{se }d_n = 0\textrm{;} \\
\frac{1}{d_n} & \textrm{caso contrário,} \\
\end{array}\right.$$

onde $d_n$ é o grau de $n$.

In [6]:
def cost(g, n):
    dn = g.degree(n)

    if dn == 0:
        return 0
    return 1 / dn

Restrição do nó $n$ para *openers* (fórmula de Burt):

$$\sum_{m \in N_n} \left(c_n + \sum_{k \in N_n, k \in N_m} c_n c_k\right)^2\textrm{,}$$

onde $N_n$ é o conjunto de vizinhos de $n$.

Esta fórmula parte da premissa de que o nó não está isolado.

Interpretação informal: o agente busca aumentar suas conexões e prefere conexões indiretas.

In [7]:
def opener_constraint(g, n):
    constraint = 0

    for m in g.neighbors(n):
        sub_constraint = cost(g, n)

        for k in g.neighbors(n):
            if g.has_edge(k, m):
                sub_constraint += cost(g, n) * cost(g, k)

        constraint += sub_constraint**2

    return constraint

Restrição do nó $n$ para *closers* (uma fórmula alternativa):

$$\frac{9}{8} - b_n\textrm{,}$$

onde $b_n$ é a fórmula de Burt.

Esta fórmula parte da premissa de que o nó não está isolado.

Interpretação informal: o agente busca diminuir suas conexões e prefere conexões diretas.

### Comportamento do Closer

O comportamento definido pelo closer é de ter o menor custo possível com suas relações, porém, tendo o melhor aproveitamento. Com isso, ele buscará relações diretas com agentes com muitas conexões, mantendo o mínimo de relações possíveis.

Para calcular a restrição do closer, é necessário somar o número de degrees dos vizinhos do agente sobre o número total de nós da rede. Assim, quanto mais conexões os vizinhos tiverem, mais custoso será manter essas relações.
Ainda, divide-se a soma pelo número total de vizinhos do agente, indicando que a restrição aumenta conforme mais vizinhos. Por fim, realiza-se uma subtração entre 9/8 e a restrição do closer.

In [8]:
def closer_constraint(g, n):
    constraint = 0
    for m in g.neighbors(n):
        #Quanto mais conexões seus vizinhos tiverem, mais custoso será manter essas relações.
        constraint += g.degree(m)/NUM_NODES #Um número maior de degrees terá um peso maior de acordo com o tamanho da rede
        
    constraint /= len(list(g.neighbors(n))) #Divide-se pelos total de vizinhos, 
                                            #indicando que a restrição aumenta conforme mais vizinhos.
    return 9/8 - constraint
#     return 9/8 - opener_constraint(g, n)

Restrição geral do nó $n$:

* se o nó estiver isolado, é igual a $2$;
* caso contrário, depende de qual é o tipo.

In [9]:
def constraint(g, n):
    if g.degree(n) == 0:
        return 2

    if g.nodes[n]['type'] == OPENER:
        return opener_constraint(g, n)
    return closer_constraint(g, n)

Inicialização da simulação:

In [10]:
def initialize(g):
    for n in g.nodes:
        g.nodes[n]['constraint'] = constraint(g, n)

Passo da simulação:

1. escolha aleatoriamente um par de nós;
2. considere uma *inversão* da situação desse par, ou seja, remover a aresta se ela existir ou adicionar se não existir;
3. calcule o *ganho* de cada um desses nós, ou seja, a redução da restrição como consequência dessa inversão;
4. no caso particular em que a inversão foi adição, se um dos ganhos for negativo, os dois ganhos são redefinidos como zero *(justificativa no código)*;
5. se um dos ganhos foi positivo aceite a inversão e termine o passo, senão volte para (1);
6. se todos os pares foram escolhidos e nenhuma inversão foi aceita, termine o passo.

In [11]:
def invert(g, n, m):
    if g.has_edge(n, m):
        g.remove_edge(n, m)
    else:
        g.add_edge(n, m)
        g.edges[n, m]['color'] = sn.edge_color


def update(g):
    # Para cada par de nós, em ordem aleatória.

    pairs = list(combinations(g.nodes, 2))
    shuffle(pairs)

    for n, m in pairs:
        # Inverte a situação do par.
        invert(g, n, m)

        # Calcula as restrições após inversão.
        constraint_n = constraint(g, n)
        constraint_m = constraint(g, m)

        # Calcula os ganhos após inversão,
        # (lembrando que restrição é ruim)
        gain_n = g.nodes[n]['constraint'] - constraint_n
        gain_m = g.nodes[m]['constraint'] - constraint_m

        # Se a inversão foi adição e um dos nós foi prejudicado,
        # então o ganho é zero porque essa inversão é impossível.
        # (você não pode forçar uma pessoa a manter uma relação)
        if g.has_edge(n, m) and (gain_n < 0 or gain_m < 0):
            gain_n = 0
            gain_m = 0

        # Se algum nó teve um ganho, aceita a inversão e
        # considera o passo da simulação como terminado,
        # devolvendo True para indicar que houve mudança.
        if gain_n > 0 or gain_m > 0:
            g.nodes[n]['constraint'] = constraint_n
            g.nodes[m]['constraint'] = constraint_m
            return True

        # Se nenhum nó teve um ganho, essa inversão não é aceita.
        # Restauramos, portanto, a situação original do par de nós.
        invert(g, n, m)

    # Se passamos por todos os pares e nenhuma inversão foi aceita,
    # considera o passo da simulação como terminado, devolvendo
    # False para indicar que não houve mudança: a rede estabilizou.
    return False

Simulação com visualização, quando todos os nós buscam reduzir a restrição de Burt:

In [12]:
def simulate(num_closers):
    g = build_graph()

    set_types(g, num_closers)

    initialize(g)

    while update(g):
        pass

    return g


num_closers = 0

g = simulate(num_closers)

sn.reset_positions(g)

sn.show_graph(g)

Inversão da visualização:

In [13]:
def inver_show(g):
    cg = nx.complement(g)

    sn.reset_positions(cg)

    for n in g.nodes:
        g.nodes[n]['pos'] = cg.nodes[n]['pos']

    sn.show_graph(g)


inver_show(g)

Distribuição de *betweenness*:

In [14]:
betweenness = nx.betweenness_centrality(g)

df = pd.DataFrame({
    'betweenness': [betweenness[n] for n in g.nodes],
})

df.describe()

Unnamed: 0,betweenness
count,25.0
mean,0.02087
std,0.002629
min,0.018395
25%,0.018395
50%,0.018395
75%,0.023551
max,0.023551


Simulação com visualização, quando apenas uma minoria dos nós busca reduzir a restrição de Burt, enquanto todos os outros buscam aumentar:

## Closer = Azul, Opener = Verde

In [15]:
num_closers = int(FRAC_CLOSERS * NUM_NODES)

g = simulate(num_closers)

sn.reset_positions(g)

sn.show_graph(g)

# Conclusões

O comportamento do nosso closer foi bastante interessante. Os openers do nosso grafo desejam ter o máximo de relações possíveis, enquanto que os closers desejam ter apenas relações com pessoas influentes. Como resultado, os openers formaram dois cliques, pois estão se relacionando com várias pessoas ao mesmo tempo, enquanto que os closers ficaram na periferia, formando apenas relações "estratégicas" com pessoas influentes. Houve, então, uma situação boa para ambas as partes.

Olhando para o gráfico, pode-se pensar numa estrutura de hierarquia nas empresas. Os openers funcionariam como um time e os closers como os chefes ou diretores. Contudo, há um nó que "une" a maioria dos closers e dos openers, que pode ser visto como um coordenador de algum projeto ou área. Assim, verifica-se a importância desse coordenador em relação à rede da empresa, pois possui um "capital social" elevado.

Dado o comportamento do closer em relação ao comportamento dos openers, pode-se concluir que essa relação construtiva permite uma rede com maior capital social em cada nó? Queremos saber, então, se o comportamento dos dois (um busca maior número de conexões, um busca conexões eficientes) afeta positivamente a rede no sentido de capital social para ambos.
Observando o grafo resultante, percebe-se a existência de diversas lacunas estruturais e dois cliques, indicando um potencial decapital social para várias partes da rede. Ainda, observando as distribuições de betweenness, verifica-se que há uma grande variação da medida, viesada pelo nó com maior número de degrees. Mas os openers, no geral, estão com betweenness elevada e os closers com baixa.


Distribuição de *betweenness*:

In [16]:
betweenness = nx.betweenness_centrality(g)

df = pd.DataFrame({
    'betweenness': [betweenness[n] for n in g.nodes],
})

df.describe()

Unnamed: 0,betweenness
count,25.0
mean,0.036812
std,0.067319
min,0.0
25%,0.009511
50%,0.026842
75%,0.028482
max,0.35


Distribuição de *betweenness* dos *openers*:

In [17]:
betweenness = nx.betweenness_centrality(g)

df = pd.DataFrame({
    'betweenness': [betweenness[n] for n in g.nodes if g.nodes[n]['type'] == OPENER],
})

df.describe()

Unnamed: 0,betweenness
count,18.0
mean,0.05001
std,0.075709
min,0.016787
25%,0.026842
50%,0.028482
75%,0.038406
max,0.35


Distribuição de *betweenness* dos *closers*:

In [18]:
betweenness = nx.betweenness_centrality(g)

df = pd.DataFrame({
    'betweenness': [betweenness[n] for n in g.nodes if g.nodes[n]['type'] == CLOSER],
})

df.describe()

Unnamed: 0,betweenness
count,7.0
mean,0.002873
std,0.004552
min,0.0
25%,0.0
50%,0.0
75%,0.005299
max,0.009511
