# Encontro 13: Medidas de Centralidade

Importando a biblioteca:

In [2]:
import sys
sys.path.append('..')

from random import choice
from itertools import permutations

import pandas as pd
import networkx as nx

import socnet as sn

import scipy
from scipy import stats

from scipy.stats import ttest_ind, ttest_ind_from_stats
from scipy.special import stdtr


Configurando a biblioteca:

In [3]:
sn.node_size = 10
sn.node_color = (255, 255, 255)

sn.edge_width = 1
sn.edge_color = (192, 192, 192)

sn.node_label_position = 'top center'

Carregando rede de casamentos entre famílias de Florença durante a Renascença.

J. F. Padgett e C. K. Ansell. *Robust action and the rise of the Medici, 1400–1434.* American Journal of
Sociology 98, págs. 1259-1319, 1993.

In [4]:
g = sn.load_graph('Renaissance.gml', has_pos=True)

sn.show_graph(g, nlab=True)

Função que registra, em cada nó, seus sucessores em geodésicas de $s$ a $t$.

In [5]:
def set_geodesic_successors(g, s, t):
    for n in g.nodes:
        g.nodes[n]['geodesic_successors'] = set()

    for p in nx.all_shortest_paths(g, s, t):
        for i in range(len(p) - 1):
            g.nodes[p[i]]['geodesic_successors'].add(p[i + 1])

Funções que representam uma escolha aleatória de sucessor para diferentes tipos de trajetórias.

In [6]:
# Pense que o atributo 'passages' abaixo indica quantas
# vezes um fluxo já passou por um nó ou por uma aresta.

def random_geodesic_successor(g, n):
    return choice([m for m in g.nodes[n]['geodesic_successors']])

def random_path_successor(g, n):
    return choice([m for m in g.neighbors(n) if g.nodes[m]['passages'] == 0])

def random_trail_successor(g, n):
    return choice([m for m in g.neighbors(n) if g.edges[n, m]['passages'] == 0])

def random_walk_successor(g, n):
    return choice([m for m in g.neighbors(n)])

Função que faz uma simulação de fluxo de $s$ a $t$, que pode ou não ser bem-sucedida.

In [7]:
def simulate_single_flow(g, s, t, dif):
    # Inicializa o atributo 'passages' de cada nó.
    for n in g.nodes:
        g.nodes[n]['passages'] = 0
    g.nodes[s]['passages'] = 1

    # Inicializa o atributo 'passages' de cada aresta.
    for n, m in g.edges:
        g.edges[n, m]['passages'] = 0

    # Inicializa s como o único dono do insumo.
    for n in g.nodes:
        g.nodes[n]['owner'] = False
    g.nodes[s]['owner'] = True

    # Simula o fluxo, contando o número total de passos.

    steps = 0

    while True:
        # O conjunto reached representa todos os nós
        # que o fluxo consegue alcançar no passo atual.
        reached = set()

        # Verifica cada um dos donos atuais do insumo.

        owners = [n for n in g.nodes if g.nodes[n]['owner']]

        for n in owners:
            # Escolhe aleatoriamente um dos sucessores.
            try:
                m = random_geodesic_successor(g, n)
            except IndexError:
                continue

            # Deixa de ser dono do insumo.
            if dif == "transf":
                g.nodes[n]['owner'] = False
            elif dif != "dup":
                raise ValueError("argumento de difusão invalido")
            
            # Incrementa o atributo 'passages' do nó.
            g.nodes[m]['passages'] += 1

            # Incrementa o atributo 'passages' da aresta.
            g.edges[n, m]['passages'] += 1

            # Registra que consegue alcançar esse nó.
            reached.add(m)

        # Todo nó alcançado passa a ser dono do insumo.

        for n in reached:
            g.nodes[n]['owner'] = True

        # Isso conclui o passo atual da simulação.
        steps += 1

        # Se o passo alcançou t, chegamos ao fim da simulação.
        # Ela foi bem-sucedida: devolvemos o número de passos.
        if t in reached:
            return steps

        # Se o passo não alcançou ninguém, chegamos ao fim da
        # simulação. Ela não foi bem-sucedida: devolvemos -1.
        if not reached:
            return -1

Função que faz simulações de fluxo de $s$ a $t$ até uma ser bem-sucedida.

In [8]:
def simulate_successful_flow(g, s, t, dif):
    set_geodesic_successors(g, s, t)

    while True:
        steps = simulate_single_flow(g, s, t, dif)

        if steps != -1:
            return steps

Função que faz simulações de fluxo para todo $s$ e $t$ possíveis, e tira disso um *closeness simulado* e um *betweenness simulado*.

In [9]:
def simulate_all_flows(g, dif):
    for n in g.nodes:
        g.nodes[n]['closeness'] = 0
        g.nodes[n]['betweenness'] = 0

    for s, t in permutations(g.nodes, 2):
        steps = simulate_successful_flow(g, s, t, dif)

        g.nodes[s]['closeness'] += steps
        for n in g.nodes:
            if n != s and n != t:
                g.nodes[n]['betweenness'] += g.nodes[n]['passages']

    # Normalizações necessárias para comparar com os
    # resultados analíticos. Não é preciso entender.
    for n in g.nodes:
        g.nodes[n]['closeness'] = (g.number_of_nodes() - 1) / g.nodes[n]['closeness']
        g.nodes[n]['betweenness'] /= (g.number_of_nodes() - 1) * (g.number_of_nodes() - 2)

Média de *closeness simulado* e *betweenness simulado* para muitas repetições da simulação acima.

In [10]:
TIMES = 100


for n in g.nodes:
    g.nodes[n]['mean_closeness'] = 0
    g.nodes[n]['mean_betweenness'] = 0
    g.nodes[n]['closeness_geodesic_transf_list'] = []
    g.nodes[n]['betweenness_geodesic_transf_list'] = []

for _ in range(TIMES):
    simulate_all_flows(g, "transf")

    for n in g.nodes:
        g.nodes[n]['mean_closeness'] += g.nodes[n]['closeness']
        g.nodes[n]['mean_betweenness'] += g.nodes[n]['betweenness']
        g.nodes[n]['closeness_geodesic_transf_list'].append(g.nodes[n]['closeness'])
        g.nodes[n]['betweenness_geodesic_transf_list'].append(g.nodes[n]['betweenness'])
        

for n in g.nodes:
    g.nodes[n]['mean_closeness'] /= TIMES
    g.nodes[n]['mean_betweenness'] /= TIMES
    
for n in g.nodes:
    g.nodes[n]['closeness_geodesic_transf'] = g.nodes[n]['mean_closeness']
    g.nodes[n]['betweenness_geodesic_transf']  = g.nodes[n]['mean_betweenness']

In [11]:
TIMES = 100


for n in g.nodes:
    g.nodes[n]['mean_closeness'] = 0
    g.nodes[n]['mean_betweenness'] = 0
    g.nodes[n]['closeness_geodesic_dup_list'] = []
    g.nodes[n]['betweenness_geodesic_dup_list'] = []

for _ in range(TIMES):
    simulate_all_flows(g, "dup")

    for n in g.nodes:
        g.nodes[n]['mean_closeness'] += g.nodes[n]['closeness']
        g.nodes[n]['mean_betweenness'] += g.nodes[n]['betweenness']
        g.nodes[n]['closeness_geodesic_dup_list'].append(g.nodes[n]['closeness'])
        g.nodes[n]['betweenness_geodesic_dup_list'].append(g.nodes[n]['betweenness'])

for n in g.nodes:
    g.nodes[n]['mean_closeness'] /= TIMES
    g.nodes[n]['mean_betweenness'] /= TIMES
    
for n in g.nodes:
    g.nodes[n]['closeness_geodesic_dup'] = g.nodes[n]['mean_closeness']
    g.nodes[n]['betweenness_geodesic_dup']  = g.nodes[n]['mean_betweenness']

Cálculo de *closeness* e *betweenness* a partir das funções prontas da NetworkX, para comparação.

E agora, vamos pensar um pouco...

* Onde você precisa mudar o código para usar uma *trajetória* que não seja a *geodésica*? (caminho, trilha, passeio)

* Onde você precisa mudar o código para usar uma *difusão* que não seja a *transferência*? (duplicação)

Considere então a seguinte **hipótese**:

>Quando consideramos outros tipos de trajetória e outros tipos de difusão, os nós com maior *closeness simulado* e *betweenness simulado* não são necessariamente os nós com maior *closeness* e *betweenness* segundo as fórmulas clássicas. (que correspondem ao uso de geodésica e transferência na simulação)

Queremos:

1. Operacionalização e teste dessas hipótese. (Objetivo 3)
2. Interpretação dos resultados na linguagem de Análise de Redes Sociais (Objetivo 4)

Um *feedback* da atividade sobre *coreness no Jazz* será dado em breve, para vocês terem uma melhor referência do item 2.

## Teste da hipótese

Abaixo temos as funções utilizadas para realizar os cálculos adaptados para os diferentes tipos de trajetória e difusão

In [12]:
def simulate_single_flow_path_tp(g, s, t, tp, dif):

    # Inicializa o atributo 'passages' de cada nó.
    for n in g.nodes:
        g.nodes[n]['passages'] = 0
    g.nodes[s]['passages'] = 1

    # Inicializa o atributo 'passages' de cada aresta.
    for n, m in g.edges:
        g.edges[n, m]['passages'] = 0

    # Inicializa s como o único dono do insumo.
    for n in g.nodes:
        g.nodes[n]['owner'] = False
    g.nodes[s]['owner'] = True

    # Simula o fluxo, contando o número total de passos.

    steps = 0

    while True:
        # O conjunto reached representa todos os nós
        # que o fluxo consegue alcançar no passo atual.
        reached = set()

        # Verifica cada um dos donos atuais do insumo.

        owners = [n for n in g.nodes if g.nodes[n]['owner']]

        for n in owners:
            # Deixa de ser dono do insumo.
            if dif == "transf":
                g.nodes[n]['owner'] = False
            elif dif != "dup":
                raise ValueError("argumento de difusão invalido")

            # Escolhe aleatoriamente um dos sucessores.
            try:
                #tipo: trail, walk, path
                if tp == "trail":

                        m = random_trail_successor(g, n)


                elif tp == "path":
                    m = random_path_successor(g, n)

                elif tp == "walk":
                    m = random_walk_successor(g, n)

                else:
                    return "invalid type"

                # Incrementa o atributo 'passages' do nó.
                g.nodes[m]['passages'] += 1

                # Incrementa o atributo 'passages' da aresta.
                g.edges[n, m]['passages'] += 1

                # Registra que consegue alcançar esse nó.
                reached.add(m)
            except:
                pass

        # Todo nó alcançado passa a ser dono do insumo.

        for n in reached:
            g.nodes[n]['owner'] = True

        # Isso conclui o passo atual da simulação.
        steps += 1

        # Se o passo alcançou t, chegamos ao fim da simulação.
        # Ela foi bem-sucedida: devolvemos o número de passos.
        if t in reached:
            return steps

        # Se o passo não alcançou ninguém, chegamos ao fim da
        # simulação. Ela não foi bem-sucedida: devolvemos -1.
        if not reached:
            return -1

def simulate_successful_flow_tp(g, s, t, tp, dif):
    
    while True:
        steps = simulate_single_flow_path_tp(g, s, t, tp, dif)

        if steps != -1:
            return steps


def simulate_all_flows_tp(g, tp, dif):
    for n in g.nodes:
        g.nodes[n]['closeness'] = 0
        g.nodes[n]['betweenness'] = 0

    for s, t in permutations(g.nodes, 2):
        steps = simulate_successful_flow_tp(g, s, t, tp, dif)

        g.nodes[s]['closeness'] += steps
        for n in g.nodes:
            if n != s and n != t:
                g.nodes[n]['betweenness'] += g.nodes[n]['passages']

    # Normalizações necessárias para comparar com os
    # resultados analíticos. Não precisa entender.
    for n in g.nodes:
        g.nodes[n]['closeness'] = (g.number_of_nodes() - 1) / g.nodes[n]['closeness']
        g.nodes[n]['betweenness'] /= (g.number_of_nodes() - 1) * (g.number_of_nodes() - 2)
        


In [13]:
def avg_calc(g, tp, dif):
    TIMES = 100


    for n in g.nodes:
        g.nodes[n]['mean_closeness'] = 0
        g.nodes[n]['mean_betweenness'] = 0
        g.nodes[n]['closeness_'+tp+'_'+dif+'_list'] = []
        g.nodes[n]['betweenness_'+tp+'_'+dif+'_list'] = []

    for _ in range(TIMES):
        simulate_all_flows_tp(g, tp, dif)

        for n in g.nodes:
            g.nodes[n]['mean_closeness'] += g.nodes[n]['closeness']
            g.nodes[n]['mean_betweenness'] += g.nodes[n]['betweenness']
            g.nodes[n]['closeness_'+tp+'_'+dif+'_list'].append(g.nodes[n]['closeness'])
            g.nodes[n]['betweenness_'+tp+'_'+dif+'_list'].append(g.nodes[n]['betweenness'])

    for n in g.nodes:
        g.nodes[n]['mean_closeness'] /= TIMES
        g.nodes[n]['mean_betweenness'] /= TIMES

In [14]:
tps = ["trail", "path", "walk"]
dif = ["transf", "dup"]

cc = nx.closeness_centrality(g)
bc = nx.betweenness_centrality(g)

# ------------------------------- Transferencia ---------------------------------

avg_calc(g, tps[0], dif[0])

for n in g.nodes:
    g.nodes[n]['closeness_trail_transf'] = g.nodes[n]['mean_closeness']
    g.nodes[n]['betweenness_trail_transf'] = g.nodes[n]['mean_betweenness']

avg_calc(g, tps[1], dif[0])

for n in g.nodes:
    g.nodes[n]['closeness_path_transf'] = g.nodes[n]['mean_closeness']
    g.nodes[n]['betweenness_path_transf'] = g.nodes[n]['mean_betweenness']
                                     
avg_calc(g, tps[2], dif[0])

for n in g.nodes:
    g.nodes[n]['closeness_walk_transf'] = g.nodes[n]['mean_closeness']
    g.nodes[n]['betweenness_walk_transf'] = g.nodes[n]['mean_betweenness']

# ------------------------------- Duplicação ---------------------------------

avg_calc(g, tps[0], dif[1])

for n in g.nodes:
    g.nodes[n]['closeness_trail_dup'] = g.nodes[n]['mean_closeness']
    g.nodes[n]['betweenness_trail_dup'] = g.nodes[n]['mean_betweenness']

avg_calc(g, tps[1], dif[1])

for n in g.nodes:
    g.nodes[n]['closeness_path_dup'] = g.nodes[n]['mean_closeness']
    g.nodes[n]['betweenness_path_dup'] = g.nodes[n]['mean_betweenness']
    
avg_calc(g, tps[2], dif[1])

for n in g.nodes:
    g.nodes[n]['closeness_walk_dup'] = g.nodes[n]['mean_closeness']
    g.nodes[n]['betweenness_walk_dup'] = g.nodes[n]['mean_betweenness']

### Dados obtidos

Agora com os dados coletados, geramos uma tabela para poder comparar os dados como um todo, onde temos as médias para cada família de closeness/betweenness para todos os tipos de difusão/trajetória. Depois separamos para cada caso, a família com a maior média, para comprovarmos a hipótese. Por fim temos a realização do teste T para todos os casos e famílias, com o cálculo do P-value, assim podemos validar melhor as análises referentes a hipótese.

## Closeness

In [15]:
pd.DataFrame({
'família': [g.nodes[n]['label'] for n in g.nodes],
'trail transf': [g.nodes[n]['closeness_trail_transf'] for n in g.nodes],
'trail dup': [g.nodes[n]['closeness_trail_dup'] for n in g.nodes],
'path transf': [g.nodes[n]['closeness_path_transf'] for n in g.nodes],
'path dup': [g.nodes[n]['closeness_path_dup'] for n in g.nodes],
'walk transf': [g.nodes[n]['closeness_walk_transf'] for n in g.nodes],
'walk dup': [g.nodes[n]['closeness_walk_dup'] for n in g.nodes],
'geodesic transf': [g.nodes[n]['closeness_geodesic_transf'] for n in g.nodes],
'geodesic dup': [g.nodes[n]['closeness_geodesic_dup'] for n in g.nodes],
'closeness analítico': [cc[n] for n in g.nodes],
})

Unnamed: 0,closeness analítico,família,geodesic dup,geodesic transf,path dup,path transf,trail dup,trail transf,walk dup,walk transf
0,0.333333,ginori,0.333333,0.333333,0.231244,0.204124,0.222375,0.218124,0.140874,0.03903
1,0.325581,lambertes,0.325581,0.325581,0.234715,0.210433,0.228386,0.209238,0.14218,0.035441
2,0.482759,albizzi,0.482759,0.482759,0.257311,0.260252,0.247027,0.263706,0.161397,0.037144
3,0.466667,guadagni,0.466667,0.466667,0.26363,0.262056,0.251599,0.261685,0.161977,0.036796
4,0.285714,pazzi,0.285714,0.285714,0.204516,0.198561,0.200646,0.200023,0.125791,0.040212
5,0.388889,salviati,0.388889,0.388889,0.224741,0.247998,0.219524,0.241997,0.142982,0.040819
6,0.56,medici,0.56,0.56,0.262618,0.301191,0.257533,0.283607,0.170258,0.03322
7,0.482759,tornabuon,0.482759,0.482759,0.278539,0.256549,0.26383,0.25342,0.169573,0.036165
8,0.4,bischeri,0.4,0.4,0.26619,0.24575,0.251581,0.235171,0.1566,0.034146
9,0.482759,ridolfi,0.482759,0.482759,0.278105,0.254941,0.262049,0.240961,0.168856,0.037256


In [23]:
difs = ["transf","dup"]
tps = ["geodesic","walk","path","trail"]

for dif in difs:
    for tp in tps:
        values = []
        families = []
        for n in g.nodes:
            values.append(g.nodes[n]['closeness_'+tp+"_"+dif])
            families.append(g.nodes[n]['label'])
        print("closeness "+tp+" "+dif+":")
        print("maior valor: "+families[values.index(max(values))]+" - "+str(max(values))+"\n")

closeness geodesic transf:
maior valor: medici - 0.5600000000000007

closeness walk transf:
maior valor: salviati - 0.040819364216885

closeness path transf:
maior valor: medici - 0.3011914380864138

closeness trail transf:
maior valor: medici - 0.2836067947958601

closeness geodesic dup:
maior valor: medici - 0.5600000000000007

closeness walk dup:
maior valor: medici - 0.17025807089443723

closeness path dup:
maior valor: tornabuon - 0.278538593636966

closeness trail dup:
maior valor: tornabuon - 0.2638295256781487



### Closeness geodesic dup

In [26]:
t_stats = []
p_vals = []

for n in g.nodes:
    t_stat, p_val = stats.ttest_rel(g.nodes[n]['closeness_geodesic_transf_list'], g.nodes[n]['closeness_geodesic_dup_list'])
    t_stats.append(round(t_stat,2))
    p_vals.append(p_val)
    
pd.DataFrame({
'Teste T': t_stats,
'P-Valor': p_vals,
'família': [g.nodes[n]['label'] for n in g.nodes]
})

Unnamed: 0,P-Valor,Teste T,família
0,,,ginori
1,,,lambertes
2,,,albizzi
3,,,guadagni
4,,,pazzi
5,,,salviati
6,,,medici
7,,,tornabuon
8,,,bischeri
9,,,ridolfi


### Closeness walk transf

In [27]:
t_stats = []
p_vals = []

for n in g.nodes:
    t_stat, p_val = stats.ttest_rel(g.nodes[n]['closeness_geodesic_transf_list'], g.nodes[n]['closeness_walk_transf_list'])
    t_stats.append(round(t_stat,2))
    p_vals.append(p_val)
    
pd.DataFrame({
'Teste T': t_stats,
'P-Valor': p_vals,
'família': [g.nodes[n]['label'] for n in g.nodes]
})

Unnamed: 0,P-Valor,Teste T,família
0,3.489559e-139,242.62,ginori
1,2.085341e-142,261.54,lambertes
2,4.949733e-154,342.84,albizzi
3,6.484951e-147,290.49,guadagni
4,4.919689e-135,220.27,pazzi
5,1.1514179999999999e-138,239.71,salviati
6,6.840766e-168,473.34,medici
7,3.953749e-154,343.62,tornabuon
8,2.062341e-152,330.16,bischeri
9,4.752492e-152,327.38,ridolfi


### Closeness walk dup

In [28]:
t_stats = []
p_vals = []

for n in g.nodes:
    t_stat, p_val = stats.ttest_rel(g.nodes[n]['closeness_geodesic_transf_list'], g.nodes[n]['closeness_walk_dup_list'])
    t_stats.append(round(t_stat,2))
    p_vals.append(p_val)
    
pd.DataFrame({
'Teste T': t_stats,
'P-Valor': p_vals,
'família': [g.nodes[n]['label'] for n in g.nodes]
})

Unnamed: 0,P-Valor,Teste T,família
0,2.245312e-104,107.61,ginori
1,3.225763e-99,95.34,lambertes
2,6.500400999999999e-115,137.73,albizzi
3,1.145163e-112,130.68,guadagni
4,1.224588e-106,113.48,pazzi
5,5.217612e-117,144.64,salviati
6,9.553886e-117,143.76,medici
7,9.640918e-107,113.75,tornabuon
8,1.315666e-103,105.69,bischeri
9,4.4345069999999996e-111,125.91,ridolfi


### Closeness path transf

In [29]:
t_stats = []
p_vals = []

for n in g.nodes:
    t_stat, p_val = stats.ttest_rel(g.nodes[n]['closeness_geodesic_transf_list'], g.nodes[n]['closeness_path_transf_list'])
    t_stats.append(round(t_stat,2))
    p_vals.append(p_val)
    
pd.DataFrame({
'Teste T': t_stats,
'P-Valor': p_vals,
'família': [g.nodes[n]['label'] for n in g.nodes]
})

Unnamed: 0,P-Valor,Teste T,família
0,2.395007e-76,55.43,ginori
1,7.000471e-68,45.17,lambertes
2,7.878284e-77,56.08,albizzi
3,2.274721e-76,55.46,guadagni
4,1.69153e-66,43.67,pazzi
5,2.612389e-70,47.92,salviati
6,1.9247890000000002e-81,62.62,medici
7,3.222936e-80,60.81,tornabuon
8,6.676632e-74,52.27,bischeri
9,1.243167e-82,64.42,ridolfi


### Closeness path dup

In [30]:
t_stats = []
p_vals = []

for n in g.nodes:
    t_stat, p_val = stats.ttest_rel(g.nodes[n]['closeness_geodesic_transf_list'], g.nodes[n]['closeness_path_dup_list'])
    t_stats.append(round(t_stat,2))
    p_vals.append(p_val)
    
pd.DataFrame({
'Teste T': t_stats,
'P-Valor': p_vals,
'família': [g.nodes[n]['label'] for n in g.nodes]
})

Unnamed: 0,P-Valor,Teste T,família
0,1.554244e-97,91.64,ginori
1,8.084438e-96,88.01,lambertes
2,1.517746e-110,124.35,albizzi
3,6.815804e-107,114.16,guadagni
4,2.2428139999999998e-85,68.76,pazzi
5,8.623536e-109,119.35,salviati
6,7.891328e-109,119.45,medici
7,9.230044e-102,101.21,tornabuon
8,1.61904e-93,83.36,bischeri
9,5.817095e-108,117.05,ridolfi


### Closeness trail transf

In [31]:
t_stats = []
p_vals = []

for n in g.nodes:
    t_stat, p_val = stats.ttest_rel(g.nodes[n]['closeness_geodesic_transf_list'], g.nodes[n]['closeness_trail_transf_list'])
    t_stats.append(round(t_stat,2))
    p_vals.append(p_val)
    
pd.DataFrame({
'Teste T': t_stats,
'P-Valor': p_vals,
'família': [g.nodes[n]['label'] for n in g.nodes]
})

Unnamed: 0,P-Valor,Teste T,família
0,1.246302e-72,50.69,ginori
1,1.602149e-68,45.88,lambertes
2,9.451005e-77,55.97,albizzi
3,9.201038e-76,54.66,guadagni
4,2.875135e-57,34.75,pazzi
5,5.883055000000001e-66,43.1,salviati
6,3.352282e-82,63.76,medici
7,2.4228979999999997e-78,58.15,tornabuon
8,3.442233e-73,51.38,bischeri
9,6.970735e-85,67.96,ridolfi


### Closeness trail dup

In [32]:
t_stats = []
p_vals = []

for n in g.nodes:
    t_stat, p_val = stats.ttest_rel(g.nodes[n]['closeness_geodesic_transf_list'], g.nodes[n]['closeness_trail_dup_list'])
    t_stats.append(round(t_stat,2))
    p_vals.append(p_val)
    
pd.DataFrame({
'Teste T': t_stats,
'P-Valor': p_vals,
'família': [g.nodes[n]['label'] for n in g.nodes]
})

Unnamed: 0,P-Valor,Teste T,família
0,2.238235e-92,81.15,ginori
1,6.548e-93,82.18,lambertes
2,6.244989e-110,122.57,albizzi
3,1.560967e-108,118.63,guadagni
4,9.304693e-95,85.84,pazzi
5,4.433867e-107,114.66,salviati
6,7.44841e-109,119.52,medici
7,4.069279e-110,123.11,tornabuon
8,6.539193e-98,92.45,bischeri
9,2.228598e-107,115.46,ridolfi


## Betweenness

In [40]:
pd.DataFrame({
'família': [g.nodes[n]['label'] for n in g.nodes],
'trail transf': [g.nodes[n]['betweenness_trail_transf'] for n in g.nodes],
'trail dup': [g.nodes[n]['betweenness_trail_dup'] for n in g.nodes],
'path transf': [g.nodes[n]['betweenness_path_transf'] for n in g.nodes],
'path dup': [g.nodes[n]['betweenness_path_dup'] for n in g.nodes],
'walk transf': [g.nodes[n]['betweenness_walk_transf'] for n in g.nodes],
'walk dup': [g.nodes[n]['betweenness_walk_dup'] for n in g.nodes],
'geodesic transf': [g.nodes[n]['betweenness_geodesic_transf'] for n in g.nodes],
'geodesic dup': [g.nodes[n]['betweenness_geodesic_dup'] for n in g.nodes],
'betweenness analítico': [cc[n] for n in g.nodes],
})

Unnamed: 0,betweenness analítico,família,geodesic dup,geodesic transf,path dup,path transf,trail dup,trail transf,walk dup,walk transf
0,0.333333,ginori,0.0,0.0,0.393242,0.0,0.371264,0.0,0.807363,0.747418
1,0.325581,lambertes,0.0,0.0,0.401319,0.0,0.392637,0.0,0.701209,0.753736
2,0.482759,albizzi,0.571319,0.208571,0.615604,0.229066,0.682802,0.26478,3.072253,2.41978
3,0.466667,guadagni,0.688077,0.254231,0.741978,0.407418,0.892033,0.405769,4.509945,3.283462
4,0.285714,pazzi,0.0,0.0,0.263846,0.0,0.268242,0.0,0.775659,0.699835
5,0.388889,salviati,0.406593,0.142857,0.441264,0.142857,0.424945,0.142857,1.843516,1.563022
6,0.56,medici,1.389286,0.522143,0.821154,0.629286,1.249396,0.700549,7.002692,4.974011
7,0.482759,tornabuon,0.243736,0.09,0.68011,0.335714,0.928407,0.317088,2.425824,2.473626
8,0.4,bischeri,0.312308,0.120495,0.653407,0.371429,0.780824,0.339011,2.751703,2.426648
9,0.482759,ridolfi,0.249945,0.091923,0.701209,0.366758,0.925879,0.332967,2.574725,2.488956


In [41]:
difs = ["transf","dup"]
tps = ["geodesic","walk","path","trail"]

for dif in difs:
    for tp in tps:
        values = []
        families = []
        for n in g.nodes:
            values.append(g.nodes[n]['betweenness_'+tp+"_"+dif])
            families.append(g.nodes[n]['label'])
        print("betweenness "+tp+" "+dif+":")
        print("maior valor: "+families[values.index(max(values))]+" - "+str(max(values))+"\n")

betweenness geodesic transf:
maior valor: medici - 0.5221428571428572

betweenness walk transf:
maior valor: medici - 4.9740109890109885

betweenness path transf:
maior valor: medici - 0.6292857142857148

betweenness trail transf:
maior valor: medici - 0.7005494505494508

betweenness geodesic dup:
maior valor: medici - 1.3892857142857138

betweenness walk dup:
maior valor: medici - 7.002692307692309

betweenness path dup:
maior valor: medici - 0.821153846153846

betweenness trail dup:
maior valor: medici - 1.2493956043956045



### betweenness geodesic dup

In [33]:
t_stats = []
p_vals = []

for n in g.nodes:
    t_stat, p_val = stats.ttest_rel(g.nodes[n]['betweenness_geodesic_transf_list'], g.nodes[n]['betweenness_geodesic_dup_list'])
    t_stats.append(round(t_stat,2))
    p_vals.append(p_val)
    
pd.DataFrame({
'Teste T': t_stats,
'P-Valor': p_vals,
'família': [g.nodes[n]['label'] for n in g.nodes]
})

Unnamed: 0,P-Valor,Teste T,família
0,,,ginori
1,,,lambertes
2,2.717004e-113,-132.6,albizzi
3,5.917208e-128,-186.75,guadagni
4,,,pazzi
5,0.0,-4.727235e+16,salviati
6,3.8406990000000003e-165,-444.01,medici
7,2.572495e-79,-59.52,tornabuon
8,1.478301e-111,-127.33,bischeri
9,8.586699e-92,-80.04,ridolfi


### betweenness walk transf

In [34]:
t_stats = []
p_vals = []

for n in g.nodes:
    t_stat, p_val = stats.ttest_rel(g.nodes[n]['betweenness_geodesic_transf_list'], g.nodes[n]['betweenness_walk_transf_list'])
    t_stats.append(round(t_stat,2))
    p_vals.append(p_val)
    
pd.DataFrame({
'Teste T': t_stats,
'P-Valor': p_vals,
'família': [g.nodes[n]['label'] for n in g.nodes]
})

Unnamed: 0,P-Valor,Teste T,família
0,7.637153e-84,-66.3,ginori
1,6.957532e-89,-74.72,lambertes
2,1.178703e-97,-91.9,albizzi
3,2.584576e-99,-95.55,guadagni
4,1.4877149999999999e-77,-57.06,pazzi
5,4.355775999999999e-87,-71.61,salviati
6,7.109151e-103,-103.89,medici
7,1.6753590000000001e-103,-105.43,tornabuon
8,2.45966e-96,-89.09,bischeri
9,1.258402e-99,-96.26,ridolfi


### betweenness walk dup

In [35]:
t_stats = []
p_vals = []

for n in g.nodes:
    t_stat, p_val = stats.ttest_rel(g.nodes[n]['betweenness_geodesic_transf_list'], g.nodes[n]['betweenness_walk_dup_list'])
    t_stats.append(round(t_stat,2))
    p_vals.append(p_val)
    
pd.DataFrame({
'Teste T': t_stats,
'P-Valor': p_vals,
'família': [g.nodes[n]['label'] for n in g.nodes]
})

Unnamed: 0,P-Valor,Teste T,família
0,1.849663e-94,-85.24,ginori
1,3.384301e-98,-93.08,lambertes
2,3.184409e-98,-93.14,albizzi
3,6.858130999999999e-100,-96.86,guadagni
4,3.316865e-89,-75.29,pazzi
5,1.579294e-92,-81.44,salviati
6,3.755357e-104,-107.05,medici
7,1.353943e-110,-124.49,tornabuon
8,9.52242e-102,-101.18,bischeri
9,1.0164370000000001e-101,-101.11,ridolfi


### betweenness path transf

In [36]:
t_stats = []
p_vals = []

for n in g.nodes:
    t_stat, p_val = stats.ttest_rel(g.nodes[n]['betweenness_geodesic_transf_list'], g.nodes[n]['betweenness_path_transf_list'])
    t_stats.append(round(t_stat,2))
    p_vals.append(p_val)
    
pd.DataFrame({
'Teste T': t_stats,
'P-Valor': p_vals,
'família': [g.nodes[n]['label'] for n in g.nodes]
})

Unnamed: 0,P-Valor,Teste T,família
0,,,ginori
1,,,lambertes
2,1.058792e-12,-8.17,albizzi
3,7.253069e-67,-44.07,guadagni
4,,,pazzi
5,,,salviati
6,4.290684e-62,-39.19,medici
7,3.9053010000000003e-84,-66.76,tornabuon
8,7.977563e-91,-78.23,bischeri
9,4.650043e-89,-75.03,ridolfi


### betweenness path dup

In [37]:
t_stats = []
p_vals = []

for n in g.nodes:
    t_stat, p_val = stats.ttest_rel(g.nodes[n]['betweenness_geodesic_transf_list'], g.nodes[n]['betweenness_path_dup_list'])
    t_stats.append(round(t_stat,2))
    p_vals.append(p_val)
    
pd.DataFrame({
'Teste T': t_stats,
'P-Valor': p_vals,
'família': [g.nodes[n]['label'] for n in g.nodes]
})

Unnamed: 0,P-Valor,Teste T,família
0,4.871943e-117,-144.74,ginori
1,4.491433e-121,-159.05,lambertes
2,9.626538e-117,-143.75,albizzi
3,8.192195e-131,-199.62,guadagni
4,9.234603e-108,-116.5,pazzi
5,5.3984640000000004e-105,-109.19,salviati
6,5.786557e-117,-144.49,medici
7,3.6410069999999995e-133,-210.87,tornabuon
8,4.140806e-131,-201.01,bischeri
9,2.836149e-132,-206.54,ridolfi


### betweenness trail transf

In [38]:
t_stats = []
p_vals = []

for n in g.nodes:
    t_stat, p_val = stats.ttest_rel(g.nodes[n]['betweenness_geodesic_transf_list'], g.nodes[n]['betweenness_trail_transf_list'])
    t_stats.append(round(t_stat,2))
    p_vals.append(p_val)
    
pd.DataFrame({
'Teste T': t_stats,
'P-Valor': p_vals,
'família': [g.nodes[n]['label'] for n in g.nodes]
})

Unnamed: 0,P-Valor,Teste T,família
0,,,ginori
1,,,lambertes
2,7.640657e-43,-23.86,albizzi
3,6.826038e-70,-47.44,guadagni
4,,,pazzi
5,,,salviati
6,3.631564e-70,-47.75,medici
7,1.761443e-83,-65.73,tornabuon
8,8.684953e-83,-64.66,bischeri
9,4.13376e-82,-63.62,ridolfi


### betweenness trail dup

In [39]:
t_stats = []
p_vals = []

for n in g.nodes:
    t_stat, p_val = stats.ttest_rel(g.nodes[n]['betweenness_geodesic_transf_list'], g.nodes[n]['betweenness_trail_dup_list'])
    t_stats.append(round(t_stat,2))
    p_vals.append(p_val)
    
pd.DataFrame({
'Teste T': t_stats,
'P-Valor': p_vals,
'família': [g.nodes[n]['label'] for n in g.nodes]
})

Unnamed: 0,P-Valor,Teste T,família
0,5.085038e-114,-134.88,ginori
1,2.311771e-117,-145.84,lambertes
2,8.210086000000001e-113,-131.12,albizzi
3,5.513032e-117,-144.56,guadagni
4,3.126116e-109,-120.58,pazzi
5,7.653959e-105,-108.8,salviati
6,4.474584e-119,-151.8,medici
7,7.070462e-126,-177.92,tornabuon
8,7.597695e-131,-199.77,bischeri
9,1.253373e-125,-176.89,ridolfi
