# **Questionário: Distância e Correlações**

### **1. QUESTÃO**

In [1]:
# Importando as bibliotecas necessárias
import networkx as nx

# Carregando o arquivo de arestas
with open("hamsterster.txt", "r") as file:
    edges = [tuple(map(int, line.strip().split())) for line in file if line.strip()]

# Criando o grafo
G = nx.Graph()
G.add_edges_from(edges)

# Obtendo o maior componente conectado
largest_cc = max(nx.connected_components(G), key=len)
subgraph = G.subgraph(largest_cc)

# Calculando a média dos menores caminhos e o diâmetro
average_shortest_path = nx.average_shortest_path_length(subgraph)
diameter = nx.diameter(subgraph)

# Exibindo os resultados
print(f"Média dos menores caminhos: {average_shortest_path:.2f}")
print(f"Diâmetro: {diameter}")

Média dos menores caminhos: 3.45
Diâmetro: 14


### **2. QUESTÃO**

In [2]:
# Importando as bibliotecas necessárias
import networkx as nx
import numpy as np

# Carregando o arquivo de arestas para a rede de aeroportos
with open("USairport500.txt", "r") as file:
    edges = [tuple(map(int, line.strip().split())) for line in file if line.strip()]

# Criando o grafo
G = nx.Graph()
G.add_edges_from(edges)

# Obtendo o maior componente conectado
largest_cc = max(nx.connected_components(G), key=len)
subgraph = G.subgraph(largest_cc)

# Calculando todos os menores caminhos entre pares
lengths = dict(nx.all_pairs_shortest_path_length(subgraph))

# Extraindo os comprimentos e armazenando numa lista
all_lengths = []
for source in lengths:
    for target in lengths[source]:
        if source != target:
            all_lengths.append(lengths[source][target])

# Calculando a média e variância
mean_length = np.mean(all_lengths)
var_length = np.var(all_lengths)

# Exibindo os resultados
print(f"Média dos menores caminhos: {mean_length:.2f}")
print(f"Variância dos menores caminhos: {var_length:.2f}")

Média dos menores caminhos: 2.99
Variância dos menores caminhos: 0.82


### **3. QUESTÃO**

In [3]:
# Importando as bibliotecas necessárias
import networkx as nx

# Carregando o arquivo de arestas para a rede Advogato
with open("advogato.txt", "r") as file:
    edges = [tuple(map(int, line.strip().split())) for line in file if line.strip()]

# Criando o grafo dirigido (Advogato é uma rede dirigida)
G = nx.DiGraph()
G.add_edges_from(edges)

# Obtendo o maior componente fortemente conectado
largest_scc = max(nx.strongly_connected_components(G), key=len)
subgraph = G.subgraph(largest_scc)

# Calculando o coeficiente de assortatividade por grau
assortativity = nx.degree_pearson_correlation_coefficient(subgraph)

# Exibindo o resultado
print(f"Coeficiente de assortatividade: {assortativity:.2f}")

Coeficiente de assortatividade: -0.07


### **4. QUESTÃO**

In [6]:
# Importando as bibliotecas necessárias
import networkx as nx
import math
from collections import Counter

# Carregando o arquivo de arestas para a rede USairport500
with open("USairport500.txt", "r") as file:
    edges = [tuple(map(int, line.strip().split())) for line in file if line.strip()]

# Criando o grafo
G = nx.Graph()
G.add_edges_from(edges)

# Obtendo o maior componente conectado
largest_cc = max(nx.connected_components(G), key=len)
subgraph = G.subgraph(largest_cc)

# Calculando todos os menores caminhos entre pares
lengths = dict(nx.all_pairs_shortest_path_length(subgraph))

# Extraindo os comprimentos e armazenando numa lista
all_lengths = []
for source in lengths:
    for target in lengths[source]:
        if source != target:
            all_lengths.append(lengths[source][target])

# Contando frequências e convertendo para distribuição de probabilidade
counts = Counter(all_lengths)
total = sum(counts.values())
probs = [count / total for count in counts.values()]

# Calculando entropia de Shannon com log base 2
entropy = -sum(p * math.log2(p) for p in probs)

# Exibindo o resultado
print(f"Entropia de Shannon: {entropy:.2f}")

Entropia de Shannon: 1.88


### **5. QUESTÃO**

In [1]:
import networkx as nx
from scipy.stats import pearsonr

# Carregando o arquivo de arestas
try:
    with open("word_adjacencies.txt", "r") as file:
        edges = [tuple(map(int, line.strip().split())) for line in file if line.strip()]
except FileNotFoundError:
    print("Erro: O arquivo word_adjacencies.txt não foi encontrado.")
    exit()

# Criando o grafo e extraindo o maior componente
G = nx.Graph()
G.add_edges_from(edges)
largest_cc = max(nx.connected_components(G), key=len)
subgraph = G.subgraph(largest_cc).copy()

# Dicionários de grau e grau médio dos vizinhos
degree_dict = dict(subgraph.degree())
avg_nei_deg = nx.average_neighbor_degree(subgraph)

# Agrupa por grau k e calcula a média de <k_nn> para cada k
from collections import defaultdict
grouped = defaultdict(list)
for node, k in degree_dict.items():
    grouped[k].append(avg_nei_deg[node])

# Cria as listas (ordenadas por k)
ks = sorted(grouped.keys())
mean_knn = [sum(grouped[k]) / len(grouped[k]) for k in ks]

# Calcula o coeficiente de Pearson entre ks e mean_knn
corr, pval = pearsonr(ks, mean_knn)
print(f"Coeficiente de correlação de Pearson: {corr:.2f}")


Coeficiente de correlação de Pearson: -0.71
