# **Questionário: Distância e Correlações**

### **1. QUESTÃO**

In [1]:
# Importando as bibliotecas necessárias
import networkx as nx

# Carregando o arquivo de arestas
with open("hamsterster.txt", "r") as file:
    edges = [tuple(map(int, line.strip().split())) for line in file if line.strip()]

# Criando o grafo
G = nx.Graph()
G.add_edges_from(edges)

# Obtendo o maior componente conectado
largest_cc = max(nx.connected_components(G), key=len)
subgraph = G.subgraph(largest_cc)

# Calculando a média dos menores caminhos e o diâmetro
average_shortest_path = nx.average_shortest_path_length(subgraph)
diameter = nx.diameter(subgraph)

# Exibindo os resultados
print(f"Média dos menores caminhos: {average_shortest_path:.2f}")
print(f"Diâmetro: {diameter}")

Média dos menores caminhos: 3.45
Diâmetro: 14


### **2. QUESTÃO**

In [2]:
# Importando as bibliotecas necessárias
import networkx as nx
import numpy as np

# Carregando o arquivo de arestas para a rede de aeroportos
with open("USairport500.txt", "r") as file:
    edges = [tuple(map(int, line.strip().split())) for line in file if line.strip()]

# Criando o grafo
G = nx.Graph()
G.add_edges_from(edges)

# Obtendo o maior componente conectado
largest_cc = max(nx.connected_components(G), key=len)
subgraph = G.subgraph(largest_cc)

# Calculando todos os menores caminhos entre pares
lengths = dict(nx.all_pairs_shortest_path_length(subgraph))

# Extraindo os comprimentos e armazenando numa lista
all_lengths = []
for source in lengths:
    for target in lengths[source]:
        if source != target:
            all_lengths.append(lengths[source][target])

# Calculando a média e variância
mean_length = np.mean(all_lengths)
var_length = np.var(all_lengths)

# Exibindo os resultados
print(f"Média dos menores caminhos: {mean_length:.2f}")
print(f"Variância dos menores caminhos: {var_length:.2f}")

Média dos menores caminhos: 2.99
Variância dos menores caminhos: 0.82


### **3. QUESTÃO**

In [3]:
# Importando as bibliotecas necessárias
import networkx as nx

# Carregando o arquivo de arestas para a rede Advogato
with open("advogato.txt", "r") as file:
    edges = [tuple(map(int, line.strip().split())) for line in file if line.strip()]

# Criando o grafo dirigido (Advogato é uma rede dirigida)
G = nx.DiGraph()
G.add_edges_from(edges)

# Obtendo o maior componente fortemente conectado
largest_scc = max(nx.strongly_connected_components(G), key=len)
subgraph = G.subgraph(largest_scc)

# Calculando o coeficiente de assortatividade por grau
assortativity = nx.degree_pearson_correlation_coefficient(subgraph)

# Exibindo o resultado
print(f"Coeficiente de assortatividade: {assortativity:.2f}")

Coeficiente de assortatividade: -0.07


### **4. QUESTÃO**

In [6]:
# Importando as bibliotecas necessárias
import networkx as nx
import math
from collections import Counter

# Carregando o arquivo de arestas para a rede USairport500
with open("USairport500.txt", "r") as file:
    edges = [tuple(map(int, line.strip().split())) for line in file if line.strip()]

# Criando o grafo
G = nx.Graph()
G.add_edges_from(edges)

# Obtendo o maior componente conectado
largest_cc = max(nx.connected_components(G), key=len)
subgraph = G.subgraph(largest_cc)

# Calculando todos os menores caminhos entre pares
lengths = dict(nx.all_pairs_shortest_path_length(subgraph))

# Extraindo os comprimentos e armazenando numa lista
all_lengths = []
for source in lengths:
    for target in lengths[source]:
        if source != target:
            all_lengths.append(lengths[source][target])

# Contando frequências e convertendo para distribuição de probabilidade
counts = Counter(all_lengths)
total = sum(counts.values())
probs = [count / total for count in counts.values()]

# Calculando entropia de Shannon com log base 2
entropy = -sum(p * math.log2(p) for p in probs)

# Exibindo o resultado
print(f"Entropia de Shannon: {entropy:.2f}")

Entropia de Shannon: 1.88


### **5. QUESTÃO**

In [30]:
# Importando as bibliotecas necessárias
import networkx as nx
from scipy.stats import pearsonr

# Carregando o arquivo de arestas
# Certifique-se de que o arquivo "word_adjacencies.txt" exista no mesmo diretório
try:
    with open("word_adjacencies.txt", "r") as file:
        edges = [tuple(map(int, line.strip().split())) for line in file if line.strip()]
except FileNotFoundError:
    print("Erro: O arquivo word_adjacencies.txt não foi encontrado. Verifique o nome e o local do arquivo.")
    exit()

# Criando o grafo
G = nx.Graph()
G.add_edges_from(edges)

# Obtendo o maior componente conectado
try:
    largest_cc = max(nx.connected_components(G), key=len)
    subgraph = G.subgraph(largest_cc).copy()
except ValueError:  # Handle cases where the graph might be empty or disconnected
    print("Erro: O grafo está vazio ou não possui componentes conectados.  Impossível calcular a correlação.")
    exit()


# Calculando o grau e o grau médio dos vizinhos
degree_dict = dict(subgraph.degree())
avg_neighbor_degree = nx.average_neighbor_degree(subgraph)

# Coletando os valores para o cálculo da correlação
graus = [degree_dict[node] for node in subgraph.nodes()]
medias_vizinhos = [avg_neighbor_degree[node] for node in subgraph.nodes()]

# Calculando o coeficiente de correlação de Pearson
if len(graus) > 1 and len(medias_vizinhos) > 1: # Ensure there are enough data points for correlation
    pearson_corr, _ = pearsonr(graus, medias_vizinhos)
    print(f"Coeficiente de correlação de Pearson: {pearson_corr:.2f}")
else:
    print("Erro: Não é possível calcular a correlação.  O grafo pode ter apenas um nó no componente conectado ou estar vazio.")

Coeficiente de correlação de Pearson: -0.16
