# Respostas Questionário II - SME0130

**Aluno:** Luiz Fernando Rabelo (11796893)

### Bibliotecas Utilizadas

Para a resolução do questionário, foram utilizadas as bibliotecas _numpy_ e _networkx_, as quais são importadas abaixo:


In [None]:
import numpy as np
import networkx as nx

### Questão 01

In [None]:
# Leitura da rede a partir de arquivo:
G = nx.read_edgelist('data/hamsterster.txt')

# Seleção do maior componente conectado:
G = G.subgraph(sorted(nx.connected_components(G), key=len, reverse=True)[0])

# Transformação dos labels de strings para inteiros:
G = nx.convert_node_labels_to_integers(G)

# Cálculo da média do comprimento dos menores caminhos:
print('Média comprimento dos menores caminhos =', nx.average_shortest_path_length(G))

# Cálculo do diâmetro da rede (menor caminho mais longo):
print('Diâmetro da rede =', nx.diameter(G))

### Questão 02

In [None]:
# Função que calcula a variância dos comprimentos dos menores caminhos:
def evaluate_variance(spl, average):
    s, n = 0, 0
    for _, lengths in spl:
        for l in lengths.values():
            if l > 0:
                s += (l - average) ** 2
                n += 1
    return s / n

# Leitura da rede a partir de arquivo:
G = nx.read_edgelist('data/USairport500.txt')

# Transformação dos labels de strings para inteiros:
G = nx.convert_node_labels_to_integers(G)

# Cálculo da média do comprimento dos menores caminhos:
average = nx.average_shortest_path_length(G)
print('Média comprimento dos menores caminhos =', average)

# Cálculo da variância do comprimento dos menores caminhos:
spl = nx.shortest_path_length(G)
print('Variância comprimento dos menores caminhos =', evaluate_variance(spl, average))

### Questão 03

In [None]:
# Leitura da rede a partir de arquivo:
G = nx.read_edgelist('data/advogato.txt')

# Seleção do maior componente conectado:
G = G.subgraph(sorted(nx.connected_components(G), key=len, reverse=True)[0])

# Transformação dos labels de strings para inteiros:
G = nx.convert_node_labels_to_integers(G)

# Cálculo do coeficiente de assortatividade:
print('Coeficiente de assortatividade =', nx.degree_assortativity_coefficient(G))

### Questão 04



In [None]:
# Função que determina a distribuição do comprimento:
def build_path_length_distribution(G):
    lengths = np.array([l for _,lengths in nx.shortest_path_length(G) for l in lengths.values() if l > 0])
    max_length = np.max(lengths)
    occurrences = np.zeros(max_length + 1)
    for length in lengths:
        occurrences[length] += 1
    return occurrences / sum(occurrences)  # normalized

# Função que calcula a entropia de Sannon:
def evaluate_shannon_entropy(G):
    ps = build_path_length_distribution(G)
    entropy = 0
    for p in ps:
        if p > 0:
            entropy -= p * np.math.log2(p)
    return entropy

# Leitura da rede a partir de arquivo:
G = nx.read_edgelist('data/USairport500.txt')

# Seleção do maior componente conectado:
G = G.subgraph(sorted(nx.connected_components(G), key=len, reverse=True)[0])

# Transformação dos labels de strings para inteiros:
G = nx.convert_node_labels_to_integers(G)

# Cálculo da Entropia de Shannon para os menores caminhos:
print('Entropia de Shannon =', evaluate_shannon_entropy(G))

### Questão 05

In [None]:
# Função que calcula a lista dos graus médios da vizinhança:
def evaluate_neighborhood_average_degrees(G):
    neighborhood_avg_degrees = []
    for node in G.nodes():
        neighborhood_avg_degrees.append(float(nx.average_neighbor_degree(G, nodes=[node])[node]))
    return np.array(neighborhood_avg_degrees)
    
# Definição de função para cálculo do coeficiente de Pearson entre o grau dos vizinhos e do nó:
def evaluate_pearson_correlation(G):
    degrees = list(dict(G.degree()).values())
    neighborhood_avg_degrees = evaluate_neighborhood_average_degrees(G)
    degrees_with_neighborhood = []
    average_clusterings = []
    for degree in np.arange(np.min(degrees), np.max(degrees) + 1):
        current_degree = degrees == degree
        if len(neighborhood_avg_degrees[current_degree]) > 0:
            degrees_with_neighborhood.append(degree)
            average_clusterings.append(np.mean(neighborhood_avg_degrees[current_degree]))
    return np.corrcoef(degrees_with_neighborhood, average_clusterings)[0,1]

# Leitura da rede a partir de arquivo:
G = nx.read_edgelist('data/word_adjacencies.txt')

# Seleção do maior componente conectado:
G = G.subgraph(sorted(nx.connected_components(G), key=len, reverse=True)[0])

# Transformação dos labels de strings para inteiros:
G = nx.convert_node_labels_to_integers(G)

print('Coeficiente de correlação de Pearson: ', evaluate_pearson_correlation(G))