In [76]:
from statistics import mean, variance
from matplotlib import pyplot as plt
import networkx as nx
import numpy as np
import math

In [77]:
def read_file(fileName):
  self = nx.read_edgelist(f'drive/MyDrive/DataComplexNetworks/{fileName}.txt', nodetype=int, data=(('weight', float),))
  self = self.to_undirected()
  self.remove_edges_from(nx.selfloop_edges(self))
  Gcc = sorted(nx.connected_components(self), key=len, reverse=True)
  self = self.subgraph(Gcc[0])
  self = nx.convert_node_labels_to_integers(self, first_label=0)
  return self
  

**Exercicio 1:**

Para a rede social Hamsterster, calcule a média dos menores caminhos e o diâmetro. Considere apenas o maior componente.

In [78]:
ex1 = read_file('hamsterster')
print('A média dos menores caminhos é: {:.2f}'.format(nx.average_shortest_path_length(ex1)))
print('O diâmetro é: {:.3f}'.format(nx.diameter(ex1)))

A média dos menores caminhos é: 3.45
O diâmetro é: 14.000


**Exercicio 2:**

**Para** a rede de aeroportos (base USairport500), calcule a média e variância do comprimento dos menores caminhos. Considere apenas o maior componente na rede.

In [79]:
def distances(self):
    N = len(self)
    vl = []
    for i in np.arange(0, N):
        for j in np.arange(i+1, N):
            if(i != j):
                aux = nx.shortest_path(self,i,j)
                vl.append(len(aux)-1)
    return vl

In [80]:
def variance_small_path(self):
  return variance(distances(self))

In [81]:
ex2 = read_file('USairport500')
print('A média do comprimento dos menores caminhos é: {:.2f}'.format(nx.average_shortest_path_length(ex2)))
print('O diâmetro é: {:.3f}'.format(variance_small_path(ex2)))

A média do comprimento dos menores caminhos é: 2.99
O diâmetro é: 0.818


**Exercicio 3:**

Calcule o coeficiente de assortatividade para a rede Advogato. Considere apenas o maior componente.

In [82]:
ex3 = read_file('advogato')
print('O coeficiente é: {:.3f}'.format(nx.degree_assortativity_coefficient(ex3)))

O coeficiente é: -0.096


**Exercicio 4:**

Calcule o coeficiente de assortatividade para a rede Advogato. Considere apenas o maior componente.

In [83]:
def degree_distribution(self):
  vk = np.array(distances(self))
  maxk = np.max(vk)
  kvalues = np.arange(0,maxk+1)
  Pk = np.zeros(maxk+1)
  for k in vk:
      Pk[k] = Pk[k] + 1
  Pk = Pk/sum(Pk)
  return kvalues, Pk

In [84]:
def shannon_entropy(G):
    k,Pk = degree_distribution(G)
    H = 0
    for p in Pk:
        if(p > 0):
            H = H - p*math.log(p, 2)
    return H

In [85]:
ex4 = read_file('USairport500')
print('A entropia de Shannon é: {:.3f}'.format(shannon_entropy(ex4)))

A entropia de Shannon é: 1.884


**Exercicio 5:**

Calcule o coeficiente de correlação de Pearson entre o grau médio dos vizinhos e o grau para a rede de palavras (word_adjacencies). Considere apenas o maior componente conectado.

In [86]:
def pearson_correlation(self):
  knn = []
  for i in self.nodes():
      aux =  nx.average_neighbor_degree(self, nodes = [i])
      knn.append(float(aux[i]))
  knn = np.array(knn)
  vk = dict(self.degree())
  vk = list(vk.values())
  knnk = list()
  ks = list()
  for k in np.arange(np.min(vk), np.max(vk)+1):
      aux = vk == k
      if(len(knn[aux]) > 0):
          av_knn = mean(knn[aux])
          knnk.append(av_knn)
          ks.append(k)
  return np.corrcoef(ks, knnk)[0,1]

In [87]:
ex5 = read_file('word_adjacencies')
print('A correlação de Pearson é: {:.3f}'.format(pearson_correlation(ex5)))


A correlação de Pearson é: -0.711
