# Funções auxiliares e imports

## Imports

In [54]:
from numpy  import *
import numpy as np
import matplotlib.pyplot as plt
import networkx as nx
import math

## Lendo e plotando o grafo dos dados

### Base Lesmis

In [55]:
# Base de dados para a questão 1
lesmis = nx.read_gml("lesmis.gml")

# plt.figure(figsize=(12,10))
# pos = nx.spring_layout(lesmis)
# nx.draw(lesmis, pos, node_color="lightgray", node_size=500, with_labels=True)

### Base Powergrid

In [56]:
# Base de dados para a questão 2
powergrid = nx.read_edgelist("powergrid.txt")

# plt.figure(figsize=(12,10))
# pos = nx.spring_layout(powergrid)
# nx.draw(powergrid, pos, node_color="lightgray", node_size=50, with_labels=True)

### Base Euroroad

In [57]:
# Base de dados para a questão 3
euroroad = nx.read_edgelist("euroroad.txt")

# plt.figure(figsize=(12,10))
# pos = nx.spring_layout(euroroad)
# nx.draw(euroroad, pos, node_color="lightgray", node_size=500, with_labels=True)

### Base Usairport

In [58]:
# Base de dados para as questões 4 e 5
usairport = nx.read_weighted_edgelist("usairport.txt")

# plt.figure(figsize=(12,10))
# pos = nx.spring_layout(usairport)
# nx.draw(usairport, pos, node_color="lightgray", node_size=500, with_labels=True)

## Padronização da Rede

In [59]:
# Função que "padroniza" a rede, transformando-a em uma rede sem direção, e retornando o maior componente conectado para a análise.
def padronizar_rede(G):
    # Transformamos o grafo em uma rede sem direção.
    G = G.to_undirected()
    G.remove_edges_from(nx.selfloop_edges(G))

    # Vamos selecionar apenas o maior componente conectado.
    Gcc = sorted(nx.connected_components(G), key=len, reverse=True)
    G = G.subgraph(Gcc[0])

    # Transformando os labels para números inteiros, começando com 0:

    G = nx.convert_node_labels_to_integers(G, first_label=0)

    # Número de vértices e arestas:

    N = len(G)
    M = G.number_of_edges()
    print('Number of nodes:', N)
    print('Number of edges:', M)
    return G



## Cálculo do Grau Médio

In [60]:
# Função para calcular o grau médio do grafo.
def mean_degree(G):
    vk = dict(G.degree()).values()
    vk = np.array(list(vk))
    print('Degree', vk)



    md = mean(vk)
    # print('Mean degree: ', md)
    return md



## Cálculo da Distribuição do Grau

In [61]:
# Função para calcular a distribuição do grau do grafo.
def degree_distribution(G):
    vk = dict(G.degree())
    vk = list(vk.values())  # we get only the degree values
    vk = np.array(vk)
    maxk = np.max(vk)
    mink = np.min(vk)
    kvalues= np.arange(0,maxk+1) # possible values of k
    Pk = np.zeros(maxk+1) # P(k)
    for k in vk:
        Pk[k] = Pk[k] + 1
    Pk = Pk/sum(Pk) # the sum of the elements of P(k) must to be equal to one
    return kvalues,Pk

# Função para calcular o momento da distribuição do grau do grafo.
def momment_of_degree_distribution(G,m):
    k,Pk = degree_distribution(G)
    M = sum((k**m)*Pk)
    return M

# Função para calcular a variância do grau.
def variance(G):
    variance = momment_of_degree_distribution(G,2) - momment_of_degree_distribution(G,1)**2
    return variance
# print("Variância do grau = ", variance)

## Cálculo do Momento do Grau

In [62]:
# Função para calcular o momento do grafo.
def momment(G,m):
    M = 0
    N = len(G)
    for i in G.nodes:
        M = M + G.degree(i)**m
    M = M/N
    return M

## Cálculo da Entropia de Shannon

In [64]:
# Função para calcular a entropia de Shannon do grafo.
def shannon_entropy(G):
    k,Pk = degree_distribution(G)
    H = 0
    for p in Pk:
        if(p > 0):
            H = H - p*math.log(p, 2)
    return H

# Função para calcular a entropia de Shannon normalizada do grafo.
def normalized_shannon_entropy(G):
    k,Pk = degree_distribution(G)
    H = 0
    for p in Pk:
        if(p > 0):
            H = H - p*math.log(p, 2)
    return H/math.log(len(G),2)

## Cálculo da Transitividade e do Coeficiente de Agrupamento

In [65]:
# Função para calcular o coeficiente de transitividade do grafo.
def graph_transitivity(G):
    CC = (nx.transitivity(G))
    # print("Transitivity = ","%3.4f"%CC)
    return "%3.4f"%CC

# Função para calcular o coeficiente de agrupamento do grafo.
def avg_clustering_coefficient(G):
    avc = nx.average_clustering(G)
    # print("Average clustering:", "%3.4f"%avc)
    return "%3.4f"%avc

# Questões

## Questão 1)

Para a rede do livro "Os miseráveis" (base lesmis), calcule o terceiro e quarto momento do grau. Considere o maior componente conectado.

In [66]:
lesmis = padronizar_rede(lesmis)

terceiro_momento = momment(lesmis, 3)
quarto_momento = momment(lesmis, 4)

print(
    f"Terceiro momento do grau da rede lesmis.gml: {terceiro_momento}\n"
    f"Quarto momento do grau da rede lesmis.gml: {quarto_momento}\n"
)

Number of nodes: 77
Number of edges: 254
Terceiro momento do grau da rede lesmis.gml: 1408.025974025974
Quarto momento do grau da rede lesmis.gml: 33592.72727272727



## Questão 2)

Implemente uma rotina para calcular a medida de complexidade. Qual o valor da complexidade para a rede de energia elétrica dos EUA (Base powergrid).

In [73]:
powergrid = padronizar_rede(powergrid)

k2 = momment(powergrid, 2)
k1 = momment(powergrid, 1)

alpha = k2 / k1

print(
    f"Coeficiente de Complexididade da rede usairport.txt: {alpha}\n"
)

Number of nodes: 4941
Number of edges: 6594
Coeficiente de Complexididade da rede usairport.txt: 3.8712465878070974



## Questão 3)

Implemente uma rotina para calcular a entropia de Shannon e calcule essa medida para a base de estradas da Europa (base euroroad).

In [68]:
euroroad = padronizar_rede(euroroad)

shannon = shannon_entropy(euroroad)
n_shannon = normalized_shannon_entropy(euroroad)

print(
    f"Entropia de Shannon da rede euroroad.txt: {shannon}\n"
    f"Entropia de Shannon normalizada da rede euroroad.txt: {n_shannon}"
)

Number of nodes: 1039
Number of edges: 1305
Entropia de Shannon da rede euroroad.txt: 2.0036762578444716
Entropia de Shannon normalizada da rede euroroad.txt: 0.19994813581710177


## Questão 4)

Calcule as medidas transitivity e average clustering coefficient para a base de dados de aeroportos do EUA (base usairport.txt).

In [69]:
usairport = padronizar_rede(usairport)

transitividade = graph_transitivity(usairport)

acc = avg_clustering_coefficient(usairport)

print(
    f"Transitividade da rede usairport.txt: {transitividade}\n"
    f"Coeficiente de Agrupamento Médio da rede usairport.txt: {acc}"
)

Number of nodes: 1572
Number of edges: 17214
Transitividade da rede usairport.txt: 0.3841
Coeficiente de Agrupamento Médio da rede usairport.txt: 0.5048


## Questão 5)

Calcule o coeficiente de complexidade e a entropia de Shannon para a rede de aeroportos dos EUA (base usairport.txt).

In [70]:
k2 = momment(usairport, 2)
k1 = momment(usairport, 1)

alpha = k2 / k1

shannon = shannon_entropy(usairport)

print(
    f"Coeficiente de Complexididade da rede usairport.txt: {alpha}\n"
    f"Entropia de Shannon da rede usairport.txt: {shannon}"
)


Coeficiente de Complexididade da rede usairport.txt: 112.22870919019402
Entropia de Shannon da rede usairport.txt: 4.989437976520321
