# Questionário 1 - Redes Complexas (SME0130)
---

Aluno: Rafael Fernando Gigante

N° USP: 12610500

**Questão 1** - Para a rede do livro "Os miseráveis" (base lesmis), calcule o terceiro e quarto momento do grau.

Em estatística, temos que o n-ésimo momento de uma amostra de $N$ valores $x_1, \dots, x_N$ é dado por
$$
<x^n> = \frac{x_1^n + \dots + x_N^n}{N} =\frac{1}{N} \sum\limits_{i=1}^{N} x_{i}^{n}.
$$

Portanto, para determinar o terceiro e quarto momento do grau, basta calcularmos
$$
<k^3>
$$
e
$$
<k^4>.
$$

In [8]:
from numpy  import *
import numpy as np
import math
import matplotlib.pyplot as plt
import networkx as nx

In [6]:
#Definindo uma função para calcular o n-ésimo momento de um grafo
def momento(G,n):
    M = 0 #momento
    N = len(G) #número de vértices
    for i in G.nodes:
        M += G.degree(i) ** n #soma do grau do vértice i elevado a n
    return M/N

#Lendo o arquivo contendo os dados da rede
G = nx.read_gml("data/lesmis.gml")

print('Terceiro momento de k:', momento(G,3))
print('Quarto momento de k:', momento(G,4))

Terceiro momento de k: 1408.025974025974
Quarto momento de k: 33592.72727272727


**Questão 2** - Implemente uma rotina para calcular a medida de complexidade. Qual o valor da complexidade para a rede de energia elétrica dos EUA (base powergrid).

A complexidade de uma rede é definida como
$$
\alpha = \frac{<k^2>}{<k>} = \frac{\sum\limits_{i=1}^N k_i^2}{\sum\limits_{i=1}^N k_i},
$$

onde o termo $1/N$ foi omitido por aparecer tanto no numerador quanto no denominador.

Assim, podemos reaproveitar o algoritmo utilizado para implementar uma nova função que retorne a complexidade.

In [7]:
def complexidade(G):
    M_1 = 0 #Média
    M_2 = 0 #Segundo momento
    for i in G.nodes:
        M_1 += G.degree(i)
        M_2 += G.degree(i)**2
    return M_2/M_1

G=nx.read_edgelist("data/powergrid.txt", nodetype=int)

print('Coeficiente de complexidade:', complexidade(G))

Coeficiente de complexidade: 3.8712465878070974


**Questão 3** - Implemente uma rotina para calcular a entropia de Shannon e calcule essa medida para a base de estradas da Europa (base euroroad).

A Entropia de Shannon é definida como:
$$
H(X) = - \sum\limits_{i} P(x_i) log_2P(x_i) ,
$$

onde $P(x_i)$ é a probabilidade de que $X=x_i$. No nosso caso, queremos saber a probabilidade de que algum vértice escolhido de forma aleatória tenha grau $k$, assim temos que $P(k) = N_k/N$, onde $N_k$ é o número de vértices de grau $k$.

In [37]:
def shannon(G):
    vk = dict(G.degree()) #transforma a rede em um dicionário
    vk = list(vk.values()) #transforma o dicionário em uma lista com o grau de cada vértice
    N = len(G) #número de vértices da lista
    H = 0
    for i in set(vk): #lista com os possíveis graus da rede 
        H = H - (vk.count(i)/N) * math.log((vk.count(i)/N),2)
    return H

G=nx.read_edgelist("data/euroroad.txt", nodetype=int)



print("Shannon Entropy = ", shannon(G))

Shannon Entropy =  2.0033103874527756


**Questão 4** - Calcule as medidas *transitivity* e *average clustering coefficient* para a base de dados aeroportos dos EUA (base USairports).

Para obtermos as medidas requeridas basta utilizarmos as funções da biblioteca Networkx. 

In [42]:
G=nx.read_edgelist("data/USairports.txt", nodetype=int)

tran = (nx.transitivity(G))
print("Transitivity = ",tran)

avc = nx.average_clustering(G)
print("Average clustering:", avc)

Transitivity =  0.38414344664491556
Average clustering: 0.5041525392095769


**Questão 5** - Calcule o coeficiente de complexidade e a entropia de Shannon para a rede de aeroportos dos EUA (base USairport).

Para obtermos essas medidas, basta reutilizarmos as funções criadas para as outras questões.

In [43]:
G=nx.read_edgelist("data/USairports.txt", nodetype=int)

print('Coeficiente de complexidade:', complexidade(G))
print("Shannon Entropy = ", shannon(G))

Coeficiente de complexidade: 112.22224803950044
Shannon Entropy =  4.985977646539227
