# Trabajo práctico 1
### Ejercicio 4

Queremos cuantificar la __asortatividad__ de las redes _netscience_ y _as-22july06_ (de acá en adelante _july_). Para ello, exploraremos el _coeficiente de correlación ($r$)_ y la distribución del _promedio del grado de los primeros vecinos ($K_{nn}$)_

In [16]:
import numpy as np
import networkx as nx
from matplotlib import pyplot as plt
from scipy import optimize
from func4 import *
%matplotlib notebook


## Load data

netscience = nx.read_gml('c:/users/noelp/Documents/Git'+
           '/Redes-TP1/tc01_data/netscience.gml')
july = nx.read_gml('c:/users/noelp/Documents/Git'+
           '/Redes-TP1/tc01_data/as-22july06.gml')

#### Nearest neighbor degree $K_{nn}$
Definimos la función _nearest_nei(graph)_, que recorre la red buscando nodos con un dado grado (hasta el grado máximo de la red) y calcula el grado medio de sus vecinos. Finalmente devuelve el promedio de la cantidad anterior calculada para los nodos con un cierto grado en comun, y los grados hallados en la red.

In [6]:
def nearest_nei(graph):
    k_vecinos = []                      #Grado medio de los vecinos para un k
    k = []                              #Grados de los nodos
    deg = 1                             #Grado de los nodos que recorro
    while deg <= max(degrees(graph, node='All')):
        
        mismo_k = 0                     #Grado medio acumulado para un k
        m = 0                           #Número de nodos con ese k
        
        for n in list(graph.nodes()):
            
            if degrees(graph, node=n) == deg:
                deg_n = 0               #Grado medio acumulado para un nodo
                ed = list(graph.neighbors(n))  #Lista de vecinos de un nodo
                
                for i in ed:
                    deg_n += degrees(graph, node=i)
                    
                deg_n =deg_n/deg        #Valor medio del grado para un nodo
                mismo_k += deg_n        #Suma ese valor medio al grado acumulado para un k
                m+=1                    #Cuenta el nodo como perteneciente a cierto k
                
        #Recorre la lista de nodos, si hay nodos con ese grado, los appendea.
        if m != 0:
            k_vecinos.append(mismo_k/m)
            k.append(deg)           #Guardo el grado de los nodos
                
        #Cambia de grado
        deg += 1
    return k_vecinos, k


knn_net, k_net = nearest_nei(netscience)
knn_july, k_july = nearest_nei(july)

Después encontramos que esta función ya estaba definida (dos veces) en la librería networkx.  
La cantidad $k_{nn}$, está modelada en función del grado $k$ como una ley de potencias:
$k_{nn}(k) = Ce^{k^{ \mu}}$. Los siguientes gráficos presenta la cantidad $k_{nn}$ para ambas redes, con el correspondiente ajuste. 

In [71]:
##### Funciones definidas para el ajuste #####

fitfunc = lambda p,x: p[0]*x+p[1]
powerlaw = lambda x, C, a: C*(x**a)

def powerlaw_fit(Xdata,Ydata, p0 = [-2,2]):
        
    # Datos que se van a fittear
    x = np.log10(np.array(Xdata))
    y = np.log10(np.array(Ydata))
    
    # Distancia a la función objetivo
    errfunc = lambda p,x,y: fitfunc(p,x)-y 
    
    # Ajuste con scipy
    out = optimize.leastsq(errfunc, p0, args=(x,y), full_output = 1)
    p = out[0]; covar = out[1]

    # Parámetros de la power-law
    C = 10.0**p[1]
    a = p[0]
    a_err = np.sqrt(covar[0][0])
    
    return C, a, a_err

#Calculamos los parámetros del ajuste para nuestras redes

C_net, a_net, a_err_net = powerlaw_fit(k_net[:9], knn_net[:9], p0 = [-2,2])
C_july, a_july, a_err_july = powerlaw_fit(k_july, knn_july, p0 = [-2,2])

#Valores sobre los que voy a aplicar el ajuste
ejex_net = np.linspace(k_net[0],k_net[-1],num=50)
ejex_july = np.linspace(k_july[0],k_july[-1],num=50)


In [72]:
plt.figure(1)
plt.title(r'Netscience: $\gamma= %5.2f \pm %5.2f$' %(-a_net, a_err_net),loc='right',fontsize=11)
plt.loglog(k_net[8],knn_net[8],marker='d',color='c',markersize=7,label=r'$K_{max}$')
plt.loglog(k_net,knn_net,'.',markersize=7,label='$K_{nn}$')
plt.loglog(ejex_net,powerlaw(ejex_net,C_net,a_net),'k--',linewidth=1,label='Ajuste')
plt.legend()
plt.grid(linestyle=':')
plt.show(1)

plt.figure(2)
plt.title(r'$July: \gamma= %5.2f \pm %5.2f$' %(-a_july, a_err_july),loc='right',fontsize=11)
plt.loglog(k_july,knn_july,'.',markersize=7,label='$K_{nn}$')
plt.loglog(ejex_july,powerlaw(ejex_july,C_july,a_july),'k--',linewidth=1,label='Ajuste')
plt.legend()
plt.grid(linestyle=':')
plt.show(2)



<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

### Coeficiente de correlación
Siguiendo las ecuaciones 8.26 - 8.29 del libro 'Networks, an introduction. M.E.J. Newman', escribimos la función _asort_Newman(graph)_

In [27]:
def asort_Newman(graph):
    S1 = np.sum([ degrees(graph, node='All') ])
    S2 = np.sum([i**2 for i in degrees(graph, node='All')])
    S3 = np.sum([i**3 for i in degrees(graph, node='All')])
    Se = 0
    for n in list(graph.nodes()):
        kn = degrees(graph,node=n)
        ed = list(graph.neighbors(n))
        deg_ed = np.sum([degrees(graph, node=i)*kn for i in ed])
        Se += deg_ed
    Se = Se/2
    r = (S1*Se-S2**2)/(S1*S3-S2**2)
    return r

r_net = asort_Newman(netscience)
r_july = asort_Newman(july)


  if sys.path[0] == '':


Netscience: r=-0.47627213766607884.
July:       r=0.010567792478101306.


In [73]:
import pandas as pd

r = [r_net,r_july]
a = [-a_net, -a_july]

caract = pd.DataFrame({ 'Red':['Netscience','July'], 
                        '$r$':r,
                        '$mu$':a,
                      })

caract = caract[['Red','$r$','$mu$']]

display(caract)

Unnamed: 0,Red,$r$,$mu$
0,Netscience,-0.476272,-0.532403
1,July,0.010568,0.444174


El estadístico $r$ toma valores del rango (-1,1), donde para valores negativos las redes son no asortativas. Por lo tanto, este estadístico predice que la red _Netscience_ es no asortativa, coincidiendo con el estadístico proveniente del valor medio del grado