# Lets Create Some Random Graphs

In [71]:
# -*- coding: utf-8 -*-
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
from scipy import stats
import random

In [97]:
'''
Idea: generar un grafo completo. Recorrerlo usando DFS desde un nodo elegido al azar.
Para cada arista que no sea puente, tomar una muestra de una variable aleatoria y eliminar
la arista si la variable supera cierto umbral. A grandes rasgos, el procedimiento consiste
en eliminar cierto porcentaje esperado de backedges.
'''

def sacarBackedges(n, grafo, p_backedge=0.5):
    # Elimina cada backedge de un grafo con una probabilidad 1.0 - p_backedge.
    vecinosYPesos = [ [] for i in range(n) ]

    for e in grafo:
        vecinosYPesos[e[0] - 1].append([ e[1], e[2] ])
        vecinosYPesos[e[1] - 1].append([ e[0], e[2] ])

    color = dict([ (i+1, "blanco") for i in range(n) ])
    backedges = backedgesDFS(vecinosYPesos, color, 1, -1, [])

    for b in backedges:
        p = np.random.uniform()
        if p >= p_backedge:
            grafo.remove(b)
    

def backedgesDFS(vecinosYPesos, color, v, padre, res):
    color[v] = "gris"

    for t in vecinosYPesos[v-1]:
        w = t[0]
        if color[w] == "blanco":
            backedgesDFS(vecinosYPesos, color, w, v, res)
        if color[w] == "gris" and w != v and w != padre:
            l, r = min(v,w), max(v,w)
            res.append([l, r, t[1]])

    color[v] = "negro"

    return res

def generarGrafoAleatorioPesosNormales(n, mu=5, sigma=1, p_backedge=0.5):
    # Genera un grafo completo representado por una lista de aristas.
    # El nodo de menor índice aparece antes, pero los pares no son ordenados
    # (es decir, el grafo no es dirigido).
    grafo = []
    pesoActual = 0
    for i in range(1, n):
        for j in range(i+1, n+1):
            grafo.append( [i, j, int(max(np.random.normal(mu, sigma), 0))] )
            pesoActual += 1

    sacarBackedges(n, grafo, p_backedge)

    grafoStr = [ " ".join( str(k) for k in e ) for e in grafo ]

    return grafoStr

def generarArbol(n, h):
    assert(n>=h)
    # Genera un árbol de n vértices con ramas de altura h.
    r = (n-1) // h # Cantidad de ramas de altura exactamente h
    arbol = [ [ 1, 2 + h*i, 1 ] for i in range(r+1) ]
    
    # Agrega las ramas de altura h
    for i in range(r):
        for j in range(2, h+1):
            arbol.append([ j + i*h, j + i*h + 1, 1 ])
            
    for i in range((n-1) % h - 1):
        arbol.append([ i + 2 + h*r, i + 3 + h*r, 1 ])
        
    arbolStr = [ " ".join( str(k) for k in e ) for e in arbol ]
    
    return arbolStr

def generarEntradaPesosNormales(n, mu=5, sigma=1, p_backedge=0.5, archivo="output"):
    # Genera un caso de test con 50 grafos de 5 a n nodos. Los pesos están distribuidos
    # uniformemente según los parámetros especificados.
    with open(archivo, 'w') as entrada:
        for k in range(5,n+1):
            for i in range(50):
                grafo = generarGrafoAleatorioPesosNormales(k, mu, sigma, p_backedge)
                entrada.write(str(k) + " " + str(len(grafo)) + '\n')
                for j in grafo:
                    entrada.write(j + '\n')
        entrada.write("0 0\n")
        
def generarEntradaArboles(n, h, archivo="output"):
    with open(archivo, 'w') as entrada:
        for k in range(5,n+1):
            for i in range(50):
                grafo = generarArbol(k, min(h,k))
                entrada.write(str(k) + " " + str(len(grafo)) + '\n')
                for j in grafo:
                    entrada.write(j + '\n')
        entrada.write("0 0\n")

In [98]:
maxNumberOfNodes = 20

for p_backedges in np.arange(0,1.01,0.25):
    generarEntradaPesosNormales(maxNumberOfNodes,5,1,p_backedges,"./tests/normales_p_{0}.test-in".format(p_backedges))

maxHeight = maxNumberOfNodes // 2
for h in range(1, maxHeight+1):
    generarEntradaArboles(maxNumberOfNodes, 1, "./tests/arbol_altura_" + str(h) + ".test-in")

# Corremos el experimento

In [99]:
! make expe

*** Error in `./main': free(): invalid next size (fast): 0x0000000001576cc0 ***
make: *** [tests/arbol_altura_10.expe] Error 134


In [60]:
results ={}

for p_backedges in np.arange(0,1.01,0.25):
    results["dfNormal_{0}".format(p_backedges)] = pd.read_csv("./experimentacion/normales_p_{0}.stderr".format(p_backedges), delimiter=";")



In [61]:
results["dfNormal_1.0"].head()

Unnamed: 0,Cantidad de Nodos,Cantidad de Ejes,Tiempo generando Mst,Tiempo calculando raiz
0,5,10,1.2e-05,1e-05
1,5,10,9e-06,9e-06
2,5,10,8e-06,7e-06
3,5,10,7e-06,6e-06
4,5,10,1e-05,9e-06


In [62]:
for key, value in results.items():
    results[key] = value.groupby("Cantidad de Nodos").mean()
# dfNormal = dfNormal.groupby("Cantidad de Nodos").mean()
results["dfNormal_1.0"]

Unnamed: 0_level_0,Cantidad de Ejes,Tiempo generando Mst,Tiempo calculando raiz
Cantidad de Nodos,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
5,10,8e-06,7e-06
6,15,1e-05,7e-06
7,21,1.1e-05,7e-06
8,28,1.3e-05,8e-06
9,36,1.5e-05,8e-06
10,45,1.8e-05,9e-06
11,55,2.1e-05,9e-06
12,66,2.4e-05,9e-06
13,78,2.7e-05,9e-06
14,91,3.2e-05,1e-05


In [67]:
df = pd.DataFrame({'Arboles': results["dfNormal_0.0"]['Tiempo generando Mst'],
                  'P = 0.25': results["dfNormal_0.25"]['Tiempo generando Mst'],
                  'P = 0.5': results["dfNormal_0.5"]['Tiempo generando Mst'],
                  'P = 0.75': results["dfNormal_0.75"]['Tiempo generando Mst'],
                  'Completos': results["dfNormal_1.0"]['Tiempo generando Mst']})

ax = df.plot(logy=False)
ax.set_ylabel("Tiempos de ejecucion en Segundos")
ax.set_xlabel("Cantidad de nodos")

plt.title("Tiempos para encontrar el MST")
plt.show()

In [68]:
dfComp = pd.DataFrame()
dfComp['Cantidad de Nodos'] = results["dfNormal_1.0"].index.values
dfComp['Complejidad n**2'] = [100 + random.normalvariate(n**2,2) for n in results["dfNormal_0.0"].index.values]
dfComp['Complejidad n'] = [100 + random.normalvariate(n,0.3) for n in results["dfNormal_0.0"].index.values]

dfComp['Tiempo en segundos de completos'] =  results["dfNormal_1.0"]['Tiempo generando Mst']
dfComp['Tiempo en segundos de arboles'] =  results["dfNormal_0.0"]['Tiempo generando Mst']
plt.clf()
correlation = dfComp.corr()
correlation

Unnamed: 0,Cantidad de Nodos,Complejidad n**2,Complejidad n,Tiempo en segundos de completos,Tiempo en segundos de arboles
Cantidad de Nodos,1.0,0.97933,0.999679,0.979302,0.995855
Complejidad n**2,0.97933,1.0,0.981908,0.998729,0.974717
Complejidad n,0.999679,0.981908,1.0,0.981359,0.994857
Tiempo en segundos de completos,0.979302,0.998729,0.981359,1.0,0.964524
Tiempo en segundos de arboles,0.995855,0.974717,0.994857,0.964524,1.0


In [69]:
sns.jointplot(dfComp['Complejidad n**2'], dfComp['Tiempo en segundos de completos'], kind="reg")
sns.jointplot(dfComp['Complejidad n'], dfComp['Tiempo en segundos de arboles'], kind="reg")


plt.show()

In [18]:
dfRoot = pd.DataFrame({'Arboles': results["dfNormal_0.0"]['Tiempo calculando raiz'],
                  'P = 0.25': results["dfNormal_0.25"]['Tiempo calculando raiz'],
                  'P = 0.5': results["dfNormal_0.5"]['Tiempo calculando raiz'],
                  'P = 0.75': results["dfNormal_0.75"]['Tiempo calculando raiz'],
                  'Completos': results["dfNormal_1.0"]['Tiempo calculando raiz']})

ax = dfRoot.plot(logy=False)
ax.set_ylabel("Tiempos de ejecución en Segundos")
ax.set_xlabel("Cantidad de nodos")

plt.title("Tiempos para encontrar el MST")
plt.show()

In [22]:
dfComp = pd.DataFrame()
dfComp['Cantidad de Nodos'] = results["dfNormal_1.0"].index.values
dfComp['Complejidad n**2'] = [100 + random.normalvariate(n**2,2) for n in results["dfNormal_0.0"].index.values]
dfComp['Complejidad n'] = [100 + random.normalvariate(n,0.3) for n in results["dfNormal_0.0"].index.values]

dfComp['Tiempo de encontrar raiz en segundos de ex-completos'] =  results["dfNormal_1.0"]['Tiempo calculando raiz']
dfComp['Tiempo de encontrar raiz en segundos de arboles'] =  results["dfNormal_0.0"]['Tiempo calculando raiz']
plt.clf()
correlation = dfComp.corr()
correlation

Unnamed: 0,Cantidad de Nodos,Complejidad n**2,Complejidad n,Tiempo de encontrar raiz en segundos de ex-completos,Tiempo de encontrar raiz en segundos de arboles
Cantidad de Nodos,1.0,0.979354,0.999647,0.998468,0.992528
Complejidad n**2,0.979354,1.0,0.977952,0.982568,0.971845
Complejidad n,0.999647,0.977952,1.0,0.997868,0.992121
Tiempo de encontrar raiz en segundos de ex-completos,0.998468,0.982568,0.997868,1.0,0.99257
Tiempo de encontrar raiz en segundos de arboles,0.992528,0.971845,0.992121,0.99257,1.0


In [24]:
sns.jointplot(dfComp['Complejidad n'], dfComp['Tiempo de encontrar raiz en segundos de ex-completos'], kind="reg")
sns.jointplot(dfComp['Complejidad n'], dfComp['Tiempo de encontrar raiz en segundos de arboles'], kind="reg")

plt.show()