## Algoritmo de PageRank

Teniendo en cuenta que algunos no estan familiarizados con la programacion orientada a objetos les 
prepare un notebook para que puedan correr el algoritmo paso por paso


***Primero preparamos nuestras variables***

In [None]:
from __future__ import division, absolute_import
from pylab import *             # para graficar
from numpy.random import *      # para generar muestreos aleatorios
seed(randint(100)) # genera un numero aleatorio y escribelo como semilla del generador :o
import time
from graph_tool.all import *    # graph_tool


g = Graph()                     # contruyendo el grafo
g.set_directed(True)            # haciendolo un grafo dirigido
num_nodes = num_nodes           # la cantidad de nodos de la red
damping_factor = damping_factor # damping factor
vlist = []                      # siempre guardamos una lista de nodos para generar la red


Los comandos anteriores solo importan las librerias necesarias y crean el grafo. Ademas necesitamos **property maps**
para guardar los valores de **PageRank** que estaremos creando. Los **property maps** son basicmente estructuras que nos
permiten guardar una asignacion

```
vertex1 -> value2
vertex2 -> value2
...
```

In [None]:
v_age = g.new_vertex_property("int")
page_rank = None   # Esta propiedad la crearemos despues, usando el PageRank de la libreria
custom_page_rank = g.new_vertex_property("float") # esta es nuestra implementacion de PageRank

Arriba solo estamos definiendo tres properties donde vamos a almacenar la edad del vertice nuevo que
crearemos y los dos valores de PageRank, el calculado por la libreria y el calculado por nosotros.

La siguiente funcion crea el grafo, es decir, inserta los nodos y las aristas de manera aleatoria
siguiendo un patron de __preferential attachment__

In [None]:
def create_graph():
        print "Armando grafo"
        stime = time.time()

        # Generamos un vertice
        v = g.add_vertex()
        self.v_age[v] = 0

        # Creamos una lista con los vertices que nos diga la cantidad de veces
        # que ha aparecido el vertice en una adicion, lo que se traduce en la
        # probabilidad que sea elegido para conectarse
        vlist.append(v)

        for i in range(1, num_nodes):
            # creando los vertices
            v = g.add_vertex()
            v_age[v] = i             # ajustando la edad del vertice en la propiedad

            # generamos una arista basandonos en una eleccion aleatoria de
            # un elemento en vlist
            i = randint(0, len(vlist))
            target = vlist[i]

            # agregamos la arista
            e = g.add_edge(v, target)

            # ponemos target y v en la lista. Asi la frecuencia de target
            # aumenta por haber sido elegido
            vlist.append(target)
            vlist.append(v)

        print "Grafo completo, tardamos", time.time()-stime

Una vez creada la red podemos pasar a calcular el PageRank de las dos formas que tenemos planeadas. Tenemos entonces
la funcion

In [None]:
def calculate_page_rank():
        page_rank = pagerank(self.g) ## usando el PageRank de la libreria de graph_tool

        # comenzamos con nuestro PageRank
        t = 60  # numero de iteraciones
        for vertex in g.vertices():
            custom_page_rank[vertex]=1/num_nodes

        for i in xrange(t):
            for v in g.vertices():
                temp_factor = 0.0
                for n in in_neighbours():
                    temp_factor += (custom_page_rank[n]/n.out_degree())
                custom_page_rank[v] = ((1-damping_factor)/num_nodes)+\
                                        damping_factor*(temp_factor)

        # Imprimimos ambos PageRank para estudiar la diferencia
        for v in self.g.vertices():
            print "PageRanks: ",
            print "Graph-Tool Rank: ", page_rank[v],
            print "Custom Rank: ", custom_page_rank[v]

Finalmente corremos nuestro codigo

In [None]:
create_graph()

In [None]:
calculate_page_rank()