# Clase 02 - Algoritmos en grafos

En esta actividad vamos a programar dos algoritmos importantes a la hora de analizar un grafo:

- PageRank: algoritmo que nos sirve para rankear nodos de acuerdo a su importancia
- Algoritmo de Dijkstra: algoritmo que nos permite encontrar las distancias más cortas entre nodos.

## 01 - PageRank

Como vimos en clases, PageRank es un algoritmo iterativo que le otorga una calificación a cada nodo. Mientras más alta esta calificación, más alta es la importancia de este nodo en la red. Una fórmula general para PageRank es la siguiente:

$$
PR_t(n_i) = \frac{1-d}{N} + d \sum_{n_j\ \in\ In(n_i)}\frac{PR_{t-1}(n_j)}{Out(n_j)}
$$

En la que: 

- $PR_t(n_i)$ es el PageRank del nodo $i$ en la iteración $t$.
- $N$ es el número de nodos en el grafo.
- $d$ es el _damping factor_ (usualmente 0.85).
- $In(n_i)$ es una función que retorna todos los nodos que apuntan hacia $n_i$.
- $Out(n_j)$ es una función que retorna el número de nodos hacia los que $n_j$ apunta.

### P1 - Función `pagerank`

En esta tarea deben implementar en Python una función llamada `pagerank` que recibe una matriz de adyacencia y retorna una lista con el PageRank de cada uno de los nodos.

In [None]:
from functools import reduce

# Esta función calcula la norma de la diferencia de dos vectores
def norm_difference(v1, v2):
    v_difference = [(v1[i] - v2[i]) for i in range(len(v1))]
    v_squared = map((lambda x: (x)**2), v_difference)
    return (reduce((lambda x, y: x + y), v_squared))**(1/2)

# Esta función calcula el PageRank en una iteración determinada 
# de cierto nodo, en base al PageRank de la iteración anterior
def calculate_pagerank_node(node, v, M, d, N):
    # node es el id del nodo que está siendo calculado
    # v es el vector de PageRank en la iteración pasada
    # M es la matriz de adyacencia
    pagerank_node = 0
    for j in range(N):
        if M[j][node] == 1:
            outgoing_links = reduce((lambda x, y: x + y), M[j])
            pagerank_node += v[j]/outgoing_links
    pagerank_node = (1-d)/N + d*pagerank_node
    return pagerank_node
            
    

def pagerank(M, eps=1.0e-8, d=0.85):
    N = len(M)
    v = [1/N for _ in range(N)]
    last_v = [100 for _ in range(N)]
    
    # Calcular aquí el PageRank e ir cambiando el valor de v
    
    return v

M = [[0, 1, 0, 0],
     [0, 0, 1, 0],
     [0, 0, 0, 0],
     [0, 1, 1, 0]]

# Llamamos a la función
pr = pagerank(M, 0.0001)
print(pr)

### P2 - Comprobar resultados

Ahora considere el siguiente grafo construido con la librería `networkx`:

In [None]:
import networkx as nx

NODES = [1, 2, 3, 4, 5, 6]

# Estas son las aristas
G = nx.DiGraph()
G.add_nodes_from(NODES)
G.add_edge(1, 3)
G.add_edge(2, 3)
G.add_edge(4, 3)
G.add_edge(2, 5)
G.add_edge(3, 5)
G.add_edge(4, 5)
G.add_edge(6, 5)

print('El PageRank del grafo es:', nx.pagerank(G))

Construya la matriz de adyacencia del grafo utilizando listas de Python y compute el PageRank utilizando la función que definió en el punto anterior. Compare que sus resultados sean los mismos y explique el resultado.

**Observación**: El PageRank calculado por Networkx está normalizado, por lo que debes normalizarlos para comparar los resultados.

## 02 - Algoritmo de Dijkstra

Como vimos en clases, el Algoritmo de Dijkstra nos sirve para computar caminos más cortos entre nodos en que las aristas tienen un costo asociado. Suponga que el usuario va a entregar una matriz de adyacencia que en vez de un 1 posee el costo de ir de un nodo a otro. Por ejemplo, esta sería un posible input:

```Python
M = [[0, 10, 0, 4, 3],
     [0, 0, 2, 0, 0],
     [0, 0, 0, 0, 0],
     [0, 3, 0, 0, 0],
     [0, 0, 15, 0, 0]]
```

### P1 - Función `dijkstra_algorithm`

Haga una función llamada `dijkstra_algorithm` que reciba la matriz de adyacencia junto con el identificador de un nodo de partida. La función debe retornar cada nodo junto al costo del camino más corto para llegar a él, partiendo desde el nodo inicial.

In [None]:
from math import inf

def get_by_priority(to_explore, costs):
    # Dada una lista que tiene los costos acumulado para llegar a cada nodo
    # junto a su padre, devuelve la posición del nodo más barato.
    minimum = inf
    min_pos = -1
    for element in to_explore:
        if costs[element][1] < minimum:
            minimum = costs[element][1]
            min_pos = element
    return min_pos

def dijkstra_algorithm(M, source):
    visited = set()
    to_explore = []
    N = len(M)
    costs = [(-1, inf) for i in range(N)]
    costs[source] = (source, 0)
    
    to_explore.append(source)
    
    while to_explore:
        # Escribir algoritmo de Dijkstra
    
    return costs

M = [[0, 10, 0, 4, 3],
     [0, 0, 2, 0, 0],
     [0, 0, 0, 0, 0],
     [0, 3, 0, 0, 0],
     [0, 0, 15, 0, 0]]

d = dijkstra_algorithm(M, 0)
print(d)

### P2 - Encontrar el camino

Use el algoritmo anterior para crear una función llamada `shortest_path` que recibe la matriz de adyacencia, un nodo inicial y un nodo objetivo y entregue los nodos por los que debo pasar para llegar desde el nodo inicial al final con menor costo. Asuma que el camino entre esos dos nodos existe.

In [None]:
def get_parent(M, s, t, l):
    # Escribir una función recursiva que retorna lo solicitado

def shortest_path(M, s, t):
    costs = dijkstra_algorithm(M, s)
    if s == t:
        print("Son el mismo nodo")
    else:
        l = [t]
        return get_parent(M, s, t, l)
    
M = [[0, 10, 0, 4, 3],
     [0, 0, 2, 0, 0],
     [0, 0, 0, 0, 0],
     [0, 3, 0, 0, 0],
     [0, 0, 15, 0, 0]]

s = 0
t = 2
l = shortest_path(M, s, t)

for i in range(len(l)):
    print("Nodo", l[len(l) - 1 - i])