# Page Rank

In [1]:
import numpy as np

![Páginas](./pagerank01.png)

Calculando matriz de transição **m** para **n** páginas. m é uma matriz nxn. 

O elemento $m_{ij}$ é calculado pela função $l(p_i,p_j)$. Onde:

$l(p_i,p_j) = 0$, se não existe outlink de $p_j$ para $p_i$

$l(p_i,p_j) = \frac{1}{L(p_j)}$, se existem outlinks de $p_j$  para $p_i$. Sendo que $L(p_j)$ é o total de outlinks de $p_j$.


In [2]:
m = np.matrix([[0, 0, 1, 0],
               [1/2, 0, 0 , 0],
               [1/2, 1, 0, 1],
               [0, 0, 0, 0]])


*Obs.:* $l$ está normalizada, ou seja, $\sum_{i=1}^{n}l(p_i, p_j) = 1$.

In [3]:
total_de_paginas = len(m)

## Calculo do page rank

$PR(p_j) = \frac{(1-\beta)}{T} + \beta \sum_{n}^{i=1} \frac{PR(p_i)}{L(p_i)}$



Setando parâmetros iniciais

In [4]:
threshold = 0.00001
beta = 0.8

In [5]:
E = np.full((total_de_paginas, total_de_paginas), 1/total_de_paginas)

In [6]:
page_rank = np.full((total_de_paginas, 1), 1/total_de_paginas)

In [7]:
page_rank_anterior = page_rank

while True:
    page_rank = (beta * m + ((1-beta) * E)) * page_rank
    if np.abs(np.subtract(page_rank_anterior, page_rank)).max() < threshold:
        break
    page_rank_anterior = page_rank

In [8]:
print(page_rank)

[[ 0.36320882]
 [ 0.19528015]
 [ 0.39151103]
 [ 0.05      ]]
