In [47]:
import numpy as np

#PageRank com autodecomposições
###Grupo: Alberto da Silva, Daniel Santos, Marlon Costa

##O que é PageRank?

O PageRank foi desenvolvido por volta de 1998 na Universidade de Stanford por Larry Page (daí o nome “Page” Rank) e Sergey Brin. Foi o primeiro algoritmo utilizado pelo Google para classificar páginas da internet. Tem como objetivo avaliar a relevância de uma determinada página em um contexto de pesquisa. A idéia por trás do PageRank se baseia em uma rede citações podendo ser representada por um grafo, onde cada nó representa uma página Web e a ligação entre as páginas se dá por meio de uma referência que uma página faz a outra. 

![Grafo de Representação da Rede](https://upload.wikimedia.org/wikipedia/commons/thumb/f/fb/PageRanks-Example.svg/400px-PageRanks-Example.svg.png)


Uma característica interessante nesse algoritmo é que o valor de PageRank de um determinado Website não se dá apenas pelo número de citações mas sim pela relevância que eles possuem. 






##PageRank em termos de álgebra linear:

![Grafo de Páginas](http://pi.math.cornell.edu/~mec/Winter2009/RalucaRemus/Lecture3/Images/graf1.PNG)




![Matriz A](http://pi.math.cornell.edu/~mec/Winter2009/RalucaRemus/Lecture3/Images/matrix.gif)
                                    

Cada página transfere de forma uniforme sua importância para as páginas às quais ele está vinculado. O nó 1 possui 3 arestas de saída, portanto, ele passará  sua importância para cada um dos outros 3 nós (1/3 para cada). O nó 3 tem apenas uma aresta de saída, assim passa toda a sua importância para o nó 1.

O PageRank cria um vetor V de ranks, com um elemento para cada página. Também cria uma matriz de links A, onde relaciona cada página com a citação das demais.

Inicialmente atribui valores de PageRank iguais para cada nó e a cada iteração é criado um novo vetor de rankings levando em conta os novos valores de relevância de cada nó.

![](http://pi.math.cornell.edu/~mec/Winter2009/RalucaRemus/Lecture3/Images/rezultate_1.gif)





###Implementação do PageRank

In [48]:
def pagerank(M, eps=1.0e-8, d=0.85):
    N = M.shape[1]
    v = np.random.rand(N, 1)
    v = v / np.linalg.norm(v, 1)
    last_v = np.ones((N, 1), dtype=np.float32) * 100
    M_hat = (d * M) + (((1 - d) / N) * np.ones((N, N), dtype=np.float32))
    
    while np.linalg.norm(v - last_v, 2) > eps:
        last_v = v
        v = np.matmul(M_hat, v)
        yield  v
        


M = np.array([[0, 0, 1, 1/2],
              [1/3, 0, 0, 0],
              [1/3, 1/2, 0, 1/2],
              [1/3, 1/2, 0, 0]])

v = pagerank(M, 0.001, 0.85)
print([i for i in v])


[array([[0.18588553],
       [0.17111776],
       [0.37272084],
       [0.27027587]]), array([[0.46917996],
       [0.09016757],
       [0.27775986],
       [0.16289262]]), array([[0.34282525],
       [0.17043433],
       [0.2779849 ],
       [0.20875554]]), array([[0.36250828],
       [0.13463382],
       [0.29578952],
       [0.20706841]]), array([[0.37692517],
       [0.14021068],
       [0.28543413],
       [0.19743005]]), array([[0.36402679],
       [0.14429547],
       [0.28779278],
       [0.20388501]]), array([[0.36877499],
       [0.14064093],
       [0.28861763],
       [0.2019665 ]]), array([[0.36866075],
       [0.14198625],
       [0.28759441],
       [0.20175864]]), array([[0.36770267],
       [0.14195388],
       [0.28804546],
       [0.20229804]]), array([[0.36831531],
       [0.14168243],
       [0.28798949],
       [0.20201283]])]


##O Poder dos Autovetores

Uma aplicação dos autovetores é a diagonalização de uma matriz. Dados os autovalores e autovetores de uma matriz, você pode criar três matrizes que quando combinadas, correspondem à matriz original. A matriz do meio lida com o escalonamento e é uma matriz diagonal, tendo os autovalores da matriz original como entradas.

Isso nos permite algo incrível: exponenciar a matriz original é equivalente a exponenciar *apenas* a matriz do meio do trio de matrizes vindas da diagonalização. E por fim, exponenciar uma matriz diagonal é equivalente à exponenciar *apenas* as entradas da diagonal principal.

##SVD

Em álgebra linear, a decomposição em valores singulares ou singular value decomposition (SVD) é a fatoração de uma matriz real ou complexa, com diversas aplicações importantes em processamento de sinais e estatística.

Formalmente, a decomposição em valores singulares de uma matriz m×n real ou complexa M é uma fatoração ou fatorização na forma:

\begin{equation}{M=U\Sigma V^{*},}\end{equation}

onde U é uma matriz unitária m×m real ou complexa, Σ é uma matriz retangular diagonal m×n com números reais não-negativos na diagonal, e V* (a conjugada transposta de V) é uma matriz unitária n×n real ou complexa. As entradas diagonais Σi,i de Σ são os chamados valores singulares de M. As m colunas de U e as n colunas de V são os chamados vetores singulares à esquerda e vetores singulares à direita de M, respetivamente.

A decomposição em valores singulares e a decomposição em autovalores são intimamente relacionadas. Mais especificamente:


- Os vetores singulares à esquerda de M são autovetores de ${MM^{*}.}$
- Os vetores singulares à direita de M são autovetores de ${M^{*}M.}$
- Os valores singulares não-nulos de M (ao longo da diagonal de Σ) são as raízes quadradas dos autovalores não-nulos de ${M^{*}M}$ ou ${MM^{*}}$.

##Método das potências<br>

Em matemática, o método das potências é um algoritmo para calcular autovalores: dada uma matriz A, o algoritmo irá produzir um número λ (o autovalor) e um vetor v não nulo (o autovetor), tal que Av = λv. O algoritmo também é conhecido como a iteração de Von Mises.

O método da potência é um algoritmo muito simples. Ele não computa a decomposição matricial, e portanto pode ser usada quando A é uma grande matriz esparsa. No entanto, ele irá encontrar apenas um autovalor (aquele com o maior módulo) e poderá convergir lentamente.

In [49]:
"""https://en.wikipedia.org/wiki/Power_iteration"""


def power_iteration(A, num_simulations = 100):
    # Ideally choose a random vector
    # To decrease the chance that our vector
    # Is orthogonal to the eigenvector
    b_k = np.random.rand(A.shape[1])

    for _ in range(num_simulations):
        # calculate the matrix-by-vector product Ab
        b_k1 = np.dot(A, b_k)

        # calculate the norm
        b_k1_norm = np.linalg.norm(b_k1)

        # re normalize the vector
        b_k = b_k1 / b_k1_norm

    return b_k


pi = power_iteration(M)
pi


array([0.72101012, 0.24033671, 0.54075759, 0.36050506])

##Algoritmo QR:
<br>
Em álgebra linear, o algoritmo QR é um algoritmo de autovalor: isso é, um procedimento para calcular os autovalores e autovetores de uma matriz. O algoritmo QR foi desenvolvido no fim dos anos 50 por John G. F. Francis e Vera N Kublanovskaya, trabalhando independentemente. A ideia básica é realizar a decomposição QR, escrevendo a matriz como um produto entre uma matriz ortogonal e uma matriz triangular superior, multiplicar os fatores em ordem reversa e iterar.<br>


In [50]:
def pure_qr(A, max_iter=50000):
    Ak = np.copy(A)
    n = A.shape[0]
    QQ = np.eye(n)
    for k in range(max_iter):
        Q, R = np.linalg.qr(Ak)
        Ak = R @ Q
        QQ = QQ @ Q
        if k % 100 == 0:
            print(Ak)
            print("\n")
    return Ak, QQ


pqr = pure_qr(M, 100)
pqr

[[ 0.5         0.35355339 -0.57735027 -0.20412415]
 [-0.35355339 -0.25        0.          0.14433757]
 [-0.8660254   0.61237244  0.         -0.35355339]
 [ 0.20412415 -0.14433757  0.         -0.25      ]]




(array([[ 1.00000000e+00, -3.60726469e-01, -3.67680373e-01,
         -2.07759703e-02],
        [ 7.98610383e-27, -7.15621497e-02, -5.47157253e-01,
         -4.59464994e-02],
        [ 8.60048289e-27,  4.61398008e-01, -6.49684517e-01,
         -2.19759990e-01],
        [ 3.61351696e-56,  1.93857665e-30, -2.72966769e-30,
         -2.78753333e-01]]),
 array([[ 0.72101012,  0.34317926,  0.58027437,  0.16016884],
        [ 0.24033671, -0.87192667,  0.3005907 , -0.30270014],
        [ 0.54075759,  0.14251356, -0.59759318, -0.57458986],
        [ 0.36050506, -0.31884441, -0.46455277,  0.7433472 ]]))

##Abordagem em duas etapas
Na abordagem em duas etapas para encontrar autovalores, seguimos as etapas:<br><br>
1 - Reduzir a matriz para a forma de *Hessenberg* (zeros abaixo da primeira subdiagonal).<br>
2 - Processo iterativo que faz Hessenberg convergir para uma matriz triangular. Os autovalores de uma matriz triangular são os valores da diagonal.
<br><br>
Na etapa 1, alcançamos a solução exata em um número finito de etapas, enquanto a fase 2 teoricamente nos dá a solução exata.
<br><br>
A etapa 2 é o próprio algoritmo QR. Lembrando que seria possível usar apenas o algoritmo QR, porém ele é extermamente lento.
<br><br>
Para a etapa 1, podemos usar o algoritmo de iteração de Arnoldi:

In [51]:
def arnoldi(A):
    m, n = A.shape
    assert (n <= m)

    # Hessenberg matrix
    H = np.zeros([n + 1, n])  # , dtype=np.float64)
    # Orthonormal columns
    Q = np.zeros([m, n + 1])  # , dtype=np.float64)
    # 1st col of Q is a random column with unit norm
    b = np.random.rand(m)
    Q[:, 0] = b / np.linalg.norm(b)
    for j in range(n):
        v = A @ Q[:, j]
        for i in range(j + 1):
            # This comes from the formula for projection of v onto q.
            # Since columns q are orthonormal, q dot q = 1
            H[i, j] = np.dot(Q[:, i], v)
            v = v - (H[i, j] * Q[:, i])
        H[j + 1, j] = np.linalg.norm(v)
        Q[:, j + 1] = v / H[j + 1, j]

        # printing this to see convergence, would be slow to use in practice
        # print(np.linalg.norm(A @ Q[:, :-1] - Q @ H))
    return Q[:, :-1], H[:-1, :]


Q0, H0 = arnoldi(M)
Q0, H0


(array([[ 0.40969909,  0.89153222, -0.10656141, -0.16112609],
        [ 0.01860023,  0.15820122,  0.94029881,  0.30077324],
        [ 0.75805456, -0.26273255, -0.15516762,  0.57640949],
        [ 0.50710351, -0.33333808,  0.28355919, -0.74251326]]),
 array([[ 0.79374457,  0.17930907,  0.65120523, -0.07606798],
        [ 0.76992157, -0.51631042, -0.3138749 ,  0.21431793],
        [ 0.        ,  0.39936577,  0.00182988, -0.00234396],
        [ 0.        ,  0.        ,  0.00100315, -0.27926403]]))

##Aplicando ao PageRank
<br>
No PageRank aplicamos várias vezes a matriz de links ao vetor PageRank. Isso equivale à repetidamente multiplicar a matriz de links por si mesma e depois de suficientes auto-multiplicações, aplicar o resultado ao vetor PageRank.
<br><br>Mas, multiplicação repetida de algo por si mesmo é a exponenciação. Então, nós podemos fazer isso exponenciando a matriz, o que pode ser feito através da exponenciação da diagonal da matriz centraldo resultado da decomposição, a qual contém os autovalores da matriz original.
<br><br>
Porém, o PageRank trabalha com uma matriz de milhões de valores, ou seja, até que o algoritmo se estabilize, existe um número imenso de iterações, ou seja de exponenciações da matriz de links. Assim, o maior autovalor passa a ser dominante na matriz, assim como a matriz de links final tem como vetor dominante um vetor associado com o maior autovalor, da mesma forma que o autovetor final.