# Cas d'utilisation des valeurs et vecteurs propres

In [1]:
import numpy as np
import numpy.linalg as lin

np.set_printoptions(precision=3, linewidth=150, suppress=True)

## Fibonacci

La suite de Fibonacci est définie par $x_n = x_{n-2} + x_{n-1}$ avec $x_0 = 1$ et $x_1 = 1$.

On vera des algorithmes pour calculer $x_n$.


Comme on a 2 termes à droite du signe égal, écrivons Fibonnacci sous forme d'un système matriciel $2\times 2$ :

$
\begin{align}
x_{n-1} &= x_{n-1} \\
x_n &= x_{n-2} + x_{n-1} \\
\end{align}
$
ce qui donne
$
\begin{bmatrix}
x_{n-1}\\
x_n  \\
\end{bmatrix}
=
\begin{bmatrix}
0 & 1 \\
1 & 1 \\
\end{bmatrix}
\begin{bmatrix}
x_{n-2}\\
x_{n-1}  \\
\end{bmatrix}
$

Écrire la matrice F ci-dessous.

In [20]:
# F = ...

Calculer les 6 premiers éléments de notre « suite vectorielle » de Fibonacci, en n'utilisant que la matrice F et les valeurs initiales de la suite. La fonction `numpy.linalg.matrix_power` pourra vous être utile.

Calculer n produits matriciels n'est pas rentable, par contre sachant que
$F = P\, D\, P^{-1}$ avec

* P la matrice des vecteurs propres
* D la matrice diagonale des valeurs propres

on peut faire quelque chose car il va avoir des simplification lors du calcul de de $F^n$. 

* Ecrire la formule matriciel de la suite de Fibonnacci en fonction de P et D. 
* Expliquer pourquoi le calcul du n-ème élément de la suite peut se faire en temps constant.

Écrire une fonction `fibo(n)` qui calcule le n-ème élément de la suite de Fibonacci en temps constant.

In [19]:
# fval, fvec = ...
fval = fval.astype('float')  # la matrice est symétrique donc ses valeurs propres sont réelles
print("Valeurs propres de la matrice de fibonnacci :", fval,"\n")
print("Vecteurs propres de la matrice de fibonnacci :\n", fvec)
def fibo(n):
    # votre code ici

fibo(50) # on a une erreur de 10⁻⁵, ca va

Valeurs propres de la matrice de fibonnacci : [-0.618  1.618] 

Vecteurs propres de la matrice de fibonnacci :
 [[-0.851 -0.526]
 [ 0.526 -0.851]]


20365011074.00003

Vérifier que votre fonction est en temps constant en chronométrant `fibo(5)` et `fibo(1000)` avec la commande 
`%timeit` de Jupyter.

In [None]:
%timeit fibo(5)

In [None]:
%timeit fibo(1000)

## Google page rank

Soit N pages web numérotées qui font référence les unes aux autres. Disons que si la page 3 est référencée par les pages 8 9 et 13 j'écris $x_3 = x_8 + x_9 + x_{13}$. On voit qu'on peut écrire ces référencements dans une
matrice avec le i-ième ligne qui décrit par qui est référencée la i-ème page web. Cette matrice a un 1 dans
la j-ième colonne si la page j cite la page i et sinon un 0.

In [9]:
np.random.seed(42)
N = 8
A = np.random.randint(2,size=(N,N))
for i in range(len(A)):
    A[i,i] = 0   # on ne compte pas les auto-référencements
A

array([[0, 1, 0, 0, 0, 1, 0, 0],
       [0, 0, 0, 0, 0, 0, 1, 0],
       [1, 1, 0, 0, 1, 0, 1, 1],
       [1, 1, 1, 0, 1, 1, 0, 0],
       [1, 1, 1, 0, 0, 0, 0, 0],
       [0, 0, 1, 1, 1, 0, 1, 0],
       [1, 1, 0, 1, 0, 1, 0, 1],
       [1, 0, 0, 0, 0, 0, 0, 0]])

On va utiliser cette matrice pour classer nos pages web selon leur importance. On part du principe qu'une page importante est référenciée par beaucoup d'autres pages importantes. (Inversement, personne a envie de faire des liens vers une page sans importance.)

Cette idée est derrière l'algorithme PageRank que Google utilisait (et peut-être toujours utilise) pour ranger les résultats d'une recherche internet.

## Approche itérative

Dans un premier temps on procède de la manière suivante pour trouver l'importance d'une page:
Étant donné N pages à évaluer 
* On initialise un vecteur __v__ de taille N avec 1 partout -> Correspond à une distribution uniforme de l'importance initialement
* On calcule le produit A __v__
* On normalise le résultat pour que la norme 1 soit égale au nombre de pages (N)
* Cela nous donne l'importance de chaque page selon le nombre de liens vers elle des autres pages
* On répète ces étapes jusqu'à un point fixe

De cette manière l'entrée i du vecteur __v__ correspond à l'importance de la page i. *Discutez pourquoi.*

In [None]:
v = np.zeros((N,1))
vprime = np.ones((N,1))
while (np.absolute(np.max(vprime - v)) > 1e-5): # which norm is used here?
    v = vprime
    # vprime =  ...
    # vprime = vprime * ...
    print(vprime.T)


## Un autre approche

On a calculé un vecteur __v__ pour lequel A.__v__ = __v__. Est-ce que ça vous rappelle quelque chose ?

* On considère que les composantes du premier vecteur propre représentent la valeur de chaque page. Calculez les valeurs des pages. Comparez avec le résultat obtenue auparavant.
* Calculez le nombre de citations pour chaque page.