## Partie 1 : PageRank - version itérative, premier exemple

##### 1. Justifier pourquoi l’algorithme de la puissance iterérée permet de calculer le score de chacune des pages. 

Dans un premier temps il faut que la matrice symbolysant le web soit une matrice stochastique, c'est une matrice de probabilité ou la somme de chaque colonne doit être égal à 1, elle traduit la probabilité de se rendre sur une autre page depuis la page courante. En appliquant l'algorythme de puissance itértée sur celle-ci on obtient des vecteurs propre pour chaque point de la matrice. Ces vecteurs nous donne la probabilité de se retrouvé sur une page apres tant d'itération. Plus sa valeur est grande plus la page est fréquemment visité au cour des itérations.    



In [9]:
from random import randint
import numpy as np
from math import sqrt

In [10]:
#fonction pour la norme
def norme(X:np.array):
    sum = 0 
    for x in X:
        sum += x**2
    return np.sqrt(sum)

V = np.array([2,0,0,3])
print(norme(V))

3.605551275463989


In [11]:

def puissanceItere(l,A:np.array):
   """Fonction qui applique l'algorithme de puissance itérée sur une matrice. 
   Matrice de toutes tailles, stochastique ou non"""
   X = np.array([randint(1,10) for x in range (A.shape[0])])
   Lambda = 0
   while (True):
       aLambda = Lambda
       AX = np.dot(A,X) # approximation du vecteur propre associé
       Lambda = norme(AX) # approximation de lambda
       X = AX / Lambda
       if (abs(Lambda - aLambda) < l ):
           return X,Lambda


C2 = np.array([[2, 3], [1, 0]])
X, Lambda = puissanceItere(1e-6, C2)
print("Vecteur propre approximé :", X)
print("Valeur propre approximée :", Lambda)
print("--------------------------------------")
C3 = np.array([[4,1,0], [1,3,1], [0,1,2]])
X, Lambda = puissanceItere(1e-6, C3)
print("Vecteur propre approximé :", X)
print("Valeur propre approximée :", Lambda)
print("--------------------------------------")
C4 = np.array([[4, 1, 0, 0],[1, 3, 1, 0],[0, 1, 2, 1],[0, 0, 1, 1]])
X, Lambda = puissanceItere(1e-6, C4)
print("Vecteur propre approximé :", X)
print("Valeur propre approximée :", Lambda)

Vecteur propre approximé : [0.94868329 0.31622778]
Valeur propre approximée : 2.9999999123875525
--------------------------------------
Vecteur propre approximé : [0.78848582 0.57753951 0.21151412]
Valeur propre approximée : 4.7320504292029275
--------------------------------------
Vecteur propre approximé : [0.77770011 0.57999781 0.2342364  0.06259696]
Valeur propre approximée : 4.745280642207406


##### 2. Implementer cet algorithme pour calculer le score de chacune des pages du graphe precedent. On verifiera que le vecteur de score obtenu est bien approximativement solution de r = Qr.


In [12]:
def stocastique (C:np.array) -> np.array:
    """renvoi la matice stocastique de C"""
    sum_col = C.sum(axis=0)     #somme des colonne dans un tableau
    sum_col[sum_col == 0] = 1   #si la somme vaut 0 on remplace par 1 pour eviter la division par 0 
    Q = C/sum_col               #divison de chaque valeur pas la somme de sa colonne
    return Q


In [13]:
def score(C:np.array,precision):
    Q = stocastique(C)
    #print ("C : ","\n",C)
    #print ("Q : ","\n",Q)
    r = np.array([1/C.shape[0] for i in range(C.shape[0])])
    while (True):
        r_copie = r
        r = np.dot(Q,r) # approximation du vecteur propre associé
        if ( np.allclose(r_copie, r, atol=precision)):
            return r
        


C = np.array([
    [0,1,1,1,1,0,1,0,0,0,0,0,0,0],
    [1,0,0,0,0,0,0,0,0,0,0,0,0,0],
    [1,1,0,0,0,0,0,0,0,0,0,0,0,0],
    [1,0,1,0,0,0,0,0,0,0,0,0,0,0],
    [1,1,0,1,0,0,0,0,0,0,0,0,0,0],
    [1,0,0,0,0,0,0,1,0,1,0,0,0,0],
    [0,0,0,0,0,1,0,0,0,0,0,0,0,0],
    [0,0,0,0,0,1,1,0,1,0,0,0,0,0],
    [0,0,0,0,0,1,0,0,0,0,0,0,0,0],
    [0,0,0,0,0,0,0,0,1,0,1,1,1,1],
    [0,0,0,0,0,0,0,0,0,1,0,0,0,0],
    [0,0,0,0,0,0,0,0,0,1,1,0,0,0],
    [0,0,0,0,0,0,0,0,0,1,0,1,0,0],
    [0,0,0,0,0,0,0,0,0,1,1,0,1,0]
])

t = score (C,1e-6)
for i in range (len(t)):
    print (i+1,": ",t[i])

1 :  0.13761783539830247
2 :  0.027523733949253455
3 :  0.03669838652216148
4 :  0.04587309429687282
5 :  0.059635154836846296
6 :  0.16513143092381713
7 :  0.05504320270122657
8 :  0.11008575366685683
9 :  0.05504320270122657
10 :  0.13761783539830244
11 :  0.02752373394925345
12 :  0.03669838652216147
13 :  0.04587309429687281
14 :  0.05963515483684628


##### 3. Analyser la pertinence du resultat obtenu.
Pour verifier mes resultats, étant donné que les vecteurs obtenue traduisent une probabilité il faut que la somme global soit d'environ 1. C'est le cas ce qui me laisse penser que les resultats sont corrects.
Ici on obtient le score de chaque noeuds (pages), on voit que le noeud 6 est celui avec le meilleur score ce sera donc la page la mieux classé par PageRank. Elle a le meilleur score car elle est celle vers qui les liens pointe le plus. L'importance de ses enfants lui donne la plus grand importance global.

## Partie 2 : PageRank - version itérative, deuxième exemple

##### 1. Appliquer l’algorithme de la Partie 1 au graphe suivant et commenter le resultat obtenu
![image.png](attachment:image.png)


In [14]:
B = np.array([
    [0,1,1,1,1],
    [0,0,0,1,1],
    [0,0,0,0,0],
    [0,0,1,0,0],
    [0,0,0,0,0]
])

b = score (B,1e-6)
sum = 0 
for i in range (len(b)):
    print (i+1,": ",b[i])
    sum += b[i]
print("somme ",sum)

1 :  0.0
2 :  0.0
3 :  0.0
4 :  0.0
5 :  0.0
somme  0.0


##### 2.  En utilisant cette matrice de transition (avec α = 0, 85), calculer les scores de chacune des pages du graphe precedent. Commenter. On verifiera que le vecteur de score obtenu est bien approximativement solution de r = Pr

In [15]:
def matriceAmortie(C:np.array,alpha) -> np.array:
    """ 
    C = matrice d'adjacence déjà transposé
    alpha = facteur d'amortissement
    Renvoi une matrice P qui est la matrice de transition de C
    """
    Q = stocastique(C)                                                      # calcul de la stocastique de C dans Q
    sum_col = Q.sum(axis=0)                                                 # somme de chaque colonne de Q dans sum_col
    P = np.where(sum_col==0 ,1/C.shape[0],alpha * Q + (1-alpha)/C.shape[0]) # mettre la somme de toutes les colonnes à 1  
    return P


In [16]:
def score_amortie(C:np.array,precision,alpha= 0.85):
    P = matriceAmortie(C,alpha)
    r = np.array([1/C.shape[0] for i in range(C.shape[0])])
    while (True):
        r_copie = r
        r = np.dot(P,r) # approximation du vecteur propre associé
        if ( np.allclose(r_copie, r, atol=precision)):
            return r

Q = np.array([
    [0.5, 0.5],
    [0.5, 0.5]
])
#q = score_amortie (Q,1e-6)
b = score_amortie(B,1e-6)
sum = 0 
for i in range (len(b)):
    print (i+1,": ",b[i])
    sum += b[i]
print("somme ",sum)

1 :  0.4339039433205188
2 :  0.21070486737709532
3 :  0.10376389257979572
4 :  0.1478634041427952
5 :  0.10376389257979572
somme  1.0000000000000007


## Partie 3 : PageRank - version itérative, analyse

##### 1. Analyser l’influence du critere d’arret dans l’algorithme de la puissance iteree.

Dans l'algorithme de puissance itéré le critère d'arrêt permet de determiner à quel moment les changements entre deux derivées sont si faibles qu'ils sont négligablent. Plus le critere d'arret est petit plus l'algorithme sera precis sur le score des pages, le point négatif sera qu'il effectura beaucoup plus de calcul et sera donc plus lourd et plus long.

##### 2.Ajouter quelques hubs (pages qui ont beaucoup de liens sortant) et autorites (pages qui ont beaucoup de liens entrant). Commenter l’impact sur les scores


On se rend compte que si on ajoute un HUB, ici 15, qui pointe vers diverses autres noeuds mais qui n'est jamais pointé, alors son score sera très bas ce qui impact tres peu les scores des autres pages. 
A l'inverse ajouter une autortié, ici 16, qui est reférencé par une tres grande quantité d'autres noeuds changera les scores des page le referencant. Chaque page qui le pointe diminu son propre score et augmente celui de 16.     

In [17]:
C_bis = np.array([
    [0,1,1,1,1,0,1,0,0,0,0,0,0,0,0],
    [1,0,0,0,0,0,0,0,0,0,0,0,0,0,0],
    [1,1,0,0,0,0,0,0,0,0,0,0,0,0,0],
    [1,0,1,0,0,0,0,0,0,0,0,0,0,0,0],
    [1,1,0,1,0,0,0,0,0,0,0,0,0,0,1],
    [1,0,0,0,0,0,0,1,0,1,0,0,0,0,0],
    [0,0,0,0,0,1,0,0,0,0,0,0,0,0,1],
    [0,0,0,0,0,1,1,0,1,0,0,0,0,0,1],
    [0,0,0,0,0,1,0,0,0,0,0,0,0,0,1],
    [0,0,0,0,0,0,0,0,1,0,1,1,1,1,0],
    [0,0,0,0,0,0,0,0,0,1,0,0,0,0,1],
    [0,0,0,0,0,0,0,0,0,1,1,0,0,0,0],
    [0,0,0,0,0,0,0,0,0,1,0,1,0,0,0],
    [0,0,0,0,0,0,0,0,0,1,1,0,1,0,0],
    [0,0,0,0,0,0,0,0,0,0,0,0,0,0,0]
])

b = score_amortie (C_bis,1e-6)
for i in range (len(b)):
    print (i+1,": ",b[i])

1 :  0.13710087178982486
2 :  0.033307221704075414
3 :  0.0427442788792119
4 :  0.051473594987059196
5 :  0.06632063570007304
6 :  0.13516403114390627
7 :  0.049996036706404214
8 :  0.09249261813343182
9 :  0.049996036706404214
10 :  0.13669838971194656
11 :  0.0349388259843711
12 :  0.04313818058328237
13 :  0.05157262700195971
14 :  0.06505665096805076
15 :  0.010000000000000016


##### 3. Essayez d’accroître le score de certaines pages. Expliquez votre méthode et validez-la experimentalement

On a fait en sorte que chaque page soit pointée et pointe une autre page. Donc chaque page peut être accessible depuis toutes les pages. On a rajouté un lien de 6 à 10, de 6 à 1 et de 5 à 11.
6 étant la page la plus importante, elle a transmis son score aux pages 1 et 10 qui ont donc gagné en importance, au détriment de la page 6 qui en a perdu. La page 5 pointait uniquement vers la page 1 et transmet donc maintenant une partie de son importance à la page 11, tout en perdant un peu de son importance.

##### 4. Faites varier le facteur d’amortissement α pour analyser son influence. On rappelle que α ∈ [0, 1] 

Le facteur d'amortissement traduit le hasard de passer d'une page a l'autre. Plus le facteur d'amortissement est proche de 1 plus on considere que l'on peut se déplacer qu'entre deux pages ayant un lien. Alors que si le facteur d'amortiessent est 0 on considere que les liens n'ont aucunes instances sur le score de la page. 

In [18]:
t = score_amortie (C,1e-6,0)
for i in range (len(t)):
    print (i+1,": ",t[i])

1 :  0.07142857142857142
2 :  0.07142857142857142
3 :  0.07142857142857142
4 :  0.07142857142857142
5 :  0.07142857142857142
6 :  0.07142857142857142
7 :  0.07142857142857142
8 :  0.07142857142857142
9 :  0.07142857142857142
10 :  0.07142857142857142
11 :  0.07142857142857142
12 :  0.07142857142857142
13 :  0.07142857142857142
14 :  0.07142857142857142


In [19]:
t = score_amortie (C,1e-6,1)
for i in range (len(t)):
    print (i+1,": ",t[i])

1 :  0.13761783539830247
2 :  0.027523733949253455
3 :  0.03669838652216148
4 :  0.04587309429687282
5 :  0.059635154836846296
6 :  0.16513143092381713
7 :  0.05504320270122657
8 :  0.11008575366685683
9 :  0.05504320270122657
10 :  0.13761783539830244
11 :  0.02752373394925345
12 :  0.03669838652216147
13 :  0.04587309429687281
14 :  0.05963515483684628


## Partie 4 : PageRank - version itérative, analyse

##### 1. En utilisant le logiciel d’exploration de site web present sur la page Ametice, construire trois matrices de votre choix et appliquez l’algorithme de PageRank a ces matrices. L’ordre de ces matrices sera compris entre 10 et 30. Ces matrices, le resultat du logiciel d’exploration ainsi que le site web choisi apparaıtront clairement dans le dossier.

Après avoir tester un grand nombre de site web nous avons trouver pertinant de choisir le site de base de donnée en ligne de supabase (supabase.com), car chaque page trouvé dans celle ci ont des scores plus ou moins différents. On choisit de faire une matrice de 10, 20,puis 30. 

Pour l'interpretation de nos ressultats nous implementons une fonction qui renvoi une liste decroissant du score de chacun des noeuds, ainsi la valeur à l'indice 0 nous donnera la page la mieux referencé par PageRank  

In [20]:
#"""le logiciel fournit renvoi une matrice d'adjacence, 
#il faut donc la transposé grace à la méthode .T"""

linkedin10 = np.array([
    [0,0,0,0,0,0,0,0,0,0],
    [1,0,0,0,1,0,0,0,0,0],
    [1,0,0,0,1,0,0,0,0,0],
    [1,0,0,0,1,0,0,0,0,0],
    [1,0,0,0,1,0,0,0,0,0],
    [0,1,1,1,0,1,1,1,0,1],
    [0,1,1,1,0,1,1,1,0,1],
    [0,1,1,1,0,1,1,1,0,1],
    [0,1,1,1,0,1,1,1,0,1],
    [0,1,1,1,0,1,1,1,0,1]
])  #linkedin
print(linkedin10.T, "\n")               # Affichage de la transposé 
t = score_amortie (linkedin10.T,1e-6)   # Affichage des scores des pages 
for i in range (len(t)):
    print (i+1,": ",t[i])

[[0 1 1 1 1 0 0 0 0 0]
 [0 0 0 0 0 1 1 1 1 1]
 [0 0 0 0 0 1 1 1 1 1]
 [0 0 0 0 0 1 1 1 1 1]
 [0 1 1 1 1 0 0 0 0 0]
 [0 0 0 0 0 1 1 1 1 1]
 [0 0 0 0 0 1 1 1 1 1]
 [0 0 0 0 0 1 1 1 1 1]
 [0 0 0 0 0 0 0 0 0 0]
 [0 0 0 0 0 1 1 1 1 1]] 

1 :  0.22352014783198584
2 :  0.07413721123707796
3 :  0.07413721123707796
4 :  0.07413721123707796
5 :  0.22352014783198584
6 :  0.07413721123707796
7 :  0.07413721123707796
8 :  0.07413721123707796
9 :  0.03399922567648314
10 :  0.07413721123707796


In [21]:

supabase20 = np.array([
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0],
    [0,1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0],
    [1,1,1,1,1,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,1,0,0],
    [1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0],
    [1,0,1,0,0,0,0,0,0,1,0,1,1,0,0,0,0,0,0,0],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0],
    [1,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0],
    [1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1],
    [1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1],
    [1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1],
    [1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1],
    [1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1]
])

print(len(supabase20[0])==supabase20.shape[0])

t = score_amortie (supabase20,1e-6)

for i in range (len(t)):
    print (i+1,": ",t[i])

True
1 :  0.03975428163992574
2 :  0.03975428163992574
3 :  0.09162373661848987
4 :  0.10461727327250325
5 :  0.03975428163992574
6 :  0.048311567204636724
7 :  0.009278512020167204
8 :  0.023067450815414663
9 :  0.03975428163992574
10 :  0.03975428163992574
11 :  0.03975428163992574
12 :  0.03975428163992574
13 :  0.03975428163992574
14 :  0.03975428163992574
15 :  0.012946788263775374
16 :  0.07047322740913653
17 :  0.07047322740913653
18 :  0.07047322740913653
19 :  0.07047322740913653
20 :  0.07047322740913653


In [22]:
supabase30 = np.array([
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1],
    [1,1,1,1,1,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,1,0,0,0,0,0,0,0,1,1,1,1,1],
    [1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0],
    [1,0,1,0,0,0,0,0,0,1,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,1,1],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1], 
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1],   
    [1,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0],
    [1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0],
    [1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0],
    [1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0],
    [1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0],
    [1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0],
    [1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0],
    [1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0],
    [1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0],
    [1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0],
    [1,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,0,0,0,0,0],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1],
    [1,1,1,0,1,0,1,1,1,1,1,1,1,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,1,1],
    [1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0],
    [1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0],
    [1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0]
])

print(len(supabase30[0])==supabase30.shape[0])

t = score_amortie (supabase30,1e-6)

for i in range (len(t)):
    print (i+1,": ",t[i])

True
1 :  0.025213337644381398
2 :  0.025213337644381398
3 :  0.025213337644381398
4 :  0.07689355587836003
5 :  0.025213337644381398
6 :  0.02899469818731322
7 :  0.006535941612970298
8 :  0.013728436807858542
9 :  0.025213337644381398
10 :  0.025213337644381398
11 :  0.025213337644381398
12 :  0.025213337644381398
13 :  0.025213337644381398
14 :  0.025213337644381398
15 :  0.01136696333674756
16 :  0.05338513812317166
17 :  0.05338513812317166
18 :  0.05338513812317166
19 :  0.05338513812317166
20 :  0.05338513812317166
21 :  0.05338513812317166
22 :  0.05338513812317166
23 :  0.05338513812317166
24 :  0.05338513812317166
25 :  0.05338513812317166
26 :  0.025213337644381398
27 :  0.025213337644381398
28 :  0.007796653100491576
29 :  0.009136159055982933
30 :  0.009136159055982933


##### 2. Sur la page Ametice vous trouverez les matrices du reseau routier (issues de OpenStreet Map) de differentes villes. Chaque groupe étudiera la matrice “413 Avenue Gaston Berger” ainsi que la ville qui lui a eté affectée.

In [23]:
Gaston_Berger = np.load("413 avenue Gaston Berger, Aix en Provence, France_Matrice.npy")

t = score_amortie (Gaston_Berger,1e-6)

for i in range (len(t)):
    print (i+1,": ",t[i])

print(type(t))
print(t.shape)
t = t.reshape(-1,1)
print(t.shape)


1 :  0.0005991480330293877
2 :  0.0006537429228383005
3 :  0.0005162681011770737
4 :  0.0007288819947886454
5 :  0.0008706899068152682
6 :  0.001308388251373732
7 :  0.0006373482087544042
8 :  0.0013356420017103018
9 :  0.0008054269260376651
10 :  0.0007554035809727121
11 :  0.0007001092605901666
12 :  0.0007094857160612751
13 :  0.0003744663316238473
14 :  0.0009358080001364384
15 :  0.0007907811271792508
16 :  0.0007608246282005526
17 :  0.0009021183982086898
18 :  0.0005839469335755537
19 :  0.0008177833036353742
20 :  0.0006045851502684789
21 :  0.00028260264380829673
22 :  0.0013694601371988238
23 :  0.0008727793645338301
24 :  0.0009828029815992251
25 :  0.0005626343965262695
26 :  0.000794282191130671
27 :  0.000823055052749675
28 :  0.0008230584112385783
29 :  0.0008108070275885355
30 :  0.0008126604715928254
31 :  0.0008283349199154788
32 :  0.0006734249769273331
33 :  0.0006470183059277961
34 :  0.0009820034658882047
35 :  0.0007610622137566141
36 :  0.0008436990491947913
37 

In [24]:
M = np.load("413 avenue Gaston Berger, Aix en Provence, France_Id_Noeud.npy")
print(M)
print(M.shape[0])
print(len(M))
print(M[0])
print(type(M[1]))

[  12156118   12156297   12156309 ... 9406109696 9481625757 9501232881]
1259
1259
12156118
<class 'numpy.int64'>


##### 2. Sur la page Ametice vous trouverez les matrices du reseau routier (issues de OpenStreet Map) de differentes villes. Chaque groupe étudiera la matrice “413 Avenue Gaston Berger” ainsi que la ville qui lui a eté affectée.

In [27]:
def classement(noeud:np.array,score:np.array):
    corres = {}
    for i in range(len(noeud)):
        corres[noeud[i]] = score[i]
    sorted_corres = dict(sorted(corres.items(), key=lambda item: item[1],reverse=True))
    return list(sorted_corres.keys())


In [28]:
Gaston_Berger = np.load("413 avenue Gaston Berger, Aix en Provence, France_Matrice.npy")
Gaston_Berger = Gaston_Berger.T
id_Gaston_Berger = np.load("413 avenue Gaston Berger, Aix en Provence, France_Id_Noeud.npy")
score = score_amortie(Gaston_Berger,1e-6)
t = classement(id_Gaston_Berger,score)

for i in range(len(t)):
    print(f"{i+1} : {t[i]} : https://www.openstreetmap.org/node/{t[i]}") 


1 : 5672603788 : https://www.openstreetmap.org/node/5672603788
2 : 9196449217 : https://www.openstreetmap.org/node/9196449217
3 : 7251343585 : https://www.openstreetmap.org/node/7251343585
4 : 33706402 : https://www.openstreetmap.org/node/33706402
5 : 1840330051 : https://www.openstreetmap.org/node/1840330051
6 : 7304213674 : https://www.openstreetmap.org/node/7304213674
7 : 1840330044 : https://www.openstreetmap.org/node/1840330044
8 : 34550845 : https://www.openstreetmap.org/node/34550845
9 : 33707108 : https://www.openstreetmap.org/node/33707108
10 : 302864793 : https://www.openstreetmap.org/node/302864793
11 : 4836722465 : https://www.openstreetmap.org/node/4836722465
12 : 304010763 : https://www.openstreetmap.org/node/304010763
13 : 5323321826 : https://www.openstreetmap.org/node/5323321826
14 : 34552857 : https://www.openstreetmap.org/node/34552857
15 : 1837997824 : https://www.openstreetmap.org/node/1837997824
16 : 12162239 : https://www.openstreetmap.org/node/12162239
17 : 3108

Pour la première donnée, nous pouvons observer qu'il y a une forte influence devant l'IUT Aix-Marseille. L'autoroute est juste à côté ce qui permet de venir beaucoup plus facilement en voiture, il y a de nombreux transport à proximité notament grâce au P+R Krypton et de nombreux étudiant y accède. Il y a également un logement universitaire ainsi qu'un restaurant et une bibliothèque universitaire juste à coté.
La seconde donnée à été supprimé il y a environ 2ans ce qui est étrange étant donné que nous avons toujours accès à la carte bien que le point n'est plus disponible. Cette donnée à été choisi pour montrer que plusieurs d'autre lien ont également ce même problème.
La donnée numéro 4 est à coté d'une fontaine un peu écarté de la route. Il y a un collège ainsi qu'un hôtel à proximité. Etant donné que c'est dans le centre ville et que c'est une petite rue. Il y est facile d'y accéder à pied.
La dernière donnée choisie est la numéro 1257. A coté de la Cour d'Appel et du Palais de Justice. Autour, il y a plusieurs magasins de vêtement ce qui favorise l'influence. L'acc-s en voiture est cependant assez difficile. 

Nous avons choisi 4 données qui sont très différente entre elles pour un meilleur visuel ainsi qu'avoir quelque donnée pertinente. En utilisant ses données, nous pouvons vérifiez si la matrice est bonne à Aix en Provence.

In [29]:
Paris = np.load("Paris, France_Matrice.npy")
Paris = Paris.T
id_Paris = np.load("Paris, France_Id_Noeud.npy")
score = score_amortie(Paris,1e-6)
t = classement(id_Paris,score)

for i in range(len(t)):
    print(f"{i} : {t[i]} : https://www.openstreetmap.org/node/{t[i]}") 

0 : 178763582 : https://www.openstreetmap.org/node/178763582
1 : 34909027 : https://www.openstreetmap.org/node/34909027
2 : 34909043 : https://www.openstreetmap.org/node/34909043
3 : 243507564 : https://www.openstreetmap.org/node/243507564
4 : 94258877 : https://www.openstreetmap.org/node/94258877
5 : 25668541 : https://www.openstreetmap.org/node/25668541
6 : 34845763 : https://www.openstreetmap.org/node/34845763
7 : 24966020 : https://www.openstreetmap.org/node/24966020
8 : 971501937 : https://www.openstreetmap.org/node/971501937
9 : 470142 : https://www.openstreetmap.org/node/470142
10 : 24984072 : https://www.openstreetmap.org/node/24984072
11 : 25580452 : https://www.openstreetmap.org/node/25580452
12 : 541421449 : https://www.openstreetmap.org/node/541421449
13 : 34845761 : https://www.openstreetmap.org/node/34845761
14 : 14798304 : https://www.openstreetmap.org/node/14798304
15 : 470153 : https://www.openstreetmap.org/node/470153
16 : 6638599300 : https://www.openstreetmap.org/no

Nous pouvons voir que le point avec le score le plus élevé est dans le boulevard Malesherbes, proche de l'Église de la Madeleine, de l'Opéra, de la Gare Saint-Lazare, de la place la Concorde et et les Champs-Élysées.
Le deuxième point est dans la rue Mayran juste à côté de la rue La Fayette