# **ALGORITMA PAGE RANK**

# *Apa itu PageRank?*
PageRank adalah algoritma yang diciptakan oleh Larry Page dan digunakan oleh Google untuk memberikan bobot numerik pada setiap elemen dokumen hyperlink. Tujuannya adalah mengukur kepentingan dalam kumpulan dokumen seperti World Wide Web. PageRank menghitung probabilitas pengguna berpindah antar halaman, dan konsep ini juga dapat diterapkan pada hubungan antar kalimat dalam dokumen.

# *Konsep PageRank*
PageRank memperhitungkan inbound link (link masuk) dan outbound link (link keluar) dari setiap halaman web. Sebuah halaman dianggap penting jika banyak halaman lain merujuk kepadanya, terutama jika halaman-halaman yang merujuk memiliki ranking tinggi. Proses penentuan ranking ini bersifat rekursif, di mana ranking halaman web ditentukan oleh ranking halaman web lain yang merujuk kepadanya. 

Untuk menentukan pentingnya sebuah halaman web, kita menghitung jumlah halaman lain yang merujuk ke halaman tersebut. Namun, ini mengabaikan perbedaan pentingnya setiap halaman. Pendekatan yang lebih baik adalah dengan mendistribusikan kepentingan halaman secara merata ke semua halaman yang ditautkannya. 

Skor halaman $ j $ dihitung berdasarkan skor halaman-halaman $ i $ yang merujuk padanya, dibagi dengan jumlah tautan keluar dari halaman $i$ :

$
r_j = \sum_{i \text{ yang mengarah ke } j} \frac{r_i}{d_i}
$

Pendekatan ini memberikan ukuran yang lebih akurat dengan mempertimbangkan kualitas halaman yang memberikan tautan.

PageRank dapat dilihat sebagai rantai Markov, di mana graf web direpresentasikan dengan matriks transisi. Matriks transisi ini menunjukkan probabilitas berpindah dari satu halaman ke halaman lainnya. Distribusi awal adalah merata, artinya setiap halaman web memiliki peluang awal yang sama untuk dipilih.



# *Langkah-langkah Penggunaan Algoritma Power Method pada PageRank*

1. **Buat Matriks Transisi (A):**
   - Matriks $ A $ menunjukkan probabilitas berpindah dari satu halaman ke halaman lainnya.

2. **Inisialisasi Vektor Probabilitas Awal (v):**
   - Mulai dengan vektor $ v_0 $ yang memiliki nilai merata, misalnya $ \frac{1}{n} $ untuk setiap elemen.

3. **Iterasi Power Method:**
   - **Perkalian Matriks:**
     $
     v_{i+1} = A v_i
     $
   - **Pemeriksaan Konvergensi:**
     $
     \| v_{i+1} - v_i \| < \text{toleransi}
     $
   - Ulangi hingga vektor konvergen.

4. **Output Hasil PageRank:**
   - Vektor $ v $ yang dihasilkan adalah skor PageRank, menunjukkan kepentingan relatif dari setiap halaman.

In [1]:
# Contoh implementasi pada code
import numpy as np

def perkalianMatriks(A,v0):
  vbaru = A@v0
  return vbaru

def hitung(vbaru,vlama):
  temp = 0
  for i in range(len(vbaru)):
    temp += (vbaru[i] - vlama[i])**2
  return temp

def converge(A,v0,toleransi):
  count = 1
  vbaru = perkalianMatriks(A,v0)
  iterasi = hitung(vbaru,v0)
  print(f'v{count} = {vbaru}')
  print(f'iterasi ke-{count} = {iterasi}')
  print()
  while iterasi > toleransi :
    vbaru2 = perkalianMatriks(A,vbaru)
    iterasi = hitung(vbaru2,vbaru)
    print(f'v{count+1} = {vbaru}')
    print(f'iterasi ke-{count+1} = {iterasi}')
    print()
    vbaru = vbaru2
    count += 1
  return f'urutan = {pageRank(vbaru2)}'

def pageRank(vbaru):
  return np.argsort(vbaru,axis=0)[::-1]

A = np.array([[0,0,0,0,1/3],[0,0,1/2,1,1/3],[1/3,0,0,0,1/3],[1/3,0,1/2,0,0],[1/3,1,0,0,0]])
v0 = np.array([[0.2],[0.2],[0.2],[0.2],[0.2]])
toleransi = 0.01
hasil = converge(A,v0,toleransi)
print(hasil)

v1 = [[0.06666667]
 [0.36666667]
 [0.13333333]
 [0.16666667]
 [0.26666667]]
iterasi ke-1 = [0.05555556]

v2 = [[0.06666667]
 [0.36666667]
 [0.13333333]
 [0.16666667]
 [0.26666667]]
iterasi ke-2 = [0.02395062]

v3 = [[0.08888889]
 [0.32222222]
 [0.11111111]
 [0.08888889]
 [0.38888889]]
iterasi ke-3 = [0.00768176]

urutan = [[4]
 [1]
 [2]
 [0]
 [3]]


# *Referensi*

1). [https://id.wikipedia.org/wiki/PageRank](https://id.wikipedia.org/wiki/PageRank)

2). [https://mti.binus.ac.id/2021/12/31/algoritma-pagerank/](https://mti.binus.ac.id/2021/12/31/algoritma-pagerank/)

3). [https://towardsdatascience.com/pagerank-algorithm-fully-explained-dc794184b4af](https://towardsdatascience.com/pagerank-algorithm-fully-explained-dc794184b4af)

