# PageRank

#### **Apa itu PageRank??**
PageRank adalah algoritma yang digunakan oleh mesin pencari Google untuk memberi peringkat halaman web dalam hasil pencarian mereka. Algoritma ini dinamai menurut Larry Page, salah satu pendiri Google. PageRank bekerja dengan menghitung jumlah dan kualitas tautan ke sebuah halaman untuk menentukan estimasi kasar dari pentingnya situs web tersebut. Asumsinya adalah bahwa halaman web yang lebih penting kemungkinan besar akan menerima lebih banyak tautan dari halaman lain.

#### **Sejarah Singkat PageRank**
PageRank pertama kali diperkenalkan oleh Larry Page dan Sergey Brin, dua pendiri Google, saat mereka masih menjadi mahasiswa Ph.D. di Universitas Stanford pada tahun 1996. Nama "PageRank" berasal dari nama Larry Page.

Konsep dasar PageRank didasarkan pada ide bahwa tautan dapat dianggap sebagai suara atau dukungan untuk halaman web. Semakin banyak tautan yang mengarah ke suatu halaman, semakin penting halaman tersebut. Namun, tidak semua tautan memiliki bobot sama. Tautan dari halaman dengan PageRank tinggi memiliki bobot lebih dibandingkan tautan dari halaman dengan PageRank rendah.

PageRank awalnya digunakan oleh Google untuk mengurutkan hasil pencarian berdasarkan relevansi. Cara ini membantu Google menawarkan hasil yang lebih akurat kepada audiens, sehingga pada akhirnya meningkatkan popularitas Google itu sendiri.

Seiring berjalannya waktu, Google terus menyempurnakan algoritma PageRank untuk mengatasi berbagai tantangan, seperti upaya manipulasi peringkat oleh webmaster. Meskipun PageRank masih menjadi bagian dari algoritma Google, banyak faktor lain yang sekarang memengaruhi peringkat halaman.

Pada tahun 2000, Google meluncurkan Toolbar PageRank yang memungkinkan audiens melihat skor PageRank untuk setiap halaman web. Namun, pada tahun 2016, Google menonaktifkan fitur ini dan menegaskan bahwa PageRank adalah salah satu dari ratusan faktor yang digunakan dalam algoritma pencariannya.

#### **Apa itu Algoritma PageRank?**

Algoritma PageRank adalah sistem yang digunakan oleh Google untuk menentukan peringkat situs web di halaman hasil mesin pencari (SERP). Ini dikembangkan oleh Larry Page dan Sergey Brin, yang merupakan salah satu pendiri Google. Algoritma ini menggunakan sejumlah faktor untuk menentukan peringkat sebuah situs web. Ini termasuk jumlah dan kualitas tautan masuk, usia situs web, jumlah halaman di situs web, dan kepadatan kata kunci pada konten.

#### **contoh penggunaan algoritma PageRank**
Membuat Matriks Transisi (A):

Matriks $ A $ merepresentasikan probabilitas transisi dari satu halaman ke halaman lainnya dalam graf.
Inisialisasi Vektor Probabilitas Awal (v):

Mulailah dengan vektor $ v_0 $ di mana setiap elemen memiliki nilai yang sama, misalnya $ \frac{1}{n} $.
Iterasi Power Method:

Perkalian Matriks:
𝑣
𝑖
+
1
=
𝐴
𝑣
𝑖
v 
i+1
​
 =Av 
i
​
 
Pemeriksaan Konvergensi:
∥
𝑣
𝑖
+
1
−
𝑣
𝑖
∥
<
toleransi
∥v 
i+1
​
 −v 
i
​
 ∥<toleransi
Lanjutkan iterasi sampai vektor konvergen (perubahan antar iterasi di bawah nilai toleransi).
Menghasilkan Skor PageRank:

Vektor $ v $ akhir merupakan nilai PageRank yang menunjukkan kepentingan relatif dari setiap halaman dalam graf.

#### **Cara Kerja Algoritma PageRank**
1. **Inisialisasi Matriks Probabilitas Transisi (A)**:
   - Matriks \( A \) menyatakan probabilitas transisi antara halaman web. Setiap elemen \( A_{ij} \) menunjukkan probabilitas untuk pergi dari halaman \( i \) ke halaman \( j \).

2. **Inisialisasi Vektor PageRank Awal (\( v_0 \))**:
   - Vektor \( v_0 \) digunakan untuk menyimpan PageRank awal untuk setiap halaman web.

3. **Perkalian Matriks**:
   - Fungsi `multiplyMatrix(A, v)` mengalikan matriks probabilitas transisi \( A \) dengan vektor PageRank \( v \) untuk menghasilkan vektor PageRank baru \( v_{baru} \).

4. **Perhitungan Iterasi**:
   - Fungsi `calculateIteration(v_new, v_old)` menghitung nilai iterasi dengan menghitung perbedaan kuadrat antara vektor PageRank baru \( v_{baru} \) dan vektor PageRank sebelumnya \( v_{lama} \).

5. **Iterasi Konvergensi**:
   - Proses iteratif dimulai dengan menghitung vektor PageRank baru menggunakan perkalian matriks. Iterasi berlanjut sampai nilai iterasi berada di bawah toleransi yang ditentukan.

6. **Pengurutan PageRank**:
   - Setelah iterasi selesai, fungsi `pageRank(v)` digunakan untuk mengembalikan urutan halaman berdasarkan PageRank yang dihasilkan.

7. **Output**:
   - Urutan halaman yang dihasilkan dari fungsi `pageRank(result)` dicetak sebagai hasil akhir dari proses PageRank.


#### **Implementasi code python**

In [5]:
import numpy as np

def create_transition_matrix(adj_matrix):
    n = adj_matrix.shape[0]
    transition_matrix = np.zeros_like(adj_matrix, dtype=float)
    for i in range(n):
        if adj_matrix[:, i].sum() != 0:
            transition_matrix[:, i] = adj_matrix[:, i] / adj_matrix[:, i].sum()
    return transition_matrix

def power_method_page_rank(adj_matrix, alpha=0.85, tol=1e-6, max_iter=100):
    n = adj_matrix.shape[0]
    transition_matrix = create_transition_matrix(adj_matrix)
    teleport_matrix = np.ones((n, n)) / n
    stochastic_matrix = alpha * transition_matrix + (1 - alpha) * teleport_matrix
    page_rank = np.ones(n) / n

    for _ in range(max_iter):
        new_page_rank = np.dot(stochastic_matrix, page_rank)
        if np.linalg.norm(new_page_rank - page_rank, ord=1) < tol:
            break
        page_rank = new_page_rank

    return page_rank

# Contoh graf sebagai adjacency matrix
adj_matrix = np.array([
    [0, 0, 1],
    [1, 0, 0],
    [1, 1, 0]
])

# Hitung PageRank
page_rank = power_method_page_rank(adj_matrix)
print("PageRank untuk setiap halaman:")
for i, rank in enumerate(page_rank):
    print(f"Halaman {i+1}: {rank:.4f}")


PageRank untuk setiap halaman:
Halaman 1: 0.3878
Halaman 2: 0.2148
Halaman 3: 0.3974
