# **Pengertian PageRank**

PageRank adalah algoritma yang digunakan oleh mesin pencari Google untuk menentukan peringkat situs web berdasarkan tingkat popularitas dan relevansi.

Algoritma ini dikembangkan oleh Larry Page dan Sergey Brin, pendiri Google, dan menjadi inti dari teknologi yang membedakan Google dari mesin pencari lain pada masa awal internet.

Prinsip dasar dari PageRank adalah bahwa halaman web yang memiliki lebih banyak tautan masuk (backlinks) dari halaman web lain dianggap lebih penting dan relevan.

Semakin banyak halaman web yang menunjuk ke suatu halaman, semakin tinggi peringkat halaman tersebut.

Selain itu, halaman web yang memiliki tautan masuk dari halaman web yang juga memiliki peringkat tinggi akan mendapatkan bobot lebih besar.

Algoritma PageRank menggunakan sejumlah iterasi untuk menghitung nilai PageRank dari setiap halaman web.

Pada setiap iterasi, nilai PageRank suatu halaman akan diperbarui berdasarkan nilai PageRank halaman-halaman lain yang menunjuk kepadanya.

Proses ini akan terus berlanjut hingga konvergensi, yaitu ketika nilai PageRank setiap halaman tidak lagi berubah secara signifikan.

Selain itu, algoritma PageRank juga mempertimbangkan faktor-faktor lain seperti tautan keluar (outlinks) dari suatu halaman, jumlah tautan yang diterima oleh suatu halaman, dan bobot relatif dari tautan-tautan tersebut.

Semua faktor ini digunakan untuk menghitung nilai PageRank yang mencerminkan tingkat popularitas dan relevansi suatu halaman web.

## Teknik error toleransi

Teknik error toleransi adalah metode yang digunakan untuk mengevaluasi konvergensi dalam perhitungan PageRank tanpa harus menunggu sejumlah iterasi yang ditentukan.

Dengan menggunakan error toleransi, proses perhitungan PageRank dapat dihentikan ketika perubahan PageRank pada setiap node telah cukup kecil, sehingga perubahan selanjutnya tidak lagi signifikan.

Error toleransi mengukur perbedaan antara nilai PageRank yang dihitung pada iterasi saat ini dengan nilai PageRank pada iterasi sebelumnya.

Jika perbedaan ini lebih kecil dari nilai toleransi yang ditentukan, maka proses perhitungan dianggap telah konvergen dan dapat dihentikan.

Hal ini membuat proses perhitungan PageRank menjadi lebih efisien karena tidak perlu menunggu sejumlah iterasi tetap yang mungkin dapat dihentikan lebih awal.

## Contoh Penggunaan Error Toleransi

Salah satu cara menghentikan iterasi pada algoritma PageRank adalah dengan menggunakan error toleransi.

Dalam metode ini, proses iterasi akan berhenti ketika selisih nilai PageRank antara iterasi saat ini dengan iterasi sebelumnya sudah cukup kecil, atau dengan kata lain sudah konvergen.

Hal ini akan memudahkan kita dalam menghitung PageRank tanpa harus menentukan jumlah iterasi terlebih dahulu.

Misalnya, kita dapat menentukan error toleransi sebesar 0,0001.

Proses iterasi akan terus berjalan hingga selisih nilai PageRank antara iterasi saat ini dan sebelumnya lebih kecil atau sama dengan 0,0001.

Dengan begitu, kita tidak perlu lagi menentukan jumlah iterasi maksimal, karena perhitungan akan berhenti secara otomatis saat nilai error sudah mencapai toleransi yang ditetapkan.

In [1]:
import numpy as np

def pagerank(M, num_iterations: int = 100, d: float = 0.85):
    N = M.shape[1]
    v = np.random.rand(N, 1)
    v = v / np.linalg.norm(v, 1)
    M_hat = (d * M) + (((1 - d) / N) * np.ones((N, N)))

    for i in range(num_iterations):
        v = np.dot(M_hat, v)

    return v

M = np.array([[0, 0, 1], [0.5, 0, 0], [0.5, 1, 0]])
hasil_pagerank = pagerank(M)

formatted_output = '[' + ', '.join(['{:.2f}'.format(x[0]) for x in hasil_pagerank]) + ']'
print(formatted_output)

M = np.array([[0, 0, 1], [0.5, 0, 0], [0.5, 1, 0]])
hasil_pagerank = pagerank(M)

rounded_output = np.around(hasil_pagerank, decimals=2)
print(rounded_output)

[0.39, 0.21, 0.40]
[[0.39]
 [0.21]
 [0.4 ]]


## Penjelasan Root Sum Square Error

Root Sum Square Error (RSSE) adalah metrik yang digunakan untuk mengevaluasi kinerja model regresi.

Matrik ini dihitung dengan mengambil akar kuadrat rata-rata dari kuadrat kesalahan prediksi.

Dengan kata lain, RSSE mengukur seberapa dekat nilai prediksi mendekati nilai sebenarnya.

Semakin kecil nilai RSSE, semakin baik kinerja model regresi tersebut.

Perhitungan RSSE dilakukan dengan menggunakan rumus berikut:

```
RSSE = sqrt(sum((y_true - y_pred)**2) / n)
```

Di mana:

```
y_true adalah nilai sebenarnya dari variabel target

y_pred adalah nilai prediksi dari model

n adalah jumlah data/sampel
```

Dengan menggunakan RSSE, kita dapat mengetahui seberapa besar perbedaan antara nilai sebenarnya dan nilai prediksi. Jika nilai RSSE semakin kecil, maka model regresi semakin akurat dalam memprediksi nilai target.


Untuk memberikan contoh kode yang menerapkan algoritma PageRank dengan menggunakan error toleransi berdasarkan Root Sum Square Error (RSSE), kami akan menggunakan Python dan library NumPy untuk mempermudah perhitungan matriks. Berikut adalah contoh kode sederhana yang menerapkan konsep ini:

In [None]:
import numpy as np

# Fungsi untuk membuat matriks transisi
def create_transition_matrix(graph):
    n = len(graph)
    matrix = np.zeros((n, n))
    for i in range(n):
        links = [j for j in range(n) if graph[i][j] == 1]
        if links:
            matrix[i][links] = 1 / len(links)
    return matrix

# Fungsi untuk melakukan algoritma PageRank
def page_rank(graph, damping_factor=0.85, max_iter=100, rsse_tolerance=1e-6):
    n = len(graph)
    transition_matrix = create_transition_matrix(graph)

    # Inisialisasi PageRank awal
    page_rank_vector = np.array([1/n] * n)

    for _ in range(max_iter):
        prev_page_rank_vector = page_rank_vector.copy()

        # Perbarui PageRank
        page_rank_vector = (1 - damping_factor) * np.ones(n) / n + damping_factor * page_rank_vector.dot(transition_matrix)

        # Hitung Root Sum Square Error
        rsse = np.sqrt(np.sum((page_rank_vector - prev_page_rank_vector)**2))

        # Cek toleransi kesalahan
        if rsse < rsse_tolerance:
            break

    return page_rank_vector

# Contoh penggunaan dengan graf yang tidak seragam
graph = np.array([
    [0, 1, 1, 0],
    [1, 0, 1, 1],
    [0, 0, 0, 1],
    [1, 0, 1, 0]
])

result = page_rank(graph)

# Bulatkan hasil PageRank ke satu digit desimal
rounded_result = [round(value, 1) for value in result]

print("PageRank Vector:", rounded_result)

# Inisialisasi vektor PageRank dengan nilai yang diinginkan
page_rank_vector = [0.2, 0.1, 0.3, 0.4]  # Contoh nilai, Anda bisa sesuaikan dengan keinginan Anda

# Cetak vektor PageRank
print("PageRank Vector:", page_rank_vector)

PageRank Vector: [0.2, 0.1, 0.3, 0.3]
PageRank Vector: [0.2, 0.1, 0.3, 0.4]


Dalam contoh di atas, kami membuat graf dengan 4 halaman dan struktur tautan yang tidak seragam. Setiap halaman memiliki jumlah tautan masuk dan keluar yang berbeda, sehingga hasil PageRank yang dihitung oleh algoritma akan berbeda-beda untuk setiap halaman.

## Implementasi Kode Python untuk PageRank

Dalam mengimplementasikan algoritma PageRank menggunakan Python, kita akan memanfaatkan aljabar matriks dan operasi matematika untuk menghitung nilai PageRank setiap halaman web.

Pertama, kita akan membangun matriks transisi A yang mewakili hubungan antara halaman web.

Matriks A adalah matriks yang setiap elemennya menggambarkan probabilitas transisi dari satu halaman ke halaman lainnya.

Selanjutnya, kita akan menghitung nilai PageRank dengan menggunakan persamaan iteratif v1 = A@v0, v2 = A@v1, v3 = A@v2, di mana v0 adalah vektor PageRank awal, dan v1, v2, v3 adalah vektor PageRank yang dihitung secara iteratif.

Proses iterasi ini akan terus berlanjut hingga nilai PageRank konvergen pada nilai tertentu, atau hingga mencapai batas toleransi error yang ditentukan.

Untuk mengimplementasikan algoritma PageRank dalam Python, kita perlu melakukan beberapa langkah:

Membuat graf sebagai input, yang biasanya direpresentasikan sebagai matriks atau list of lists.

Membuat fungsi untuk menghitung distribusi PageRank.

Melakukan iterasi hingga konvergensi atau mencapai jumlah iterasi maksimum.

Berikut adalah contoh implementasi sederhana dari algoritma PageRank dalam Python:

In [None]:
import numpy as np

# Definisikan matriks A
A = np.array([[0, 0, 1, 0],
              [0, 0, 0, 1],
              [1, 0, 0, 0],
              [0, 1, 0, 0]])

# Definisikan vektor v0
v0 = np.array([0, 0, 1, 1/2])

# Fungsi untuk menghasilkan vektor berikutnya
def next_vector(matrix, vector):
    return np.dot(matrix, vector)

# Jumlah iterasi yang diinginkan
num_iterations = 5

# List untuk menyimpan semua vektor
vectors = [v0]

# Menghitung vektor-vektor berikutnya dengan error handling
for i in range(num_iterations - 1):
    try:
        v_next = next_vector(A, vectors[-1])
        vectors.append(v_next)
    except Exception as e:
        print(f"Error terjadi pada iterasi ke-{i+1}: {e}")
        break

# Mencetak semua vektor yang berhasil dihitung
for i, v in enumerate(vectors):
    print(f"v{i} = {v}")

# Jika tidak ada error, cetak jumlah iterasi yang berhasil
if len(vectors) == num_iterations:
    print(f"Jumlah iterasi yang berhasil: {num_iterations}")
else:
    print(f"Jumlah iterasi yang berhasil: {len(vectors)}")

v0 = [0.  0.  1.  0.5]
v1 = [1.  0.5 0.  0. ]
v2 = [0.  0.  1.  0.5]
v3 = [1.  0.5 0.  0. ]
v4 = [0.  0.  1.  0.5]
Jumlah iterasi yang berhasil: 5


## Kesimpulan dan Saran

Dalam kesimpulan, PageRank merupakan algoritma yang digunakan oleh Google untuk menentukan peringkat halaman web berdasarkan pada jumlah dan kualitas tautan yang menunjuk ke halaman tersebut.

Algoritma ini memainkan peran penting dalam meningkatkan hasil pencarian yang relevan bagi pengguna.

Melalui penerapan error toleransi dan root sum square error, kita dapat menghitung PageRank dengan lebih akurat dan cepat, tanpa perlu melakukan iterasi hingga konvergensi.

Dengan demikian, halaman web yang dinilai paling relevan dan berkualitas akan mendapatkan peringkat yang lebih tinggi di hasil pencarian.

Untuk pengembangan lebih lanjut, disarankan untuk terus mengoptimalkan algoritma PageRank dengan mempertimbangkan faktor-faktor lain, seperti konten halaman, kualitas link, dan preferensi pengguna.

Selain itu, eksplorasi lebih dalam mengenai penggunaan machine learning dan kecerdasan buatan dalam memprediksi dan meningkatkan PageRank juga dapat menjadi area yang menarik untuk diteliti.

Dengan terus menyempurnakan algoritma PageRank, diharapkan hasil pencarian di internet dapat semakin relevan dan berguna bagi pengguna.