# Prediksi Rating Film dengan Regressi Linier dan Collaborative Filtering

Pada video sebelumnya, Anda melihat bagaimana jika Anda memiliki **features** untuk setiap film, seperti **features** $x_1$ dan $x_2$ yang menunjukkan seberapa besar film tersebut merupakan film **romance** atau **action**, maka Anda bisa menggunakan **linear regression** untuk memprediksi rating film. 

Namun, bagaimana jika kita tidak memiliki **features** $x_1$ dan $x_2$? Mari kita lihat bagaimana kita dapat belajar atau menghasilkan **features** $x_1$ dan $x_2$ dari data.

---

## Data Awal

Inilah data yang kita miliki sebelumnya. Namun, jika kita tidak tahu nilai dari **features** $x_1$ dan $x_2$, kita bisa menggantinya dengan tanda tanya (?) untuk menunjukkan bahwa kita tidak tahu nilainya.

Untuk keperluan ilustrasi, misalkan kita telah mempelajari parameter-parameter untuk empat pengguna sebagai berikut:

- $ w^1 = [5, 0] $ dan $ b^1 = 0 $ untuk pengguna pertama.
- $ w^2 = [5, 0] $ dan $ b^2 = 0 $ untuk pengguna kedua.
- $ w^3 = [0, 5] $ dan $ b^3 = 0 $ untuk pengguna ketiga.
- $ w^4 = [0, 5] $ dan $ b^4 = 0 $ untuk pengguna keempat.

---

![image.png](attachment:image.png)

## Prediksi Rating dengan Dot Product

Sebagai pengingat, untuk memprediksi rating pengguna $j$ terhadap film $i$, kita akan menggunakan dot product antara $w^j$ dan **features** dari film $x^i$, ditambah bias $b^j$. Dalam contoh ini, kita abaikan $b$ karena semua nilainya 0.

---

## Estimasi Fitur untuk Film

Misalkan kita mencoba menebak **features** yang masuk akal untuk film pertama. Berdasarkan parameter yang telah kita pelajari untuk empat pengguna, kita bisa mengatur **features** film pertama sebagai $[1, 0]$, sehingga:

- $ w^1 \cdot x^1 = 5 $, sesuai dengan rating Alice terhadap film ini.
- $ w^2 \cdot x^1 = 5 $, sesuai dengan rating Bob.
- $ w^3 \cdot x^1 $ dan $ w^4 \cdot x^1 $ mendekati 0 karena pengguna lain tidak memberikan rating yang tinggi.

---

## Menentukan Fungsi Cost untuk Fitur $x_1$ dan $x_2$

![image-2.png](attachment:image-2.png)

Mari kita buat fungsi cost untuk mempelajari nilai $x_1$ dan $x_2$. Kita ingin meminimalkan **squared error** antara rating yang diprediksi dan rating sebenarnya. Untuk film $i$, fungsi cost-nya adalah:

$$
\text{Cost}(x^i) = \sum_{j \in \text{user rated}} \frac{1}{2}(w^j \cdot x^i - y_{i,j})^2 + \frac{\lambda}{2} \sum_{k=1}^{n} (x^i_k)^2
$$

Dimana $y_{i,j}$ adalah rating sebenarnya, dan $\lambda$ adalah faktor regularisasi untuk menghindari overfitting.

---

## Collaborative Filtering

![image-3.png](attachment:image-3.png)

Karena kita memiliki banyak pengguna yang menilai film yang sama, kita bisa membuat tebakan yang lebih baik untuk **features** film tersebut. Dengan menggunakan **collaborative filtering**, kita bisa belajar **features** $x_1$ sampai $x_n$ untuk semua film, dan kemudian memprediksi rating yang belum diberikan oleh pengguna lain. 

Algoritma ini sangat berguna dalam sistem rekomendasi film atau produk. Dengan mengumpulkan data dari beberapa pengguna yang bekerja sama (kolaboratif), kita bisa memprediksi bagaimana pengguna lain mungkin memberikan rating di masa depan.

---

## Optimasi dengan Gradient Descent

![image-3.png](attachment:image-3.png)

Untuk meminimalkan fungsi cost di atas, kita dapat menggunakan **gradient descent**. Pada dasarnya, kita melakukan pembaruan terhadap parameter $w$, $b$, dan **features** $x$ secara berulang-ulang sampai kita mendapatkan nilai optimal. Algoritma ini mirip dengan **gradient descent** yang telah dipelajari di regresi linier.

$$
w := w - \alpha \frac{\partial}{\partial w} \text{Cost}(w, b, x)
$$
$$
x := x - \alpha \frac{\partial}{\partial x} \text{Cost}(w, b, x)
$$

---

## Kesimpulan

Dengan **collaborative filtering**, kita bisa belajar **features** dari film yang tidak diketahui sebelumnya hanya berdasarkan rating yang diberikan oleh beberapa pengguna. Algoritma ini memungkinkan prediksi yang lebih baik terhadap rating pengguna yang belum memberikan rating terhadap film tertentu.

Pada video selanjutnya, kita akan melihat bagaimana model ini dapat digeneralisasi untuk label biner, seperti menyukai atau tidak menyukai sebuah item. Mari kita lanjutkan ke video berikutnya.
