### Regresi Polinomial: Memahami Model yang Lebih Kompleks

Di dunia pembelajaran mesin, **regresi linier** sering kali digunakan untuk memodelkan hubungan antara variabel independen dan variabel dependen. Namun, dalam banyak kasus, hubungan antara fitur dan target tidak selalu linier. Inilah saatnya untuk memperkenalkan **regresi polinomial**, yang memungkinkan kita untuk menyesuaikan **kurva** atau **fungsi non-linear** pada data kita, daripada hanya menggunakan garis lurus. Mari kita jelajahi konsep ini lebih dalam.

---

### **Contoh Data Set Perumahan:**

Bayangkan Anda memiliki dataset perumahan yang hanya mencakup satu fitur, yaitu **ukuran rumah dalam kaki persegi (x)**. Jika Anda memplot data ini, Anda mungkin akan melihat bahwa harga rumah tidak mengikuti pola garis lurus yang sederhana. Mungkin harga rumah lebih tinggi untuk ukuran rumah yang lebih besar, namun hubungan tersebut tidak linier, atau bisa lebih **melengkung**.

#### Menggunakan Regresi Polinomial untuk Menangkap Hubungan Non-Linier

Jika data Anda tampaknya mengikuti **kurva** (misalnya, harga rumah mungkin meningkat secara signifikan setelah ukuran rumah mencapai titik tertentu), model **regresi linier** sederhana tidak cukup memadai. Di sini, **regresi polinomial** menjadi solusi.

Misalkan Anda memiliki **ukuran rumah** sebagai fitur utama (x). Dalam **regresi polinomial**, kita bisa menambahkan **x²** (ukuran kuadrat) dan **x³** (ukuran kubik) sebagai fitur tambahan untuk memungkinkan model menangkap **hubungan non-linier**.

---

### **Apa Itu Regresi Polinomial?**

**Regresi polinomial** adalah jenis regresi linier di mana kita menambahkan fitur yang lebih kompleks, seperti **x²**, **x³**, dan seterusnya, untuk menangkap hubungan yang lebih kompleks dalam data. Sebagai contoh, dengan regresi polinomial tingkat dua, kita tidak hanya menggunakan fitur **x**, tetapi juga **x²** untuk membentuk model seperti ini:

$$
f(x) = w_1 \cdot x + w_2 \cdot x^2 + b
$$

Ini memungkinkan kita untuk menyesuaikan **kurva kuadratik** pada data. Dalam kasus perumahan, ini mungkin memberikan model yang lebih tepat karena kita tidak hanya mengandalkan hubungan linier antara ukuran rumah dan harga, tetapi juga memasukkan efek dari **ukuran rumah yang lebih besar** yang mungkin memiliki dampak yang lebih besar pada harga.

Jika **regresi polinomial** tingkat dua (kuadratik) tidak cukup, kita bisa menggunakan **regresi polinomial tingkat tiga (kubik)** dengan menambahkan **x³** sebagai fitur tambahan:

$$
f(x) = w_1 \cdot x + w_2 \cdot x^2 + w_3 \cdot x^3 + b
$$

---

### **Pentingnya Skala Fitur**

Ketika Anda menambahkan fitur-fitur baru seperti **x²** dan **x³**, **skala fitur** menjadi sangat penting. Misalnya, jika **x** adalah ukuran rumah dalam kaki persegi dan berkisar antara 1 hingga 1000, maka **x²** akan berkisar dari 1 hingga 1.000.000, dan **x³** akan berkisar dari 1 hingga 1.000.000.000. Fitur-fitur ini memiliki rentang nilai yang sangat berbeda dibandingkan dengan **x**.

**Mengapa ini penting?** Karena perbedaan skala yang besar antara fitur asli dan fitur polinomial dapat menyebabkan masalah dalam algoritma pembelajaran mesin, terutama jika Anda menggunakan **gradient descent** untuk melatih model. Oleh karena itu, sangat disarankan untuk melakukan **scaling** (penskalaan) fitur, seperti **normalisasi** atau **standarisasi**, sebelum melanjutkan dengan pelatihan model.

---

### **Alternatif: Menggunakan Akar Kuadrat sebagai Fitur**

Selain menggunakan **x²** dan **x³**, ada alternatif lain yang dapat digunakan, seperti **akar kuadrat** dari **x**. Fungsi akar kuadrat memiliki karakteristik unik yang tidak terlalu curam seperti **x²**, namun tetap menunjukkan **pertumbuhan yang lebih lambat** seiring meningkatnya nilai **x**.

Sebagai contoh, Anda bisa menggunakan model berikut:

$$
f(x) = w_1 \cdot x + w_2 \cdot \sqrt{x} + b
$$

Dengan pendekatan ini, harga rumah mungkin tidak akan menurun dengan ukuran, tetapi perubahan harga rumah menjadi lebih lambat pada ukuran yang sangat besar, menciptakan model yang lebih realistis untuk beberapa jenis dataset.

---

### **Memilih Fitur yang Tepat:**

Lalu, bagaimana Anda memilih fitur mana yang harus digunakan dalam model? **Rekayasa fitur** adalah kunci untuk memahami fitur mana yang paling relevan untuk prediksi Anda. Dalam prakteknya, Anda akan perlu bereksperimen dengan berbagai jenis fitur, seperti **x**, **x²**, **x³**, atau **√x**, untuk melihat mana yang memberikan hasil terbaik dalam hal prediksi.

Di dalam kursus ini, Anda akan belajar cara mengevaluasi dan memilih fitur yang optimal berdasarkan kinerja model, yang memungkinkan Anda untuk mengukur seberapa baik setiap fitur berkontribusi pada prediksi model Anda.

---

### **Kesimpulan:**

**Regresi polinomial** adalah cara yang sangat berguna untuk menangani data yang tidak mengikuti pola linier yang sederhana. Dengan menambahkan fitur-fitur seperti **x²** dan **x³**, kita dapat menangkap hubungan yang lebih kompleks dalam data kita. Selain itu, kita juga harus selalu berhati-hati dengan **skala fitur**, terutama ketika fitur baru memiliki rentang nilai yang jauh lebih besar dibandingkan dengan fitur asli.

Dalam **regresi polinomial**, ada banyak pilihan dalam hal jenis fitur yang digunakan, apakah itu **kuadrat**, **kubic**, atau bahkan **akar kuadrat**. Semua ini dapat menciptakan model yang lebih akurat dan fleksibel, yang lebih mampu menangani hubungan non-linier antara data dan target.

---

### **Lab Opsional:**

Untuk memperdalam pemahaman Anda, ada **lab opsional** yang akan membahas cara menerapkan regresi polinomial dengan menggunakan **Scikit-learn**, pustaka machine learning yang banyak digunakan. Dalam lab ini, Anda akan belajar tidak hanya menerapkan **regresi linier**, tetapi juga bagaimana melakukannya dengan lebih efisien menggunakan pustaka open-source yang sangat kuat ini.

Meskipun menggunakan pustaka seperti **Scikit-learn** sangat praktis, penting untuk memahami dasar dari algoritma ini terlebih dahulu dengan menerapkannya secara manual. Dengan demikian, Anda akan mendapatkan pemahaman yang lebih dalam tentang cara kerja model ini, yang sangat berharga dalam pengembangan keterampilan Anda di machine learning.

---

**Penutupan:**

Selamat telah menyelesaikan video ini! Jangan lupa untuk mencoba **lab praktik** dan **kuis praktik** untuk menguji pemahaman Anda tentang regresi polinomial dan teknik regresi lainnya.

Pada minggu depan, kita akan beralih ke topik baru yang lebih menantang: **klasifikasi**, yang memprediksi kategori atau label daripada angka. Terus berlatih dan semoga sukses! Sampai jumpa minggu depan!