# Proses Pembelajaran Terawasi dengan Linear Regression

### Pendahuluan
Dalam video ini, kita akan mempelajari bagaimana **supervised learning** bekerja, serta bagaimana algoritma pembelajaran terawasi memproses dataset, dan apa yang dihasilkan sebagai output dari proses tersebut.

---

### Dataset pada Supervised Learning
Dalam supervised learning, kita memiliki **training set** yang terdiri dari **input features** (misalnya ukuran rumah) dan **output targets** (misalnya harga rumah). Output targets ini merupakan jawaban yang benar yang akan dipelajari oleh model.

---

### Proses Pelatihan Model
Untuk melatih model, kita memberikan **training set** yang terdiri dari input features dan output targets kepada algoritma pembelajaran terawasi. Algoritma ini kemudian menghasilkan suatu fungsi, yang akan kita sebut sebagai `f`, di mana `f` adalah fungsi yang digunakan untuk memprediksi output berdasarkan input yang diberikan.

Fungsi ini sebelumnya dikenal sebagai **hipotesis**, namun dalam video ini kita menyebutnya sebagai **fungsi f**.

---

### Prediksi oleh Model
Fungsi `f` digunakan untuk menerima input `x` dan menghasilkan suatu prediksi, yang akan kita sebut sebagai `ŷ` (y-hat). Dalam machine learning, `ŷ` merujuk pada estimasi atau prediksi dari nilai yang sebenarnya (`y`).

- **x**: Input atau fitur dari model (misalnya ukuran rumah)
- **ŷ**: Prediksi atau estimasi nilai dari output (`y`)
- **y**: Target, yaitu nilai yang sebenarnya dalam dataset pelatihan

---

### Representasi Fungsi f
Pertanyaan besar yang muncul saat merancang algoritma pembelajaran adalah bagaimana kita akan merepresentasikan fungsi `f`? Secara matematis, kita memilih representasi fungsi linear sederhana yang dapat ditulis sebagai:

`f_w,b(x) = w * x + b`

Di sini, **w** dan **b** adalah parameter yang perlu ditentukan, dan hasil dari fungsi ini (prediksi) bergantung pada nilai dari `w` dan `b`. Fungsi ini menggambarkan **linear regression** dengan satu variabel input, yang sering disebut juga sebagai **univariate linear regression**.

---

### Visualisasi Data dan Fit Line
Untuk menggambarkan hasil dari algoritma pembelajaran, kita dapat memplot dataset pelatihan pada grafik. Input `x` akan berada pada sumbu horizontal (misalnya ukuran rumah), sedangkan output `y` berada pada sumbu vertikal (misalnya harga rumah). Algoritma kemudian akan menghasilkan **best-fit line**, yang menggambarkan hubungan linier antara ukuran rumah dan harga rumah.

---

### Mengapa Memilih Fungsi Linear?
Meskipun kita bisa menggunakan fungsi non-linear, seperti kurva atau parabola, **fungsi linear** seringkali menjadi pilihan yang lebih sederhana dan mudah diimplementasikan, serta membantu membangun fondasi untuk model yang lebih kompleks di masa depan.

---

### Linear Regression dengan Satu Variabel
Model ini dikenal dengan nama **linear regression dengan satu variabel** (univariate linear regression), yang hanya menggunakan satu fitur input, misalnya ukuran rumah. Namun, ada juga variasi regresi yang melibatkan lebih dari satu fitur input, misalnya jumlah kamar tidur atau fasilitas lainnya.

---

### Menggunakan Model untuk Prediksi
Dengan model yang sudah dilatih, kita dapat menggunakannya untuk memprediksi harga rumah baru berdasarkan fitur yang diketahui (misalnya ukuran rumah). Hasil dari model ini adalah prediksi harga, yang mungkin tidak selalu tepat, tetapi merupakan estimasi berdasarkan data pelatihan.

---

### Penggunaan Fungsi Linear dalam Python (Lab Opsional)
Setelah menonton video ini, ada **lab opsional** di mana Anda tidak perlu menulis kode, hanya menjalankan kode yang sudah ada untuk melihat bagaimana fungsi linear didefinisikan dan bagaimana memilih nilai untuk `w` dan `b` agar fit dengan data pelatihan.

---

### Kesimpulan
- **Supervised learning**: Algoritma belajar dari data yang sudah dilabeli (input features dan output targets).
- **Linear regression**: Fungsi yang digunakan untuk memprediksi nilai kontinu berdasarkan hubungan linier antara input dan output.
- **Univariate Linear Regression**: Model linear dengan satu variabel input.
- **Best-fit line**: Garis yang digunakan untuk memprediksi output dari input yang diberikan.

---

### Langkah Selanjutnya
Di video berikutnya, kita akan melihat bagaimana membangun **cost function**, yang merupakan konsep penting dalam machine learning dan digunakan dalam banyak model canggih.

---
