# Pengaruh Parameter Regularisasi Lambda Terhadap Bias dan Variance

Dalam video sebelumnya, kita melihat bagaimana pemilihan derajat polinomial **D** mempengaruhi bias dan variance dari algoritma pembelajaran, serta dampaknya pada performa keseluruhan. Sekarang, kita akan membahas bagaimana pemilihan **parameter regularisasi Lambda** mempengaruhi bias dan variance, serta performa keseluruhan algoritma.

Ini akan berguna saat Anda ingin memilih nilai Lambda yang baik untuk regularisasi pada algoritma Anda.

## Model Polinomial dengan Regularisasi

Kita akan menggunakan model polinomial derajat empat dengan regularisasi. Di sini, **Lambda** adalah parameter regularisasi yang mengontrol sejauh mana kita menyeimbangkan antara menjaga nilai parameter **w** kecil dan menyesuaikan data pelatihan dengan baik.

### Kasus 1: Lambda Besar

Misalnya, kita tetapkan **Lambda** = 10,000. Dengan nilai Lambda yang sangat besar, algoritma akan sangat terdorong untuk menjaga parameter **w** sangat kecil, sehingga model yang dihasilkan mendekati fungsi konstan. 

Model ini memiliki **bias tinggi** dan **underfitting** data pelatihan, yang menyebabkan kesalahan pada data pelatihan (**J_train**) menjadi besar.

### Kasus 2: Lambda Kecil

Sekarang, mari kita tetapkan **Lambda** ke nilai kecil, misalnya **Lambda = 0** (tanpa regularisasi). Tanpa regularisasi, model akan menyesuaikan polinomial derajat empat secara penuh dengan data pelatihan, yang sering menyebabkan **overfitting**.

Pada kasus ini, **J_train** akan kecil, namun kesalahan validasi silang (**J_cv**) akan jauh lebih besar daripada **J_train**, mengindikasikan **variance** tinggi.

### Kasus 3: Nilai Lambda Optimal

Dengan memilih nilai **Lambda** yang tidak terlalu besar atau kecil, kita dapat menghasilkan model yang sesuai, dengan **J_train** dan **J_cv** yang keduanya kecil. Untuk menemukan nilai Lambda yang tepat, kita bisa menggunakan **validasi silang (cross-validation)**.

![image.png](attachment:image.png)

![image-2.png](attachment:image-2.png)

## Memilih Nilai Lambda dengan Validasi Silang

### Proses Validasi Silang:

1. Mulailah dengan nilai **Lambda = 0**, lalu minimalkan fungsi biaya untuk mendapatkan parameter **w1** dan **b1**.
2. Hitung kesalahan validasi silang **J_cv** untuk parameter tersebut.
3. Ulangi proses dengan nilai Lambda lain, misalnya **Lambda = 0.01**, lalu hitung **J_cv** untuk parameter yang baru.
4. Lanjutkan dengan nilai Lambda yang lebih besar, misalnya **Lambda = 0.02**, dan seterusnya, hingga menemukan nilai optimal Lambda dengan **J_cv** terkecil.

## Pengaruh Lambda Terhadap J_train dan J_cv

Jika kita memplot nilai **J_train** dan **J_cv** terhadap Lambda, kita akan melihat:

- Pada **Lambda kecil**, **J_train** akan kecil namun **J_cv** akan besar karena **overfitting**.
- Pada **Lambda besar**, **J_train** dan **J_cv** akan keduanya besar karena **underfitting**.
- Di antara keduanya, ada nilai Lambda optimal yang menghasilkan performa terbaik dengan **J_train** dan **J_cv** yang rendah.

## Grafik Hubungan Lambda dengan J_train dan J_cv

Pada grafik berikut, sumbu **x** merepresentasikan nilai **Lambda**, sedangkan **y** adalah kesalahan:

- Untuk **Lambda = 0**, model memiliki **variance tinggi** (overfitting) dengan **J_train** kecil dan **J_cv** besar.
- Untuk **Lambda** yang sangat besar, model memiliki **bias tinggi** (underfitting) dengan **J_train** dan **J_cv** yang keduanya besar.
- Nilai optimal Lambda terletak di antara dua ekstrem ini, di mana **J_train** dan **J_cv** berada pada nilai minimum.

![image-3.png](attachment:image-3.png)

Dengan menggunakan **cross-validation**, kita bisa menentukan nilai Lambda yang memberikan hasil terbaik untuk model kita.

---

Pada video berikutnya, kita akan melihat lebih lanjut bagaimana mengukur apakah **J_train** dan **J_cv** "tinggi" atau "rendah" secara numerik, serta bagaimana menilai performa algoritma menggunakan baseline tertentu.
