# Memahami Bias dan Varians dalam Algoritma Pembelajaran

Anda telah melihat proses evaluasi melalui penggunaan kurva **J** dan **Jcv**, yang mewakili kesalahan pelatihan (training error) dan kesalahan validasi silang (cross-validation error). Dalam konteks ini, Anda dapat mencoba memahami apakah algoritme pembelajaran Anda mengalami **bias tinggi** atau **varians tinggi**. 

Ini adalah prosedur yang secara rutin saya lakukan ketika melatih algoritme, terutama dengan memperhatikan kesalahan pelatihan dan kesalahan validasi silang untuk memutuskan masalah apa yang dihadapi oleh algoritme saya. Pemahaman ini membantu dalam membuat keputusan yang lebih baik tentang apa yang harus dilakukan selanjutnya untuk meningkatkan kinerja algoritme pembelajaran.

## Contoh Penerapan
Mari kita lihat sebuah contoh. Misalkan Anda telah menerapkan **regresi linier reguler** untuk memprediksi harga perumahan, tetapi algoritme Anda menghasilkan tiga kesalahan besar dalam prediksi. Apa langkah selanjutnya yang harus diambil? 

Kita bisa mempertimbangkan enam ide berikut ini:
- Mendapatkan lebih banyak contoh pelatihan.
- Mencoba serangkaian fitur yang lebih kecil.
- Menambahkan fitur tambahan.
- Menggunakan **regularisasi Lambda** yang lebih kecil atau lebih besar.

Setiap teknik ini dapat memperbaiki masalah varians tinggi atau bias tinggi. Mari kita lihat lebih detail.

![image.png](attachment:image.png)

## Teknik Perbaikan Bias Tinggi vs Varians Tinggi

### 1. **Mendapatkan Lebih Banyak Contoh Pelatihan**
Jika algoritme Anda mengalami **bias tinggi**, mendapatkan lebih banyak data pelatihan tidak akan banyak membantu. Namun, jika algoritme Anda mengalami **varians tinggi**—katakanlah algoritme terlalu pas (overfitting) pada set pelatihan kecil—mendapatkan lebih banyak contoh pelatihan akan sangat membantu.

### 2. **Menggunakan Fitur yang Lebih Sedikit**
Jika algoritme memiliki terlalu banyak fitur, ini bisa menyebabkan algoritme memiliki **varians tinggi** karena terlalu fleksibel dalam menyesuaikan dengan data. Dengan mengurangi jumlah fitur, Anda dapat menyederhanakan model dan mengurangi varians tinggi.

### 3. **Menambahkan Fitur Tambahan**
Menambahkan fitur tambahan dapat memperbaiki **bias tinggi**. Jika algoritme tidak memiliki cukup informasi, ia akan sulit melakukan prediksi yang baik bahkan pada set pelatihan. Contoh klasik adalah memprediksi harga rumah berdasarkan ukuran saja, tanpa memperhitungkan jumlah kamar, usia bangunan, dll.

### 4. **Menambahkan Fitur Polinomial**
Ini mirip dengan menambahkan fitur tambahan, tetapi Anda juga memperkenalkan hubungan yang lebih kompleks antar fitur. Teknik ini dapat memperbaiki **bias tinggi**.

### 5. **Mengurangi Regularisasi Lambda**
Menggunakan nilai **Lambda** yang lebih rendah pada regularisasi berarti Anda lebih memfokuskan model pada set pelatihan, yang dapat memperbaiki **bias tinggi**.

### 6. **Meningkatkan Regularisasi Lambda**
Sebaliknya, jika model Anda terlalu sesuai dengan data (overfitting), meningkatkan nilai **Lambda** dapat membantu memperbaiki **varians tinggi**, dengan membuat model lebih halus dan generalisasi lebih baik pada data baru.

## Kesimpulan: Mengatasi Bias dan Varians

Jika algoritme Anda memiliki **varians tinggi**, ada dua pendekatan utama:
- Mendapatkan lebih banyak contoh pelatihan.
- Menyederhanakan model, misalnya dengan menggunakan fitur yang lebih sedikit atau meningkatkan regularisasi.

Sebaliknya, jika algoritme Anda mengalami **bias tinggi**, Anda dapat membuat model lebih kompleks dengan menambahkan lebih banyak fitur atau mengurangi regularisasi.

Namun, **mengurangi ukuran set pelatihan** tidak akan membantu memperbaiki bias tinggi. Sebenarnya, hal itu malah bisa memperburuk kesalahan validasi silang.

## Praktik Mengelola Bias dan Varians

Salah satu murid saya pernah berkata bahwa meskipun bias dan varians terlihat sederhana, mereka adalah konsep yang membutuhkan latihan seumur hidup untuk dikuasai. Memahami bias dan varians sangatlah penting dalam pengembangan algoritme pembelajaran yang efektif. Dengan latihan yang cukup, Anda akan menjadi lebih efektif dalam memutuskan langkah-langkah apa yang harus diambil untuk meningkatkan performa model.

Jika pada tahap ini Anda merasa sedikit kebingungan, itu normal. Melalui praktik dan latihan tambahan, pemahaman Anda akan semakin dalam. Minggu ini, di laboratorium praktik dan kuis latihan, Anda akan memiliki kesempatan lebih banyak untuk membahas konsep ini.

Selanjutnya, kita akan melihat bagaimana konsep bias dan varians ini berlaku pada **pelatihan jaringan saraf**. Mari kita lanjutkan!
