# Pendahuluan
Jika Anda mencoba membuat algoritma pembelajaran untuk melakukan tugas yang bisa dilakukan manusia, tetapi algoritma Anda belum mencapai kinerja manusia, memeriksa kesalahan yang dibuat algoritma secara manual dapat memberikan wawasan tentang langkah selanjutnya. Proses ini disebut **error analysis** (analisis kesalahan). Mari kita mulai dengan contoh sederhana.

### Contoh
Misalkan Anda sedang mengembangkan klasifikasi kucing dengan akurasi **90%**, atau kesalahan **10%** pada dev set Anda. Jika akurasi ini masih di bawah target, mungkin salah satu anggota tim Anda melihat beberapa contoh yang salah diklasifikasikan dan menemukan bahwa algoritma mengkategorikan beberapa anjing sebagai kucing.

---

![image.png](attachment:image.png)

## Apakah Layak Fokus pada Kesalahan Tertentu?

Jika Anda ingin mengatasi kesalahan pengenalan anjing sebagai kucing, Anda mungkin berpikir untuk mengumpulkan lebih banyak gambar anjing atau merancang fitur khusus untuk anjing. Tapi, sebelum melakukan itu, Anda bisa melakukan **error analysis** sederhana untuk mengetahui apakah usaha ini akan signifikan.

### Langkah-Langkah Error Analysis

1. Ambil sekitar **100 contoh dev set** yang salah klasifikasi, dan periksa satu per satu secara manual.
2. Hitung berapa dari contoh-contoh tersebut yang sebenarnya gambar anjing.

Misalkan dari 100 contoh salah klasifikasi, **5%** adalah gambar anjing. Artinya, meskipun Anda menyelesaikan masalah "anjing sebagai kucing", Anda hanya akan memperbaiki **5 dari 100** kesalahan. Dengan kata lain, jika hanya 5% dari kesalahan Anda adalah gambar anjing, maka potensi perbaikan Anda dari **10% menjadi 9.5%**.

---

## Tabel Evaluasi Beberapa Ide dalam Error Analysis

![image-2.png](attachment:image-2.png)

Jika Anda memiliki beberapa ide untuk meningkatkan klasifikasi kucing, Anda dapat mengevaluasi beberapa ide sekaligus dengan **error analysis**.

### Contoh Tabel Analisis
Buat tabel dengan contoh dev set yang salah diklasifikasikan. Kolom tabel bisa mencakup beberapa masalah, misalnya:
- Masalah anjing
- Masalah "great cat" (seperti singa, panther, dll.)
- Masalah gambar buram

Tabel ini bisa dalam bentuk spreadsheet atau file teks sederhana.

| #  | Anjing | Great Cat | Buram | Komentar                       |
|----|--------|-----------|-------|--------------------------------|
| 1  | ✓      |           |       | Pitbull                       |
| 2  |        |           | ✓     | Gambar buram                  |
| 3  |        | ✓         | ✓     | Singa, hari hujan di kebun binatang |

Di akhir, hitung persentase masing-masing kategori kesalahan. Misalnya:
- **8%** adalah anjing
- **43%** adalah "great cats"
- **61%** adalah gambar buram

Jika kesalahan lebih banyak di kategori gambar buram atau "great cats", Anda bisa memprioritaskan perbaikan di area ini.

---

## Menentukan Prioritas Berdasarkan Error Analysis
Proses ini membantu Anda memutuskan apakah ide tertentu layak untuk dikerjakan, berdasarkan potensi perbaikan yang bisa dicapai. Jika persentase kesalahan dalam kategori tertentu tinggi, seperti gambar buram, maka fokus perbaikan di area tersebut mungkin lebih efektif.

### Kesimpulan
Lakukan **error analysis** untuk memprioritaskan kategori kesalahan yang paling berpengaruh terhadap performa model. Anda bisa membuat kategori baru selama analisis ini jika menemukan pola kesalahan lain, seperti filter Instagram atau Snapchat yang mengganggu kinerja klasifikasi. 

---

# Analisis Kesalahan dalam Machine Learning

## Pendahuluan
Data dalam **supervised learning** terdiri dari **input X** dan **output labels Y**. Misalnya, dalam masalah klasifikasi kucing, **Y** bernilai `1` untuk kucing dan `0` untuk bukan kucing. Jika Anda menemukan bahwa beberapa **output labels Y** salah atau **mislabeled**, apakah perlu memperbaiki label yang salah ini?

### Contoh Label yang Salah
Misalnya, saat menelusuri data: "Ini kucing, bukan kucing, kucing, kucing, bukan kucing," dan ada label yang seharusnya bukan kucing tapi ditandai sebagai kucing. Ini adalah contoh label yang salah, atau **mislabeled examples**. Istilah **incorrectly labeled examples** merujuk pada label yang salah dalam **training set**, **dev set**, atau **test set**.

## Algoritma Deep Learning dan Kesalahan pada Label
Algoritma **deep learning** umumnya cukup tangguh terhadap kesalahan acak dalam **training set**. Jika kesalahan label bersifat **acak**, biasanya tidak terlalu memengaruhi kinerja. Namun, algoritma ini kurang tangguh terhadap kesalahan **sistematis**. Misalnya, jika anjing berwarna putih terus dilabeli sebagai kucing, **classifier** bisa keliru menganggap semua anjing putih sebagai kucing.

## Kesalahan Label dalam Dev Set atau Test Set
Untuk kesalahan label dalam **dev set** atau **test set**, disarankan untuk menambahkan kolom saat **error analysis** agar dapat menghitung jumlah contoh di mana label Y salah. Misalnya, jika terdapat 100 contoh dalam dev set yang salah labelnya, maka dapat ditandai.

## Pertimbangan untuk Memperbaiki Label yang Salah
Untuk memutuskan apakah perlu memperbaiki label yang salah, perhatikan tiga angka berikut:
1. **Dev set error keseluruhan**
2. **Jumlah kesalahan yang disebabkan oleh label yang salah**
3. **Kesalahan yang disebabkan oleh faktor lain**

Jika dev set error keseluruhan mencapai 10% dan 6% di antaranya karena kesalahan label, berarti hanya 0,6% dari kesalahan disebabkan oleh kesalahan label. Namun, jika dev set error hanya 2%, dan 0,6% adalah kesalahan label, maka dampak kesalahan label lebih signifikan (30% dari kesalahan keseluruhan).

![image.png](attachment:image.png)

## Panduan untuk Memperbaiki Label di Dev dan Test Set
1. Terapkan proses perbaikan yang sama untuk **dev set** dan **test set**.
2. Periksa contoh di mana algoritma benar maupun salah.
3. Jika Anda memperbaiki label di dev dan test set, Anda mungkin tidak perlu melakukan hal yang sama di training set.

![image-2.png](attachment:image-2.png)

## Catatan Akhir
Sering kali, diperlukan **manual error analysis** untuk memprioritaskan langkah selanjutnya dalam membangun sistem machine learning. Melakukan analisis ini dapat membantu mengidentifikasi jenis kesalahan dan menentukan fokus perbaikan.

**Kesimpulan**: Pada kasus di mana persentase kesalahan akibat label salah cukup besar, perbaikan label bisa bermanfaat. Namun, jika dampaknya kecil, bisa diabaikan agar fokus pada aspek yang lebih kritis.

# Panduan Membangun Aplikasi Machine Learning

Jika Anda sedang mengembangkan aplikasi machine learning baru, salah satu saran yang sering saya berikan adalah **membangun sistem pertama Anda dengan cepat dan kemudian mengiterasinya**. Berikut adalah penjelasannya.

![image.png](attachment:image.png)

## Contoh Kasus: Speech Recognition
Saya sudah lama bekerja pada bidang **speech recognition**. Ketika Anda ingin membuat sistem pengenalan suara yang baru, ada banyak aspek yang bisa diprioritaskan. Contohnya:
- Teknik untuk membuat sistem lebih **tahan terhadap kebisingan**, seperti suara di kafe atau jalan raya.
- Metode untuk **menangani aksen** yang berbeda.
- Permasalahan yang muncul ketika **pembicara jauh dari mikrofon** (*far-field speech recognition*).
- Tantangan unik yang muncul saat **anak-anak** yang berbicara, terkait cara pengucapan dan kosakata.
- Situasi ketika pembicara sering **terbata-bata** atau menggunakan kata-kata seperti "oh", "ah", atau "um".

Ada banyak hal yang bisa dilakukan untuk meningkatkan sistem pengenalan suara, dan hal ini berlaku juga untuk aplikasi machine learning lainnya.

## Mulailah Dengan Cepat, Lalu Iterasikan
Meskipun saya sudah lama berkecimpung di bidang pengenalan suara, saat membuat sistem untuk domain aplikasi yang baru, saya tetap memerlukan waktu untuk berpikir dan menentukan prioritas.

Langkah-langkah awal yang saya sarankan:
1. **Tetapkan Dev/Test Set dan Metric**: Tentukan target awal. Jika kurang tepat, Anda bisa menyesuaikannya nanti.
2. **Bangun Sistem Awal dengan Cepat**: Temukan data pelatihan, latih model, dan lihat performanya terhadap dev/test set dan metric yang sudah ditetapkan.
3. **Gunakan Analisis Bias/Variance dan Analisis Error**: Setelah membangun sistem awal, lakukan analisis untuk menentukan area yang perlu diperbaiki. Misalnya, jika masalah utama adalah pembicara yang jauh dari mikrofon, fokuslah pada teknik *far-field speech recognition*.

### Nilai dari Sistem Awal
Sistem awal ini bisa saja **implementasi sederhana**, tidak perlu terlalu rumit. Nilai utamanya adalah memungkinkan Anda melakukan:
- **Analisis Bias/Variance**: Menentukan prioritas perbaikan.
- **Analisis Error**: Melihat kesalahan-kesalahan utama untuk memilih arah pengembangan selanjutnya.

## Kapan Harus Membangun Sistem yang Lebih Rumit?
Saran ini tidak terlalu kuat jika Anda sudah memiliki **pengalaman yang cukup di bidang yang Anda kerjakan** atau jika **literatur akademik yang relevan sudah tersedia**. Sebagai contoh, jika Anda ingin membangun sistem pengenalan wajah, Anda bisa langsung membangun sistem yang lebih kompleks berdasarkan literatur yang sudah ada.

Namun, untuk masalah yang benar-benar baru, sebaiknya jangan terlalu memikirkan solusi yang terlalu kompleks di awal. **Bangun sistem sederhana** terlebih dahulu dan gunakan untuk membantu memprioritaskan perbaikan.

## Rangkuman
Jika tujuan Anda adalah **membangun sistem yang berfungsi dengan baik** untuk aplikasi baru, cobalah:
- Membangun sesuatu yang sederhana.
- Gunakan untuk melakukan analisis bias/variance dan error.
- Gunakan hasil analisis tersebut untuk menentukan langkah perbaikan selanjutnya.

**Saran ini lebih relevan** untuk aplikasi baru, dibandingkan jika Anda sedang mencoba menciptakan algoritma machine learning yang benar-benar baru.

---