# Transfer Learning

## Apa itu Transfer Learning?

Salah satu ide paling kuat dalam **deep learning** adalah bahwa terkadang Anda dapat mengambil pengetahuan yang telah dipelajari oleh jaringan neural dari satu tugas dan menerapkan pengetahuan tersebut ke tugas yang terpisah. Sebagai contoh, Anda bisa mengajarkan jaringan neural untuk mengenali objek seperti kucing, lalu menggunakan pengetahuan tersebut untuk membantu membaca pemindaian sinar-X. Ini disebut **transfer learning**.

## Proses Transfer Learning

1. **Melatih Neural Network pada Tugas Pertama**  
   Pertama, Anda melatih jaringan neural pada **image recognition** dengan pasangan data X dan Y, di mana X adalah gambar dan Y adalah objek yang dikenali (misalnya kucing, anjing, burung, dll). Jaringan neural ini dilatih untuk mengenali objek dalam gambar.

2. **Menerapkan Transfer Learning ke Tugas Lain**  
   Setelah model dilatih, Anda dapat mentransfer pengetahuan yang telah dipelajari ke tugas lain, seperti **radiology diagnosis** (membaca pemindaian sinar-X). Untuk melakukan ini:
   - Hapus lapisan output terakhir dan bobot yang mengarah ke lapisan tersebut.
   - Buat lapisan output baru yang disesuaikan untuk tugas baru, dan inisialisasi bobotnya secara acak.

3. **Pelatihan pada Tugas Baru**  
   - **Jika dataset radiologi kecil**: Anda dapat melatih ulang hanya lapisan output terakhir (lapisan yang baru saja ditambahkan).
   - **Jika dataset radiologi besar**: Anda bisa melatih ulang semua lapisan dalam jaringan neural.

### Pre-Training dan Fine-Tuning

- **Pre-training**: Pelatihan pertama dengan dataset **image recognition** untuk menginisialisasi bobot jaringan neural.
- **Fine-tuning**: Pelatihan ulang jaringan pada dataset tugas baru, seperti **radiology diagnosis**, untuk memperbaiki bobot.

## Contoh Kasus Penggunaan Transfer Learning

### 1. Penggunaan dalam **Image Recognition** ke **Radiology Diagnosis**
   Pengetahuan yang dipelajari dalam mengenali fitur dasar gambar (seperti mendeteksi tepi, kurva, dan objek dasar) dari dataset image recognition yang besar dapat membantu jaringan dalam diagnosis radiologi meskipun dataset radiologi kecil.

### 2. Penggunaan dalam **Speech Recognition** ke **Wake Word Detection**
   Anda bisa mentransfer pengetahuan yang dipelajari dari sistem pengenalan suara (misalnya, pengenalan suara manusia) untuk membangun sistem deteksi **wake word** (seperti "Alexa", "OK Google", dll).

## Kapan Transfer Learning Masuk Akal?

Transfer learning masuk akal ketika Anda memiliki banyak data untuk tugas **A** (misalnya, pengenalan gambar), namun hanya sedikit data untuk tugas **B** (misalnya, diagnosis radiologi atau deteksi kata bangun). Dalam hal ini, transfer learning memungkinkan pengetahuan dari tugas A untuk mempercepat proses belajar di tugas B.

Namun, transfer learning tidak masuk akal jika **B** memiliki lebih banyak data daripada **A**, karena data untuk tugas B lebih berharga untuk meningkatkan performa di tugas B.

### Contoh Kasus:
- **Image Recognition ke Radiology Diagnosis**: Jika Anda memiliki banyak data untuk pengenalan gambar, tetapi hanya sedikit data untuk diagnosis radiologi, maka transfer learning dapat memberikan keuntungan besar.
- **Speech Recognition ke Wake Word Detection**: Jika Anda memiliki banyak data untuk pengenalan suara tetapi hanya sedikit data untuk deteksi wake word, transfer learning juga akan sangat berguna.

## Kapan Transfer Learning Tidak Masuk Akal?

Transfer learning tidak akan banyak membantu jika Anda memiliki lebih banyak data untuk tugas **B** daripada untuk tugas **A**. Misalnya, jika Anda sudah memiliki ribuan gambar sinar-X untuk diagnosis radiologi, transfer learning dari dataset pengenalan gambar (seperti kucing dan anjing) tidak akan memberikan banyak keuntungan.

## Kesimpulan

Transfer learning sangat berguna ketika:
- **Tugas A** memiliki banyak data dan **Tugas B** memiliki sedikit data.
- Pengetahuan dari tugas A dapat membantu memahami fitur dasar yang dapat diterapkan di tugas B (seperti fitur dasar dalam pengenalan gambar yang membantu diagnosis radiologi).

Namun, transfer learning tidak akan memberikan banyak keuntungan jika data untuk tugas B sudah cukup banyak.

---

**Multitask Learning**: Ada juga versi lain dari pembelajaran yang disebut **multitask learning**, di mana Anda mencoba belajar dari beberapa tugas secara bersamaan daripada belajar dari satu tugas dan kemudian mentransfernya ke tugas lain.

---


Perbedaan utama dibandingkan dengan contoh **binary classification** sebelumnya adalah Anda kini menjumlahkan di atas **j** yang berjalan dari 1 hingga 4.

### **Perbandingan dengan Softmax Regression**
Perbedaan utama antara ini dan **softmax regression** adalah, tidak seperti **softmax regression** yang menetapkan satu label untuk satu contoh, di sini satu gambar bisa memiliki beberapa label. Anda tidak mengatakan bahwa setiap gambar hanya berisi **pejalan kaki**, **mobil**, **rambu berhenti**, atau **lampu lalu lintas** saja. Anda menanyakan, untuk setiap gambar, apakah terdapat **pejalan kaki**, **mobil**, **rambu berhenti**, atau **lampu lalu lintas**. Banyak objek bisa muncul dalam gambar yang sama.

### **Multi-task Learning**
Dengan setting ini, satu gambar dapat memiliki beberapa label. Jika Anda melatih **neural network** untuk meminimalkan **cost function** ini, Anda sedang melakukan **multi-task learning**. Anda membangun satu **neural network** yang melihat setiap gambar dan secara bersamaan menyelesaikan empat tugas, yaitu mendeteksi **pejalan kaki**, **mobil**, **rambu berhenti**, dan **lampu lalu lintas**.

### **Keuntungan Multi-task Learning**
Salah satu keuntungan **multi-task learning** adalah jika beberapa fitur awal dalam **neural network** dapat dibagikan antar objek yang berbeda, maka melatih satu **neural network** untuk melakukan empat hal akan menghasilkan performa yang lebih baik dibandingkan melatih empat **neural network** terpisah untuk melakukan masing-masing tugas secara terpisah.

### **Data yang Tidak Lengkap dalam Multi-task Learning**
Terkadang, beberapa gambar mungkin hanya memiliki sebagian label yang dilabeli. Dalam hal ini, Anda bisa tetap melatih algoritma Anda untuk melakukan empat tugas sekaligus, meskipun beberapa gambar hanya memiliki subset dari label atau bahkan label yang tidak pasti. Jika ada nilai yang tidak ada atau kosong, Anda hanya akan menjumlahkan label yang ada.

### **Kapan Multi-task Learning Cocok?**
**Multi-task learning** biasanya cocok dalam tiga kondisi berikut:

1. **Fitur rendah-level yang dapat dibagikan antar tugas**: Misalnya, dalam contoh **kendaraan otonom**, mengenali **lampu lalu lintas** dan **mobil** akan memiliki fitur serupa yang juga dapat membantu mengenali **rambu berhenti**.
   
2. **Data yang cukup serupa antar tugas**: Jika Anda memiliki 1.000 contoh untuk setiap tugas, maka menggunakan data dari satu tugas untuk meningkatkan performa tugas lainnya akan sangat bermanfaat.

3. **Kemampuan untuk melatih neural network besar**: **Multi-task learning** bekerja lebih baik ketika Anda dapat melatih neural network besar yang cukup kuat untuk menangani semua tugas sekaligus.

![image.png](attachment:image.png)

![image-2.png](attachment:image-2.png)

### **Transfer Learning vs Multi-task Learning**
**Transfer learning** lebih sering digunakan dalam praktik, terutama ketika Anda memiliki dataset kecil untuk tugas tertentu, lalu memanfaatkan dataset besar dari tugas terkait untuk memindahkan pengetahuan dan mengatasi masalah tersebut. **Multi-task learning** lebih jarang digunakan, meskipun dalam beberapa aplikasi **computer vision**, seperti **object detection**, satu **neural network** yang mendeteksi berbagai objek sekaligus lebih efektif daripada menggunakan beberapa **neural network** yang terpisah.

## **Kesimpulan**
**Multi-task learning** memungkinkan Anda untuk melatih satu **neural network** untuk menyelesaikan banyak tugas, yang dapat memberikan performa lebih baik daripada melatih tugas-tugas tersebut secara terpisah. Namun, **transfer learning** lebih sering diterapkan karena lebih mudah digunakan, terutama saat data untuk tugas yang ingin diselesaikan terbatas.


# Pengembangan Terkini dalam End-to-End Deep Learning

### 1. Apa Itu End-to-End Deep Learning?
End-to-end learning adalah pendekatan dalam deep learning di mana sistem yang biasanya membutuhkan beberapa tahap pemrosesan kini dapat digantikan hanya dengan satu neural network. 

### 2. Contoh Penerapan End-to-End Deep Learning
   - **Speech Recognition**:
      - Pada sistem tradisional, pengenalan suara memiliki banyak tahap, seperti ekstraksi fitur menggunakan algoritma seperti **MFCC**, deteksi **phonemes** (satuan suara dasar), hingga penggabungan phonemes menjadi kata dan kalimat.
      - **Pendekatan End-to-End**: Sebuah neural network besar dilatih untuk langsung mengonversi audio menjadi transkrip tanpa tahapan-tahapan tersebut.

   - **Face Recognition**:
      - Contoh lain adalah turnstile dengan pengenalan wajah, yang digunakan di banyak kantor di China. Kamera mendeteksi wajah dan mengidentifikasi tanpa perlu kartu **RFID**.
      - **Pendekatan Multi-Step**: Pertama, sistem mendeteksi wajah dan melakukan crop pada wajah sebelum diproses lebih lanjut oleh neural network untuk identifikasi.

### 3. Tantangan End-to-End Deep Learning
   - **Jumlah Data yang Dibutuhkan**: Pendekatan ini membutuhkan dataset yang sangat besar agar berfungsi efektif.
   - Misalnya, dalam pengenalan suara, diperlukan lebih dari 10.000 jam data untuk membuat sistem end-to-end bekerja optimal. Sementara itu, pipeline tradisional dapat bekerja dengan baik dengan data yang lebih sedikit.
   - **Pendekatan Hybrid**: Jika data yang dimiliki terbatas, dapat digunakan pendekatan hybrid yang melibatkan pemrosesan tahap awal, tetapi neural network akan menangani sebagian proses akhir.

### 4. Keuntungan dan Kekurangan End-to-End Learning
   - **Keuntungan**:
      - **Sederhana**: Menghilangkan kebutuhan untuk komponen yang dirancang secara manual.
      - **Efisiensi**: Mengurangi kompleksitas pemrosesan data.
   - **Kekurangan**:
      - **Tidak selalu optimal**: Pada kasus tertentu, pemecahan masalah menjadi beberapa sub-tugas justru lebih efektif.

![image.png](attachment:image.png)

### 5. Contoh Kasus Lainnya
   - **Machine Translation**:
      - Dalam penerjemahan bahasa, sistem tradisional menganalisis teks dan mengekstrak fitur sebelum diterjemahkan. Dengan data pasangan bahasa (misalnya, Inggris dan Prancis) yang memadai, deep learning dapat melakukan penerjemahan secara langsung.
   - **X-Ray Bone Age Estimation**:
      - Untuk estimasi usia anak dari X-ray, metode tradisional mengenali segmen tulang terlebih dahulu sebelum memperkirakan usia berdasarkan tabel pertumbuhan rata-rata. End-to-end tidak efisien karena keterbatasan data X-ray yang lengkap untuk tugas ini.

![image-2.png](attachment:image-2.png)

### 6. Kesimpulan
   - End-to-end deep learning mampu menyederhanakan proses dan mengurangi ketergantungan pada komponen manual, namun membutuhkan data yang banyak.
   - Pendekatan hybrid atau multi-step bisa lebih efektif dalam situasi di mana data end-to-end kurang memadai.

> **Note**: Pada kasus yang tepat, pendekatan ini dapat meningkatkan performa, namun tidak selalu merupakan solusi terbaik untuk semua masalah. 

Selanjutnya, kita akan mempelajari kapan end-to-end deep learning sebaiknya digunakan dan bagaimana menggabungkan sistem machine learning yang kompleks.


# Panduan Menerapkan End-to-End Deep Learning pada Sistem Pembelajaran Mesin

Dalam membangun sistem **Machine Learning**, mungkin Anda perlu memutuskan apakah ingin menggunakan pendekatan **End-to-End**. Berikut adalah beberapa **keuntungan** dan **kerugian** dari **End-to-End Deep Learning** beserta panduan untuk mengetahui apakah pendekatan ini cocok untuk aplikasi Anda.

## Keuntungan End-to-End Learning

1. **Data Menjadi Fokus Utama**
   - Dengan **End-to-End Learning**, sistem memungkinkan data untuk “berbicara” sendiri. Jika Anda memiliki cukup data **X,Y**, maka **neural network** akan mencari fungsi yang paling sesuai dari **X ke Y**. 
   - Pendekatan ini memungkinkan **neural network** untuk menangkap pola statistik dalam data, tanpa terpengaruh oleh konsep yang ditentukan manusia.

2. **Pengurangan Desain Manual**
   - Pendekatan ini mengurangi kebutuhan untuk desain manual komponen-komponen fitur. Artinya, Anda tidak perlu banyak menghabiskan waktu merancang fitur atau representasi intermediate secara manual.

![image.png](attachment:image.png)

## Kerugian End-to-End Learning

1. **Kebutuhan Data yang Banyak**
   - Untuk mempelajari pemetaan dari **X ke Y** secara langsung, Anda mungkin membutuhkan sejumlah besar data **X,Y**. Dalam beberapa kasus, sulit untuk mendapatkan data yang cukup untuk tugas yang kompleks.
   - Karena **End-to-End Learning** memerlukan data yang lengkap dari **input end** (X) hingga **output end** (Y), ini dapat menjadi tantangan dalam aplikasi di mana data lengkap tidak tersedia.

2. **Mengabaikan Komponen yang Dirancang Manual**
   - Pendekatan **End-to-End** cenderung mengesampingkan komponen-komponen yang mungkin berguna jika dirancang manual. Saat data terbatas, komponen manual dapat memberikan wawasan tambahan ke dalam algoritma.

## Studi Kasus: Aplikasi pada Sistem Mengemudi Mandiri

![image-2.png](attachment:image-2.png)

Contoh yang tidak menggunakan pendekatan **End-to-End** adalah dalam **Sistem Mengemudi Mandiri**. Berikut proses umumnya:
1. **Input Gambar**: Mendapatkan gambar dari lingkungan sekitar mobil.
2. **Pendeteksian**: Menggunakan **Deep Learning** untuk mendeteksi mobil dan pejalan kaki di sekitar.
3. **Perencanaan Gerak (Motion Planning)**: Setelah mendeteksi objek, sistem merencanakan rute mobil untuk beberapa detik ke depan.
4. **Eksekusi Kontrol**: Sistem menghasilkan perintah **kemudi**, **akselerasi**, dan **rem** berdasarkan rute yang direncanakan.

Pada sistem ini, **Deep Learning** hanya diterapkan pada komponen tertentu seperti **deteksi objek**, bukan pada seluruh proses. Ini menunjukkan bahwa dalam banyak aplikasi, lebih efektif menggunakan kombinasi **Machine Learning** dengan algoritma kontrol atau perencanaan gerak.

## Kapan Menggunakan End-to-End Learning

Untuk menentukan apakah pendekatan **End-to-End** cocok, tanyakan:
- **Apakah data yang tersedia mencukupi?**
- Apakah pemetaan yang dibutuhkan dari **X ke Y** memiliki tingkat **kompleksitas** yang memungkinkan untuk dipelajari oleh **neural network**?

Pendekatan **End-to-End** mungkin berhasil baik dalam beberapa kasus, namun Anda juga harus mempertimbangkan ketersediaan data dan kompleksitas masalah yang dihadapi. 

Selamat mempelajari dan semoga dapat menentukan strategi yang tepat untuk proyek **Machine Learning** Anda!

---

Terima kasih telah menyelesaikan materi ini dan selamat atas kemajuan yang sudah Anda capai! Semoga latihan-latihan minggu ini memberikan kesempatan untuk lebih menguasai ide-ide ini dan siap mempraktikkannya dalam proyek-proyek yang akan datang.