# **Chapter 1: The Machine Learning Landscape**

## **1. Pendahuluan**

Pada era digital, *Machine Learning* (ML) menjadi teknologi kunci di balik berbagai aplikasi cerdas, seperti filter spam, rekomendasi produk, pengenalan suara, hingga kendaraan otonom. Chapter ini memperkenalkan konsep dasar ML, tujuan penggunaannya, contoh aplikasi, jenis sistem, hingga tantangan yang dihadapi.

---

## **2. Definisi dan Tujuan Machine Learning**

**Definisi:**  
Machine Learning adalah bidang ilmu yang mempelajari cara membuat komputer *belajar* dari data tanpa diprogram secara eksplisit.  

Menurut Tom Mitchell (1997):

> *"A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E."*

**Contoh:**  
Filter spam belajar mengenali email spam berdasarkan pola kata dari email yang pernah ditandai.

**Tujuan:**  
- Membuat sistem yang dapat *beradaptasi* dan memperbaiki diri dari data.
- Mengotomatiskan pengambilan keputusan kompleks.
- Menemukan pola tersembunyi dalam data besar (*data mining*).

---

## **3. Alasan Penggunaan Machine Learning**

Machine Learning dipilih karena:
- **Masalah terlalu kompleks** untuk algoritma konvensional (contoh: pengenalan suara, gambar).
- **Adaptasi otomatis** ke pola baru.
- **Data mining:** menemukan pola dan tren baru.

Sebagai contoh, filter spam berbasis ML dapat mendeteksi trik spammer yang mengganti kata "4U" menjadi "For U" tanpa perlu aturan manual baru.

---

## **4. Contoh Aplikasi Machine Learning**

Contoh penerapan nyata ML:
- Klasifikasi gambar (deteksi produk cacat, deteksi tumor).
- Analisis teks (*NLP*): klasifikasi artikel, deteksi komentar negatif, chatbot.
- Prediksi numerik (regresi): forecasting pendapatan.
- Rekomendasi produk (recommender system).
- Deteksi penipuan (anomaly detection).
- Bot game cerdas (*Reinforcement Learning*).

---

## **5. Jenis-Jenis Sistem Machine Learning**

### a) Berdasarkan cara belajar:
- **Supervised Learning:**  
  Dilatih dengan data berlabel. Tugas umum:
  - *Classification:* memprediksi kategori.
  - *Regression:* memprediksi nilai kontinu.
  
  Contoh regresi:  
  $$
  \hat{y} = w_0 + w_1 x_1 + w_2 x_2 + \ldots + w_n x_n
  $$

- **Unsupervised Learning:**  
  Belajar dari data *unlabeled*, menemukan pola sendiri.
  Contoh: clustering, dimensionality reduction, anomaly detection.

- **Semi-Supervised Learning:**  
  Kombinasi data berlabel dan tidak berlabel.

- **Reinforcement Learning:**  
  Belajar dari interaksi dengan *environment* melalui *reward* atau *penalty*.  
  Tujuan: memaksimalkan *cumulative reward*.

### b) Berdasarkan cara belajar dari data:
- **Batch Learning:**  
  Belajar dari seluruh data sekaligus (*offline learning*).

- **Online Learning:**  
  Belajar secara bertahap dari data yang terus datang.

### c) Berdasarkan pendekatan:
- **Instance-Based Learning:**  
  Membandingkan data baru dengan data lama (misal: k-Nearest Neighbors).
  
  Contoh jarak Euclidean:
  $$
  d(\mathbf{x}, \mathbf{x}') = \sqrt{\sum_{i=1}^{n} (x_i - x'_i)^2}
  $$

- **Model-Based Learning:**  
  Membangun model prediktif dari pola data.  
  Contoh: Linear Regression, Neural Networks.

---

## **6. Tantangan dalam Machine Learning**

Tantangan umum yang sering muncul:
- Data kurang atau tidak representatif.
- Data berkualitas buruk (noise, missing value).
- Fitur tidak relevan.
- **Overfitting:** model terlalu cocok dengan data latih, kinerja buruk pada data baru.
- **Underfitting:** model terlalu sederhana.
- Perbedaan distribusi data latih dan data produksi.
- Pemilihan model dan tuning hyperparameter.
