# Chapter 3: Classification

Chapter ini membahas salah satu tugas paling fundamental dalam Machine Learning, yaitu **classification**. Berbeda dengan regresi yang memprediksi nilai kontinu, classification bertujuan untuk memprediksi **kelas atau label diskrit**.

Classification banyak digunakan dalam kehidupan nyata, seperti deteksi spam, pengenalan wajah, diagnosis medis, sistem rekomendasi, dan pengenalan tulisan tangan. Pada chapter ini, konsep classification akan dipelajari secara bertahap menggunakan dataset MNIST sebagai studi kasus utama.

Tujuan utama dari chapter ini adalah:
- Memahami konsep dasar classification
- Mengenal berbagai metrik evaluasi classifier
- Memahami perbedaan berbagai jenis classification
- Melakukan analisis kesalahan model


## 1. What Is Classification?

Classification adalah jenis **supervised learning** di mana model mempelajari hubungan antara fitur input dan **label kategorikal**.

Berbeda dengan regresi yang menghasilkan nilai kontinu, classification menghasilkan output berupa kelas tertentu. Contohnya adalah menentukan apakah sebuah email termasuk spam atau bukan, atau mengenali angka tulisan tangan dari 0 sampai 9.

Tantangan utama dalam classification bukan hanya membuat model yang dapat memprediksi, tetapi juga memahami jenis kesalahan yang dibuat oleh model dan bagaimana mengevaluasi performanya secara tepat.

## 2. The MNIST Dataset

MNIST adalah dataset klasik dalam Machine Learning yang berisi **70.000 gambar digit tulisan tangan** dari angka 0 hingga 9.

Setiap gambar memiliki ukuran 28 × 28 piksel dan direpresentasikan sebagai vektor berdimensi 784. Dataset ini sangat populer karena cukup sederhana untuk dipelajari namun cukup kompleks untuk menunjukkan berbagai permasalahan classification.

MNIST sering digunakan sebagai benchmark untuk menguji performa berbagai algoritma classification.

In [None]:
from sklearn.datasets import fetch_openml

mnist = fetch_openml('mnist_784', version=1)
X, y = mnist['data'], mnist['target']

Dataset MNIST terdiri dari 70.000 instance, masing-masing dengan 784 fitur. Label disimpan dalam bentuk string dan perlu dikonversi menjadi numerik.

In [None]:
import numpy as np
y = y.astype(np.uint8)

## 3. Visualizing a Digit

Sebelum melatih model, penting untuk memahami bagaimana data direpresentasikan. Setiap instance adalah vektor 784 dimensi yang dapat diubah kembali menjadi gambar 28 × 28.

Visualisasi ini membantu memverifikasi bahwa data telah dimuat dengan benar.

In [None]:
import matplotlib.pyplot as plt

some_digit = X.iloc[0]
some_digit_image = some_digit.values.reshape(28, 28)

plt.imshow(some_digit_image, cmap='binary')
plt.axis('off')
plt.show()

## 4. Train–Test Split

Untuk mengevaluasi performa model secara objektif, dataset perlu dibagi menjadi training set dan test set.

MNIST secara default telah dibagi menjadi:
- 60.000 data training
- 10.000 data testing

In [None]:
X_train, X_test = X[:60000], X[60000:]
y_train, y_test = y[:60000], y[60000:]

## 5. Binary Classification: Detecting the Digit 5

Sebagai langkah awal, kita menyederhanakan masalah classification menjadi binary classification.

Model hanya akan menentukan apakah sebuah digit adalah angka **5** atau **bukan 5**.

In [None]:
y_train_5 = (y_train == 5)
y_test_5 = (y_test == 5)

## 6. Training an SGD Classifier

Stochastic Gradient Descent (SGD) adalah algoritma yang efisien untuk dataset besar.

SGDClassifier sangat cocok untuk MNIST karena dapat menangani data dalam jumlah besar dengan baik.

In [None]:
from sklearn.linear_model import SGDClassifier

sgd_clf = SGDClassifier(random_state=42)
sgd_clf.fit(X_train, y_train_5)

## 7. Evaluating the Classifier Using Accuracy

Accuracy adalah metrik evaluasi paling sederhana, namun dapat menyesatkan pada dataset yang tidak seimbang.

In [None]:
from sklearn.model_selection import cross_val_score

cross_val_score(sgd_clf, X_train, y_train_5, cv=3, scoring='accuracy')

## 8. Confusion Matrix

Confusion matrix memberikan informasi detail mengenai jenis kesalahan yang dilakukan classifier.

In [None]:
from sklearn.model_selection import cross_val_predict
from sklearn.metrics import confusion_matrix

y_train_pred = cross_val_predict(sgd_clf, X_train, y_train_5, cv=3)
confusion_matrix(y_train_5, y_train_pred)

## 9. Precision and Recall

Precision mengukur ketepatan prediksi positif, sedangkan recall mengukur kemampuan model mendeteksi seluruh instance positif.

In [None]:
from sklearn.metrics import precision_score, recall_score

precision_score(y_train_5, y_train_pred), recall_score(y_train_5, y_train_pred)

## 10. The F1 Score

F1-score adalah rata-rata harmonik dari precision dan recall.

In [None]:
from sklearn.metrics import f1_score

f1_score(y_train_5, y_train_pred)

## 13. Multiclass Classification

MNIST adalah contoh alami multiclass classification dengan 10 kelas digit.

## Closing Summary (Chapter 3)

Chapter ini membahas konsep classification secara menyeluruh, mulai dari binary classification hingga multiclass dan multilabel classification.

Evaluasi classifier tidak cukup hanya menggunakan accuracy, tetapi perlu mempertimbangkan metrik lain seperti precision, recall, F1-score, serta confusion matrix.

Pemahaman mendalam terhadap konsep ini sangat penting sebelum melanjutkan ke topik Machine Learning yang lebih kompleks.