# 📌 Klasifikasi dengan 4 Algoritma Umum
Notebook ini menjelaskan penerapan 4 algoritma klasifikasi:
- K-Nearest Neighbors (KNN)
- Decision Tree
- Logistic Regression
- Naive Bayes

Kita akan menggunakan dataset Iris dari scikit-learn dan membandingkan performa keempat model.

## 🔧 Import Library
Kita mulai dengan mengimpor semua library yang dibutuhkan untuk pemrosesan data, pelatihan model, dan visualisasi.

In [None]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score
import matplotlib.pyplot as plt

## 📥 Load Dataset Iris
Dataset iris berisi fitur panjang dan lebar sepal/petal dari 150 bunga iris yang terbagi dalam 3 kelas.

In [None]:
iris = load_iris()
x = iris.data
y = iris.target

## ✂️ Split Data Menjadi Data Latih dan Uji
80% data digunakan untuk pelatihan, 20% untuk pengujian.

In [None]:
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=42)

## ⚖️ Standarisasi Fitur
Standarisasi penting agar model berbasis jarak dan gradien bekerja lebih optimal.

In [None]:
scaler = StandardScaler()
x_train_scaled = scaler.fit_transform(x_train)
x_test_scaled = scaler.transform(x_test)

## 🧠 K-Nearest Neighbors (KNN)
Model KNN memprediksi label berdasarkan mayoritas tetangga terdekat.

In [None]:
from sklearn.neighbors import KNeighborsClassifier

knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(x_train_scaled, y_train)
y_pred_knn = knn.predict(x_test_scaled)
acc_knn = accuracy_score(y_test, y_pred_knn)
print("KNN Accuracy", acc_knn)

## 🌳 Decision Tree
Model berbasis struktur pohon yang memecah data berdasarkan fitur paling informatif.

In [None]:
from sklearn.tree import DecisionTreeClassifier

dtree = DecisionTreeClassifier()
dtree.fit(x_train_scaled, y_train)
y_pred_tree = dtree.predict(x_test_scaled)
acc_tree = accuracy_score(y_test, y_pred_tree)
print("Decision Tree Accuracy", acc_tree)

## 📈 Logistic Regression
Model linier yang digunakan untuk klasifikasi melalui fungsi sigmoid.

In [None]:
from sklearn.linear_model import LogisticRegression

logreg = LogisticRegression(max_iter=200)
logreg.fit(x_train_scaled, y_train)
y_pred_logreg = logreg.predict(x_test_scaled)
acc_logreg = accuracy_score(y_test, y_pred_logreg)
print("Logistic Regression Accuracy", acc_logreg)

## 🎲 Naive Bayes
Model probabilistik berdasarkan Teorema Bayes dengan asumsi independensi antar fitur.

In [None]:
from sklearn.naive_bayes import GaussianNB

nb = GaussianNB()
nb.fit(x_train_scaled, y_train)
y_pred_nb = nb.predict(x_test_scaled)
acc_nb = accuracy_score(y_test, y_pred_nb)
print("Naive Bayes Accuracy", acc_nb)

## 📊 Visualisasi Perbandingan Akurasi Model
Grafik batang digunakan untuk membandingkan akurasi keempat model klasifikasi.

In [None]:
algorithms = ['KNN', 'Decision Tree', 'Logistic Regression', 'Naive Bayes']
accuracies = [acc_knn, acc_tree, acc_logreg, acc_nb]
colors = ['skyblue', 'lightgreen', 'orange', 'salmon']

plt.figure(figsize=(8, 5))
bars = plt.bar(algorithms, accuracies, color=colors)

for bar in bars:
    yval = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2, yval + 0.01, f'{yval:.2f}',
             ha='center', va='bottom', fontsize=12)

plt.title('Perbandingan Akurasi Model Klasifikasi')
plt.ylabel('Akurasi')
plt.ylim(0.8, 1.05)
plt.tight_layout()
plt.show()

## ✅ Kesimpulan
Keempat algoritma memiliki performa yang sangat baik pada dataset Iris.  
Namun, pemilihan algoritma dalam praktik nyata tergantung pada kompleksitas data, kecepatan pelatihan, dan interpretabilitas.

Terima kasih telah mengikuti!