# Proyek Klasifikasi Bunga Iris

Notebook ini berisi panduan langkah demi langkah untuk melakukan klasifikasi spesies bunga Iris menggunakan algoritma K-Nearest Neighbors (KNN).

**Cara menggunakan di Google Colab:**
1. Pastikan Anda sudah mendownload file `iris.data` dari [UCI Repository](https://archive.ics.uci.edu/dataset/53/iris).
2. Jalankan setiap sel (kotak kode) di bawah ini secara berurutan dengan menekan tombol **Play**.

## Langkah 1: Import Library
Kita memanggil library `pandas` (data tabel), `matplotlib` & `seaborn` (grafik), dan `sklearn` (machine learning).

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import io
from google.colab import files  # Library khusus Colab untuk upload file
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, classification_report

## Langkah 2: Upload dan Membaca Data
Silakan upload file `iris.data` yang sudah Anda unduh. Program akan membaca file tersebut dan memberikan nama kolom yang sesuai.

In [None]:
print("=== LANGKAH UPLOAD FILE ===")
print("Silakan upload file 'iris.data' atau 'iris.csv' yang Anda unduh dari UCI.")
print("Link download: https://archive.ics.uci.edu/dataset/53/iris (klik tombol 'Download')")
print("---------------------------------------------------------")

# Memunculkan tombol upload
uploaded = files.upload()

# Mengambil nama file yang baru saja diupload
filename = next(iter(uploaded))

# Membaca file CSV
# Kita beri nama kolom secara manual karena data UCI tidak punya header
column_names = ['sepal_length', 'sepal_width', 'petal_length', 'petal_width', 'species']
df = pd.read_csv(io.BytesIO(uploaded[filename]), header=None, names=column_names)

print(f"\nBerhasil membaca file: {filename}")
print("=== 5 Baris Pertama Data ===")
df.head() # Menampilkan data teratas

## Langkah 3: Visualisasi Data (Eksplorasi)
Melihat pola penyebaran data menggunakan Scatter Plot.

In [None]:
print("=== Menampilkan Grafik Sebaran Data ===")
plt.figure(figsize=(10, 6))

# Membuat scatter plot
sns.scatterplot(x='sepal_length', y='sepal_width', hue='species', data=df)

plt.title('Sebaran Data Bunga Iris (Sepal Length vs Width)')
plt.show()

## Langkah 4: Membagi Data (Splitting)
Memisahkan data menjadi **Fitur (X)** dan **Target (y)**, lalu membaginya menjadi data Latihan (80%) dan Ujian (20%).

In [None]:
# X = Fitur (4 kolom pertama)
# y = Target (kolom spesies)
X = df.drop('species', axis=1)
y = df['species']

# Membagi data: 80% Latihan, 20% Ujian
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

print(f"Jumlah Data Latihan: {len(X_train)}")
print(f"Jumlah Data Testing: {len(X_test)}")

## Langkah 5: Melatih Model (Training)
Melatih algoritma KNN dengan data latihan.

In [None]:
# Membuat model KNN
model = KNeighborsClassifier(n_neighbors=3)

# Melatih model dengan data latihan
model.fit(X_train, y_train)

print("Model berhasil dilatih!")

## Langkah 6: Evaluasi Akurasi
Menguji performa model dengan data testing.

In [None]:
# Meminta model menebak data ujian
y_pred = model.predict(X_test)

# Menghitung skor akurasi
akurasi = accuracy_score(y_test, y_pred)

print(f"=== HASIL AKURASI MODEL: {akurasi * 100:.2f}% ===")
print("\nLaporan Klasifikasi Lengkap:")
print(classification_report(y_test, y_pred))

## Langkah 7: Tes Prediksi Manual
Mencoba memprediksi spesies bunga baru dengan data inputan manual.

In [None]:
print("=== Coba Prediksi Data Baru ===")

# Format input: [sepal_length, sepal_width, petal_length, petal_width]
# Silakan ubah angka di bawah ini untuk bereksperimen
data_baru = [[5.1, 3.5, 1.4, 0.2]]

# Prediksi
hasil_prediksi = model.predict(data_baru)

print(f"Data Input: {data_baru}")
print(f"Model memprediksi ini adalah bunga: {hasil_prediksi[0]}")