# Klasifikasi Data Iris Menggunakan Decision Tree
## Anggota Kelompok
- Muhammad Rafa Dzikrullah (24523001)
- Bravestama Isa Arasy (24523144)
- Naufal Ahmad Fauzi (24523168)


## 1. Import Library
Tahap pertama adalah mengimpor semua library yang diperlukan:
- pandas: untuk manipulasi data
- train_test_split: untuk membagi data menjadi data latih dan data uji
- DecisionTreeClassifier: untuk membuat model decision tree
- plot_tree: untuk menampilkan visualisasi pohon keputusan
- accuracy_score & classification_report: untuk mengevaluasi performa model
- matplotlib.pyplot: untuk membuat visualisasi

In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier, plot_tree
from sklearn.metrics import accuracy_score, classification_report
import matplotlib.pyplot as plt

## 2. Memuat Dataset
Pada bagian ini, kita akan menggunakan dataset *Iris* bawaan dari sklearn. Dataset ini memiliki 4 fitur dan 1 label.

In [None]:
from sklearn.datasets import load_iris
iris = load_iris()
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['target'] = iris.target
df.head()

## 3. Menjelaskan Struktur Dataset
Kita perlu memahami struktur data sebelum melatih model.

In [None]:
print('Jumlah Data:', len(df))
print('\nInformasi DataFrame:')
print(df.info())
print('\nDistribusi Label:')
print(df['target'].value_counts())

## 4. Membagi Data Menjadi Data Latih dan Data Uji
Data akan dibagi menjadi data latih (80%) dan data uji (20%).

In [None]:
X = df[iris.feature_names]
y = df['target']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
print('Jumlah data latih:', len(X_train))
print('Jumlah data uji:', len(X_test))

## 5. Membuat dan Melatih Model Decision Tree
Kita akan membuat model Decision Tree dengan kriteria *entropy* dan melatihnya menggunakan data latih.

In [None]:
model = DecisionTreeClassifier(criterion='entropy', random_state=42)
model.fit(X_train, y_train)
print('Model berhasil dilatih!')

## 6. Melakukan Prediksi Menggunakan Model
Setelah model dilatih, kita bisa menggunakannya untuk memprediksi label dari data uji.

In [None]:
y_pred = model.predict(X_test)
comparison = pd.DataFrame({'Asli': y_test, 'Prediksi': y_pred})
comparison.head()

## 7. Mengukur Akurasi Model
Kita akan menghitung akurasi dan menampilkan laporan klasifikasi.

In [None]:
acc = accuracy_score(y_test, y_pred)
print(f'Akurasi model Decision Tree: {acc:.2f}')
print('\nLaporan Klasifikasi:')
print(classification_report(y_test, y_pred, target_names=iris.target_names))

## 8. Visualisasi Pohon Keputusan
Visualisasi untuk memahami bagaimana model membuat keputusan.

In [None]:
plt.figure(figsize=(14,10))
plot_tree(model, filled=True, feature_names=iris.feature_names, class_names=iris.target_names, rounded=True, fontsize=10)
plt.title('Visualisasi Decision Tree pada Dataset Iris')
plt.show()

## 9. Kesimpulan
Model Decision Tree menunjukkan akurasi tinggi (sekitar 0.9–1.0) dalam mengklasifikasikan jenis bunga iris. Model ini sederhana, mudah dipahami, dan cocok untuk dataset kecil.