In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from sklearn.svm import SVC
from sklearn.ensemble import BaggingClassifier
from sklearn.metrics import accuracy_score
import warnings

warnings.filterwarnings('ignore')

try:
    df_iris = pd.read_csv('iris-full.csv')
    print("--- Data Iris berhasil dimuat ---")
    print("5 baris pertama dari data:")
    print(df_iris.head())
    print("\n")
except FileNotFoundError:
    print("Error: File 'iris-full.csv' tidak ditemukan. Pastikan file ada di folder yang sama.")
    exit()

fitur_columns = ['sepal length', 'sepal width', 'petal length', 'petal width']
target_column = 'Class'

X = df_iris[fitur_columns]
y = df_iris[target_column]


le = LabelEncoder()
y_encoded = le.fit_transform(y)


print("--- Hasil Encoding Target (y) ---")
for i, class_name in enumerate(le.classes_):
    print(f"'{class_name}' diubah menjadi: {i}")
print("\n")



X_train, X_test, y_train, y_test = train_test_split(X, y_encoded, test_size=0.2, random_state=42)

print("--- Ukuran Data Setelah Dibagi ---")
print(f"Data Latih (Train): {X_train.shape[0]} baris")
print(f"Data Uji (Test):   {X_test.shape[0]} baris")
print("\n")

print("--- Memulai Pelatihan Model BaggingClassifier ---")

clf = BaggingClassifier(estimator=SVC(),
                        n_estimators=10, 
                        random_state=0)

clf.fit(X_train, y_train)

print("Model berhasil dilatih!")
print("\n")

y_pred = clf.predict(X_test)

accuracy = accuracy_score(y_test, y_pred)
print(f"Akurasi model pada data uji: {accuracy * 100:.2f}%")
print("\n")


data_iris_baru = [[5.1, 3.5, 1.4, 0.2]] # Ini adalah data baris pertama dari dataset iris

prediksi_baru = clf.predict(data_iris_baru)

nama_kelas_prediksi = le.inverse_transform(prediksi_baru)

print(f"--- Prediksi untuk Data Baru ---")
print(f"Data input: {data_iris_baru}")
print(f"Hasil prediksi (angka): {prediksi_baru[0]}")
print(f"Hasil prediksi (nama kelas): '{nama_kelas_prediksi[0]}'")


--- Data Iris berhasil dimuat ---
5 baris pertama dari data:
   id        Class  sepal length  sepal width  petal length  petal width
0   1  Iris-setosa           5.1          3.5           1.4          0.2
1   2  Iris-setosa           4.9          3.0           1.4          0.2
2   3  Iris-setosa           4.7          3.2           1.3          0.2
3   4  Iris-setosa           4.6          3.1           1.5          0.2
4   5  Iris-setosa           5.0          3.6           1.4          0.2


--- Hasil Encoding Target (y) ---
'Iris-setosa' diubah menjadi: 0
'Iris-versicolor' diubah menjadi: 1
'Iris-virginica' diubah menjadi: 2


--- Ukuran Data Setelah Dibagi ---
Data Latih (Train): 120 baris
Data Uji (Test):   30 baris


--- Memulai Pelatihan Model BaggingClassifier ---
Model berhasil dilatih!


Akurasi model pada data uji: 100.00%


--- Prediksi untuk Data Baru ---
Data input: [[5.1, 3.5, 1.4, 0.2]]
Hasil prediksi (angka): 0
Hasil prediksi (nama kelas): 'Iris-setosa'
