
# Model Klasifikasi dengan Decision Tree dan k-Nearest Neighbors (k-NN)

Notebook ini akan membahas penerapan model klasifikasi menggunakan algoritma *Decision Tree* dan *k-Nearest Neighbors (k-NN)*. 
Dataset yang digunakan merupakan data aplikasi kredit, dengan kolom target 'Class'. Model akan dievaluasi menggunakan metrik evaluasi seperti:
- Akurasi
- Presisi
- Recall
- F1-score
- Area Under the Curve (AUC)
- ROC Curve


In [None]:

# Import library yang diperlukan
import pandas as pd

# Load dataset
df = pd.read_csv('CreditDataset.csv')

# Menampilkan 5 baris pertama dataset
df.head()


In [None]:

# Import library untuk preprocessing
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder

# Mengubah fitur kategorikal menjadi numerik menggunakan Label Encoding
label_enc = LabelEncoder()

for col in df.columns:
    if df[col].dtype == 'object':
        df[col] = label_enc.fit_transform(df[col])

# Memisahkan fitur dan target
X = df.drop(columns='Class')  # Fitur
y = df['Class']  # Target

# Membagi dataset menjadi data latih dan data uji (80% latih, 20% uji)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Menampilkan dimensi data latih dan uji
X_train.shape, X_test.shape


In [None]:

# Import library untuk Decision Tree
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import classification_report, accuracy_score, roc_auc_score, roc_curve
import matplotlib.pyplot as plt

# Inisialisasi model Decision Tree
dt_model = DecisionTreeClassifier(random_state=42)

# Melatih model dengan data latih
dt_model.fit(X_train, y_train)

# Memprediksi data uji
y_pred_dt = dt_model.predict(X_test)

# Evaluasi model Decision Tree
print('Akurasi:', accuracy_score(y_test, y_pred_dt))
print('Classification Report:\n', classification_report(y_test, y_pred_dt))

# Menghitung AUC dan menampilkan ROC Curve
y_proba_dt = dt_model.predict_proba(X_test)[:, 1]
auc_dt = roc_auc_score(y_test, y_proba_dt)
print(f'AUC: {auc_dt:.2f}')

fpr_dt, tpr_dt, _ = roc_curve(y_test, y_proba_dt)
plt.plot(fpr_dt, tpr_dt, label=f'Decision Tree (AUC = {auc_dt:.2f})')
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('ROC Curve - Decision Tree')
plt.legend()
plt.show()


In [None]:

# Import library untuk k-NN
from sklearn.neighbors import KNeighborsClassifier

# Inisialisasi model k-NN dengan k=5
knn_model = KNeighborsClassifier(n_neighbors=5)

# Melatih model dengan data latih
knn_model.fit(X_train, y_train)

# Memprediksi data uji
y_pred_knn = knn_model.predict(X_test)

# Evaluasi model k-NN
print('Akurasi:', accuracy_score(y_test, y_pred_knn))
print('Classification Report:\n', classification_report(y_test, y_pred_knn))

# Menghitung AUC dan menampilkan ROC Curve
y_proba_knn = knn_model.predict_proba(X_test)[:, 1]
auc_knn = roc_auc_score(y_test, y_proba_knn)
print(f'AUC: {auc_knn:.2f}')

fpr_knn, tpr_knn, _ = roc_curve(y_test, y_proba_knn)
plt.plot(fpr_knn, tpr_knn, label=f'k-NN (AUC = {auc_knn:.2f})')
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('ROC Curve - k-NN')
plt.legend()
plt.show()
