# Data Mining: Klasifikasi Kelulusan Mahasiswa (Load CSV)

Notebook ini melakukan klasifikasi status kelulusan (Lulus/Tidak Lulus) menggunakan algoritma **Decision Tree**.

**Sumber Data:** File CSV yang terletak di folder induk (Parent Directory).

## 1. Import Library dan Load Data CSV

**Fungsi:**
- Mengimpor library `pandas`, `numpy`, dll.
- Membaca file `data_mahasiswa.csv` yang berada di parent folder menggunakan sintaks path `../`.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Membaca file CSV dari parent folder (folder satu level di atas)
# '../' menandakan path relatif ke parent directory
try:
    df = pd.read_csv('../data_mahasiswa.csv')
    print("Berhasil memuat data dari parent folder!")
except FileNotFoundError:
    print("ERROR: File 'data_mahasiswa.csv' tidak ditemukan di parent folder.")
    print("Pastikan struktur foldernya benar: /Folder_Induk/data_mahasiswa.csv")

# Menampilkan data
print("\nPreview Dataset:")
display(df.head())

## 2. Preprocessing Data

**Fungsi:**
1. Memisahkan Fitur (X) dan Target (y).
2. Mengubah label target teks menjadi angka (Encoding).
3. Split data training dan testing.

In [None]:
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder

# 1. Memisahkan Fitur (X) dan Target (y)
X = df[['IPK', 'Kehadiran_Persen', 'Jumlah_SKS']]
y = df['Lulus']

# 2. Encoding Label
le = LabelEncoder()
y_encoded = le.fit_transform(y)

print(f"Mapping Label: {dict(zip(le.classes_, le.transform(le.classes_)))}")

# 3. Split Data
X_train, X_test, y_train, y_test = train_test_split(X, y_encoded, test_size=0.2, random_state=42)

print(f"Data Training: {len(X_train)} baris")
print(f"Data Testing: {len(X_test)} baris")

## 3. Modeling (Decision Tree)

**Fungsi:**
Melatih model pohon keputusan untuk mempelajari pola kelulusan.

In [None]:
from sklearn.tree import DecisionTreeClassifier

# Melatih Model
model = DecisionTreeClassifier(criterion='gini', random_state=42)
model.fit(X_train, y_train)

print("Model siap digunakan.")

## 4. Evaluasi

**Fungsi:**
Mengukur akurasi model terhadap data testing.

In [None]:
from sklearn.metrics import accuracy_score, classification_report

y_pred = model.predict(X_test)
acc = accuracy_score(y_test, y_pred)

print(f"Akurasi: {acc * 100}%")
print("\nLaporan Klasifikasi:")
print(classification_report(y_test, y_pred, target_names=le.classes_))

## 5. Visualisasi Tree

**Fungsi:**
Menampilkan diagram pohon keputusan.

In [None]:
from sklearn.tree import plot_tree

plt.figure(figsize=(10,6))
plot_tree(model, 
          feature_names=['IPK', 'Kehadiran', 'SKS'], 
          class_names=le.classes_,
          filled=True)
plt.show()

## 6. Prediksi Data Baru

**Fungsi:**
Tes manual dengan angka inputan sendiri.

In [None]:
# Contoh Data Baru
data_baru = np.array([
    [3.9, 98, 148],  # Mahasiswa Pintar
    [1.5, 40, 100]   # Mahasiswa Kurang Aktif
])

prediksi = model.predict(data_baru)
hasil = le.inverse_transform(prediksi)

print("Hasil Prediksi:", hasil)