In [4]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix
import warnings

# Nonaktifkan peringatan untuk kode ini
warnings.filterwarnings('ignore')

# 1. Load Data
df = pd.read_csv('Depression Student Dataset.csv')

# 2. Pre-processing: Membuat kolom target untuk Klasifikasi
# Karena 'Depression' adalah Yes/No, kita ubah ke 1/0
df['Status_Depresi'] = df['Depression'].apply(lambda x: 1 if x == 'Yes' else 0)

# 3. Definisikan Fitur (X) dan Target (y)
# Ganti kolom dengan yang ada di dataset: Age, Academic Pressure, Financial Stress
X = df[['Age', 'Academic Pressure', 'Financial Stress']]
y = df['Status_Depresi']

# 4. Bagi data menjadi data latih dan data uji
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 42)

# 5. Scaling fitur (Penting untuk K-NN)
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# 6. Membangun model K-Nearest Neighbor
k = 5 # Jumlah tetangga terdekat
model = KNeighborsClassifier(n_neighbors=k)
model.fit(X_train, y_train)

# 7. Prediksi pada data uji
y_pred = model.predict(X_test)

# 8. Evaluasi Model
accuracy = accuracy_score(y_test, y_pred)
print("Akurasi: ", accuracy)

print("\nLaporan Klasifikasi:")
print(classification_report(y_test, y_pred))

print('\nMatriks Konfusi:')
print(confusion_matrix(y_test, y_pred))

# 9. Simulasi prediksi pasien baru
# Pasien baru: Age=20, Academic Pressure=3.5, Financial Stress=4
new_student_data = [[20, 3.5, 4]]
# Skala data pasien baru
new_student_data_scaled = scaler.transform(new_student_data)
# Prediksi
prediction = model.predict(new_student_data_scaled)

print("\nHasil Prediksi Status Depresi Mahasiswa Baru:")
if prediction[0] == 0:
    print("Mahasiswa baru tidak memiliki risiko depresi tinggi")
else:
    print("Mahasiswa baru memiliki risiko depresi tinggi")

# Aktifkan kembali peringatan setelah kode selesai
warnings.filterwarnings('default')

Akurasi:  0.7821782178217822

Laporan Klasifikasi:
              precision    recall  f1-score   support

           0       0.78      0.75      0.77        48
           1       0.78      0.81      0.80        53

    accuracy                           0.78       101
   macro avg       0.78      0.78      0.78       101
weighted avg       0.78      0.78      0.78       101


Matriks Konfusi:
[[36 12]
 [10 43]]

Hasil Prediksi Status Depresi Mahasiswa Baru:
Mahasiswa baru memiliki risiko depresi tinggi
