Skip to content

Project machine learning untuk memprediksi status glikemik (Normal / Pre-diabetes / Diabetes) menggunakan data klinis & laboratorium (HbA1c, BMI, lipid profile, usia, dll). Meliputi EDA, preprocessing, penanganan imbalance dengan SMOTE, serta modeling dengan beberapa algoritma.

Notifications You must be signed in to change notification settings

RedEye1605/IS_Lab-Assessment

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Β 

History

2 Commits
Β 
Β 
Β 
Β 

Repository files navigation

🩺 Diabetes Prediction β€” Assessment Lab IS 2025

Proyek ini merupakan implementasi machine learning untuk memprediksi status glikemik seseorang (Normal / Pre-diabetes / Diabetes) berdasarkan data klinis dan laboratorium.
Dataset bersumber dari masyarakat Irak (Medical City Hospital & Al-Kindy Teaching Hospital), diakses melalui Mendeley Data.

✨ Tujuan

  • Mengembangkan model prediktif yang akurat dan dapat dipertanggungjawabkan.
  • Mengeksplorasi faktor klinis (HbA1c, BMI, profil lipid, usia, dll) yang berkontribusi pada klasifikasi diabetes.
  • Menangani masalah class imbalance dengan SMOTE untuk meningkatkan performa pada kelas minoritas.

πŸ”¬ Metodologi

  1. EDA (Exploratory Data Analysis) β†’ distribusi data, korelasi, insight klinis.
  2. Data Cleaning & Preprocessing β†’ normalisasi label, scaling numerik, one-hot encoding kategorikal.
  3. Resampling (SMOTE) β†’ hanya diterapkan pada data training untuk mengatasi imbalance.
  4. Baseline Models β†’ Logistic Regression, Random Forest, Gradient Boosting, SVC.
  5. Model Selection & Tuning β†’ Gradient Boosting dipilih dan dioptimasi dengan GridSearchCV.
  6. Evaluation β†’ Accuracy, F1-weighted, Macro ROC-AUC, Classification Report, Confusion Matrix.
  7. Interpretasi β†’ Feature importance & visualisasi.

πŸ“Š Hasil Utama

  • Gradient Boosting Classifier (tuned) menjadi model terbaik.
  • HbA1c terbukti sebagai faktor dominan, diikuti BMI dan biomarker lipid.
  • Performansi model sangat baik dengan F1-weighted tinggi dan Macro ROC-AUC mendekati 1.

πŸ“Œ Insight

  • Penanganan imbalance (SMOTE) terbukti meningkatkan performa kelas minoritas.
  • Model berbasis boosting lebih unggul dibandingkan baseline linear atau bagging.
  • Potensi besar untuk clinical decision support system dalam skrining awal diabetes.

πŸš€ Struktur Repo

.
β”œβ”€β”€ diabetes_lab_IS2025.ipynb   # Notebook utama (storytelling + code)
β”œβ”€β”€ Dataset of Diabetes .csv    # Dataset (perlu disimpan manual, sesuai lisensi)
β”œβ”€β”€ best_model_diabetes.pkl     # Model terlatih (opsional)
└── README.md                   # Deskripsi proyek

⚠️ Catatan

  • Dataset tidak berisi PII (sudah dianonimkan).
  • Model ini hanya alat bantu β†’ tidak menggantikan diagnosis klinis.
  • Untuk penggunaan nyata, perlu validasi eksternal dan kalibrasi probabilitas.

About

Project machine learning untuk memprediksi status glikemik (Normal / Pre-diabetes / Diabetes) menggunakan data klinis & laboratorium (HbA1c, BMI, lipid profile, usia, dll). Meliputi EDA, preprocessing, penanganan imbalance dengan SMOTE, serta modeling dengan beberapa algoritma.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published