Proyek ini merupakan Capstone Project yang bertujuan untuk menganalisis kondisi keuangan pengguna secara objektif dan memberikan rekomendasi keuangan yang personal berbasis integrasi data skala besar (Big Data).
SplitWise adalah sistem analisis keuangan personal yang mengklasifikasikan kondisi finansial pengguna dengan menggabungkan profil risiko kredit, perilaku belanja harian, dan skor kelayakan kredit. Sistem ini dirancang untuk membantu pengguna (khususnya generasi muda) memahami apakah mereka sudah memiliki pondasi keuangan yang sehat untuk mulai berinvestasi.
- Bagaimana kondisi finansial pengguna diklasifikasikan secara objektif? (Good / Average / Bad)
- Apakah pengguna memiliki kesiapan finansial untuk mulai berinvestasi?
- Kategori pengeluaran mana yang paling dominan membebani keuangan pengguna?
- Rekomendasi finansial apa yang paling tepat berdasarkan profil risiko dan sisa pendapatan (savings)?
- Bagaimana kaitan antara tingkat pendapatan dengan risiko gagal bayar pada nasabah?
Proyek ini menggunakan teknik Data Integration dari empat sumber berbeda untuk menciptakan profil pengguna yang komprehensif sebanyak 31.856 baris data.
| Nama Variabel (Kolom) | Tipe Data | Deskripsi |
|---|---|---|
age |
Integer | Usia dari pengguna/nasabah (Tahun). |
income |
Integer / Float | Total pendapatan atau gaji tahunan pengguna. |
risk_status |
Integer (0/1) | Status risiko pinjaman nasabah (0 = Aman, 1 = Pernah Gagal Bayar/Berisiko). |
loan_int_rate |
Float | Suku bunga pinjaman yang dikenakan kepada pengguna (%). |
family_size |
Integer | Jumlah anggota keluarga yang menjadi tanggungan pengguna. |
education |
Integer (Kategori) | Tingkat pendidikan terakhir pengguna (dalam bentuk kode angka numerik). |
cc_expense |
Float | Rata-rata pengeluaran bulanan menggunakan Kartu Kredit (Credit Card). |
lifestyle_expense |
Integer / Float | Rata-rata pengeluaran bulanan untuk kebutuhan gaya hidup (lifestyle). |
credit_score |
Float | Skor kredit pengguna yang menunjukkan tingkat kelayakan finansial. |
total_expense |
Float | Feature hasil engineering: Total pengeluaran gabungan (lifestyle_expense + cicilan CC). |
savings |
Float | Feature hasil engineering: Sisa uang atau tabungan pengguna (income - total_expense). |
budget_status |
Object (String) | Target Variable: Label klasifikasi kesehatan finansial (Good, Average, Bad). |
Variabel utama dikembangkan untuk memberikan penilaian yang lebih informatif bagi model:
total_expense: Menggabungkan biaya gaya hidup tahunan dengan pengeluaran kartu kredit tahunan.budget_status:- Bad: Memiliki riwayat gagal bayar (
risk_status= 1) atau tabungan negatif. - Good: Skor kredit > 700 dan rasio tabungan > 30% dari pendapatan.
- Average: Pengguna yang berada di antara kedua kategori tersebut.
- Bad: Memiliki riwayat gagal bayar (
- Distribusi Kondisi Finansial: Sebanyak 56,8% pengguna berada di kategori Average, menunjukkan perlunya edukasi finansial lebih lanjut.
- Beban Pengeluaran: Temuan data menunjukkan bahwa Gaya Hidup merupakan beban pengeluaran yang jauh lebih dominan dibandingkan cicilan kartu kredit.
- Kesiapan Investasi: Hanya 21,4% pengguna yang diklasifikasikan sebagai 'Investment Ready' (Kategori Good).
- Python 3
- Pandas & NumPy (Data Wrangling & Integration)
- Plotly & Streamlit (Interactive Dashboard Deployment)
- Matplotlib & Seaborn (Exploratory Data Analysis)
- Jupyter Notebook / VS Code
Capstone Project — Data Science Team