Skip to content

SplitWisee/data-science

Repository files navigation

💰 SplitWise — Analisis Kondisi Finansial & Rekomendasi Investasi

Proyek ini merupakan Capstone Project yang bertujuan untuk menganalisis kondisi keuangan pengguna secara objektif dan memberikan rekomendasi keuangan yang personal berbasis integrasi data skala besar (Big Data).


📌 Deskripsi Project

SplitWise adalah sistem analisis keuangan personal yang mengklasifikasikan kondisi finansial pengguna dengan menggabungkan profil risiko kredit, perilaku belanja harian, dan skor kelayakan kredit. Sistem ini dirancang untuk membantu pengguna (khususnya generasi muda) memahami apakah mereka sudah memiliki pondasi keuangan yang sehat untuk mulai berinvestasi.


❓ Pertanyaan Bisnis

  1. Bagaimana kondisi finansial pengguna diklasifikasikan secara objektif? (Good / Average / Bad)
  2. Apakah pengguna memiliki kesiapan finansial untuk mulai berinvestasi?
  3. Kategori pengeluaran mana yang paling dominan membebani keuangan pengguna?
  4. Rekomendasi finansial apa yang paling tepat berdasarkan profil risiko dan sisa pendapatan (savings)?
  5. Bagaimana kaitan antara tingkat pendapatan dengan risiko gagal bayar pada nasabah?

🗂️ Dataset & Data Dictionary

Proyek ini menggunakan teknik Data Integration dari empat sumber berbeda untuk menciptakan profil pengguna yang komprehensif sebanyak 31.856 baris data.

Kamus Data (Data Dictionary)

Nama Variabel (Kolom) Tipe Data Deskripsi
age Integer Usia dari pengguna/nasabah (Tahun).
income Integer / Float Total pendapatan atau gaji tahunan pengguna.
risk_status Integer (0/1) Status risiko pinjaman nasabah (0 = Aman, 1 = Pernah Gagal Bayar/Berisiko).
loan_int_rate Float Suku bunga pinjaman yang dikenakan kepada pengguna (%).
family_size Integer Jumlah anggota keluarga yang menjadi tanggungan pengguna.
education Integer (Kategori) Tingkat pendidikan terakhir pengguna (dalam bentuk kode angka numerik).
cc_expense Float Rata-rata pengeluaran bulanan menggunakan Kartu Kredit (Credit Card).
lifestyle_expense Integer / Float Rata-rata pengeluaran bulanan untuk kebutuhan gaya hidup (lifestyle).
credit_score Float Skor kredit pengguna yang menunjukkan tingkat kelayakan finansial.
total_expense Float Feature hasil engineering: Total pengeluaran gabungan (lifestyle_expense + cicilan CC).
savings Float Feature hasil engineering: Sisa uang atau tabungan pengguna (income - total_expense).
budget_status Object (String) Target Variable: Label klasifikasi kesehatan finansial (Good, Average, Bad).

🛠️ Feature Engineering Logic

Variabel utama dikembangkan untuk memberikan penilaian yang lebih informatif bagi model:

  • total_expense: Menggabungkan biaya gaya hidup tahunan dengan pengeluaran kartu kredit tahunan.
  • budget_status:
    • Bad: Memiliki riwayat gagal bayar (risk_status = 1) atau tabungan negatif.
    • Good: Skor kredit > 700 dan rasio tabungan > 30% dari pendapatan.
    • Average: Pengguna yang berada di antara kedua kategori tersebut.

📊 Analisis & Insight Utama

  • Distribusi Kondisi Finansial: Sebanyak 56,8% pengguna berada di kategori Average, menunjukkan perlunya edukasi finansial lebih lanjut.
  • Beban Pengeluaran: Temuan data menunjukkan bahwa Gaya Hidup merupakan beban pengeluaran yang jauh lebih dominan dibandingkan cicilan kartu kredit.
  • Kesiapan Investasi: Hanya 21,4% pengguna yang diklasifikasikan sebagai 'Investment Ready' (Kategori Good).

🛠️ Tools & Library

  • Python 3
  • Pandas & NumPy (Data Wrangling & Integration)
  • Plotly & Streamlit (Interactive Dashboard Deployment)
  • Matplotlib & Seaborn (Exploratory Data Analysis)
  • Jupyter Notebook / VS Code

👤 Author

Capstone Project — Data Science Team

About

No description, website, or topics provided.

Resources

Code of conduct

Contributing

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors