Dalam kompetisi ini, kasus yang peserta hadapi adalah churn. Churn adalah suatu istilah dimana nasabah meninggalkan perusahaan. Jika dalam dunia perbankan, nasabah tersebut pada periode tertentu memutuskan untuk tidak lagi menjadi nasabah di suatu bank dan mungkin kemudian menjadi nasabah di bank lain. Peserta akan diminta untuk membuat model machine learning untuk klasifikasi yang dapat membedakan antara nasabah yang tergolong churn dan yang tidak churn.
Pekerjaan yang peserta lakukan harus memenuhi langkah-langkah berikut, antara lain:
- Exploratory data analysis (EDA)
- Feature Engineering
- Modeling
- Evaluation
- Prediction Output
Data terdiri atas dua dataset, yaitu:
- fin_data_challenge_train.csv: 100.000 baris dan 126 kolom (125 kolom fitur dan 1 kolom target 'y’)
- fin_data_challenge_test.csv: 25.000 baris dan 125 kolom (tanpa kolom target 'y’)
Deskripsi Kolom
Data Nasabah:
x0-x124 (125 kolom) : Merupakan data nasabah yang telah dinormalisasi dan dirahasiakan nama kolomnya.
Variabel target:
y - Apakah nasabah akan churn? (1 :iya,0 :tidak)
Note :
Terdapat beberapa Missing Value pada data.
Evaluasi dilakukan dengan mengukur performa model yang dilakukan oleh peserta, berdasarkan performance AUC. File yang dikirimkan memiliki format sebagai berikut:
- Coding script dalam bentuk ‘nama_lengkap-submission.ipynb’
- Nama file output (hasil prediksi terhadap data test): 'nama_lengkap-submission.csv'
Kolom: 'Id' dan 'Predicted'.
Mohon perhatikan bahwa nama file dan nama kolom bersifat case sensitive.
- Satu akun per perserta. Tidak ada penggabungan peserta dalam kompetisi ini.
- Batasan/larangan dalam kompetisi ini adalah sebagai berikut:
- Peserta dilarang untuk melakukan code sharing
- Peserta dilarang untuk meminta atau mendapatkan bantuan dari pihak lain.
- Peserta dilarang melakukan pelabelan manual
Jadwal:
10 Feb 2022 : Webinar Roadmap to Smart Banking Mindset Through AI-ML
14 Feb – 11 Maret 2022 : Pelaksanaan Lomba
14 Mar – 18 Mar 2022 : Penilaian
25 Mar 2022 : Pengumuman Pemenang