Skip to content

From Kaggle. This is a dataset to predict behavior to retain customers. The purpose is to analyze all relevant customer data and develop focused customer retention programs.

Notifications You must be signed in to change notification settings

YevaW/Telco-Customer-Churn

Repository files navigation

Open in Visual Studio Code

Phase 2 - Milestones 1

Milestones ini dibuat guna mengevaluasi pembelajaran pada Hacktiv8 Data Science Full Time Program Phase 2 khususnya pada Artificial Neural Network.


Data Sources

Unduh dataset yang akan digunakan disini

Assignment Instructions

Milestones 1 dikerjakan dalam format notebook dengan/atau dengan model deployment (opsional) dengan beberapa kriteria wajib di bawah ini:

  1. Deep Learning framework yang digunakan adalah Tensorflow.

  2. Ada penggunaan library visualisasi, seperti matplotlib, seaborn, atau yang lain.

  3. Isi notebook harus mengikuti outline di bawah ini:

    1. Perkenalan

      Bab pengenalan harus diisi dengan identitas, gambaran besar dataset yang digunakan, dan objective yang ingin dicapai.

    2. Import Libraries

      Cell pertama pada notebook harus berisi dan hanya berisi semua library yang digunakan dalam project.

    3. Data Loading

      Bagian ini berisi proses penyiapan data sebelum dilakukan eksplorasi data lebih lanjut. Proses Data Loading dapat berupa memberi nama baru untuk setiap kolom, mengecek ukuran dataset, dll.

    4. Exploratory Data Analysis (EDA)

      Bagian ini berisi explorasi data pada dataset diatas dengan menggunakan query, grouping, visualisasi sederhana, dan lain sebagainya.

    5. Data Preprocessing

      Bagian ini berisi proses penyiapan data untuk proses pelatihan model, seperti pembagian data menjadi train-dev-test, transformasi data (normalisasi, encoding, dll.), dan proses-proses lain yang dibutuhkan.

    6. Model Definition

      Bagian ini berisi cell untuk mendefinisikan model. Jelaskan alasan menggunakan suatu algoritma/model, hyperparameter yang dipakai, jenis penggunaan metrics yang dipakai, dan hal lain yang terkait dengan model.

    7. Model Training

      Cell pada bagian ini hanya berisi code untuk melatih model dan output yang dihasilkan. Lakukan beberapa kali proses training dengan hyperparameter yang berbeda untuk melihat hasil yang didapatkan. Analisis dan narasikan hasil ini pada bagian Model Evaluation.

    8. Model Evaluation

      Pada bagian ini, dilakukan evaluasi model yang harus menunjukkan bagaimana performa model berdasarkan metrics yang dipilih. Hal ini harus dibuktikan dengan visualisasi tren performa dan/atau tingkat kesalahan model. Lakukan analisis terkait dengan hasil pada model dan tuliskan hasil analisisnya.

    9. Model Saving

      Dengan melihat hasil evaluasi model, pilihlah model terbaik untuk disimpan. Model terbaik ini akan digunakan kembali dalam melakukan deployment di Heroku.

    10. Model Inference

      Model yang sudah dilatih akan dicoba pada data yang bukan termasuk ke dalam train-set ataupun test-set. Data ini harus dalam format yang asli, bukan data yang sudah di-scaled.

    11. Pengambilan Kesimpulan

      Pada bagian terakhir ini, harus berisi kesimpulan yang mencerminkan hasil yang didapat dengan objective yang sudah ditulis di bagian pengenalan.

  4. Notebook harus diupload dalam akun GitHub masing-masing siswa untuk selanjutnya dinilai.

  5. Penilaian project dilakukan berdasarkan notebook dan service/API model yang sudah di-deploy (jika melakukan Model Deployment).

  6. Presentasikan model yang telah dibuat pada P2W2D2AM.

Assignment Submission

  • Simpan assignment pada sesi ini dengan nama h8dsft_Milestone1P2_<nama-student>.ipynb, misal h8dsft_Milestone1P2_raka_ardhi.ipynb.
  • Push Assigment yang telah dibuat ke akun Github organization.
  • Jika melakukan Model Deployment ke Heroku :
    • Push juga semua file yang berkaitan dengan deployment ke repository. Akan lebih bagus jika semua file deployment berada dalam satu folder yang sama.
    • Buat sebuah file bernama url.txt yang berisi URL Dataset dan URL deployment.

Assignment Objectives

Milestones 1 ini dibuat guna mengevaluasi Pembelajaran Phase 2 :

  • Mampu memahami konsep Artificial Neural Network.
  • Mampu mempersiapkan data untuk digunakan dalam model Artificial Neural Network.
  • Mampu mengimplementasikan Artificial Neural Network dengan data yang diberikan.
  • Mampu menganalisis dan menjelaskan layer yang dibuat.

Assignment Rubrics

Code Review

Criteria Meet Expectations Points
Feature Engineering Mampu melakukan proses Feature Engineering sebelum melakukan proses modeling 30 pts
Pipelines Mampu membangun Pipeline. Pipeline yang dimaksud adalah Pipeline yang menggunakan modul Tensorflow 40 pts
Modeling Membuat model Artifical Neural Network dengan menggunakan Sequential API dan Functional API 30 pts (untuk Sequential API), 30 pts (untuk Functional API)
Model Evaluation Mampu melakukan Model Evaluation 40 pts
Model Improvement Mampu melakukan Model Improvement 40 pts
Model Inference Mencoba model yang telah dibuat dengan data baru 20 pts
Apakah Kode Berjalan Tanpa Ada Error? Kode berjalan tanpa ada error. Seluruh kode berfungsi dan dibuat dengan benar. 10 pts

Readability

Criteria Meet Expectations Points
Tertata Dengan Baik Semua baris kode terdokumentasi dengan baik dengan menggunakan Markdown untuk penjelasan kode. 10 pts

Analysis

Criteria Meet Expectations Points
EDA Analysis Menarik informasi/kesimpulan dari keseluruhan eksplorasi data yang dilakukan 30 pts
Model Analysis Menganalisa informasi dari model yang telah dibuat 40 pts

Deployment (Bonus Point) (Optional)

Criteria Meet Expectations Points
Model Deployment Membuat webapps terhadap project yang telah dibuat 10 pts

Total Points (tanpa Deployment)  : 320
Total Points (dengan Deployment) : 330

Catatan : Penilaian pada milestone dapat bersifat subyektif tergantung daripada pemilihan algoritma, penulisan kesimpulan, presentasi dan lain sebagainya diluar dari rubrik yang tertera.

About

From Kaggle. This is a dataset to predict behavior to retain customers. The purpose is to analyze all relevant customer data and develop focused customer retention programs.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Languages