Milestones ini dibuat guna mengevaluasi pembelajaran pada Hacktiv8 Data Science Full Time Program Phase 2 khususnya pada Artificial Neural Network.
Unduh dataset yang akan digunakan disini
Milestones 1 dikerjakan dalam format notebook dengan/atau dengan model deployment (opsional) dengan beberapa kriteria wajib di bawah ini:
-
Deep Learning framework yang digunakan adalah Tensorflow.
-
Ada penggunaan library visualisasi, seperti matplotlib, seaborn, atau yang lain.
-
Isi notebook harus mengikuti outline di bawah ini:
-
Perkenalan
Bab pengenalan harus diisi dengan identitas, gambaran besar dataset yang digunakan, dan objective yang ingin dicapai.
-
Import Libraries
Cell pertama pada notebook harus berisi dan hanya berisi semua library yang digunakan dalam project.
-
Data Loading
Bagian ini berisi proses penyiapan data sebelum dilakukan eksplorasi data lebih lanjut. Proses Data Loading dapat berupa memberi nama baru untuk setiap kolom, mengecek ukuran dataset, dll.
-
Exploratory Data Analysis (EDA)
Bagian ini berisi explorasi data pada dataset diatas dengan menggunakan query, grouping, visualisasi sederhana, dan lain sebagainya.
-
Data Preprocessing
Bagian ini berisi proses penyiapan data untuk proses pelatihan model, seperti pembagian data menjadi train-dev-test, transformasi data (normalisasi, encoding, dll.), dan proses-proses lain yang dibutuhkan.
-
Model Definition
Bagian ini berisi cell untuk mendefinisikan model. Jelaskan alasan menggunakan suatu algoritma/model, hyperparameter yang dipakai, jenis penggunaan metrics yang dipakai, dan hal lain yang terkait dengan model.
-
Model Training
Cell pada bagian ini hanya berisi code untuk melatih model dan output yang dihasilkan. Lakukan beberapa kali proses training dengan hyperparameter yang berbeda untuk melihat hasil yang didapatkan. Analisis dan narasikan hasil ini pada bagian Model Evaluation.
-
Model Evaluation
Pada bagian ini, dilakukan evaluasi model yang harus menunjukkan bagaimana performa model berdasarkan metrics yang dipilih. Hal ini harus dibuktikan dengan visualisasi tren performa dan/atau tingkat kesalahan model. Lakukan analisis terkait dengan hasil pada model dan tuliskan hasil analisisnya.
-
Model Saving
Dengan melihat hasil evaluasi model, pilihlah model terbaik untuk disimpan. Model terbaik ini akan digunakan kembali dalam melakukan deployment di Heroku.
-
Model Inference
Model yang sudah dilatih akan dicoba pada data yang bukan termasuk ke dalam train-set ataupun test-set. Data ini harus dalam format yang asli, bukan data yang sudah di-scaled.
-
Pengambilan Kesimpulan
Pada bagian terakhir ini, harus berisi kesimpulan yang mencerminkan hasil yang didapat dengan objective yang sudah ditulis di bagian pengenalan.
-
-
Notebook harus diupload dalam akun GitHub masing-masing siswa untuk selanjutnya dinilai.
-
Penilaian project dilakukan berdasarkan notebook dan service/API model yang sudah di-deploy (jika melakukan Model Deployment).
-
Presentasikan model yang telah dibuat pada P2W2D2AM.
- Simpan assignment pada sesi ini dengan nama
h8dsft_Milestone1P2_<nama-student>.ipynb
, misalh8dsft_Milestone1P2_raka_ardhi.ipynb
. - Push Assigment yang telah dibuat ke akun Github organization.
- Jika melakukan Model Deployment ke Heroku :
- Push juga semua file yang berkaitan dengan deployment ke repository. Akan lebih bagus jika semua file deployment berada dalam satu folder yang sama.
- Buat sebuah file bernama
url.txt
yang berisi URL Dataset dan URL deployment.
Milestones 1 ini dibuat guna mengevaluasi Pembelajaran Phase 2 :
- Mampu memahami konsep Artificial Neural Network.
- Mampu mempersiapkan data untuk digunakan dalam model Artificial Neural Network.
- Mampu mengimplementasikan Artificial Neural Network dengan data yang diberikan.
- Mampu menganalisis dan menjelaskan layer yang dibuat.
Criteria | Meet Expectations | Points |
---|---|---|
Feature Engineering | Mampu melakukan proses Feature Engineering sebelum melakukan proses modeling | 30 pts |
Pipelines | Mampu membangun Pipeline. Pipeline yang dimaksud adalah Pipeline yang menggunakan modul Tensorflow |
40 pts |
Modeling | Membuat model Artifical Neural Network dengan menggunakan Sequential API dan Functional API | 30 pts (untuk Sequential API), 30 pts (untuk Functional API) |
Model Evaluation | Mampu melakukan Model Evaluation | 40 pts |
Model Improvement | Mampu melakukan Model Improvement | 40 pts |
Model Inference | Mencoba model yang telah dibuat dengan data baru | 20 pts |
Apakah Kode Berjalan Tanpa Ada Error? | Kode berjalan tanpa ada error. Seluruh kode berfungsi dan dibuat dengan benar. | 10 pts |
Criteria | Meet Expectations | Points |
---|---|---|
Tertata Dengan Baik | Semua baris kode terdokumentasi dengan baik dengan menggunakan Markdown untuk penjelasan kode. | 10 pts |
Criteria | Meet Expectations | Points |
---|---|---|
EDA Analysis | Menarik informasi/kesimpulan dari keseluruhan eksplorasi data yang dilakukan | 30 pts |
Model Analysis | Menganalisa informasi dari model yang telah dibuat | 40 pts |
Criteria | Meet Expectations | Points |
---|---|---|
Model Deployment | Membuat webapps terhadap project yang telah dibuat | 10 pts |
Total Points (tanpa Deployment) : 320
Total Points (dengan Deployment) : 330
Catatan : Penilaian pada milestone dapat bersifat subyektif tergantung daripada pemilihan algoritma, penulisan kesimpulan, presentasi dan lain sebagainya diluar dari rubrik yang tertera.