Skip to content

Latest commit

 

History

History
337 lines (241 loc) · 9.98 KB

postest-id.md

File metadata and controls

337 lines (241 loc) · 9.98 KB

Post test Questions and Answers from DataScience Class

Q1. Predicting the price of a house to a certain value is one example of the case ...

  • Regression
  • Data Merge
  • Association
  • Classification
  • Databases

Q2. The steps taken after modeling (building a model) is ...

  • Data collection
  • Model evaluation
  • Data validation
  • Model deployment
  • Data understanding

Q3. The proper flow in the data science methodology are ...

  • Data Collection - Modeling - Evaluation - Business Understanding
  • Data Collection - Modeling - Business Understanding - Evaluation
  • Business Understanding - Data Collection - Modeling - Evaluation
  • Business Understanding - Evaluation - Data Collection - Modeling
  • Modeling - Evaluation - Data Collection - Business Understanding

Q4. The following are the fundamental knowledge that a Data Scientist mus possess are as follows, except ...

  • Language literature
  • Math
  • Domain/Business Knowledge
  • Computer Science
  • Statistics

Q5. What do data scientist typically use for exploratory analysis of data and to get acquinted with it?

  • Use SVM or Neural Network as feature extraction
  • Use text summarization method
  • Use self-learning
  • Use descriptive statistics and data visualization techniques
  • Use deep learning

Q6. Modul apakah yang perlu kita import untuk menangani perhitungan tanggal dan waktu menggunakan Python?

  • datetime
  • timedate
  • time
  • timescount
  • date

Q7. Ketika melewati sebuah fungsi, *args akan disimpan pada datatype ...

  • dictionary
  • tuple
  • tensor
  • list
  • semua benar

Q8. Berikut ini yang merupakan statement untuk Exception Handling adalah ...

  • except
  • Semua benar
  • try
  • raise
  • finally

Q9. Manakah dari fungsi berikut pada Python yang mengubah tanggal menjadi waktu yang sesuai?

  • semua benar
  • strftime()
  • strptime()
  • to_time()
  • semua salah

Q10. Ketika melewati sebuah fungsi, **kwargs akan disimpan pada datatype ...

  • tensor
  • list
  • tuple
  • semua benar
  • dictionary

Q11. Untuk melihat proporsi suatu kelas di dalam data yang kita analisis, dapat dilakukan dengan memvisualisasikannya ke dalam ...

  • Line chart
  • Pie chart
  • Matrix faktorisasi
  • Table excel
  • Numpy array

Q12. Berikut ini yang bukan merupakan manfaat Exploratory Data Analysis yang dilakukan sebelum memodelkan data adalah ...

  • Menyiapkan data berdasarkan kondisi dan karakteristiknya
  • Mengenali karakteristik data
  • Menggali insight data
  • Memahami korelasi dan pola yang ada pada data
  • Memastikan nilai akurasi

Q13. Dalam EDA, proses melakukan analisis yang menggunakan lebih dari atau sama dengan tiga variabel disebut dengan ...

  • Univariate analysis
  • Dimensional analysis
  • Factor analysis
  • Multivariate analysis
  • Bivariate analysis

Q14. Ada atau tidaknya hubungan antara dua variabel dapat kita lihat pada nilai ...

  • Akurasi
  • Mean
  • Identifikasi
  • Median
  • Korelasi

Q15. Dalam EDA, proses melakukan analisis relasi dengan dua variabel yang biasanya dengan target variabel disebut juga dengan ...

  • Bivariate analysis
  • Multivariate analysis
  • Univariate analysis
  • Factor analysis
  • Dimensional analysis

Q16. Berikut ini yang bukan termasuk proses yang biasanya ada di dalam preprocessing adalah ...

  • Evaluasi performa model
  • Handling outliers
  • Hapus duplikat data
  • Handling missing value
  • Transformasi data

Q17. Pada kasus imbalanced data, metric evaluasi yang dilihat hanyalah metric akurasi

  • True
  • False

Q18. Berikut ini yang merupakan salah satu bentuk teknik feature extraction pada data audio adalah ...

  • Spectogram
  • Morphological Transformation
  • Case Folding
  • Geometric Transformations
  • TF-IDF

Q19. Teknik pengolahan gambar untuk mengatur dan merubah jenis channel dikenal juga dengan teknik ...

  • Resize image
  • Changing color space
  • Morphological Transformation
  • Stopword removal
  • Croping

Q20. Preprocessing teks untuk men-generalisir bentuk tulisan ke dalam huruf kecil atau besar disebut juga dengan ...

  • slang word handling
  • bag of words
  • stopword removal
  • case folding
  • feature scaling

Q21. Dalam melakukan visualisasi atau membangun dashboard tidak diwajibkan menggunakan semua jenis grafik yang tersedia.

  • True
  • False

Q22. Visualisasi yang bagus dapat mempersulit user mencerna informasi dan berpotensi terjadi salah pemahaman (missunderstanding) pada hasil analisa data

  • True
  • False

Q23. Untuk visualisasi atribut yang berisi nilai longitude dan latitude dapat menggunakan grafik ...

  • Histogram
  • Boxplot
  • Geomap
  • Bar chart
  • Line chart

Q24. Untuk melihat relasi dan sebaran dari dua buah variabel lebih cocok menggunakan scatter plot.

  • True
  • False

Q25. Grafik yang cocok untuk visualisasi data yang bersifat time series adalah ...

  • Pie chart
  • Line chart
  • Subplot
  • Box plot
  • Histogram

Q26. Berikut pernyataan yang benar untuk algoritma KNN adalah ...

  • KNN menggunakan hyperplane untuk melakukan klasifikasi.
  • KNN merupakan algoritma Machine Learning yang tidak menunjang untuk classification task.
  • KNN percaya suatu data dapat diklasifikasikan menurut mayoritas kelas/label dari k tetangga terdekatnya.
  • KNN menggunakan entropy untuk melakukan klasifikasi
  • KNN melakukan klasifikasi dengan melakukan break down pada permasalahan data untuk mendapatkan struktur klasifikasi.

Q27. Entropi merupakan suatu perhitungan untuk mengukur impurity atau uncertainty dari kelompok data observasi.

  • True
  • False

Q28. Algoritma SVM tidak dibutuhkan hyperplane.

  • True
  • False

Q29. Perhatikan tabel berikut:
Q29image
Tentukan Entropy dari windy pada tabel tersebut!

  • 0,1
  • 0
  • 0,2
  • 0,25
  • 0,5

Q30. Berikut ini yang bukan algoritma Machine Learning untuk kasus klasifikasi adalah ...

  • Kmeans
  • SVM
  • KNN
  • Decision Tree
  • Naive Bayes

Q31. Berikut contoh penerapan regresi adalah ...

  • Sentiment analysis data teks.
  • Deteksi penyakit pada citra medis.
  • Estimasi harga saham di masa depan.
  • Topic modelling dari dokumen.
  • Segmentasi sel kanker pada citra MRI otak.

Q32. Dalam algoritma Decission Tree yang dipakai untuk kasus regresi, output pada setiap ujung cabang diperoleh dengan menghitung nilai rata-rata dari subdata tersebut.

  • True
  • False

Q33. Berikut contoh algoritma yang tidak cocok digunakan dalam kasus regresi adalah ...

  • Multiple Linear Regression
  • Decision Tree
  • K-Means
  • Linear Regression
  • Support Vector Machine

Q34. Berikut library yang menyediakan algoritma regresi siap pakai adalah ...

  • opencv
  • pandas
  • plotly
  • scikit-learn
  • matplotlib

Q35. Support Vector Machine dapat diarahkan untuk kasus Klasifikasi, juga dapat digunakan dalam kasus Regresi.

  • True
  • False

Q36. K Means akan memaksakan semua datapoint akan masuk ke salah satu cluster yang ada

  • True
  • False

Q37. Karena Unsupervised Learning tidak memiliki target, maka dalam konsep Clustering akan mencari homogenitas atau kemiripan antar data.

  • True
  • False

Q38. Berikut ini yang tidak termasuk dalam Unsupervised Learning adalah

  • Regression
  • Autoencoder
  • Dimensionality Reduction
  • Association Rules
  • Clustering

Q39. Dalam DBSCAN algorithm, suatu datapoint dikatakan Noise Point jika

  • memiliki epsilon yang paling besar
  • memiliki jumlah tetangga dibawah Min. Samples yang ditentukan dan datapoint tersebut tidak berada dalam Neighborhood dari Core Point
  • terhubung dengan Density Edge
  • memiliki jumlah tetangga yang memenuhi Min. Samples walaupun tidak berada dalam Neighborhood dari Core Point
  • memiliki tetangga paling banyak dalam Neighborhood

Q40. Dalam K Means algorithm, untuk mengupdate centroid digunakan rumus median

  • True
  • False

Q41. Recall tidak sama dengan Sensitivity

  • True
  • False

Q42. Berikut ini hal yang tidak tepat adalah

  • Metric Evaluasi pada klasifikasi tidak cocok untuk regresi
  • MSE dan MAE merupakan metric evaluation untuk regresi
  • Dalam clustering, selain melihat hasil dari evaluasinya, kita juga harus melihat interpretasi dari cluster yang terbentuk
  • Dalam evaluasi klasifikasi, selain menggunakan akurasi bisa juga ditambahkan dengan f1 score
  • Menggunakan akurasi dalam kasus clustering

Q43. Specificity disebut juga True Negative Rate (TNR)

  • True
  • False

Q44. Nilai Mean Squared Error cenderung lebih besar daripada Root Mean Squarred Error

  • True
  • False

Q45. Output minimum yang dihasilkan dari fungsi ReLU adalah 0

  • True
  • False

Q46. Perbedaan Single Perceptron dengan Multi-Layer Perceptron yaitu jumlah neuron yang didefinisikan

  • True
  • False

Q47. Di proses apakah kita dapat memperoleh nilai bobot baru?

  • Input data
  • Penggunaan fungsi aktivasi sigmoid
  • Feedforward
  • Feature Learning
  • Backpropagation

Q48. Dalam Neural Network, setiap input data akan dilakukan pembobotan (dikalikan dengan suatu nilai bobot). Bagaimana cara mendefinisikan nilai bobot tersebut?

  • Nilai bobot berada pada rentang 0 sampai 365
  • Nilai bobot berada pada rentang 1 sampai 26 (angka mewakili huruf alfabet)
  • Nilai bobot sama dengan nilai input
  • Nilai bobot hanya boleh bernilai 1 atau -1
  • Bobot didefinisikan dari suatu random value (nilai acak)