Data Science merupakan suatu bidang ilmu yang menggabungkan beberapa disiplin ilmu yang kemudian dapat digunakan untuk mengekstraksi sebuah ilmu dan insight dengan mempelajari pattern data yang ada baik data yang terstruktur maupun yang tidak terstruktur.
Dalam bisnis, Data Science kerap digunakan untuk menggali berbagai insight baru yang berpotensi mampu meningkatkan performa bisnis perusahaan melalui sekumpulan data besar dan akan terus berkembang yang diproduksi oleh entitas bisnis itu sendiri.
Data Science sendiri sejatinya menggabungkan metode saintifik, matematika, statistika, ilmu komputer, domain knowledge, serta storytelling untuk menggali insight yang terdapat dalam kumpulan data. Jika digambarkan kedalam diagram, kurang lebih akan menjadi seperti berikut relasi antar disiplin ilmunya.
Mudahnya, Data Science merupakan seperangkat metode untuk mengambil ribuan data yang saat ini tersedia, dan menggunakannya untuk menarik kesimpulan. Di era saat ini, data ada dimana-mana di sekitar kita. Setiap like, klik, email, gesekan kartu kredit, bahkan tweet merupakan sebuah data baru yang bisa digunakan untuk menggambarkan kejadian saat ini atau bahkan memprediksi masa depan dengan lebih baik.
Python atau R merupakan bahasa pemrograman yang sangat umum di bidang Data Science. Keduanya dapat membantu kita dalam hal pengolahan dan eksplorasi data. Dengan menggunakan bahasa pemrograman, kita bisa memanfaatkan library yang tersedia untuk menunjang pekerjaan kita. Dan dukungan library untuk kedua bahasa tersebut sudah cukup banyak, sehingga kita akan bisa lebih fleksibel dan efisien dalam melakukan pekerjaan.
Bahasa pemrograman: Python/R
Coding environment:
- Jupyter Notebook
- Jupyter Lab
- VS Code
Struktur Data
- lists,tuples,sets,dictonaries
- Operasi Struktur Data
- Numpy
- Operasi Array
- Fungsi Math dan Statistik
Library Visualisasi:
- seaborn
- Matplotlib
- plotly
Dataframe processing :
- Pandas
- PySpark
- Web Scraping dan Eksplorasi Data (EDA)
Machine Learning:
- Machine Learning Library (MLlib)
- Scikit-learn
- Algoritma Supervised Learning
- Algoritma Unsupervised Learning