Skip to content

Ay0-Belajar/Data-Science-with-Python

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 

Repository files navigation

Pengenalan Data Science

Apa itu Data Science?

Data Science merupakan suatu bidang ilmu yang menggabungkan beberapa disiplin ilmu yang kemudian dapat digunakan untuk mengekstraksi sebuah ilmu dan insight dengan mempelajari pattern data yang ada baik data yang terstruktur maupun yang tidak terstruktur.

Dalam bisnis, Data Science kerap digunakan untuk menggali berbagai insight baru yang berpotensi mampu meningkatkan performa bisnis perusahaan melalui sekumpulan data besar dan akan terus berkembang yang diproduksi oleh entitas bisnis itu sendiri.

Data Science sendiri sejatinya menggabungkan metode saintifik, matematika, statistika, ilmu komputer, domain knowledge, serta storytelling untuk menggali insight yang terdapat dalam kumpulan data. Jika digambarkan kedalam diagram, kurang lebih akan menjadi seperti berikut relasi antar disiplin ilmunya.

source: https://www.ironhack.com/en/data-analytics/data-science-data-analytics

Mudahnya, Data Science merupakan seperangkat metode untuk mengambil ribuan data yang saat ini tersedia, dan menggunakannya untuk menarik kesimpulan. Di era saat ini, data ada dimana-mana di sekitar kita. Setiap like, klik, email, gesekan kartu kredit, bahkan tweet merupakan sebuah data baru yang bisa digunakan untuk menggambarkan kejadian saat ini atau bahkan memprediksi masa depan dengan lebih baik.

Python / R

Python atau R merupakan bahasa pemrograman yang sangat umum di bidang Data Science. Keduanya dapat membantu kita dalam hal pengolahan dan eksplorasi data. Dengan menggunakan bahasa pemrograman, kita bisa memanfaatkan library yang tersedia untuk menunjang pekerjaan kita. Dan dukungan library untuk kedua bahasa tersebut sudah cukup banyak, sehingga kita akan bisa lebih fleksibel dan efisien dalam melakukan pekerjaan.

Data Scientist Toolbox

Bahasa pemrograman: Python/R

Coding environment:

  • Jupyter Notebook
  • Jupyter Lab
  • VS Code

Struktur Data

  • lists,tuples,sets,dictonaries
  • Operasi Struktur Data
  • Numpy
  • Operasi Array
  • Fungsi Math dan Statistik

Library Visualisasi:

  • seaborn
  • Matplotlib
  • plotly

Dataframe processing :

  • Pandas
  • PySpark
  • Web Scraping dan Eksplorasi Data (EDA)

Machine Learning:

  • Machine Learning Library (MLlib)
  • Scikit-learn
  • Algoritma Supervised Learning
  • Algoritma Unsupervised Learning

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published