Artikel ini akan membahas clustering pada saham di Indonesia menggunakan algoritma K-Means dan K-Medoid serta melakukan profiling terhadap cluster yang terbentuk.
- Profil Perusahaan : didapat dari website resmi idx dengan cara scraping
- Harga Saham : didapat dari Yahoo finance dengan menggunakan package
tidyquant
Secara garis besar proses clustering ini memiliki 5 tahapan yaitu :
Data Collaction
: Pengumpulan data dari berbagai sumber.Feature Engineering
: Mengekstrak feature/ informasi dari data yang ada.Anomaly Detection
: Mencari data yang bersifat anomali dan menghapusnya sehingga tidak mengganggu cluster yang akan dibentuk.Clustering
: Mengelompokkan data menjadi beberapa kelompok berdasarkan karakteristik data.Cluster Profiling
: Mencari karakteristik dari setiap cluster yang sudah terbentuk.
Hasil dari clustering adalah profil atau karakteristik dari setiap cluster yang terbentuk.