# Plotly pada Data Penjualan K-Pop

## Pendahuluan
Plotly merupakan salah satu library visualisasi data yang populer digunakan dalam pengembangan aplikasi web, analisis data, dan penelitian ilmiah. Plotly bisa diterapkan pada data penjualan K-Pop. Dengan menggunakan Plotly, visualisasi yang menarik dan informatif dapat dibuat untuk menganalisis tren penjualan, membandingkan kinerja artis, dan menjelajahi faktor-faktor yang memengaruhi popularitas K-Pop di berbagai negara. Sebelum melakukan visualisasi data tentang industri Kpop menggunakan Plotly, pahami terlebih dahulu tentang Plotly yang akan digunakan untuk visualisasi. Berikut adalah pengertian, fungsi, serta kelebihan dan kelemahan dari Plotly.

## Pengertian Plotly
Plotly adalah sebuah library Python yang digunakan untuk membuat visualisasi data interaktif. Dengan Plotly, pengguna dapat membuat berbagai jenis plot seperti grafik garis, scatter plot, bar plot, heat map, dan lainnya. Plotly memiliki fitur interaktif yang memungkinkan pengguna untuk melakukan zoom, hover, dan filter data langsung pada plot.

## Fungsi Plotly
- Visualisasi Data Interaktif: Plotly memungkinkan pembuatan visualisasi data yang interaktif, sehingga pengguna dapat menjelajahi dan menganalisis data dengan lebih mudah.
- Kustomisasi: Plotly menyediakan berbagai opsi untuk menyesuaikan tampilan plot sesuai kebutuhan pengguna, seperti mengubah warna, marker, dan tata letak.
- Integrasi: Plotly dapat diintegrasikan dengan berbagai bahasa pemrograman seperti Python, R, dan JavaScript, serta berbagai platform seperti Jupyter Notebook, Dash, dan Flask.
- Ekspor dan Berbagi: Plotly memungkinkan pengguna untuk menyimpan plot dalam berbagai format gambar dan berbagi plot secara online.

## Kelebihan Plotly
- Interaktif: Fitur interaktif Plotly memudahkan pengguna dalam menjelajahi dan menganalisis data secara langsung pada plot.
- Kustomisasi: Plotly memberikan kebebasan bagi pengguna untuk menyesuaikan tampilan plot sesuai preferensi.
- Multi-platform: Plotly dapat digunakan dalam berbagai bahasa pemrograman dan platform.
- Komunitas dan Dokumentasi: Plotly memiliki komunitas yang aktif serta dokumentasi yang lengkap dan mudah dipahami.

## Kelemahan Plotly
- Kompleksitas: Beberapa fitur Plotly mungkin memerlukan pembelajaran lebih lanjut untuk dimengerti dan dimanfaatkan secara maksimal.
- Ketergantungan Internet: Untuk menggunakan fitur interaktif Plotly, pengguna memerlukan koneksi internet.

## Jenis-Jenis Plotly

Plotly menyediakan berbagai jenis plot dan grafik, termasuk:
- Scatter Plot: Grafik yang menampilkan titik data dalam ruang dua dimensi.
- Line Plot: Grafik yang menampilkan data dalam bentuk garis yang menghubungkan titik-titik data.
- Bar Plot: Grafik batang yang menampilkan data dalam bentuk batang vertikal atau horizontal.
- Pie Chart: Grafik lingkaran yang menampilkan proporsi data dalam bentuk bagian dari lingkaran.
Selain itu, Plotly juga menyediakan jenis plot lainnya, seperti heatmap, box plot, bubble chart, dan masih banyak lagi.

# Plotly untuk Eksplorasi Data K-Pop

Data yang digunakan adalah data Sales Idol K-Pop Generasi 4, meliputi IZONE, ITZY, Stray Kids, Treasure, TXT, (G)I-dle, Cravity, Verivery, Loona, Ateez, dan Everglow. Generasi keempat (Gen 4) dalam K-pop dimulai sekitar tahun 2017-an setelah era Gen 3. Gen 4 ditandai dengan diversifikasi genre musik, penekanan pada kreativitas grup, penggunaan teknologi dan media sosial dalam pemasaran, pengaruh global yang meluas, konten digital tambahan, dan kepedulian pada isu-isu sosial. Ini adalah era inovasi, eksperimen, dan pengaruh global yang semakin meningkat dalam industri K-pop. Industri Kpop telah menjadi fenomena global yang memengaruhi budaya populer, musik, dan mode di seluruh dunia. Eksplorasi data K-Pop dapat dilakukan dengan lebih interaktif dan informatif dengan menggunakan Plotly. Hal ini juga memungkinkan pengguna untuk mendapatkan wawasan yang lebih dalam tentang industri musik K-Pop.

Berikut ini adalah bagaimana Plotly dapat digunakan untuk menganalisa data penjualan menjadi insight bagi pecinta musik K-Pop.

## Import Library

In [337]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import plotly.express as px
import plotly.graph_objects as go


## Load Dataset

In [338]:
df = pd.read_csv('Kpop 4th gen Sales.csv')

In [339]:
# Mengubah format tanggal
df['date'] = pd.to_datetime(df['date'], format='%m/%d/%Y')
# Menambah kolom year
df['year'] = df['date'].dt.year.astype('str')
# Menambah kolom Year_Month
df['Year_Month'] = df['date'].dt.to_period('M').astype('str')
# Mengubah kesalahan penulisan pada kolom sales
df['sales'] = df['sales'].str.replace(',', '').astype(int)

In [340]:
# Dataframe baru yang sudah diurutkan berdasarkan Year Month
df_new = df.sort_values('Year_Month')
df_new

Unnamed: 0,Artist,title,date,country,sales,peak_chart,year,Year_Month
72,Loona,Love & Live,2017-03-13,KOR,7130,10,2017,2017-03
76,Loona,Love & Evil,2017-04-27,KOR,5924,24,2017,2017-04
73,Loona,Mix & Match,2017-09-21,KOR,7869,16,2017,2017-09
77,Loona,Max & Match,2017-10-31,KOR,11136,7,2017,2017-10
19,Stray Kids,Mixtape,2018-01-08,JPN,1063,47,2018,2018-01
...,...,...,...,...,...,...,...,...
53,(G)I-dle,I Burn,2021-01-11,KOR,207927,3,2021,2021-01
80,Ateez,Into the A to Z,2021-03-24,JPN,10813,6,2021,2021-03
90,Ateez,Zero: Fever Part.2,2021-03-01,KOR,380711,1,2021,2021-03
91,Ateez,Zero: Fever Part.2,2021-03-01,JPN,11027,10,2021,2021-03


In [341]:
# Cek Missing Value
df.isna().sum()

Artist        0
title         0
date          0
country       0
sales         0
peak_chart    0
year          0
Year_Month    0
dtype: int64

In [342]:
# Cek data Duplikat
df.duplicated().sum()

0

In [344]:
# Filter Dataframe per negara 
df_kor = df_new[df_new['country'] == 'KOR']
df_jpn = df_new[df_new['country'] == 'JPN']
df_chn = df_new[df_new['country'] == 'CHN']

In [345]:
# Grouping berdasarkan Artist dan Sales
df_grup = df_new.groupby(['Artist'])[['sales']].sum().sort_values('sales', ascending= False).reset_index()

In [346]:
# Membuat chart dengan Plotly
fig = px.bar(df_grup, x='Artist', y='sales', title='Penjualan Album Kpop Gen 4')
fig.show()


Insight:
- Penjualan tertinggi secara keseluruhan diperoleh IZ*ONE dengan total 2,356,819 album terjual.
- Penjualan terendah diperoleh Everglow dengan total 138,621 album

In [347]:
# Membuat treemap dengan Plotly
fig = px.treemap(df_new, path=['country', 'Artist'], values='sales', hover_data=['title', 'sales'], title='Treemap Penjualan K-Pop Berdasarkan Negara dan Artis')

# Show plot
fig.show()

Insight:
- Penjualan terbesar di Korea, diikuti Jepang dan China. Hal ini karena tidak semua grup melakukan promosi di 3 negara tersebut.
- 5 besar penjualan Album didominasi oleh Boygroup (Stray Kids, Ateez, TXT, Treasure) hanya IZ*ONE yang mewakili Girlgroup namun berada di urutan 1 sales.
- 5 besar grup dengan penjualan album di Jepang sama dengan 5 besar grup dengan penjualan tertinggi di Korea
- Hanya (G)I-dle yang melakukan promosi di China

In [348]:
izone_kor = df_kor[df_kor['Artist'] == 'IZONE']
izone_jpn = df_jpn[df_jpn['Artist'] == 'IZONE']

# Membuat dropdown options
dropdown_options = [
    {'label': 'All', 'method': 'update', 'args': [{'visible': [True, True, True]}]},
    {'label': 'Korea', 'method': 'update', 'args': [{'visible': [True, False, False]}]},
    {'label': 'Jepang', 'method': 'update', 'args': [{'visible': [False, True, False]}]}
]

# Membuat traces untuk tiap negara
trace_kor = go.Scatter(x=izone_kor['date'], y=izone_kor['sales'], mode='lines', name='Korea')
trace_jpn = go.Scatter(x=izone_jpn['date'], y=izone_jpn['sales'], mode='lines', name='Jepang')

# Membuat layout dengan dropdown
layout = go.Layout(title='Penjualan Album IZONE Berdasarkan Negara (Diurutkan berdasarkan Bulan-Tahun)',
                   xaxis=dict(title='date'),
                   yaxis=dict(title='Sales'),
                   updatemenus=[{'buttons': dropdown_options,
                                 'direction': 'down',
                                 'showactive': True,
                                 'x': 1,
                                 'xanchor': 'left',
                                 'y': 1.2,
                                 'yanchor': 'top'}])

# Membuat figure
fig = go.Figure(data=[trace_kor, trace_jpn], layout=layout)

# Show plot
fig.show()

Insight:
- Penjualan Album IZ*ONE di Jepang cenderung meningkat di akhir 2020
- Penjualan Album baik di Korea maupun di Jepang mengalami fluktuasi
- Album debut terjual di Korea sebanyak 282,816, menandakan awal yang baik bagi Girlgroup yang baru debut, ditambah adanya member Jepang yang sudah lama debut seperti Miyawaki Sakura, Yabuki Nako, dan Honda Hitomi menjadi faktor lain tingginya penjualan.
- Penjualan terbesar dari Album Oneiric Diary dengan total lebih dari 560K Album

## KESIMPULAN
- Diantara 5 besar grup dengan penjualan terbanyak, IZ*ONE merupakan satu-satunya Girlgroup dengan total sales Album terbanyak.
- Penjualan terbanyak diraih oleh IZ*ONE baik di Korea maupun di Jepang.
- Penjualan yang tinggi dikarenakan berbagai faktor, diantaranya dipengaruhi oleh banyaknya fans, kualitas lagu, kualitas member, gencarnya promosi oleh agensi, dll.
- Hanya (G)I-dle yang melakukan promosi di China.