<img src="../images/ilmudatapy-logo.png" width="350" align="center">
<br>

<center><h1>Pie Chart</h1></center>
<hr>

__Halo, Learners!__ Di notebook ini, kita akan membahas __Pie Chart__. Disini kita akan membuat <i>pie chart</i> menggunakan dataset asli, serta mengatur berbagai parameter untuk mempercantik <i>pie chart</i>. Kita juga akan belajar membuat __Donut Chart__.

<h2>Table of Contents</h2>
<div class="alert alert-block alert-info" style="margin-top: 25px">
    <ul>
        <li>
            Load Dataset
        </li>
        <li>
            Visualisasi data dengan <b>Pie Chart</b>
            <ul>
                <li>Menghapus label dan menggantinya dengan legend</li>
                <li>Mengatur posisi angka persentase</li>
                <li>Mengatur warna</li>
                <li>Menekankan irisan chart</li>
            </ul>
        </li>
        <li>
            Donut Chart
        </li>
    </ul>
</div>

<hr>
<div class="alert alert-success" style="margin-top: 20px">
    <strong>Catatan:</strong> Untuk menjalankan kode program Python di Jupyter Notebook, klik pada <i>cell</i> yang ingin di-<i>run</i> lalu tekan <kbd>Shift</kbd> + <kbd>Enter</kbd>.
</div>

<div class="alert alert-danger" style="margin-top: 20px">
    <strong>Warning!:</strong> Jika ada kode program yang <i>error</i> atau output yang dihasilkan tidak sesuai, silahkan <b>Restart & Run All</b> kernel pada bagian menu <b>Kernel</b> di menu bar Jupyter Notebook, atau <b>Restart & Clear Output</b> kernel kemudian jalankan satu per satu <i>cell</i> secara berurutan dari atas ke bawah.
</div>
<hr>

## Load dataset

Dataset yang digunakan dalam praktek kali ini adalah <a href="https://www.kaggle.com/dhs/refugee-report?select=refugee_status.csv">Refugees in the United States, 2006-2015</a> yang mana menampilkan data pengungsi di Amerika Serikat dari berbagai negara dari tahun 2006 sampai 2015.

__Feature Information:__

* __Continent/Country of Nationality__: Benua atau negara asal para pengungsi.
* __2006 - 2015__ : Jumlah pengungsi yang pindah ke Amerika Serikat pada tahun tersebut (2006 - 2015).

Seperti biasa, mari kita <i>import</i> terlebih dahulu <i>library</i> yang dibutuhkan. Disini kita akan membutuhkan Pandas dan Matplotlib.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

plt.style.use('fivethirtyeight')

Setelah itu kita <i>load</i> dataset ke dalam dataframe Pandas dengan <code>read_csv()</code>.

In [None]:
# Load dataset ke dalam dataframe Pandas

df = pd.read_csv("../datasets/refugee_status.csv")
df.head(10)

Untuk memudahkan pengindeksan dan visualisasi data, kita akan mengatur kolom <code>Continent/Country of Nationality</code> sebagai indeks dengan <code>set_index()</code>.

In [None]:
# Set 'Continent/Country of Nationality' sebagai indeks

df.set_index('Continent/Country of Nationality', inplace=True)

Dalam praktek ini, kita akan menggunakan data pengungsi berdasarkan benua saja. Oleh karena itu, mari kita filter dataframe <code>df</code> dengan hanya mengambil 6 data teratas yang merupakan representasi benua dan menyimpannya ke dalam dataframe baru, misalnya <code>df_continent</code>.

In [None]:
# Mengambil 6 baris teratas yang merupakan data benua

df_continent = df.head(6)
df_continent

Seperti yang dapat kita lihat setelah menjalankan kode di atas, __Oceania__ tidak memiliki data apapun, karena itu ada baiknya kita menghapus baris tersebut karena tidak digunakan.

In [None]:
# Menghapus baris 'Oceania'

df_continent = df_continent.drop(['Oceania'], axis=0)
df_continent

Sekarang mari kita cek informasi dataframe dengan <code>info()</code>.

In [None]:
# Cek info dataframe

df_continent.info()

Seperti yang kita lihat ternyata semua kolom masih bertipe __object__ yang berarti string. Jika tidak diganti dengan tipe numerik, seperti integer atau float, akan menjadi masalah saat kita ingin melakukan operasi numerik. Dapat kita lihat pada dataframe bahwa penulisan angkanya dipisahkan oleh koma. Oleh karena itu, sebelum konversi tipe data dengan <code>astype()</code>, kita harus menghilangkan tanda koma tersebut terlebih dahulu. Perhatikan kode berikut. 

In [None]:
# Mengganti tanda koma dengan blank

for i in df_continent.columns:
    df_continent[i] = df_continent[i].str.split(',').str.join('').astype(int)

Sekarang mari kita cek hasilnya.

In [None]:
# Melihat dataframe df_continent

df_continent

Sekarang mari kita cek lagi tipe datanya dengan <code>dtypes</code>.

In [None]:
# Mengecek tipe data

df_continent.dtypes

Setelah itu, kita dapat melakukan operasi numerik pada dataframe <code>df_continent</code>. Disini kita akan membuat kolom baru, yaitu kolom <code>Total</code> untuk menampung jumlah total pengungsi dari tahun 2006 sampai 2015.

In [None]:
# Membuat kolom 'Total'

df_continent['Total'] = df_continent.sum(axis=1)
df_continent

<hr>

## Visualisasi data dengan Pie Chart

Setelah menyiapkan data yang akan divisualisasi, kita dapat langsung mengeksekusinya. Visualisasi data dengan <i>pie chart</i> dapat menggunakan <code>plot()</code> serta memberikan parameter <code>kind = 'pie'</code>. Perhatikan kode berikut.

In [None]:
# Membuat pie chart

df_continent['Total'].plot(kind='pie',
                           figsize=(5, 6),
                           autopct='%1.1f%%', # menambahkan persentase
                           startangle=90,     # start angle 90° 
                           shadow=True        # menambahkan shadow      
                           )

plt.title('Refugees in the United States (2006 - 2015)')
plt.axis('equal')     # mengatur rasio axis agar sama antara axis x dan y

plt.show()

Seperti dapat kita lihat pada kode di atas, selain parameter <code>kind</code> dan <code>figsize</code> yang sudah sering kita gunakan pada jenis plot lainnya, ada beberapa parameter lain yang dapat digunakan diantaranya:

* <code>autopct</code> untuk menambahkan angka persentase. 
* <code>startangle</code> untuk mengatur sudut awal chart.
* <code>shadow</code> untuk memberikan kesan bayangan.

Anda dapat melakukan eksperimen sendiri dengan mengubah-ubah nilai parameter tersebut untuk melihat perbedaannya.

### Menghapus label dan menggantinya dengan legend

Selanjutnya, jika kita lihat pada visualisasi sebelumnya, teks label kategorinya (nama benua) ada yang bertumpukan karena memang porsi irisan-irisan yang kecil bersebelahan. Tentunya itu kurang menarik, bukan? 

Nah, untuk mengakalinya, kita dapat menghapus label tersebut dan menggantinya dengan menggunakan legend. Perhatikan kode berikut.

In [None]:
# Membuat pie chart

df_continent['Total'].plot(kind='pie',
                           figsize=(15, 6),
                           autopct='%1.1f%%', # menambahkan persentase
                           startangle=90,     # start angle 90° 
                           shadow=True,       # menambahkan shadow 
                           labels=None        # menghilangkan label pada pie chart
                           )

plt.title('Refugees in the United States (2006 - 2015)', size=18, y=1.12)
plt.axis('equal') # mengatur rasio axis agar sama antara axis x dan y

# add legend
plt.legend(labels=df_continent.index, loc='upper left', fontsize=14) 

plt.show()

Untuk menghapus teks label, kita dapat memberikan parameter <code>label = None</code> pada <code>plot()</code> dan juga menambahkan <i>method</i> <code>legend()</code> dari Matplotlib. 

Di dalam <code>legend()</code> kita dapat menambahkan parameter <code>labels</code> yang diberikan nilai indeks dari <code>df_continent</code> serta mengatur lokasi penempatan legend dengan parameter <code>loc</code> dan ukuran huruf dengan <code>fontsize</code>.

### Mengatur posisi angka persentase

Jika kita lihat angka persentase juga ada yang saling bertumpuk karena diletakkan di dalam <i>pie chart</i>. Untuk merapikannya, kita dapat membuat teks persentase tersebut berada di luar <i>pie chart</i> dengan menambahkan parameter <code>pctdistance</code> yang dapat diberikan nilai numerik berupa bilangan float. Perhatikan kode berikut.

In [None]:
# Membuat pie chart

df_continent['Total'].plot(kind='pie',
                           figsize=(15, 6),
                           autopct='%1.1f%%', # menambahkan persentase
                           startangle=90,     # start angle 90° 
                           shadow=True,       # menambahkan shadow 
                           labels=None,       # menghilangkan label pada pie chart
                           pctdistance=1.12   # rasio antara pusat pie chart posisi awal teks yang dihasilkan oleh autopct 
                           )

plt.title('Refugees in the United States (2006 - 2015)', size=18, y=1.12)
plt.axis('equal') # mengatur rasio axis agar sama antara axis x dan y

# add legend
plt.legend(labels=df_continent.index, loc='upper left', fontsize=14) 

plt.show()

Sekarang sudah terlihat lebih rapi, bukan?

### Mengatur warna

Tidak berbeda dengan pengaturan warna pada jenis plot lainnya, untuk mengatur warna pada <i>pie chart</i> dapat menggunakan parameter <code>colors</code> yang diberikan nilai berupa list nama atau kode warna.

In [None]:
# Membuat pie chart

colors_list = ['pink', 'yellowgreen', 'gold', 'lightskyblue', 'lightcoral']

df_continent['Total'].plot(kind='pie',
                           figsize=(15, 6),
                           autopct='%1.1f%%',    # menambahkan persentase
                           startangle=90,        # start angle 90° 
                           shadow=True,          # menambahkan shadow 
                           labels=None,          # menghilangkan label pada pie chart
                           pctdistance=1.12,     # rasio antara pusat pie chart posisi awal teks yang dihasilkan oleh autopct 
                           colors=colors_list    # mengatur warna
                           )

plt.title('Refugees in the United States (2006 - 2015)', size=18, y=1.12)
plt.axis('equal') # mengatur rasio axis agar sama antara axis x dan y

# add legend
plt.legend(labels=df_continent.index, loc='upper left', fontsize=14) 

plt.show()

Selain dengan menentukan sendiri warnanya, kita juga dapat menggunakan <i>colormap</i> dengan memberikan parameter <code>cmap</code> yang diberi nilai jenis <i>colormap</i>-nya. Misalnya di bawah ini kita memberikan parameter <code>cmap = 'coolwarm'</code>.

In [None]:
# Membuat pie chart

df_continent['Total'].plot(kind='pie',
                           figsize=(15, 6),
                           autopct='%1.1f%%',    # menambahkan persentase
                           startangle=90,        # start angle 90° 
                           shadow=True,          # menambahkan shadow 
                           labels=None,          # menghilangkan label pada pie chart
                           pctdistance=1.12,     # rasio antara pusat pie chart posisi awal teks yang dihasilkan oleh autopct 
                           cmap='coolwarm'       # mengatur warna dengan colormap
                           )

plt.title('Refugees in the United States (2006 - 2015)', size=18, y=1.12)
plt.axis('equal') # mengatur rasio axis agar sama antara axis x dan y

# add legend
plt.legend(labels=df_continent.index, loc='upper left', fontsize=14) 

plt.show()

### Menekankan irisan chart

Jika ingin menekankan atau menonjolkan irisan tertentu kita dapat menggunakan parameter <code>explode</code> yang diberikan nilai berupa list rasionya dalam bentuk bilangan float. 

Misalnya pada contoh berikut, kita ingin menekankan 3 benua dengan angka persentase terkecil. Kita harus membuat list yang terdiri dari 5 bilangan float. Jika memberikan angka <b>0</b> berarti kita tidak ingin menggesernya atau menonjolkannya, sedangkan jika memberikan nilai __0.1__ dan seterusnya berarti irisan akan bergeser ke luar sesuai nilai rasio tersebut. Perhatikan kode berikut.

In [None]:
# Membuat pie chart

colors_list = ['pink', 'yellowgreen', 'gold', 'lightskyblue', 'lightcoral']
explode_list = [0, 0, 0.1, 0.1, 0.1] # rasio untuk tiap benua untuk mengimbangi tiap irisan.

df_continent['Total'].plot(kind='pie',
                           figsize=(15, 6),
                           autopct='%1.1f%%',    # menambahkan persentase
                           startangle=90,        # start angle 90° 
                           shadow=False,         # menambahkan shadow 
                           labels=None,          # menghilangkan label pada pie chart
                           pctdistance=1.12,     # rasio antara pusat pie chart posisi awal teks yang dihasilkan oleh autopct 
                           colors=colors_list,   # mengatur warna
                           explode=explode_list  # menekankan 3 benua dengan persentase terkecil
                           )

plt.title('Refugees in the United States (2006 - 2015)', size=18, y=1.12)
plt.axis('equal') # mengatur rasio axis agar sama antara axis x dan y

# add legend
plt.legend(labels=df_continent.index, loc='upper left', fontsize=14) 

plt.show()

Terlihat bukan perbedannya?! Untuk irisan dengan warna __gold__, __lightskyblue__, dan __lightcoral__ yang merupakan 3 benua dengan persentase terkecil terlihat lebih menonjol ke luar lingkaran.

Kita juga dapat memisah-misahkannya jika seluruh bagian irisan pada variabel <code>explode_list</code> diberikan nilai selain 0 seperti di bawah ini.

In [None]:
# Membuat pie chart

colors_list = ['pink', 'yellowgreen', 'gold', 'lightskyblue', 'lightcoral']
explode_list = [0.1, 0.1, 0.2, 0.2, 0.2] # rasio untuk tiap benua untuk mengimbangi tiap irisan.

df_continent['Total'].plot(kind='pie',
                           figsize=(15, 6),
                           autopct='%1.1f%%',    # menambahkan persentase
                           startangle=90,        # start angle 90° 
                           shadow=False,         # menambahkan shadow 
                           labels=None,          # menghilangkan label pada pie chart
                           pctdistance=1.12,     # rasio antara pusat pie chart posisi awal teks yang dihasilkan oleh autopct 
                           colors=colors_list,   # mengatur warna
                           explode=explode_list  # menekankan 3 benua dengan persentase terkecil
                           )

plt.title('Refugees in the United States (2006 - 2015)', size=18, y=1.12)
plt.axis('equal') # mengatur rasio axis agar sama antara axis x dan y

# add legend
plt.legend(labels=df_continent.index, loc='upper left', fontsize=14) 

plt.show()

<hr>

## Donut Chart

Jika sebelumnya kita telah belajar membuat <i>pie chart</i> dengan lingkaran penuh, sekarang kita akan belajar membuat <i>donut chart</i>. Dilihat dari namanya saja pasti kita sudah dapat membayangkan bentuknya, bukan?! Ya, bentuk <i>chart</i>-nya nanti akan terlihat seperti donut yang memiliki lubang di tengah.

Sebenarnya untuk membuat <i>donut chart</i> tidak berbeda jauh dari <i>pie chart</i>. Kita juga masih menggunakan parameter <code>kind = 'pie'</code> untuk membuatnya. Namun, yang membedakan adalah kita harus membuat lubang di tengah <i>pie</i> tersebut. Perhatikan kode berikut.

In [None]:
# Membuat donut chart

colors_list = ['pink', 'yellowgreen', 'gold', 'lightskyblue', 'lightcoral']

df_continent['Total'].plot(kind='pie',
                           figsize=(15, 6),
                           autopct='%1.1f%%',    # menambahkan persentase
                           startangle=90,        # start angle 90° 
                           shadow=True,          # menambahkan shadow 
                           labels=None,          # menghilangkan label pada pie chart
                           pctdistance=1.12,     # rasio antara pusat pie chart posisi awal teks yang dihasilkan oleh autopct 
                           colors=colors_list,   # mengatur warna
                           )

#draw circle
centre_circle = plt.Circle((0,0), 0.7, fc='white')
fig = plt.gcf()
fig.gca().add_artist(centre_circle)

plt.title('Refugees in the United States (2006 - 2015)', size=18, y=1.12)
plt.axis('equal') # mengatur rasio axis agar sama antara axis x dan y

# add legend
plt.legend(labels=df_continent.index, loc='upper left', fontsize=14) 

plt.show()

Seperti yang dapat kita lihat pada kode di atas, untuk membuat lubang atau lingkaran pada <i>pie chart</i>, yang perlu kita lakukan yaitu membuat lingkaran dengan <i>method</i> <code>Cirlce()</code> dan menyimpannya dalam variabel, misalnya <code>centre_circle</code> seperti pada contoh ini. 

Selanjutnya, kita juga harus mendapatkan <i>figure</i> yang sedang aktif dengan <i>method</i> <code>gcf()</code> serta <i>axes</i> yang sedang aktif dengan <code>gca()</code> dan kemudian menambahkan variabel <code>centre_cirlce</code> tadi ke dalam <i>axes</i> tersebut dengan <i>method</i> <code>add_artist()</code>.

Kita juga dapat mengatur <i>radius</i> lingkarannya. Misalnya disini kita akan mengganti <i>radius</i>-nya menjadi __0.5__.

In [None]:
# Membuat donut chart

colors_list = ['pink', 'yellowgreen', 'gold', 'lightskyblue', 'lightcoral']

df_continent['Total'].plot(kind='pie',
                           figsize=(15, 6),
                           autopct='%1.1f%%',    # menambahkan persentase
                           startangle=90,        # start angle 90° 
                           shadow=True,          # menambahkan shadow 
                           labels=None,          # menghilangkan label pada pie chart
                           pctdistance=1.12,     # rasio antara pusat pie chart posisi awal teks yang dihasilkan oleh autopct 
                           colors=colors_list,   # mengatur warna
                           )

#draw circle
centre_circle = plt.Circle((0,0), 0.5, fc='white')
fig = plt.gcf()
fig.gca().add_artist(centre_circle)

plt.title('Refugees in the United States (2006 - 2015)', size=18, y=1.12)
plt.axis('equal') # mengatur rasio axis agar sama antara axis x dan y

# add legend
plt.legend(labels=df_continent.index, loc='upper left', fontsize=14) 

plt.show()

<hr>

Copyright @ <a href="https://ilmudatapy.com/">ilmudatapy.com</a>