<img src="../images/ilmudatapy-logo.png" width="350" align="center">
<br>

<center><h1>Waffle Chart</h1></center>
<hr>

__Halo, Learners!__ Di notebook ini, kita akan membahas __Waffle Chart__. Disini kita akan membuat <i>waffle chart</i> dari dataset asli dengan menggunakan dua pendekatan yaitu menggunakan Matplotlib dan PyWaffle.

<h2>Table of Contents</h2>
<div class="alert alert-block alert-info" style="margin-top: 25px">
    <ul>
        <li>
            Apa itu Waffle Chart?
        </li>
        <li>
            Load dataset
        </li>
        <li>
            Waffle Chart dengan Matplotlib
            <ul>
                <li>Menambahkan grid lines</li>
                <li>Menambahkan legend</li>
            </ul>
        </li>
        <li>
            Waffle Chart dengan PyWaffle
            <ul>
                <li>Mengatur legend dan warna</li>
                <li>Menambahkan judul</li>
                <li>Mengatur jarak blok</li>
                <li>Mengganti blok persegi dengan karakter dan icon</li>
                <li>Vertical Waffle Chart</li>
            </ul>
        </li>
    </ul>
</div>

<hr>
<div class="alert alert-success" style="margin-top: 20px">
    <strong>Catatan:</strong> Untuk menjalankan kode program Python di Jupyter Notebook, klik pada <i>cell</i> yang ingin di-<i>run</i> lalu tekan <kbd>Shift</kbd> + <kbd>Enter</kbd>.
</div>

<div class="alert alert-danger" style="margin-top: 20px">
    <strong>Warning!:</strong> Jika ada kode program yang <i>error</i> atau output yang dihasilkan tidak sesuai, silahkan <b>Restart & Run All</b> kernel pada bagian menu <b>Kernel</b> di menu bar Jupyter Notebook, atau <b>Restart & Clear Output</b> kernel kemudian jalankan satu per satu <i>cell</i> secara berurutan dari atas ke bawah.
</div>
<hr>

## Apa itu Waffle Chart ?

__Waffle Chart__ adalah sebuah visualisasi data yang umumnya berbentuk persegi dan biasanya terdiri dari kotak-kotak kecil yang disusun dalam tata letak tertentu. Kotak diberi warna sesuai dengan proporsi masing-masing kategori. Dinamakan <i>waffle chart</i> karena memang bentuknya menyerupai jenis makanan <i>waffle</i>. 

Disini kita akan belajar membuat <i>waffle chart</i> menggunakan bahasa pemrograman Python. Sebelumnya kita <i>import</i> terlebih dahulu <i>library</i> yang dibutuhkan seperti Pandas, Numpy, dan tentunya Matplotlib. 

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

import matplotlib.patches as mpatches # Diperlukan untuk membuat waffle Charts

<hr>

## Load dataset

Dataset yang akan digunakan pada praktek kali ini adalah dataset <a href='https://www.kaggle.com/imdevskp/world-population-19602018'>Populasi penduduk dunia</a> berdasarkan negara.

Mari kita <i>load</i> dataset ke dalam dataframe Pandas dan disimpan pada variabel <code>df</code>.

In [None]:
# Load dataset

df = pd.read_csv("../datasets/pop_worldometer_data.csv")
df.head(10)

Untuk memudahkan proses visualisasi, kita akan menjadikan kolom <code>Country (or dependency)</code> sebagai indeks.

In [None]:
# Menjadikan kolom 'Country (or dependency)' sebagai indeks

df.set_index('Country (or dependency)', inplace=True)

Sekarang mari kita lihat data teratas dari dataframe <code>df</code> setelah perubahan indeks.

In [None]:
# Menampilkan 10 data teratas

df.head(10)

Pada praktek kali ini, kita hanya akan membuat <i>waffle chart</i> untuk 5 negara dengan populasi terbanyak. Karena dataframe <code>df</code> sudah terurut berdasarkan populasi terbanyak, sekarang kita buat dataframe baru yang menampung 5 data teratas dari dataframe <code>df</code> dan disimpan pada variabel <code>df_top5</code>.

In [None]:
# Mengambil 5 data teratas dan menyimpannya pada dataframe baru

df_top5 = df.head(5)
df_top5

Nah, dataframe <code>df_top5</code> inilah yang nantinya akan kita gunakan untuk membuat <i>waffle chart</i>.

<hr>

## Waffle Chart dengan Matplotlib

Yang pertama akan kita praktekkan adalah membuat <i>waffle chart</i> menggunakan __Matplotlib__. Secara umum, langkah-langkah dalam membuat <i>waffle chart</i> dengan Matplotlib adalah sebagai berikut.

1. Menentukan proporsi dari masing-masing kategori dengan membagi nilai dari tiap kategori tersebut dengan total nilai dari keseluruhan kategori.
2. Mendefinisikan keseluruhan ukuran <i>waffle chart</i>.
3. Menggunakan proporsi dari tiap kategori untuk menentukan jumlah kotak yang mewakili tiap kategori.
4. Membuat matriks yang menyerupai <i>waffle chart</i> dan mengisinya.
5. Memetakan matriks <i>waffle chart</i> ke dalam bentuk visual.

__Langkah 1 -__ Menentukan proporsi dari masing-masing kategori.

In [None]:
# Menghitung proporsi dari tiap kategori
total = sum(df_top5['Population (2020)'])
category_proportions = [(float(value) / total) for value in df_top5['Population (2020)']]

# Menampilkan proporsi tiap kategori (negara)
for i, prop in enumerate(category_proportions):
    print (df_top5.index.values[i] + ': ' + str(prop))

Setelah mendapatkan proporsi dari masing-masing kategori atau dalam hal ini proporsi dari tiap negara, kita harus menentukan ukuran <i>waffle chart</i>

__Langkah 2 -__ Mendefinisikan keseluruhan ukuran <i>waffle chart</i>.

In [None]:
width = 45       # lebar chart
height = 15      # tinggi chart

total_num_tiles = width * height   # jumlah total blok persegi

print ('Total jumlah kotak : ', total_num_tiles)

__Langkah 3 -__ Menggunakan proporsi dari tiap kategori untuk menentukan jumlah kotak yang mewakili tiap kategori.

In [None]:
# Menghitung jumlah blok persegi untuk tiap kategori/negara
tiles_per_category = [round(proportion * total_num_tiles) for proportion in category_proportions]

# Menampilkan jumlah blok persegi per kategori/negara
for i, tiles in enumerate(tiles_per_category):
    print (df_top5.index.values[i] + ': ' + str(tiles))

__Langkah 4 -__ Membuat matriks yang menyerupai <i>waffle chart</i> dan mengisinya.

In [None]:
# Menginisialisasi waffle chart sebagai matriks kosong
waffle_chart = np.zeros((height, width))

# Menentukan indeks awal untuk perulangan waffle chart
category_index = 0
tile_index = 0

# Mengisi waffle chart
for col in range(width):
    for row in range(height):
        tile_index += 1

        # Jika jumlah blok persegi yang terisi untuk kategori yang sedang diproses sama dengan blok persegi yang dialokasikan..
        if tile_index > sum(tiles_per_category[0:category_index]):
            # ...lanjutkan proses ke kategori selanjutnya
            category_index += 1       
            
        waffle_chart[row, col] = category_index

Selanjutnya mari kita tampilkan array <code>waffle_chart</code> yang terbentuk.

In [None]:
# Menampilkan array yang terbentuk

waffle_chart

__Langkah 5 -__ Memetakan matriks <i>waffle chart</i> ke dalam bentuk visual.

Di Matplotlib, kita menggunakan <i>method</i> <code>matshow()</code> untuk menampilkan <i>waffle chart</i>.

In [None]:
# Membuat objek figure
fig = plt.figure()

# Menampilkan waffle chart dengan matshow()
colormap = plt.cm.coolwarm
plt.matshow(waffle_chart, cmap=colormap)
plt.colorbar()

Setelah <i>waffle chart</i> terbentuk, sekarang saatnya kita mempercantik tampilannya dengan mengaplikasikan beberapa pengaturan seperti menambahkan <i>grid lines</i> dan menambahkan legend.

### Menambahkan grid lines

Untuk menambahkan <i>grid lines</i> pada <i>waffle chart</i>, kita harus mendapatkan <i>axes</i> saat ini atau yang sedang kita kerjakan untuk membuat <i>waffle chart</i> tersebut dengan menggunakan <i>method</i> <code>gca()</code> <i>(get current axes)</i>. Kemudian pada <i>axes</i> tersebut kita atur <i>minor ticks</i>-nya, baru setelah itu kita tambahkan <i>gridlines</i> berdasarkan <i>minor ticks</i>.

In [None]:
# Membuat objek figure
fig = plt.figure()

# Menampilkan waffle chart dengan matshow()
colormap = plt.cm.coolwarm
plt.matshow(waffle_chart, cmap=colormap)
plt.colorbar()

# Mendapatkan axes (get current axes)
ax = plt.gca()

# Mengatur minor ticks
ax.set_xticks(np.arange(-.5, (width), 1), minor=True)
ax.set_yticks(np.arange(-.5, (height), 1), minor=True)
    
# Menambahkan gridlines berdasarkan minor ticks
ax.grid(which='minor', color='w', linestyle='-', linewidth=2)

plt.xticks([])
plt.yticks([])

plt.show()

### Menambahkan legend

Untuk menambahkan legend, kita perlu menghitung jumlah kumulatif dari kategori individu untuk menyesuaikan skema warna antara chart dan legend. Setelah itu, kita dapat membuat legend dan menambahkannya ke <i>chart</i>. Perhatikan kode berikut.

In [None]:
# Membuat objek figure
fig = plt.figure()

# Menampilkan waffle chart dengan matshow()
colormap = plt.cm.coolwarm
plt.matshow(waffle_chart, cmap=colormap)
plt.colorbar()

# Menadapatkan axis
ax = plt.gca()

# Mengatur minor ticks
ax.set_xticks(np.arange(-.5, (width), 1), minor=True)
ax.set_yticks(np.arange(-.5, (height), 1), minor=True)
    
# Menambahkan gridlines berdasarkan minor ticks
ax.grid(which='minor', color='w', linestyle='-', linewidth=2)

plt.xticks([])
plt.yticks([])

# Menghitung jumlah kumulatif kategori individu untuk menyesuaikan skema warna antara chart dan legend
values_cumsum = np.cumsum(df_top5['Population (2020)'])
total_values = values_cumsum[len(values_cumsum) - 1]

# Membuat legend
legend_handles = []
for i, category in enumerate(df_top5.index.values):
    label_str = category + ' (' + str(df_top5['Population (2020)'][i]) + ')'
    color_val = colormap(float(values_cumsum[i])/total_values)
    legend_handles.append(mpatches.Patch(color=color_val, label=label_str))

# Menambahkan legend ke chart
plt.legend(handles=legend_handles,
           loc='lower center', 
           ncol=len(df_top5.index.values),
           bbox_to_anchor=(0., -0.3, 1, .1)
          )
plt.show()

Pembuatan <i>waffle chart</i> dengan menggunakan Matplotlib terbilang rumit, dan hasilnya juga terkadang kurang memuaskan. Nah, ada satu <i>package</i> dari Python yang khusus digunakan untuk membuat <i>waffle chart</i>, yaitu __PyWaffle__. Untuk lebih jelasnya langsung saja lihat pembahasan berikut.

<hr>

## Waffle Chart dengan PyWaffle

__PyWaffle__ adalah <i>package</i> Python yang dikhususkan untuk membuat <i>waffle chart</i>. Dengan menggunakan PyWaffle, kita dapat dengan mudah men-<i>generate</i>- <i>waffle chart</i> serta melakukan modifikasi-modifikasi untuk memperindah tampilan sesuai yang kita inginkan. Untuk lebih detailnya silahkan lihat dokumentasi <a href='https://pywaffle.readthedocs.io/en/latest/'>PyWaffle</a>

Sebelumnya, kita harus menginstall terlebih dahulu PyWaffle dengan menjalankan kode di bawah ini.

In [None]:
pip install pywaffle

Selanjutnya, dari <i>package</i> PyWaffle kita <i>import</i> __Waffle__.

In [None]:
# Import Waffle

from pywaffle import Waffle

Setelah itu, kita dapat dengan mudah membuat visualisasi data jenis <i>waffle chart</i> dengan mendefinisikan <code>FigureClass = Waffle</code> seperti di bawah ini.

In [None]:
# Membuat waffle chart dengan PyWaffle

fig = plt.figure(
    FigureClass=Waffle, 
    rows=15, 
    columns=45,
    values=tiles_per_category,
    labels=list(df_top5.index.values),
    figsize=(12, 8),
    legend={'bbox_to_anchor': (0.15, 0.4)}    
)

Dari kode di atas, kita harus menentukan 

* <code>rows</code> : Jumlah baris yang diinginkan.
* <code>columns</code> : Jumlah kolom yang diinginkan.
* <code>values</code> : Nilai dari <i>waffle chart</i>, dalam hal ini nilainya adalah <code>tiles_per_category</code> yang sudah kita buat sebelumnya.
* <code>labels</code> : Label yang akan ditampilkan pada legend, dalam hal ini adalah nama negara yang merupakan indeks dari <code>df_top5</code>.
* <code>figsize</code> : Ukuran <i>figure</i>.
* <code>legend</code> : Untuk menampilkan legend, dimana <code>bbox_to_anchor</code> adalah untuk mengatur posisinya.

### Mengatur legend dan warna 

<i>Default</i>-nya legend akan ditampilkan seperti output di atas. Namun, kita juga dapat mengaturnya menjadi berbentuk memanjang dengan mendefinisikan <code>ncol</code>. Selain itu kita juga dapat mengatur ukuran huruf dengan <code>fontsize</code> dan lokasinya dengan <code>loc</code>. Perhatikan kode berikut.

In [None]:
# Membuat waffle chart dengan PyWaffle

fig = plt.figure(
    FigureClass=Waffle, 
    rows=15,
    columns=45,
    cmap_name='Paired',
    values=tiles_per_category,
    labels=list(df_top5.index.values),
    figsize=(12, 8),
    legend={'bbox_to_anchor': (0, -0.2), 
            'loc': 'lower left', 
            'ncol': len(df_top5.index.values),
            'fontsize': 14}    
)

### Menambahkan judul

Kita juga dapat menambahkan judul dengan mendefinisikan <code>title</code>.

In [None]:
# Membuat waffle chart dengan PyWaffle

fig = plt.figure(
    FigureClass=Waffle, 
    rows=15,
    columns=45,
    cmap_name='Paired',
    values=tiles_per_category,
    labels=list(df_top5.index.values),
    figsize=(12, 8),
    legend={'bbox_to_anchor': (0, -0.2), 
            'loc': 'lower left', 
            'ncol': len(df_top5.index.values),
            'fontsize': 14},
    title={'label': "Top 5 World's Population\n",
          'loc': 'center',
          'fontdict': {'fontsize': 20}}
)

### Mengatur jarak blok

PyWaffle membuat modifikasi <i>waffle chart</i> menjadi lebih mudah. Dengan membuat <i>waffle chart</i> dengan PyWaffle, kita dapat mengatur jarak antar blok atau kotaknya dengan menambahkan parameter berikut:

* <code>interval_ratio_x</code> : Untuk mengatur jarak antar kotak di sumbu X, atau jarak kanan dan kirinya.
* <code>interval_ratio_y</code> : Untuk mengatur jarak antar kotak di sumbu Y, atau jarak atas dan bawahnya.

In [None]:
# Membuat waffle chart dengan PyWaffle

fig = plt.figure(
    FigureClass=Waffle, 
    rows=15,
    columns=45,
    cmap_name='Paired',
    values=tiles_per_category,
    labels=list(df_top5.index.values),
    figsize=(12, 8),
    legend={'bbox_to_anchor': (0, -0.2), 
            'loc': 'lower left', 
            'ncol': len(df_top5.index.values),
            'fontsize': 14},
    title={'label': "Top 5 World's Population\n",
          'loc': 'center',
          'fontdict': {'fontsize': 20}},
    interval_ratio_x=1,
    interval_ratio_y=0.5
)

### Mengganti blok persegi dengan karakter dan icon

Selanjutnya, yang menarik dari PyWaffle adalah kita dapat mengganti blok atau kotak-kotak tersebut dengan karakter atau <i>icon</i> seperti bentuk bulat, bintang, matahari, bulan, dan sebagainya. 

Misalnya pada contoh berikut kita menggunakan karakter berbentuk bulat dengan menambahkan parameter <code>characters</code> dan diberikan nilai berupa bentuk bulat atau yang diinginkan.

In [None]:
# Membuat waffle chart dengan PyWaffle

fig = plt.figure(
    FigureClass=Waffle, 
    rows=15,
    columns=45,
    cmap_name='Paired',
    values=tiles_per_category,
    labels=list(df_top5.index.values),
    figsize=(12, 8),
    legend={'bbox_to_anchor': (0, -0.2), 
            'loc': 'lower left', 
            'ncol': len(df_top5.index.values),
            'fontsize': 14},
    title={'label': "Top 5 World's Population\n",
          'loc': 'center',
          'fontdict': {'fontsize': 20}},
    characters='⬤',
    font_size=14
)

Kita juga dapat menggunakan parameter <code>icons</code> dan diberikan nilai berupa nama <i>icon</i> yang diinginkan. 

Misalnya kita memberikan parameter <code>icons = 'star'</code> untuk mengganti kotak dengan <i>icon</i> bintang.

In [None]:
# Membuat waffle chart dengan PyWaffle

fig = plt.figure(
    FigureClass=Waffle, 
    rows=15,
    columns=45,
    cmap_name='Paired',
    values=tiles_per_category,
    labels=list(df_top5.index.values),
    figsize=(12, 8),
    legend={'bbox_to_anchor': (0, -0.2), 
            'loc': 'lower left', 
            'ncol': len(df_top5.index.values),
            'fontsize': 14},
    title={'label': "Top 5 World's Population\n",
          'loc': 'center',
          'fontdict': {'fontsize': 20}},
    icons='star',
    font_size=14
)

Jika kita ingin <i>icon</i> untuk tiap kategori adalah bentuk yang berbeda, maka kita hanya perlu mendefinisikannya dalam bentuk list. Kita juga dapat memberikan parameter <code>icon_legend = True</code> agar legend menampilkan <i>icon</i> yang sesuai untuk tiap kategori. Perhatikan kode di bawah ini.

In [None]:
# Membuat waffle chart dengan bentuk icon berbeda untuk tiap kategori

fig = plt.figure(
    FigureClass=Waffle, 
    rows=15,
    columns=45,
    cmap_name='Paired',
    values=tiles_per_category,
    labels=list(df_top5.index.values),
    figsize=(12, 8),
    legend={'bbox_to_anchor': (0, -0.2), 
            'loc': 'lower left', 
            'ncol': len(df_top5.index.values),
            'fontsize': 14},
    title={'label': "Top 5 World's Population\n",
          'loc': 'center',
          'fontdict': {'fontsize': 20}},
    icons=['star', 'sun', 'cloud-showers-heavy', 'snowflake', 'moon'],
    icon_size=14,
    icon_legend=True
)

### Vertical Waffle Chart

Contoh-contoh sebelumnya memperlihatkan bentuk <i>waffle chart</i> yang ditampilkan secara horizontal atau menyamping. Nah, jika kita ingin menampilkan <i>waffle chart</i> dalam bentuk vertikal, kita dapat menambahkan parameter <code>vertical = True</code>. Perhatikan kode berikut.

In [None]:
fig = plt.figure(
    FigureClass=Waffle, 
    rows=15,
    columns=45,
    cmap_name='Paired',
    values=tiles_per_category,
    labels=list(df_top5.index.values),
    figsize=(12, 8),
    legend={'bbox_to_anchor': (0, -0.2), 
            'loc': 'lower left', 
            'ncol': len(df_top5.index.values),
            'fontsize': 14},
    title={'label': "Top 5 World's Population\n",
          'loc': 'center',
          'fontdict': {'fontsize': 20}},
    icons='star',
    icon_size=15,
    icon_legend=True,
    vertical=True
)

<hr>

Copyright @ <a href="https://ilmudatapy.com/">ilmudatapy.com</a>