# Pengenalan

In [1]:
# Package plotnine ini berdasarkan pada implementasi package ggplot2 yang terdapat di bahasa R, 
# dan menggunakan pendekatan konstruksi bernama grammar of graphics yang dicetuskan oleh Leland Wilkinson. 
# Dengan pendekatan ini, kita dapat membuat visualisasi data baik 
# yang simpel maupun kompleks dengan mudah dan menarik.

# Plotnine sendiri dibuat di atas package matplotlib, 
# yaitu salah satu package di Python yang umum digunakan untuk visualisasi data. 
# Perbedaan antara plotnine dengan matplotlib adalah 
# plotnine telah menyediakan berbagai fungsi yang mempermudah kita untuk membuat visualisasi data.

# Package plotnine juga dapat digunakan dengan mudah bersamaan dengan pandas, package Python yang
# biasanya digunakan untuk memanipulasi data.

In [2]:
# Meng-Import Package

# Pertama-tama, kita perlu mengimpor package plotnine terlebih dahulu.
# Kita masih membutuhkan package pandas untuk membaca data serta melakukan manipulasi data sederhana,
# sebelum kita membuat visualisasi data yang kita perlukan.
# Oleh karena itu kita perlu mengimpor package pandas juga:

import matplotlib.pyplot as plt
import plotnine as p9
import pandas as pd

In [3]:
# Membaca Data

# Selanjutnya kita akan membaca data-data yang kita perlukan.
# Terdapat dua dataset yang akan kita gunakan di modul ini:
# 1. Data kependudukan DKI Jakarta, yang akan disimpan dalam variabel bernama df_penduduk
# 2. Data inflasi Indonesia dan Singapura, yang akan disimpan dalam variabel bernama df_inflasi

# Kedua data tersebut akan disimpan dalam bentuk Pandas data frame.

# Link dataset :
# Kependudukan DKI Jakarta : https://storage.googleapis.com/dqlab-dataset/datakependudukandki-dqlab.csv
# Inflasi : https://storage.googleapis.com/dqlab-dataset/inflasi.csv

import pandas as pd
df_penduduk = pd.read_csv(
    'https://storage.googleapis.com/dqlab-dataset/datakependudukandki-dqlab.csv')
df_inflasi = pd.read_csv(
    'https://storage.googleapis.com/dqlab-dataset/inflasi.csv')

In [4]:
# Menampilkan Data

# Ide dasar dari grammar of graphics adalah,
# sebuah grafik statistik merupakan pemetaan dari data ke atribut-atribut aestetik
# (seperti warna, ukuran, dan bentuk) dari objek-objek geometris (seperti titik dan garis).

# Pada package plotnine , sebuah grafik terdiri dari komponen-komponen sebagai berikut:
# 1. data: sebuah data frame yang berisi data yang ingin kita visualisasikan
# 2. geoms (geometric objects): objek geometris seperti lingkaran, titik,
# dan teks yang ingin kita lihat di grafik
# 3. aesthetics: pemetaan dari data ke geometric objects seperti posisi, ukuran, warna, bentuk, dll.

# Di plotnine, ketiga komponen tersebut dihubungkan dengan operator + .

# Di bagian ini, kita akan membuat plot pertama kita dengan menggunakan data yang ada di variabel df_penduduk.
# Kita akan mencoba untuk membuat visualisasi jumlah penduduk di DKI Jakarta untuk masing-masing kabupaten/kota.

# Kode di bawah ini akan memperlihatkan 5 baris pertama dari dataset kependudukan yang kita miliki.
print(df_penduduk.head())

   TAHUN         NAMA PROVINSI NAMA KABUPATEN/KOTA NAMA KECAMATAN  \
0   2013  PROVINSI DKI JAKARTA       JAKARTA BARAT     CENGKARENG   
1   2013  PROVINSI DKI JAKARTA       JAKARTA BARAT     CENGKARENG   
2   2013  PROVINSI DKI JAKARTA       JAKARTA BARAT     CENGKARENG   
3   2013  PROVINSI DKI JAKARTA       JAKARTA BARAT     CENGKARENG   
4   2013  PROVINSI DKI JAKARTA       JAKARTA BARAT     CENGKARENG   

     NAMA KELURAHAN  LUAS WILAYAH (KM2)  KEPADATAN (JIWA/KM2) JENIS KELAMIN  \
0  CENGKARENG BARAT                4.26                 16409     Laki-laki   
1  CENGKARENG BARAT                4.26                 16409     Perempuan   
2  CENGKARENG BARAT                4.26                 16409     Laki-laki   
3  CENGKARENG BARAT                4.26                 16409     Perempuan   
4  CENGKARENG BARAT                4.26                 16409     Laki-laki   

  RENTANG UMUR  JUMLAH  
0        35-39    5316  
1        35-39    3221  
2        40-44    3137  
3        4

In [None]:
# Menjalankan Fungsi ggplot

# Pertama-tama, kita akan membuat plot terlebih dahulu.
# Untuk membuat plot, kita akan menggunakan fungsi ggplot.
# Untuk membuat sebuah plot kita perlu ggplot data apa yang ingin kita visualisasikan, dengan argumen data .

# Jalankan fungsi ggplot dan tambahkan argumen data dengan nilai,
# berupa data frame data kependudukan yang telah kita definisikan sebelumnya!

# Note : Karena kita belum mendefinisikan komponen-komponen lain seperti aestetik dan objek geometris,
# maka kita akan mendapatkan sebuah plot kosong.
import matplotlib.pyplot as plt
from plotnine import *
ggplot(data=df_penduduk).draw()
plt.show()