# Plot Types

- Di notebook ke-2 ini, akan dibahas tentang:
    1. Fungsi-fungsi figure-level vs axis-level
    2. Rel-plot vs scatter plot & line plot
    3. Displot vs histplot
    4. Catplot vs barplot

# Import package

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# Import seaborn sebagai sns
import seaborn as sns

# Gunakan tema default
sns.set_theme()

# Fungsi-fungsi Figure-level vs Axes-level

- Seaborn memiliki beberapa fungsi dengan tingkatan yang berbeda:
    1. Figure-level
    2. Axes-level


- Fungsi Axes-level akan menggambarkan plot ke satu `matplotlib.pyplot.Axes`



- Fungsi Figure-level akan berinteraksi dengan figure pada Matplotlib melalui sebuah objek seaborn.



- Setiap modul memiliki satu fungsi Figure-level yang di dalamnya terdapat interface untuk masing-masing dari fungsi axes-level.

    1. relplot (Relasional):
        - scatterplot
        - lineplot
        
    2. displot (Distribusi):
        - histplot
        - kdeplot
        - ecdfplot
        - rugplot
        
    3. catplot (Kategorikal):
        - stripplot
        - swarmplot
        - boxplot
        - violinplot
        - pointplot
        - barplot


Dokumentasi: https://seaborn.pydata.org/tutorial/function_overview.html

<img src="https://seaborn.pydata.org/_images/function_overview_8_0.png" alt="Drawing" width= 500px;/>

[Source](https://seaborn.pydata.org/_images/function_overview_8_0.png)

# Load dataset

- Kebanyakan dari plot yang akan diolah pada course ini menggunakan data dari `seaborn.load_dataset()`, salah satunya adalah `tips`

In [None]:
tips = sns.load_dataset("tips")
tips.head()

In [None]:
tips.dtypes

# relplot vs scatterplot & lineplot

## relplot

- Fungsi `replot()` memberikan akses ke beberapa fungsi axes-level yaitu `scatterplot()` dan `lineplot()`. Untuk menggambarkan plot seperti masing-masing fungsi axes-level, cukup menggunakan parameter `kind=`.


`scatterplot()`: dengan `kind="scatter"`; default

`lineplot()` : dengan `kind="line"`; default
    


- Fungsi `relpot()` memberikan kemudahan untuk mengubah jenis plot relasional sesuai dengan kecocokan dengan data dan tujuan dari plot relasional yang ingin ditampilkan.


- Documentation: https://seaborn.pydata.org/generated/seaborn.relplot.html#seaborn.relplot

In [None]:
sns.relplot(data=tips, 
            x='total_bill', 
            y='tip', 
            hue='sex', 
            style='sex', 
            size='size')

Quiz


- Gunakan fungsi `relplot()` untuk menampilkan lineplot dari dataset "dots"

In [None]:
# Quiz

dots = sns.load_dataset("dots")
sns.relplot(
    data=dots,
    x="time",
    y="firing_rate",
    col="align",
    hue="choice",
    size="coherence",
    style="choice",
    facet_kws=dict(sharex=False),
    
    # spesifikasikan parameter kind
    
)

- seaborn juga dapat meningkatkan scatterplot dengan menggunakan linera regression model dan uncertainty-nya menggunakan `lmplot()` 

In [None]:
sns.lmplot(data=tips, 
           x='total_bill', 
           y='tip',
           col="time", 
           hue="smoker")

# Displot vs Histplot

- Untuk menggambarkan analisa statistik berupa distribusidari sebuah variabel, seaborn menyediakan fungsi figure-level `displot()`.

- Fungsi ini memudahkan untuk berganti dan menggambarkan beberapa tipe plot tanpa melakukan perhitungan sebelumnya, yaitu:

    1. `histplot()` (dengan `kind="hist"`)

    2. `kdeplot()` (dengan `kind="kde"`)

    3. `ecdfplot()` (dengan `kind="ecdf"`)


Dokumentasi: https://seaborn.pydata.org/generated/seaborn.displot.html#seaborn.displot

In [None]:
sns.displot(data=tips, 
            x="total_bill", 
            col="time", 
            kde=True, 
            hue="smoker", 
            rug=True,
            kind='hist'
           )

Quiz:
- Gambarkan histogram, kdeplot, dan ecdf plot dari  distribusi `total_bill` dari dataset `tips` dengan kolom yang berbeda untuk tiap kategori `time`, warna yang berbeda tiap kategori `smoker`

In [None]:
# Quiz

# histogram
sns.displot(data=, 
            x="", 
            col="", 
            hue="", 
            kind=''
           )


# kde
sns.displot(data=, 
           )


# ecdf
sns.displot(data=, 
           )

# Catplot vs Barplot

- seaborn menyediakan beberapa fungsi untuk memvisualisasikan data ketegorikal. Dalam figure-level, semuanya dapat diakses menggunakan `catplot()`. Berikut adalah tipe-tipe visualisasi data kategorikal yang disediakan:

Categorical scatterplots:

- `stripplot()` (dengan `kind="strip"`;  default)

- `swarmplot()` (dengan `kind="swarm"`)

Categorical distribution plots:

- `boxplot()` (dengan `kind="box"`)

- `violinplot()` (dengan `kind="violin"`)

- `boxenplot()` (dengan `kind="boxen"`)

Categorical estimate plots:

- `pointplot()` (dengan `kind="point"`)

- `barplot()` (dengan `kind="bar"`)

- `countplot()` (dengan `kind="count"`)


Dokumentasi: https://seaborn.pydata.org/generated/seaborn.catplot.html#seaborn.catplot

In [None]:
sns.catplot(data=tips, 
            kind="swarm", 
            x="day", 
            y="total_bill", 
            hue="smoker",
            dodge=True
           )

Quiz:
- Ubah plot di atas menjadi violinplot dan boxplot dengan mengubah parameter `kind`
- Use parameter `split=True` sebagai ganti dari parameter `dodge` jika dibutuhkan

In [None]:
# Quiz

# violinplot
sns.catplot(data=, 
            kind="", 
            x="", 
            y="", 
            hue="", 
            split=
           )



# boxplot
sns.catplot(data=, 
            kind="", 
            x="", 
            y="", 
            hue="", 
            dodge=
           )