# Wizualizacja i wykresy - seaborn

Biblioteka `seaborn` jest nakładką na `matplotlib` i pozwala na tworzenie atrakcyjnych wykresów w kilku liniach kodu.

`seaborn` tworzy wykresy, które adresują problemy przed którymi zwykle stoimy w trakcie analizy danych. 

## Jak zainstalować i używać bibliotekę `seaborn`?

Za pomocą conda:
```bash
conda activate od_zera_do_ai
conda install -y seaborn
```

lub za pomocą pip:
```bash
pip install seaborn
```

In [None]:
import seaborn as sns

sns.set_theme()

## Jak badać relację pomiędzy zmiennymi / kolumnami używając `seaborn` i wykresów punktowych?

In [None]:
# searborn posiada wbudowane zbiory danych
tips_df = sns.load_dataset("tips")

tips_df.sample(10)

In [None]:
# relational plots
sns.relplot(
    data=tips_df,
    x="total_bill",
    y="tip",
    col="time",
    hue="smoker",
    style="smoker",
    size="size",
)

## Jak badać relację pomiędzy zmiennymi / kolumnami używając `seaborn` i wykresów liniowych (z przedziałami ufności)?

In [None]:
fmri_df = sns.load_dataset("fmri")

fmri_df.sample(10)

In [None]:
# średnia + przedział ufności
sns.relplot(
    data=fmri_df,
    kind="line",
    x="timepoint",
    y="signal",
    col="region",
    hue="event",
    style="event",
)

## Jak tworzyć linie regresji za pomocą `seaborn`?

In [None]:
tips_df = sns.load_dataset("tips")

# regression model
sns.lmplot(data=tips_df, x="total_bill", y="tip", col="time", hue="smoker")

## Jak badać rozkłady zmiennych liczbowych za pomocą `seaborn`?

In [None]:
tips_df = sns.load_dataset("tips")

sns.displot(data=tips_df, x="total_bill", col="time", kde=True)

## Jak badać rozkłady zmiennych kategorycznych za pomocą `seaborn` - gdy rekordów nie jest zbyt wiele?

In [None]:
tips_df = sns.load_dataset("tips")

sns.catplot(data=tips_df, kind="swarm", x="day", y="total_bill", hue="smoker")

## Jak badać rozkłady zmiennych kategorycznych za pomocą `seaborn` - gdy rekordów jest dużo?

In [None]:
tips_df = sns.load_dataset("tips")

sns.catplot(data=tips_df, kind="violin", x="day", y="total_bill", hue="smoker", split=True)

## Jak badać rozkłady zmiennych kategorycznych za pomocą `seaborn` i wykresów słupkowych?

In [None]:
tips_df = sns.load_dataset("tips")

sns.catplot(data=tips_df, kind="bar", x="day", y="total_bill", hue="smoker")

## Jak łączyć wiele wykresów w jednym obiekcie `seaborn`?

In [None]:
penguins_df = sns.load_dataset("penguins")

penguins_df.sample(10)

In [None]:
sns.jointplot(data=penguins_df, x="flipper_length_mm", y="bill_length_mm", hue="species")

## Jak badać zależności pomiędzy zmiennymi za pomocą `seaborn`?

In [None]:
penguins_df = sns.load_dataset("penguins")

sns.pairplot(data=penguins_df, hue="species")