![logo](img/logo.svg)

**Seaborn** je bal√≠ƒçek n√°stroj≈Ø pro vizualizaci dat v Pythonu implementovan√Ω nad Matplotlibem, operuj√≠c√≠ nad sloupci v pandas. V t√©to uk√°zce nebudeme zab√≠hat do technick√Ωch detail≈Ø, ale uk√°≈æeme si, jak grafy v seaborn funguj√≠ a jak je modifikovat podle na≈°ich p≈ôedstav. 

Dal≈°√≠ informace hledejte zde:
- [Dokumentace](https://seaborn.pydata.org/index.html)
- [Tutori√°ly](https://seaborn.pydata.org/tutorial.html)
- [Example Gallery](https://seaborn.pydata.org/examples/index.html)
- [Python Data Science Handbook](https://jakevdp.github.io/PythonDataScienceHandbook/04.14-visualization-with-seaborn.html) 

_Pozn.: Tento tutori√°l ƒçerp√° z v√Ω≈°e zm√≠nƒõn√Ωch odkaz≈Ø._

In [None]:
# Import seaborn
import seaborn as sns

Na pozad√≠ pou≈æ√≠v√° seaborn k vykreslov√°n√≠ graf≈Ø knihovnu matplotlib. Pro interaktivn√≠ pr√°ci se doporuƒçuje pou≈æ√≠vat rozhran√≠ Jupyter/IPython v [re≈æimu matplotlib](https://ipython.readthedocs.io/en/stable/interactive/plotting.html), jinak je nutn√© zavolat `matplotlib.pyplot.show()`, pokud budete cht√≠t graf zobrazit.

D√°le n√°sleduje nastaven√≠ motivu. Ten vyu≈æ√≠v√° matplotlib rcParam a ovliv≈àuje vzhled v≈°ech graf≈Ø matplotlib, i kdy≈æ je nevytv√°≈ô√≠te pomoc√≠ seabornu. Kromƒõ v√Ωchoz√≠ho motivu existuje nƒõkolik dal≈°√≠ch mo≈ænost√≠, pomoc√≠ kter√Ωch m≈Ø≈æete nez√°visle ovl√°dat styl a mƒõ≈ô√≠tko grafu (v√≠ce [zde](https://seaborn.pydata.org/tutorial/aesthetics.html)). Pokud se v√°m l√≠b√≠ v√Ωchoz√≠ nastaven√≠ matplotlibu nebo d√°v√°te p≈ôednost jin√©mu motivu, m≈Ø≈æete tento krok p≈ôeskoƒçit a i tak pou≈æ√≠vat funkce pro vytv√°≈ôen√≠ graf≈Ø v seabornu.

In [None]:
# Apply the default theme
sns.set_theme()

Vƒõt≈°ina k√≥du v dokumentaci pou≈æ√≠v√° funkci `load_dataset()` pro jednoduch√Ω p≈ô√≠stup k uk√°zkov√©mu datasetu. Tyto datasety nejsou nijak zvl√°≈°tn√≠: jsou to pouze pandas DataFrame, kter√© jsme mohli naƒç√≠st pomoc√≠ pandas.read_csv() nebo vytvo≈ôit ruƒçnƒõ. Vƒõt≈°ina p≈ô√≠klad≈Ø v dokumentaci specifikuje data pomoc√≠ pandas DataFrame, ale seaborn je velmi flexibiln√≠, pokud jde o datov√© struktury, kter√© akceptuje.

In [None]:
# Load an example dataset
tips = sns.load_dataset("tips")

In [None]:
tips.head()

Graf n√≠≈æe zn√°zor≈àuje vztah mezi pƒõti promƒõnn√Ωmi v datasetu o d√Ω≈°k√°ch pomoc√≠ jedin√©ho vol√°n√≠ funkce seaborn `relplot()`. V≈°imnƒõte si, ≈æe jsme zadali pouze n√°zvy promƒõnn√Ωch a jejich role v grafu. Na rozd√≠l od p≈ô√≠m√©ho pou≈æit√≠ matplotlib nebylo nutn√© specifikovat atributy prvk≈Ø grafu z hlediska barevn√Ωch hodnot nebo k√≥d≈Ø znaƒçek. V pozad√≠ seaborn zpracoval p≈ôevod hodnot z DataFrame na argumenty, kter√Ωm matplotlib rozum√≠. Tento deklarativn√≠ p≈ô√≠stup v√°m umo≈æ≈àuje soust≈ôedit se sp√≠≈°e na ot√°zky, na kter√© hled√°te v grafech odpovƒõdi, ne≈æ na slo≈æit√© ovl√°d√°n√≠ matplotlibu. _(to p√≠≈°√≠ v tutori√°lu, k pou≈æ√≠v√°n√≠ seabornu v√°s nijak nenav√°d√≠m üòÄ)_

In [None]:
# Create a visualization
sns.relplot(
    data=tips,
    x="total_bill", y="tip", col="time",
    hue="smoker", style="smoker", size="size",
);

In [None]:
# Another type of visualization
sns.catplot(data=tips, kind="swarm", x="day", y="total_bill", hue="smoker");

In [None]:
sns.kdeplot(data=tips, x="total_bill", hue="smoker", multiple="stack");

My se ale nebudeme zaob√≠rat r≈Øzn√Ωmi typy vizualizac√≠ v seaborn, inspirovat se m≈Ø≈æete v bohat√© "[Example Gallery](https://seaborn.pydata.org/examples/index.html)". Pov√≠me si pouze letmo o organizaci jednotliv√Ωch funkc√≠ a pust√≠me se do mo≈ænost√≠ p≈ôizp≈Øsoben√≠.

## Podobn√© funkce pro podobn√© √∫koly

V≈°echny funkce seaborn jsou p≈ô√≠stupn√© na nejvy≈°≈°√≠ √∫rovni. Samotn√Ω k√≥d je v≈°ak hierarchicky strukturov√°n, s moduly funkc√≠, kter√© dosahuj√≠ podobn√Ωch vizualizaƒçn√≠ch c√≠l≈Ø r≈Øzn√Ωmi prost≈ôedky. Vƒõt≈°ina dokumentace se toƒç√≠ okolo modul≈Ø ‚Äûrelational‚Äú, ‚Äûdistributional‚Äú a ‚Äûcategorical‚Äú.

Nap≈ô√≠klad modul `displot` ("distributional") definuje funkce, kter√© se specializuj√≠ na reprezentaci rozdƒõlen√≠ datov√Ωch bod≈Ø. To zahrnuje zn√°m√© metody, jako je histogram, kde graf apod.

![seaborn](img/seaborn1.png)

Kromƒõ rozd√≠ln√Ωch modul≈Ø m≈Ø≈æeme narazit na dƒõlen√≠ funkc√≠ podle **axes-level** nebo **figure-level**. Posledn√≠ uk√°zka pou≈æ√≠v√° pr√°vƒõ axes-level funkci, kdy jsou data vykreslena pomoc√≠ objektu `matplotlib.pyplot.Axes`, kter√Ω vrac√≠ hodnotu dan√© funkce. Uk√°zky p≈ôedch√°zej√≠c√≠ zase vyu≈æ√≠valy figure-level funkc√≠, kter√© nab√≠zej√≠ jednotn√© prost≈ôed√≠ pro d√≠lƒç√≠ axes-level funkce (dƒõlen√≠ lze vidƒõt na obr√°zku v√Ω≈°e).

Histogram jste v seabornu schopni vykreslit buƒè pr√°vƒõ pomoc√≠ funkce `displot()`, kter√Ω defaultnƒõ pou≈æ√≠v√° stejn√© parametry jako `histplot()`, nebo m≈Ø≈æete pou≈æ√≠t rovnou pr√°vƒõ `histplot()`. Obdobn√Ω p≈ô√≠pad by to byl s `kdeplot()`, m√≠sto kter√©ho lze pou≈æ√≠t `histplot()` s parametrem `kind="kde"`.

V matplotlibu jste vidƒõli sestavov√°n√≠ graf≈Ø pomoc√≠ `fig` a `ax`. Axes-level funkce vykresluj√≠ grafy automaticky do "aktivn√≠" axes, spolu s legendou a popisem os. M≈Ø≈æeme ale vyu≈æ√≠t argumentu `ax`, kter√Ω interaguje s n√°m ji≈æ zn√°m√Ωm OO rozhran√≠m, a specifikocat tak, kde a jak budou na≈°e grafy rozm√≠stƒõny.

In [None]:
import matplotlib.pyplot as plt

penguins = sns.load_dataset("penguins")
penguins.head()

In [None]:
f, axs = plt.subplots(1, 2, figsize=(8, 4), gridspec_kw=dict(width_ratios=[4, 3]))
sns.scatterplot(data=penguins, x="flipper_length_mm", y="bill_length_mm", hue="species", ax=axs[0])
sns.histplot(data=penguins, x="species", hue="species", shrink=.8, alpha=.8, legend=False, ax=axs[1])
f.tight_layout()

Oproti tomu figure-level funkce nemohou b√Ωt jednodu≈°e kombinov√°ny, tzn. nelze vykreslovat v√≠ce figure-level graf≈Ø do jedn√© axes. M≈Ø≈æete ale p≈ôistupovat k axes, kterou figure-level funkce vr√°t√≠, a k n√≠ p≈ôid√°vat dal≈°√≠ prvky, nap≈ô.:

In [None]:
g = sns.relplot(data=tips, x="total_bill", y="tip")
g.ax.axline(xy1=(10, 2), slope=.2, color="b", dashes=(5, 2));

## √öprava velikosti grafu

Pro nastaven√≠ velikosti obr√°zku m≈Ø≈æete vyu≈æ√≠t zn√°m√Ω parametr `figsize` z [`matplotlib.pyplot.subplots()`](https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.subplots.html#matplotlib.pyplot.subplots) nebo zavolat metodu `matplotlib.Figure.set_size_inches()`. 

Pokud pou≈æ√≠v√°te axes-level funkce, pak plat√≠, ≈æe velikost grafu je dan√° velikost√≠ Figure, kter√© je souƒç√°st√≠, a rozvr≈æen√≠m Axes. U figure-level funkc√≠ je velikost d√°na pomoc√≠ `FacetGrid` a je defaultnƒõ ƒçtvercov√°, p≈ô√≠padnƒõ lze upravit parametrem `width = height * aspect` (nastavuje velikost jednotliv√Ωch podgraf≈Ø, ne≈æ celkov√© Figure).

In [None]:
# axes-level
f, ax = plt.subplots(1, 2, sharey=True)

In [None]:
# figure-level
g = sns.FacetGrid(penguins)

In [None]:
g = sns.FacetGrid(penguins, col="sex")

In [None]:
g = sns.FacetGrid(penguins, col="sex", height=3.5, aspect=.75)

## Seaborn a data

Je rozd√≠l, zda jsou va≈°e data reprezentov√°na jako _wide_ nebo _long_ form√°t. Seaborn obecnƒõ pot≈ôebuje m√≠t ka≈ædou promƒõnnou jako vektor, resp. v√≠ce vektor≈Ø organizovan√Ωch jako tabulku.

![wide-long](img/wide-long.png)

### Dlouh√Ω form√°t

Jak jsme si u≈æ ≈ô√≠kala v uk√°zce o pandas, p≈ôi dlouh√©m form√°tu je ka≈æd√° promƒõnn√° reprezentov√°na jedn√≠m sloupcem a ka≈æd√© pozorov√°n√≠ p≈ôedstavuje jeden ≈ô√°dek. V tomto form√°tu staƒç√≠ dan√Ω sloupec p≈ôi≈ôadit dan√© promƒõnn√© (x, y, hue).

In [None]:
flights = sns.load_dataset("flights")
flights.head()

In [None]:
sns.relplot(data=flights, x="year", y="passengers", hue="month", kind="line");

### ≈†irok√Ω form√°t

≈†irok√Ω form√°t m≈Ø≈æe b√Ωt ƒçasto intuitivnƒõj≈°√≠ - data jsou reprezentov√°na jako spreadsheet, kdy sloupce a ≈ô√°dky obsahuj√≠ r≈Øzn√© √∫rovnƒõ r≈Øzn√Ωch promƒõnn√Ωch.

In [None]:
flights_wide = flights.pivot(index="year", columns="month", values="passengers")
flights_wide.head()

U dlouh√©ho form√°tu jsme schopni p≈ôistupovat k promƒõnn√© pomoc√≠ jej√≠ho jm√©na. To u ≈°irok√©ho nelze. Seaborn se s t√≠m dok√°≈æe popasovat pomoc√≠ argumentu `data`:

In [None]:
sns.relplot(data=flights_wide, kind="line");

‚òùÔ∏è V≈°imnete si nƒõjak√©ho rozd√≠lu?

P≈ôesto≈æe se m≈Ø≈æe zd√°t, ≈æe jsme si u ≈°irok√©ho from√°tu u≈°et≈ôili psan√≠, dlouh√Ω form√°t v√°m usnadn√≠ p≈ôem√Ω≈°len√≠ nad strukturou va≈°ich dat - jakmile data jednou p≈ôevedete do tohoto form√°tu, m≈Ø≈æete se u≈æ soust≈ôedit jen na to, jak jednotliv√© promƒõnn√© vykreslit. Tak√© je dlouh√Ω form√°t pova≈æovan√Ω za "tidy" a seaborn m≈Ø≈æe m√≠t probl√©my p≈ôi zpracov√°n√≠ multi-indexu - seaborn nem√° p≈ô√≠mou podporu pro objekty `xarray`, tyto objekty m≈Ø≈æete p≈ôev√©st na pandas DataFrame pomoc√≠ metody `to_pandas`.

üìñ V√≠ce si m≈Ø≈æete nastudovat [zde](https://seaborn.pydata.org/tutorial/data_structure.html).

## Tvorba grafu

P≈ôi tvorbƒõ grafu se nemus√≠te omezovat pouze na jeden podgraf s jedn√≠m druhem znaƒçek - d√≠ky metodƒõ `Plot`. Komplexnƒõj≈°√≠ grafika m≈Ø≈æe b√Ωt realizov√°na pomoc√≠ `Plot.add()`, kterou lze pou≈æ√≠vat opakovanƒõ - poka≈æd√©, kdy≈æ funkci zavol√°te, vytvo≈ô√≠ se dal≈°√≠ vrstva v grafu:

In [None]:
# seaborn objects interface
import seaborn.objects as so

In [None]:
(
so.Plot(tips, x="total_bill", y="tip") # nejd≈ô√≠ve specifikujeme data
    .add(so.Dots()) # a pak p≈ôid√°v√°me prvky - scatter plot
    .add(so.Line(), so.PolyFit()) # regresn√≠ p≈ô√≠mku
)

A ka≈ædou vrstvu m≈Ø≈æete samostatnƒõ pomoc√≠ parametr≈Ø nastavovat.

![markers](img/markers.svg)

U t≈ô√≠dy `Dot` (`Dots`) je p≈ô√≠kladem `Mark`, co≈æ je objekt, kter√Ω graficky reprezentuje datov√© body. Ka≈æd√° znaƒçka m√° nƒõkolik vlastnost√≠, kter√© m≈Ø≈æete nastavovat (nap≈ô. `color`, `pointsize`). Mimo to je mo≈æn√© jednotliv√© vlastnosti p≈ôi≈ôadit p≈ô√≠mo dat≈Øm:

In [None]:
(
    so.Plot(
        penguins, x="bill_length_mm", y="bill_depth_mm",
        color="species", pointsize="body_mass_g",
    )
    .add(so.Dot())
)

In [None]:
(
    so.Plot(penguins, x="species", y="body_mass_g", color="sex")
    .add(so.Dot(), so.Dodge(), so.Jitter(.3)) 
)

In [None]:
# podporuje i statistick√© transformace
(
    so.Plot(penguins, x="species", y="body_mass_g", color="sex")
    .add(so.Bar(), so.Agg(), so.Dodge()) # z√°rove≈à jedntliv√© funkce m≈Ø≈æete skl√°dat
)

Pomoc√≠ `Plot.facet()` jste tak√© schopni vytvo≈ôit nƒõkolik podgraf≈Ø, nap≈ô.:

In [None]:
(
    so.Plot(penguins, x="flipper_length_mm")
    .facet(col="species", row="sex")
    .add(so.Bars(), so.Hist())
)

A pokud byste chtƒõli vytvo≈ôit v√≠ce podgraf≈Ø v jednom Figure s komplexnƒõj≈°√≠ strukturou, lze vyu≈æ√≠t matplotlibu (buƒè `axes.Axes`, `figure.Figure` nebo `figure.SubFigure`):

In [None]:
import matplotlib as mpl

In [None]:
f = mpl.figure.Figure(figsize=(8, 4))
sf1, sf2 = f.subfigures(1, 2)
(
    so.Plot(penguins, x="body_mass_g", y="flipper_length_mm")
    .add(so.Dots())
    .on(sf1)
    .plot()
)
(
    so.Plot(penguins, x="body_mass_g")
    .facet(row="sex")
    .add(so.Bars(), so.Hist())
    .on(sf2)
    .plot()
)

üìñ [zde](https://seaborn.pydata.org/tutorial/objects_interface.html#building-and-displaying-the-plot) z√°rove≈à najdete, jak nastavit r≈Øzn√© ≈°k√°ly, motiv, popisky os, nadpisy apod. Komplexnƒõj≈°√≠ uk√°zka:

In [None]:
(
    so.Plot(penguins, x="body_mass_g", y="species", color="island")
    .facet(col="sex")
    .add(so.Dot(), so.Jitter(.5))
    .share(x=False)
    .limit(y=(2.5, -.5))
    .label(
        x="Body mass (g)", y="",
        color=str.capitalize,
        title="{} penguins".format,
    )
)

## Vlastnosti znaƒçek

Stejnƒõ jako tomu bylo u matplotlibu, i u seaborn graf≈Ø m≈Ø≈æeme znaƒçk√°m (`Mark`) nastavovat nƒõkolik vlastnost√≠:
- sou≈ôadnice: x (vertik√°lnƒõ), y (vertik√°lnƒõ) , xmin, xmax, ymin, ymax, ≈°k√°la
- barvy: color, fillcolor, edgecolor, scale, alpha, fillalpha, edgealpha,
- styl: fill, marker, linestyle, edgestyle,
- velikost: pointsize, linewidth, edgewidth, stroke,
- text: halign, valign, fontsize, offset,
a dal≈°√≠.

Podrobnosti se doƒçtete [zde](https://seaborn.pydata.org/tutorial/properties.html). üìñ

D√°le si m≈Ø≈æete pohr√°t s [barevn√Ωmi paletami](https://seaborn.pydata.org/tutorial/color_palettes.html) a nebo s celkov√Ωm [stylem grafu](https://seaborn.pydata.org/tutorial/aesthetics.html) (`set_theme`, `set_style`).