# Knižnice

## 🐍 Kurz Interaktívne Vizualizácie v Pythone I. Začiatočník (Plotly a Bokeh)
**🧑‍🏫 Lektor:** Miroslav Reiter  
**📥 LinkedIn kontakt:** https://www.linkedin.com/in/miroslav-reiter/  

`*Testovaci* **Text**`

**✅ Osnova:** https://itkurzy.sav.sk/node/225

**🎞️ YouTube videá:** https://www.youtube.com/c/IT-AcademySK  
**📇 Zdrojové kódy a materiály:** https://github.com/miroslav-reiter/Kurzy_SAV_Analytika_Python_R  

**😊 Emojis:** Win + .  

# ⚒️ Používané nástroje dátovej analýzy
- 🐍 **Python** - momentálne najpopulárnejší jazyk pre vedu o údajoch (Data science). Python je síce interpretovaný a pomalší jazyk ako C/C++, ale využitím knižníc, ako je NumPy (a Pandas navyše), sa môžeme priblížiť rýchlosti C.  
  
- 🪐 **Jupyter** - nástroj s prostredím interaktívneho notebooku, mocný prieskumný, vizualizačný a komunikačný nástroj.
  
- 🐼 **Pandas** - nástroj na manipuláciu s tabuľkovými údajmi v Pythone. Je to obrovská knižnica, ale ak poznáte správne metódy, môžeme vytvoriť výkonnú analýzu.
  
- 📊 **Plotly** - dynamická grafická knižnica s rôznymi grafmi a vizualizáciami. V spojení s Pandas a Jupyter môžeme rýchlo získať prehľad o našich údajoch.  
  
- 🚀 **Bokeh** - knižnica v Pythone určená na tvorbu interaktívnych vizualizácií, ktoré možno ľahko zobrazovať v prehliadači. Umožňuje vytvárať dynamické grafy, tabuľky a mapy s podporou pre veľké množstvo dát a interakcií.

😎 Existuje 300 000+ knižníc pre Python.  

# 📚 PIP, Knižnice a ich verzie 
**PIP (package installer for Python)** - Správca Balíčkov pre moduly programovacieho jazyka Python, Tiež napísaný v Pythone, Licencia MIT.  
Dokumentácia PIP: https://pip.pypa.io/en/stable/

**PyPI (The Python Package Index)** - Repozitár/úložisko softvéru pre programovací jazyk Python  
https://pypi.org
1

In [6]:
# !pip list
!pip install plotly
!pip install bokeh
!pip install seaborn
!pip install matplotlib
!pip install squarify


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m23.1.2[0m[39;49m -> [0m[32;49m24.2[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m

[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m23.1.2[0m[39;49m -> [0m[32;49m24.2[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m

[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m23.1.2[0m[39;49m -> [0m[32;49m24.2[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m

[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m23.1.2[0m[39;49m -> [0m[32;49m24.2[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --u

In [9]:
!pip freeze

absl-py==2.1.0
aiohttp==3.8.4
aiosignal==1.3.1
alabaster==0.7.13
annotated-types==0.7.0
anyio==3.7.1
argon2-cffi==23.1.0
argon2-cffi-bindings==21.2.0
astunparse==1.6.3
async-timeout==4.0.3
attrs==23.2.0
Babel==2.15.0
backcall==0.2.0
beautifulsoup4==4.12.3
bleach==6.1.0
blis==0.7.11
bokeh==3.1.1
boto3==1.26.133
botocore==1.29.165
cachetools==5.4.0
catalogue==2.0.10
certifi==2024.7.4
cffi==1.16.0
charset-normalizer==3.3.2
click==8.1.7
click-plugins==1.1.1
cligj==0.7.2
cloudpathlib==0.18.1
confection==0.1.5
contourpy==1.1.1
cycler==0.12.1
cymem==2.0.8
decorator==5.1.1
defusedxml==0.7.1
descartes==1.1.0
docutils==0.20.1
duckdb==0.7.1
exceptiongroup==1.2.2
fastai==2.7.12
fastcore==1.5.55
fastdownload==0.0.7
fastjsonschema==2.20.0
fastprogress==1.0.3
filelock==3.15.4
Fiona==1.9.3
flatbuffers==24.3.25
fonttools==4.53.1
frozenlist==1.4.1
fsspec==2024.6.1
gast==0.4.0
gensim==4.3.1
geopandas==0.13.0
google-auth==2.32.0
google-auth-oauthlib==0.

# 📜 Verzie vizualizačných knižnic 
try - except - finally  

https://docs.python.org/3/tutorial/errors.html 

In [20]:
import pandas as pd

import matplotlib as plt
import plotly
import bokeh
import seaborn
import squarify
import importlib_metadata

# print(f"squarify verzia: {squarify.__version__}")
print(f"Matplotlib verzia: {plt.__version__}")
print(f"Plotly verzia: {plotly.__version__}")
print(f"pandas verzia: {pd.__version__}")
print(f"bokeh verzia: {bokeh.__version__}")
print(f"seaborn verzia: {seaborn.__version__}")
print(f"squarify verzia: {importlib_metadata.version('squarify')}")
print(f"seaborn verzia: {importlib_metadata.version('seaborn')}")

Matplotlib verzia: 3.7.1
Plotly verzia: 5.14.1
pandas verzia: 1.5.3
bokeh verzia: 3.1.1
seaborn verzia: 0.12.2
squarify verzia: 0.4.4
seaborn verzia: 0.12.2


In [21]:
try:
    # Dataframes (Datove Ramce) = Tabulky
    # Uzitocne metody import, export, statistiky
    import pandas as pd
    # Grafy, Diagramy, Vizualizacie
    import matplotlib
    import plotly
    import bokeh
    import seaborn
    import importlib.metadata
    import squarify

    print("TRY:")
    print("✅ Moduly/kniznice boli nacitane")
    # Zobrazenie verzií knižníc
    print(f"Plotly verzia: {plotly.__version__}")
    print(f"Bokeh verzia: {bokeh.__version__}")
    print(f"Seaborn verzia: {seaborn.__version__}")
    print(f"Matplotlib verzia: {matplotlib.__version__}")
    print(f"Squarify verzia: {importlib.metadata.version('squarify')}")
    # print(f"Squarify verzia: {squarify.__version__}")

except:
    print("EXCEPT: Moduly/Kniznice neboli nacitane, nastala chyba...")

finally:
    print("\nFINALLY: Tento text sa vypise vzdy")

TRY:
✅ Moduly/kniznice boli nacitane
Plotly verzia: 5.14.1
Bokeh verzia: 3.1.1
Seaborn verzia: 0.12.2
Matplotlib verzia: 3.7.1
Squarify verzia: 0.4.4

FINALLY: Tento text sa vypise vzdy


# 📊 Príklad na použitie Plotly

In [6]:
import plotly.graph_objects as go 

x_hodnota = [1,2,3,4,5]
y_hodnota = [10, 14, 12, 8, 16]

fig = go.Figure(data=go.Scatter(x=x_hodnota, y=y_hodnota, name = "Ciarovy graf 👍"))

fig.update_layout(
    title="Ciarovy graf",
    xaxis_title = "Os X",
    yaxis_title = "Os Y",
    legend_title = "Legenda",
    showlegend=True
)

fig.show()

# 📈 Príklad na použitie Bokeh

In [10]:
from bokeh.plotting import figure, show, output_notebook
from bokeh.io import push_notebook

# Aktivacia vystupu v jupyter notebook
output_notebook()

x_hodnota = [1,2,3,4,5]
y_hodnota = [10, 14, 12, 8, 16]

graf = figure(title = "Ciarovy graf", x_axis_label = "Os x", y_axis_label = "Os Y")

graf.line(x_hodnota, y_hodnota, legend_label = "Ciarovy graf")

show(graf, notebook_handle=True)

# Plotly

# 📊 Čo je Plotly?
- Najpopulárnejšia Python knižnica na vytváranie dynamických grafov
- Tvorba interaktívnych grafov a vizualizácií
- Vhodná pre vývojárov, dátových vedcov a analytikov
- Stĺpcové grafy, čiarové grafy, teplotné mapy, 3D grafy, geografické mapy 
- Používatelia môžu klikať, približovať a skúmať údaje priamo v grafickom výstupe

# 📊 Stĺpcový graf 1
- Stĺpcový graf (Bar Chart) pre porovnanie kategórií

**Použitie**:
Stĺpcový graf je výborný na porovnávanie kategórií. Každý stĺpec reprezentuje určitú hodnotu pre danú kategóriu, pričom dĺžka stĺpca odráža jej veľkosť.

**Aplikácie**:
Porovnávanie kategórií: Predaj produktov, počet hlasov v prieskume, návštevnosť stránok podľa regiónov.
Zoskupené stĺpce (grouped bar chart): Umožňuje porovnať viacero kategórií pre každú skupinu (napr. predaje produktov v rôznych rokoch).

**Tipy**:
Pri veľkom počte kategórií použite horizontálne stĺpce namiesto vertikálnych, aby sa dalo lepšie čítať názvy kategórií.
Ak chcete porovnávať viac dátových sérií v rôznych kategóriách, použite zoskupené stĺpcové grafy.

**Príklady**:
Porovnanie predajov produktov v štyroch rôznych krajinách.
Výsledky rôznych kandidátov v komunálnych voľbách.

In [88]:
import plotly.express as px
import pandas as pd

data = {
    'Mesiac': ['Január', 'Február', 'Marec', 'Apríl', 'Máj', 'Jún', 'Júl', 'August', 'September', 'Október', 'November', 'December'],
    'Python': [220, 230, 210, 240, 250, 260, 270, 275, 290, 300, 320, 330],
    'Java': [180, 190, 170, 200, 210, 215, 220, 230, 240, 250, 260, 270],
    'JavaScript': [150, 160, 145, 155, 165, 170, 180, 185, 195, 200, 210, 220]
}

# Prevod dict na Dataframe (Tabulka)
df_data = pd.DataFrame(data)

# Vytvorenie grafu
fig = px.bar(df_data, x = "Mesiac", y = ['Python','Java', 'JavaScript'], title = "Predaje online kurzov programovania za 2024", labels={"value":"Pocet predanych kurzov", "Mesiac":"Mesiac"})

fig.show()

# 📊 Stĺpcový graf 2

In [102]:
import plotly.express as px
import pandas as pd

data = {
    'Mesiac': ['Január', 'Február', 'Marec', 'Apríl', 'Máj', 'Jún', 'Júl', 'August', 'September', 'Október', 'November', 'December']*3,
    'Predaje': [220, 230, 210, 240, 250, 260, 270, 275, 290, 300, 320, 330,  # Python
                180, 190, 170, 200, 210, 215, 220, 230, 240, 250, 260, 270,  # Java
                150, 160, 145, 155, 165, 170, 180, 185, 195, 200, 210, 220], # JavaScript
    'Kurz': ['Python']*12 + ['Java']*12 + ['JavaScript']*12
}


# Prevod dict na Dataframe (Tabulka)
df_data = pd.DataFrame(data)

# Vytvorenie grafu
fig = px.bar(
    df_data, 
    x = "Mesiac", 
    y = "Predaje", 
    color = "Kurz",
    barmode = "group",
    title = "Predaje online kurzov programovania za 2024",
    labels={"value":"Pocet predanych kurzov", "Mesiac":"Mesiac"},
    range_y= [0, 350]
)

fig.update_layout(
    updatemenus=[{
        'buttons': [
            {'method': 'update', 'label': 'Všetky kurzy', 'args': [{'visible': [True, True, True]}]},
            {'method': 'update', 'label': 'Python', 'args': [{'visible': [True, False, False]}]},
            {'method': 'update', 'label': 'Java', 'args': [{'visible': [False, True, False]}]},
            {'method': 'update', 'label': 'JavaScript', 'args': [{'visible': [False, False, True]}]},
        ],
        'direction': 'down',
        'showactive': True
    }]
)

fig.show()

# 📊 Stĺpcový graf 3

In [104]:
import plotly.express as px
import pandas as pd

# Údaje o predaji online kurzov programovania
data = {
    'Mesiac': ['Január', 'Február', 'Marec', 'Apríl', 'Máj', 'Jún', 'Júl', 'August', 'September', 'Október', 'November', 'December']*3,
    'Predaje': [220, 230, 210, 240, 250, 260, 270, 275, 290, 300, 320, 330,  # Python
                180, 190, 170, 200, 210, 215, 220, 230, 240, 250, 260, 270,  # Java
                150, 160, 145, 155, 165, 170, 180, 185, 195, 200, 210, 220], # JavaScript
    'Kurz': ['Python']*12 + ['Java']*12 + ['JavaScript']*12
}

# Prevod dát do DataFrame
df = pd.DataFrame(data)

# Vytvorenie stĺpcového grafu s animáciou po mesiacoch
fig = px.bar(df, x='Kurz', y='Predaje', color='Kurz',
             title="Predaje online kurzov programovania za jednotlivé mesiace",
             animation_frame='Mesiac', range_y=[0, 350],
             labels={'Predaje':'Počet predaných kurzov', 'Kurz':'Názov kurzu'})

# Zobrazenie grafu
fig.show()

# 🥧 Koláčový graf (Pie Chart)
- na zobrazenie relatívnych proporcií alebo podielov v celku

**Použitie:**
Koláčový graf zobrazuje relatívne podiely jednotlivých kategórií ako segmenty kruhu. Je vhodný na zobrazenie rozdelenia alebo proporcií z celkového súboru dát.

**Aplikácie:**
Podiely kategórií: Zobrazenie podielu rôznych kategórií na celkovej hodnote (napr. trhový podiel firiem, percentuálne rozdelenie výdavkov).
Percentuálne rozdelenie: Vizualizácia toho, ako sú dáta rozdelené medzi rôzne skupiny (napr. ako sa rozdeľujú náklady na projekt medzi rôzne položky).

**Tipy:**
Použite koláčový graf, iba ak máte relatívne malé množstvo kategórií (ideálne 5-6), aby bola vizualizácia prehľadná. Ak máte veľa kategórií, zvoľte iný typ grafu, napr. stĺpcový graf.
Zvýraznite najdôležitejšie segmenty tým, že ich vizuálne oddelíte (napr. tzv. „exploded pie chart“), aby boli okamžite viditeľné.
Každý segment by mal mať označenie (percentuálny podiel alebo hodnota), aby bol význam grafu zrejmý.

**Príklad:**
Rozdelenie firemného rozpočtu medzi rôzne oddelenia.
Percentuálny podiel rôznych výrobkov na celkovom predaji.

In [107]:
import plotly.express as px
import pandas as pd


data_jedla = {
    "Kategoria": ["Maso", "Ovocie", "Zelenina", "Mliecne vyrobky", "Cerealie", "Sladkosti"],
    "Vydavky" : [300, 150, 120, 200, 80, 100]
}

df_jedlo = pd.DataFrame(data_jedla)

fig = px.pie(df_jedlo, values = "Vydavky", names="Kategoria", title = "Rozdelenie vydavkov na jedlo")

fig.show()

# 🥧 Koláčový graf (Pie Chart) 2

In [108]:
import plotly.graph_objects as go

# Dáta o spotrebe jedla
jedlo_data = {
    'Kategória': ['Mäso', 'Ovocie', 'Zelenina', 'Mliečne výrobky', 'Cereálie', 'Sladkosti'],
    'Výdavky': [300, 150, 120, 200, 80, 100]
}

# Vytvorenie základného koláčového grafu so všetkými kategóriami
fig = go.Figure()

# Pridanie dát pre všetky kategórie do jedného koláčového grafu
fig.add_trace(go.Pie(labels=jedlo_data['Kategória'], values=jedlo_data['Výdavky'], name="Všetky kategórie"))

# Pridanie interaktívneho prepínacieho menu pre zobrazenie konkrétnych kategórií
fig.update_layout(
    updatemenus=[
        {
            'buttons': [
                # Nastavenie tlačidla na zobrazenie všetkých kategórií
                {'label': 'Všetky kategórie', 'method': 'update', 
                 'args': [{'labels': [jedlo_data['Kategória']], 'values': [jedlo_data['Výdavky']], 'visible': True}, 
                          {'title': 'Všetky kategórie'}]},
                
                # Nastavenie tlačidla na zobrazenie len kategórie Mäso
                {'label': 'Mäso', 'method': 'update', 
                 'args': [{'labels': [['Mäso']], 'values': [[300]], 'visible': True}, 
                          {'title': 'Mäso'}]},
                
                # Nastavenie tlačidla na zobrazenie len kategórie Ovocie
                {'label': 'Ovocie', 'method': 'update', 
                 'args': [{'labels': [['Ovocie']], 'values': [[150]], 'visible': True}, 
                          {'title': 'Ovocie'}]},
                
                # Nastavenie tlačidla na zobrazenie len kategórie Zelenina
                {'label': 'Zelenina', 'method': 'update', 
                 'args': [{'labels': [['Zelenina']], 'values': [[120]], 'visible': True}, 
                          {'title': 'Zelenina'}]},
                
                # Nastavenie tlačidla na zobrazenie len kategórie Mliečne výrobky
                {'label': 'Mliečne výrobky', 'method': 'update', 
                 'args': [{'labels': [['Mliečne výrobky']], 'values': [[200]], 'visible': True}, 
                          {'title': 'Mliečne výrobky'}]},
                
                # Nastavenie tlačidla na zobrazenie len kategórie Cereálie
                {'label': 'Cereálie', 'method': 'update', 
                 'args': [{'labels': [['Cereálie']], 'values': [[80]], 'visible': True}, 
                          {'title': 'Cereálie'}]},
                
                # Nastavenie tlačidla na zobrazenie len kategórie Sladkosti
                {'label': 'Sladkosti', 'method': 'update', 
                 'args': [{'labels': [['Sladkosti']], 'values': [[100]], 'visible': True}, 
                          {'title': 'Sladkosti'}]},
            ],
            'direction': 'down',
            'showactive': True
        }
    ]
)

# Zobrazenie grafu
fig.show()

# 📈 Čiarový graf (Line Chart)
- pre trendové zobrazenie dát v čase

**Použitie**:
Čiarový graf je ideálny na zobrazenie vývoja a zmien dát v čase. Jeho najväčšou výhodou je, že umožňuje jednoducho sledovať trendy, sezónnosť, či prípadné výkyvy.

**Aplikácie**:
Časové rady: Zmena hodnôt premenných v čase, ako sú predaje, ceny akcií, návštevnosť webu.
Porovnanie trendov: Vizualizácia viacerých časových radov na jednom grafe (napr. porovnanie predajov medzi rôznymi produktami alebo regiónmi).

**Tipy**:
Pri viacerých čiarach na jednom grafe používajte rôzne farby alebo štýly čiar (napr. bodkovanú alebo prerušovanú čiaru) pre lepšie rozlíšenie.
Ak máte veľké množstvo dátových bodov, skúste ich redukovať alebo zoskupiť, aby graf zostal prehľadný.

**Príklady**:
Sledovanie dennej teploty počas roka.
Vizualizácia výnosov akcií dvoch konkurenčných spoločností za posledných 10 rokov.

In [117]:
import plotly.express as px
import pandas as pd

# Údaje o teplotách
data_teplota = {
    'Hodina': list(range(24)),
    'Teplota': [2, 3, 4, 5, 6, 8, 10, 12, 15, 18, 21, 23, 25, 27, 28, 29, 30, 28, 26, 24, 20, 18, 15, 10]
}

# Prevod do DataFrame
df_teplota = pd.DataFrame(data_teplota)

# Vytvorenie čiarového grafu
fig = px.line(df_teplota, x='Hodina', y='Teplota', title='Vývoj teploty počas dňa')

# Zobrazenie grafu
fig.show()

In [118]:
import plotly.graph_objects as go
import pandas as pd

# Dáta o teplotách počas dňa
data_teplota = {
    'Hodina': list(range(24)),
    'Teplota': [2, 3, 4, 5, 6, 8, 10, 12, 15, 18, 21, 23, 25, 27, 28, 29, 30, 28, 26, 24, 20, 18, 15, 10]
}

# Prevod dát do DataFrame
df_teplota = pd.DataFrame(data_teplota)

# Vytvorenie čiarového grafu
fig = go.Figure()

# Pridanie dát pre všetky hodiny
fig.add_trace(go.Scatter(x=df_teplota['Hodina'], y=df_teplota['Teplota'], mode='lines+markers', name='Teplota'))

# Pridanie interaktívnych prvkov - tlačidla na filtrovanie podľa časti dňa
fig.update_layout(
    updatemenus=[
        {
            'buttons': [
                {'label': 'Celý deň', 'method': 'update', 'args': [{'x': [df_teplota['Hodina']], 'y': [df_teplota['Teplota']]}, {'title': 'Teplota počas celého dňa'}]},
                {'label': 'Ráno (0-8)', 'method': 'update', 'args': [{'x': [df_teplota['Hodina'][:9]], 'y': [df_teplota['Teplota'][:9]]}, {'title': 'Teplota počas rána'}]},
                {'label': 'Popoludnie (9-16)', 'method': 'update', 'args': [{'x': [df_teplota['Hodina'][9:17]], 'y': [df_teplota['Teplota'][9:17]]}, {'title': 'Teplota počas popoludnia'}]},
                {'label': 'Večer (17-23)', 'method': 'update', 'args': [{'x': [df_teplota['Hodina'][17:]], 'y': [df_teplota['Teplota'][17:]]}, {'title': 'Teplota počas večera'}]},
            ],
            'direction': 'down',
            'showactive': True
        }
    ],
    title="Vývoj teploty počas dňa",
    xaxis_title="Hodina",
    yaxis_title="Teplota (°C)"
)

# Pridanie interaktívnych funkcií ako priblíženie a posúvanie
fig.update_layout(
    dragmode='zoom',  # Umožňuje používateľovi priblížiť a odzoomovať graf
    hovermode='x unified'  # Zobrazí informácie na hover (priblíženie) pre všetky body na osi X
)

# Pridanie posuvníka pre zobrazovanie hodín počas dňa
fig.update_layout(
    xaxis=dict(
        rangeslider=dict(visible=True),  # Zobrazenie posuvníka na spodnej osi
        type="linear"
    )
)

# Zobrazenie grafu
fig.show()

# 📈 Čiarový graf (Line Chart) 2

# 🗺️ Mapy
- Mapy v Plotly umožňujú vytvárať interaktívne geografické vizualizácie s vrstvami bodov, čiar alebo farebnými plochami na základe geografických údajov.
- Podporuje rôzne typy máp, ako sú chloropleth mapy, scattergeo a mapové grafy s prispôsobiteľnými prvkami.
- Interaktívne funkcie umožňujú používateľom priblížiť, posúvať a skúmať údaje v reálnom geografickom kontexte priamo v prehliadači.

Mapa slúži na zobrazenie geografických dát alebo na vizualizáciu dát v tabuľkovom formáte pomocou farebných odstupňovaní (heatmapa). Je vhodná na analýzu dát, ktoré súvisia s miestom alebo priestorom.

**Aplikácie:**
Geografické dáta: Vizualizácia dát podľa geografických regiónov, ako sú demografické údaje, predaje podľa regiónov, hustota obyvateľstva.
Heatmapa (teplotná mapa): Zobrazenie intenzity alebo frekvencie výskytu hodnôt v tabuľkách alebo mriežkach (napr. korelácia medzi premennými, hustota výskytu udalostí).

**Tipy:**
Pre geografické mapy používajte choropleth maps, kde sú oblasti (napr. štáty, regióny) farebne odlíšené podľa hodnoty (napr. HDP, počet obyvateľov).
Uistite sa, že farebná škála je dobre zvolená – mala by byť intuitívna a prehľadná (napr. teplé farby pre vyššie hodnoty, studené pre nižšie).
Pre heatmapy, ktoré zobrazujú korelácie alebo vzory, používajte gradientné farebné schémy, ktoré umožnia jasne rozlíšiť nízke a vysoké hodnoty.

**Príklad (geografická mapa):**
Mapa zobrazujúca počet predajov v rôznych krajinách alebo regiónoch.
Vizualizácia voličských preferencií v rámci krajiny.

**Príklad (heatmapa):**
Korelačná matica pre premenné vo výskume (napr. vzťahy medzi ekonomickými ukazovateľmi).
Teplotná mapa zobrazujúca intenzitu návštevníkov na webovej stránke podľa miesta kliknutí.

In [119]:
import plotly.express as px
import pandas as pd

# Dáta o mestách a populácii
data_mesta = {
    'Mesto': ['Bratislava', 'Košice', 'Prešov', 'Žilina', 'Nitra'],
    'Populácia': [432000, 239000, 89000, 82000, 79000],
    'Latitude': [48.14816, 48.71639, 49.00169, 49.2231, 48.30885],
    'Longitude': [17.10674, 21.26107, 21.23943, 18.74002, 18.08685]
}

# Vytvorenie DataFrame
df_mesta = pd.DataFrame(data_mesta)

# Vytvorenie mapy
fig = px.scatter_mapbox(df_mesta, lat="Latitude", lon="Longitude", size="Populácia", 
                        hover_name="Mesto", title="Populácia miest na Slovensku",
                        zoom=6, mapbox_style="open-street-map")

# Zobrazenie mapy
fig.show()

# 🗺️ Mapy 2

In [120]:
import plotly.graph_objects as go
import pandas as pd

# Rozšírené údaje o mestách a populácii na Slovensku
data_mesta = {
    'Mesto': ['Bratislava', 'Košice', 'Prešov', 'Žilina', 'Nitra', 'Trnava', 'Trenčín', 'Banská Bystrica', 'Poprad', 'Martin'],
    'Populácia': [432000, 239000, 89000, 82000, 79000, 65000, 56000, 78000, 52000, 54000],
    'Latitude': [48.14816, 48.71639, 49.00169, 49.2231, 48.30885, 48.37741, 48.89452, 48.73949, 49.05827, 49.06632],
    'Longitude': [17.10674, 21.26107, 21.23943, 18.74002, 18.08685, 17.58844, 18.04497, 19.14619, 20.29753, 18.92255]
}

# Prevod dát do DataFrame
df_mesta = pd.DataFrame(data_mesta)

# Vytvorenie mapy pomocou Graph Objects
fig = go.Figure()

# Pridanie dát pre všetky mestá
fig.add_trace(go.Scattermapbox(
    lat=df_mesta['Latitude'],
    lon=df_mesta['Longitude'],
    mode='markers',
    marker=go.scattermapbox.Marker(
        size=df_mesta['Populácia'] / 5000,  # Zvýšenie veľkosti bublín
        color=df_mesta['Populácia'],
        colorscale='Plasma',  # Použitie jasnejšej farebnej škály
        showscale=True,
        sizemode='area',
        sizeref=0.05  # Zníženie sizeref pre zväčšenie bublín
    ),
    text=df_mesta['Mesto'] + ' - Populácia: ' + df_mesta['Populácia'].astype(str),
    hoverinfo='text',
    name="Všetky mestá",
    visible=True
))

# Pridanie dát pre veľké mestá
df_velke_mesta = df_mesta[df_mesta['Populácia'] > 100000]
fig.add_trace(go.Scattermapbox(
    lat=df_velke_mesta['Latitude'],
    lon=df_velke_mesta['Longitude'],
    mode='markers',
    marker=go.scattermapbox.Marker(
        size=df_velke_mesta['Populácia'] / 5000,
        color=df_velke_mesta['Populácia'],
        colorscale='Plasma',
        showscale=False,
        sizemode='area',
        sizeref=0.05
    ),
    text=df_velke_mesta['Mesto'] + ' - Populácia: ' + df_velke_mesta['Populácia'].astype(str),
    hoverinfo='text',
    name="Veľké mestá",
    visible=False
))

# Pridanie dát pre stredné mestá
df_stredne_mesta = df_mesta[(df_mesta['Populácia'] >= 50000) & (df_mesta['Populácia'] <= 100000)]

fig.add_trace(go.Scattermapbox(
    lat=df_stredne_mesta['Latitude'],
    lon=df_stredne_mesta['Longitude'],
    mode='markers',
    marker=go.scattermapbox.Marker(
        size=df_stredne_mesta['Populácia'] / 5000,
        color=df_stredne_mesta['Populácia'],
        colorscale='Plasma',
        showscale=False,
        sizemode='area',
        sizeref=0.05
    ),
    text=df_stredne_mesta['Mesto'] + ' - Populácia: ' + df_stredne_mesta['Populácia'].astype(str),
    hoverinfo='text',
    name="Stredné mestá",
    visible=False
))

# Nastavenie interaktívneho rozbaľovacieho menu
fig.update_layout(
    updatemenus=[
        {
            'buttons': [
                {'label': 'Všetky mestá', 'method': 'update', 'args': [{'visible': [True, False, False]}, {'title': 'Všetky mestá'}]},
                {'label': 'Veľké mestá', 'method': 'update', 'args': [{'visible': [False, True, False]}, {'title': 'Veľké mestá (nad 100 000)'}]},
                {'label': 'Stredné mestá', 'method': 'update', 'args': [{'visible': [False, False, True]}, {'title': 'Stredné mestá (50 000 - 100 000)'}]}
            ],
            'direction': 'down',
            'showactive': True
        }
    ]
)

# Povolenie priblíženia a posúvania na mape
fig.update_layout(
    mapbox=dict(
        style="open-street-map",
        zoom=6,  # Štandardný zoom
        center={"lat": 48.5, "lon": 19.0}  # Centrum mapy na Slovensku
    ),
    margin={"r": 0, "t": 40, "l": 0, "b": 0}  # Zmenšené okraje pre lepšie zobrazenie mapy
)

# Zobrazenie mapy
fig.show()

# 🌐 Kombinovaný graf

In [122]:
import plotly.graph_objects as go
import plotly.express as px
import pandas as pd
from plotly.subplots import make_subplots  # Importovanie make_subplots

# Dáta pre grafy
data = {
    'Kategória': ['A', 'B', 'C', 'D'],
    'Hodnota1': [10, 20, 30, 40],
    'Hodnota2': [15, 25, 35, 45],
    'Hodnota3': [50, 30, 40, 60],
    'Hodnota4': [100, 150, 200, 250]
}

# Prevod dát do DataFrame
df = pd.DataFrame(data)

# Vytvorenie dashboardu s viacerými grafmi v jednom rozložení
fig_dashboard = make_subplots(
    rows=2, cols=2, 
    specs=[[{"type": "xy"}, {"type": "domain"}], [{"type": "xy"}, {"type": "xy"}]],
    subplot_titles=("Stĺpcový graf", "Koláčový graf", "Čiarový graf", "Bodový graf")
)

# Pridanie stĺpcového grafu
fig_dashboard.add_trace(
    go.Bar(
        x=df['Kategória'], 
        y=df['Hodnota1'], 
        name="Stĺpcový graf"), 
    row=1, 
    col=1)

# Pridanie koláčového grafu
fig_dashboard.add_trace(
    go.Pie(
        labels=df['Kategória'], 
        values=df['Hodnota3'], 
        name="Koláčový graf"), 
    row=1, 
    col=2)

# Pridanie čiarového grafu
fig_dashboard.add_trace(
    go.Scatter(
        x=df['Kategória'], 
        y=df['Hodnota2'], 
        mode='lines+markers', 
        name="Čiarový graf"), 
    row=2, col=1)

# Pridanie bodového grafu
fig_dashboard.add_trace(go.Scatter(x=df['Kategória'], y=df['Hodnota4'], mode='markers', name="Bodový graf"), row=2, col=2)

# Nastavenie layoutu dashboardu
fig_dashboard.update_layout(
    title_text="Interaktívny Dashboard so Štyrmi Grafmi",
    height=800,
    showlegend=False
)

# Zobrazenie dashboardu
fig_dashboard.show()

# Plotly Príklady

# Plotly 
- Výkonná knižnica pre Python, ktorá sa používa na vytváranie interaktívnych a vizuálne atraktívnych grafikov a vizualizácií dát

# 📈 Základný čiarový graf

In [26]:
import plotly.graph_objects as go

x_data = ["Január", "Február", "Marec", "Apríl"]
y_data = [10, 15, 13, 17]

# Vytvorenie grafu
fig = go.Figure(
    data = go.Scatter(
        x = x_data, 
        y = y_data,
        mode = "text+markers+lines",
        text = ["A", "B", "C", "D"],
        textfont = dict(size=24),
        textposition= "top center"
    )
)

fig.show()

# 📊 Stĺpcový graf
Sú užitočné na porovnávanie hodnôt medzi rôznymi kategóriami. Tento príklad ukazuje, ako vytvoriť základný stĺpcový graf.

In [40]:
import plotly.graph_objects as go

kategorie_produkty = ["Produkt A", "Produkt B", "Produkt C"]
hodnoty = [20, 34, 30]

# Vytvorenie grafu
fig = go.Figure(
    data = go.Bar(
        x = kategorie_produkty, 
        y = hodnoty,
        text = hodnoty,
        textposition="inside",
        marker=dict(color=["#000000", "#FF0000", "#00FF00"])
    )
)


# Nastavenia grafu, osi, titulok
fig.update_layout(
    title = "Predaj produktov/kurzy",
    xaxis_title = "Kategorie produktov",
    yaxis_title = "Pocet predanych produktov",
    plot_bgcolor = "rgba(0,0,0,0)",
    yaxis = dict(showgrid = True, gridcolor = "lightgray")
)

fig.show()

# 🥧 Koláčový graf
Sú vhodné na zobrazovanie percentuálneho rozdelenia kategórií voči celku.

In [60]:
import plotly.graph_objects as go

menovky = ["Oddelenie A", "Oddelenia B", "Oddelenie C"]
hodnoty = [450, 300, 250]

fig = go.Figure(
    data = go.Pie(
        labels = menovky,
        values=hodnoty,
        textinfo = "label+percent",
        hole = 0.2,
        marker = dict(colors = ["1f77b4", "ff7f0e", "2ca02c"]),
        pull = [0.2, 0, 0]
        
    )
)

fig.update_layout(
    title = "Rozdelenie pracovnych oddeleni",
    showlegend = True,
    annotations = [dict
    (text = "Oddelenia", x = 0.5, y = 0.5, font_size = 20, showarrow = False)
                   ]

)

fig.show()

## 3D Scatter Plot
Sú užitočné na zobrazovanie vzťahov medzi 3 premennými

In [82]:
import plotly.graph_objects as go
import numpy as np

x, y, z = np.random.random(100), np.random.random(100), np.random.random(100)

fig = go.Figure(data = [
    go.Scatter3d(
        x = x,
        y = y,
        z = z,
        mode = "markers",
        marker = dict(size = 10, color = z, colorscale = "ice", opacity = 0.5)
    
    )
])

fig.update_layout(
    scene = dict(
        xaxis_title = "Os X",
        yaxis_title = "Os Y",
        zaxis_title = "Os Z",
    ),

    title = "3D graf",
    width = 1000,
    margin = dict(r=20, b=20, l=10, t=50)

)

fig.show()

## 🌡️ Heatmapy
Sú užitočné na zobrazovanie intenzity alebo četnosti v dvojrozmernom formáte, často používané pre zobrazovanie dát v mriežke.

# Bublinový graf
Bublinové grafy rozširujú scatter ploty tým, že veľkosť bubliny reprezentuje ďalšiu dimenziu dát

## Box Plot
Box ploty (alebo box-and-whisker grafy) sú užitočné na zobrazovanie distribúcie dát cez kvartily, odhalenie odľahlých hodnôt a porovnanie distribúcií medzi rôznymi skupinami.

# Bokeh

In [50]:
#!pip install bokeh
from bokeh.plotting import figure, show
from bokeh.io import output_notebook
from bokeh.models import HoverTool
from bokeh.models import Label, ImageURL, ColumnDataSource


# Kontrola notebook
output_notebook()

# Hlupe data
x = [1,2,3,4,5]
y = [6,7,2,4,5]

# Vytvorenie grafu
graf = figure(
    title = "Jednoduchy ciarovy graf", 
    x_axis_label = "Os X", 
    y_axis_label = "Os Y",
    width = 800,
    height = 400,
    tools = "pan, wheel_zoom, box_zoom, reset, save"
)

# Nastavenie rozsahu osi
graf.x_range.start = 0
graf.y_range.start = 0
graf.x_range.end = 6
graf.y_range.end = 8

# Mriezky
graf.xgrid.grid_line_color = None
graf.ygrid.grid_line_alpha = 0.8

# Pridanie ciarove grafu s bodmi
graf.line(x, y, legend_label = "Legenda 👍", line_width = 3)
graf.circle(x, y, size = 10, color = "red", alpha = 0.8, legend_label = "Body")

menovka = Label(x = 0, y = 4, text="Poznamka", text_font_size = "14pt", text_color = "red")

graf.add_layout(menovka)


zdroj = ColumnDataSource(
    data = dict(
        url = ["https://eurocc.nscc.sk/wp-content/uploads/2020/12/CC_EURO-_logo_gold-1.png"],
        x = [2],
        y = [2]
    ))

obrazok = ImageURL(url = "url", x = "x", y = "y", w = 2, h = 2)
graf.add_glyph(zdroj, obrazok)

graf.legend.location = "center"
# graf.legend.x = 0
# graf.legend.y = 200
graf.legend.click_policy = "hide"
graf.legend.visible = True

hover = HoverTool()
hover.tooltips = [("Os x", "@x"), ("Os y", "@y")]
graf.add_tools(hover)

# Zobrazenie grafu
show(graf)

In [57]:
from bokeh.plotting import figure, show
from bokeh.io import output_notebook

# Kontrola notebook
output_notebook()

kategorie = ["A", "B", "C", "D", "E"]
hodnoty = [10,20,15,25,18]

graf_ciarovy = figure(
    x_range = kategorie,
    title = "Stlpcovy (Vertikalny) graf",
    x_axis_label = "Kategórie",
    y_axis_label = "Hodnoty",
    width = 800,
    height = 400
)

graf_ciarovy.vbar(x = kategorie, top = hodnoty, width=0.5)

show(graf_ciarovy)

In [58]:
from bokeh.plotting import figure, show
from bokeh.io import output_notebook

# Výstup do notebooku
output_notebook()

# Dáta
x = [1, 2, 3, 4, 5]
y = [6, 7, 2, 4, 5]
sizes = [10, 20, 30, 40, 50]

# Vytvorenie grafu
p = figure(
    title="Bodový graf", 
    x_axis_label='X', 
    y_axis_label='Y'
)

# Pridanie bodov
p.scatter(x, y, size=sizes, legend_label="Body", fill_color="red")

# Zobrazenie grafu
show(p)

# Stlpcove Grafy

In [73]:
from bokeh.plotting import figure, show
from bokeh.io import output_notebook
from bokeh.models import HoverTool, ColumnDataSource
from bokeh.transform import factor_cmap
from bokeh.palettes import Spectral5


output_notebook()

kategorie = ["Najom", "Potraviny", "Doprava", "Zabava", "Oblecenie"]
vydavky = [500, 250, 100, 150, 80]

# Zoradovanie dat podla vydavkov
data_zoradene = sorted(zip(kategorie, vydavky), key= lambda x : x[1], reverse = False)

# Rozbalenie zoradenych dat
kategorie, vydavky = zip(*data_zoradene)


# Vytvorit zdroj udajov
zdroj = ColumnDataSource(data = dict(kategorie = kategorie, vydavky = vydavky))

graf_stlpcovy = figure(
    x_range = kategorie,
    title = "Mesacne vydavky",
    height = 400,
    width = 800
)

graf_stlpcovy.vbar(
    x = "kategorie", 
    top = "vydavky",
    width = 0.5,
    source = zdroj,
    fill_color = factor_cmap("kategorie", palette = Spectral5, factors = kategorie)
)

hover = HoverTool()
hover.tooltips = [("Kategorie", "@kategorie"), ("Vydavky", "@vydavky")]

graf_stlpcovy.add_tools(hover)

show(graf_stlpcovy)



In [84]:
from bokeh.plotting import figure, show
from bokeh.io import output_notebook
from bokeh.models import HoverTool, ColumnDataSource
from bokeh.transform import linear_cmap
from bokeh.palettes import Magma7


output_notebook()

dni = ["Pondelok", "Utorok", "Streda", "Stvrtok", "Piatok", "Sobota", "Nedela"]
teploty = [15, 17, 14, 18, 21, 22, 19]

zdroj = ColumnDataSource(
    data = dict(
        dni = dni,  
        teploty = teploty)
)

# Vytvorenie farebne mapovanie podla teploty
color_mapper = linear_cmap(
    field_name="teploty", 
    palette=Magma7,
    low = min(teploty),
    high = max(teploty)
)

graf_stlpcovy_teploty = figure(
    x_range = dni,
    title = "Teploty pocas tyzdna"
)


graf_stlpcovy_teploty.vbar(
    x = "dni",
    top = "teploty",
    width = 0.7,
    source = zdroj,
    fill_color = color_mapper
)

graf_stlpcovy_teploty.xgrid.grid_line_color = None
graf_stlpcovy_teploty.y_range.start = 0
graf_stlpcovy_teploty.y_range.end = 30

show(graf_stlpcovy_teploty)

# Ciarove grafy

In [98]:
from bokeh.plotting import figure, show
from bokeh.io import output_notebook
from bokeh.models import ColumnDataSource, DatetimeTickFormatter
import pandas as pd

# Výstup do notebooku
output_notebook()

# Dáta pre celý rok 2024
data = {
    'dni': pd.to_datetime(['2024-01-02', '2024-02-15', '2024-03-10', '2024-04-20', '2024-07-10', '2024-10-12']),
    'cena': [150.25, 160.37, 158.12, 172.88, 191.75, 164.33]
}
df = pd.DataFrame(data)

# Vytvorenie zdroja dát
source = ColumnDataSource(df)

graf_ciarovy_google = figure (
    title = "Vyvoj ceny akcii Google (Aplhabet Inc) 2024",
    x_axis_label = "Datum",
    y_axis_label = "Cena akcii v USD",
    tools = "pan, box_zoom, reset",
    x_axis_type = "datetime"
)

graf_ciarovy_google.xaxis.formatter = DatetimeTickFormatter(
    days="%d.%m.%Y",
    months = "%b %Y",
    years = "%Y"
)

graf_ciarovy_google.line(
    x = "dni",
    y = "cena",
    source = source,
    line_width = 3,
    color = "green",
    legend_label = "Cena akcii Google"
)

graf_ciarovy_google.legend.location = "top_left"
graf_ciarovy_google.grid.grid_line_alpha = 0.5

show(graf_ciarovy_google)

# Mapy

In [116]:
from bokeh.plotting import figure, show
from bokeh.io import output_notebook
from bokeh.models import ColorBar, LinearColorMapper
import numpy as np

output_notebook()

# Teploty 0-40 stupnov
data = np.random.rand(10, 10) * 40

# Farebne mapovanie so farbonou skalou Inferno256
mapper = LinearColorMapper(
    palette= "Inferno256",
    low = data.min(),
    high = data.max()
)

# Vytvorenie heatmap
heatmap = figure(
    title = "Heatmap teplotne data",
    x_range = (0, 10),
    y_range = (0, 10),
    toolbar_location = None
)

heatmap.image(
    image = [data],
    x = 0,
    y = 0,
    dw = 10,
    dh = 10,
    color_mapper = mapper
)

color_bar = ColorBar(
    color_mapper = mapper,
    location = (0, 0),
    title = "Teplota v C"
) 

heatmap.add_layout(color_bar, "right")

show(heatmap)

In [119]:
from bokeh.io import output_notebook, show
from bokeh.plotting import figure
from bokeh.tile_providers import Vendors
from bokeh.models import ColumnDataSource
import numpy as np

# Zobrazíme výstup priamo v Jupyter notebooku
output_notebook()

# Definícia súradníc slovenských miest (lat a lon)
slovak_cities = {
    'mesto': ['Bratislava', 'Košice', 'Prešov', 'Žilina', 'Nitra', 'Banská Bystrica', 'Trnava'],
    'lat': [48.14816, 48.716385, 49.000, 49.223, 48.306, 48.738, 48.377],
    'lon': [17.10674, 21.261074, 21.239, 18.742, 18.086, 19.149, 17.588]
}

# Prevod geografických súradníc (lat, lon) na meter (potrebné pre použitie v Bokeh mapách)
def wgs84_to_web_mercator(lat, lon):
    k = 6378137
    x = lon * (k * np.pi / 180.0)
    y = np.log(np.tan((90 + lat) * np.pi / 360.0)) * k
    return x, y

merc_x, merc_y = wgs84_to_web_mercator(np.array(slovak_cities['lat']), np.array(slovak_cities['lon']))

# Zdroj dát pre mapu
source = ColumnDataSource(data=dict(lat=merc_y, lon=merc_x, mesto=slovak_cities['mesto']))

# Vytvorenie mapy
p = figure(
    title="Mapa slovenských miest", 
    x_range=(merc_x.min()-100000, 
    merc_x.max()+100000),
    y_range=(merc_y.min()-100000, 
    merc_y.max()+100000), 
    x_axis_type="mercator", 
    y_axis_type="mercator"
)

# Pridanie dlaždicovej mapy (napríklad CARTODBPOSITRON alebo OSM)
p.add_tile(Vendors.CARTODBPOSITRON)

# Pridanie bodov do mapy
p.circle(
    x='lon', 
    y='lat', 
    size=20, 
    fill_color="blue", 
    fill_alpha=0.8, 
    source=source
)

# Zobrazenie grafu
show(p)