# Úvod do jazyka Python

Python patří mezi nástroje pro dávkové zpracování dat. V tomto případě se nepostupuje interaktivně jako například v MS Excel, ale uživatel sestaví posloupnost příkazů a interpreter provede tyto příkazy podobně, jako spuštění programu. Výhody jsou následující.

* Možnost pracovat s daty neomezené velikosti.
* Snadná reprodukovatelnost.
* Lepší přehlednost v rozsáhlejších projektech.
* Možnost zařazení datové analýzy jako stavebního kamene delšího řetězce.
* Možnost neomezeného opakování stejné analýzy v cyklu nad jinými daty.

Nevýhoda dávkového zpracování je, že si nemůžeme požadované výstupy zajistit klikáním v menu. Jedná se však o nástroje s širokou uživatelskou základnou a v době kvalitního vyhledávání na Internetu není těžké "vygooglit" na webech s dotazy a odpověďmi příkazy nutné pro kreslení grafů různých typů a další dílčí úkoly spojené se zpracováním dat. Výhodou jsou mnohem větší možnosti, než má Excel. Srovnatelný se skriptováním v jazyce Python je jedině program Matlab, který je na univerzitě dostupný, ale vzhledem k vysoké ceně nebývá dostupný mimo univerzity a mimo velké firmy.

## Ke způsobu práce

* Učíme se na příkladech.
* Začínáme s modifikací hotových modelů. Experimentujte. Zkoušejte příklady z nápovědy, z přednášek a cvičení.
* Model stavíme z hotových bloků, málo modelů píšeme od nuly. Často najdeme podobný problém a ten si přizpůsobíme. Například najdeme obrázek podobný našemu zamýšlenému v [galerii](https://pandas.pydata.org/pandas-docs/stable/user_guide/visualization.html) a odsud vidíme, jaké příkazy a volby je potřeba použít.
* Detaily k nastavení a volbám při volání funkcí hledáme v manuálu. Pro rychlou orientaci slouží [cheatsheety](https://www.datacamp.com/cheat-sheet/category/python).
* Spousta dotazů s kvalitními odpověďmi je na serveru StackExchange nebo jinde. Popište hesly problém ve vyhledávacím políčku Google a zkuste vyhledat podobné dotazy a odpovědi na ně. Totéž s chybovými hláškami, pokud jim nerozumíte.

## Co googlit

Klíčová slova, která se hodí pro dotazy pro vyhledávací službu. Pro potřeby nalezení návodů, tutorilálů, tipů, uživatelského manuálu apod.

|Slovo, fráze|Použití|
|-|-|
|Python|Programovací jazyk, který budeme používat|
|Jupyter, JupterLab|Prostředí, ve kterém budeme Python používat nejčastěji. Prostředí pro práci je mnoho, volíme takové, které nevyžaduje instalaci na lokální PC.|
|NumPy|Knihovna numerické výpočty.|
|SciPy|Knihovna pro řešení diferenciálních rovnic a mnoho dalšího.|
|`solve_ivp`|Příkaz z knihovny SciPy pro řešení diferenciálních rovnic.|
|Matplotlib|Knihovna pro kreslení obrázků, grafů. Nejčastěji použijeme pro vizualizaci výstupu přkazu `solve_ivp`.|
|Pandas|Knihovna pro práci s tabulkami.|
|dataframe|Název pro tabulky používaný při práci s knihovnou Pandas.|

## K syntaxi v jazyce Python

* záleží na mezerách na začátku řádku
   * příkazy tvořící hlavní tělo začínají na začátku řádku
   * bloky uvnitř cyklů a podmínek jsou odsazeny o pevný počet mezer (doporučené jsou čtyři pro jednotlivé úrovně)
* zlom řádku může být uvnitř závorek s argumentem funkce a uvnitř závorek pro seznamy, potom nezáleží na odsazení
* komentáře jsou jednořádkové a uvozeny znakem #
* doporučený styl podle [Style guide](https://peps.python.org/pep-0008/)

In [None]:
pocet_opakovani = 10 # promenne pojmenovavame tak, aby nazev vypovidal o obsahu dat
pocet_velkych_cisel = 0
"""
Při práci nemusíme vypisovat celé jméno proměnné, ale můžeme používat 
doplňování kódu, kdy napíšeme jenom prvních několik písmen a po stisku 
domluvené klávesy (zpravidla tabelátor) se název buď doplní, nebo, 
je-li více variant, se nabídnou možná doplnění pomocí menu.
V tomto textu též vidíte možnost víceřádkových komentářů. Stačí je 
napsat jako víceřádkové řetězce, tj. řetězce uvozené a ukončené třemi 
uvozovkami.
"""
for i in range(pocet_opakovani):
    if i<5:
        # tisk informace o cisle i
        print("Číslo",i,"je malé")
    else:
        print(
            "Číslo",
            i,
            "je velké"
            )
        pocet_velkych_cisel = pocet_velkych_cisel + 1
print(
    "Vyskytlo se celkem",
    pocet_velkych_cisel,
    "velkych cisel"
)        


Všimněte si mimo jiné, že Python počítá a indexuje od nuly, podobně jako JavaScript a některé další jazyky. První položka v seznamu má index nula, druhá jedna atd.

## Aritmetika s čísly

In [None]:
a = 4 # promenna a obsahuje nastavenou hodnotu
b = a + 2  # promenna b bude o dve vetsi nez promenna a
a = b**2   # promenna a se nahradi druhou mocninnou promenne b, promenna b zustava na sve hodnote
a  # tisk hodnoty promenne, vystup posledniho vypoctu se tiskne, neni nutne pouzivat print

Proměnné si udrží hodnoty i v dalších políčkách. V dalším políčku zmenšíme hodnotu $a$ o 30.

In [None]:
a-30

Operace se zapisují běžným způsobem jako například v Excelu, pouze umocňování se označuje dvojicí hvězdiček. Takto vypadá druhá mocnina trojky.

In [None]:
3**2

### Úkol 1

Následující políčko s kódem `1**2 + 2**2 + 3**2 + 4**2`
sčítá druhé mocniny přirozených čísel až do čísla 4. Opravte políčko tak, aby sečetlo druhou mocninu přirozených čísel až do čísla 6.

In [None]:
1**2 + 2**2 + 3**2 + 4**2

A pokud se vám úkol povedl, podívejme se, jak by úlohu řešil zkušenější zpracovatel dat. Následující kód je sice o něco delší, ale dá se snadno modifikovat pro sečtení mnohem obsáhlejšího seznamu čísel.

In [None]:
import numpy as np # nacteni knihovny
data = np.arange(1,7) # vytvoreni seznamu s cisly od 1 do 6
print(data) # tisk pro kontrolu
sum(data**2) # součet druhých mocnin

## Hrátky s textem

Textový řetezec se bere jako seznam znaků a je možné ho ukládat do proměnná, přistupovat k prvnímu nebo poslednímu znaku, k několika prvním nebo několika posledním znakům, ke skupině znaků uprostřed atd. Pozor na to, že Python indexuje od nuly a první znak má tedy index nulový. Pokud je index záporný, znamená to pořadí od konce.

In [None]:
retezec="MENDELU"
retezec

In [None]:
retezec[0]

In [None]:
retezec[-2]

In [None]:
retezec[:4]

In [None]:
retezec[-3:]

In [None]:
retezec[2:4]

In [None]:
retezec + " je prostě " + retezec + "."

In [None]:
veta = "".join([retezec," je prostě ",retezec,"."])
veta

In [None]:
len(veta)

In [None]:
veta[:-5]

In [None]:
(10*(retezec+"-"))[:-1]

In [None]:
"-".join([retezec for i in range(10)])

In [None]:
"-".join([retezec for i in range(10)]).lower().replace("m","M")

> *Tyto techniky s přístupem k obsahu podle indexu využijeme, když budeme mít data v seznamu a budeme chtít přistupovat například k první nebo poslední hodnotě, nebo k několika prvním či
několika posledním hodnotám.* 

### Úkol 2

* Vložte pod toto políčko klávesou B (nebo pomocí menu) políčko pro vložení příkazů. Můžete také jít na následující políčko a vložit nové políčko klávesou A. Musíte být v příkazovém módu, tj. needitovat žádné pole. Před aktuálním políčkem musí být modrá čára.
* Do proměnné `muj_pokus` uložte řetězec "LDF je nejlepší".
* Určete délku řetězce pomocí funkce `len`.

## Knihovny

Jenom základní funkce jsou v Pythonu přístupny přímo. Další funkce načítáme ve formě knihoven. Pro práci s daty zpravidla nejprve importujeme knihovny pro numeriku, práci s datovými tabulkami a pro kreslení grafů. Přitom používáme pro knihovny obvyklé zkratky, například `np` namísto `numpy`.

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

## Práce se seznamem hodnot

Následující kód ukazuje

* jak se vytvoří seznam zadáním hodnot
* jak se vytvoří nový seznam na základě předchozího seznamu
* jak se vykreslí funkce, pokud máme seznam hodnot pro vodorovnou a svislou osu.

In [None]:
parametry = [0,1,2,4,6,10,15]
seznam = [i**3 for i in parametry]
plt.plot(parametry, seznam, "o-")
print(seznam)

## Práce s poli `np.array`

S poli typu `np.array` se pracuje podobně jako se seznamy ale dokážeme s nimi dělat rovnou matematické operace a zápis je pohodlnější.

In [None]:
# S polem typu array je možné provést většinu matematickcýh operací najednou pro všechny prvky.
# Pole můžeme vygenerovat pomocí prvního a posledního prvku a příkazu np.linspace.
# Jinou možnost pomocí np.array jsme viděli dříve.
N = 1
x = np.linspace(0,N)
y = x**2 
plt.plot(x,y)
plt.grid()

### Úkol 3

Nakreslete graf třetí mocniny na intervalu $(-1,1)$.

In [None]:
# Sem vložte příkazy pro nakreslení grafu funkce x**3 na intervalu od -1 do 1.

### Hollingova funkce

Můžeme nakreslit funkce $$y=\frac{ax}{x+b}$$ pro různé hodnoty $a$. Vyzkoušejte se následující příkazy. Pokuste se modifikovat kód tak, aby kreslil funkci $$y=\frac{ax^2}{x^2+b}.$$ Abyste zachovali i přednastavené příkazy, pole si nejdřív překopírujte.


In [None]:
a_seznam = [1,2,3]
b = 1
x = np.linspace(0,2)
for a in a_seznam:
    plt.plot(x,a*x/(x+b))
plt.legend(a_seznam, title="Hodnota a")

## Tabulky, pandas

In [None]:
x = np.linspace(0,5,1001)
df = pd.DataFrame(index=x)
df["Holling-I"] = np.minimum(x,1)
df["Holling-II"] = x/(x+1)
df["Holling-III"] = x**2/(x**2+1)
df["prumer"] = (df["Holling-I"] + df["Holling-II"] + df["Holling-III"])/3
df.head()

In [None]:
df.plot()

Tabulky je možno použít k operacím se sloupci podobně jako to znáte z Excelu,
ale přehledněji. 

> *Tabulky využijeme k ukládání stejně dlouhých datových řad. Výhodou je, že
> tabulky mají mnoho nástrojů na kreslení, manipulaci se sloupci a podobně.
> Využijeme u modelů, kde řešením dostaneme časový průběh pro více nastavení. Nemusíme kreslit každou křivku samostatně, ale nakreslíme je jedním příkazem.*

## Dva obrázky pod sebou, data z tabulky

Někdy chceme nakreslit do jednoho obrázku dvě funkce se společným definičním
oborem, ale značně rozdílnými funkčními hodnotami. Řešením je buď nakreslit
obrázky pod sebe a se sdílenou vodorovnou osou (viz níže), nebo nakreslit do
jednoho obrázku obě funkce, ale každou s jiným měřítkem na svislé ose, tedy
použít v jednom obrázku dvě svislé osy (viz Google a hesla `matplotlib` a `twinx`).

In [None]:
# Tisk začátku tabulky pro kontrolu
print(df.head())

# vykresleni dat do obrazku
ax = df[["Holling-II","Holling-III"]].plot(subplots=True)

# # dekorace grafu
ax[0].grid() # vykresleni mrizky
ax[1].grid() # vykresleni mrizky
