# Jupyter notebook

Prostředí, ve kterém se právě nachízíme, se nazývá **jupyter notebook**. Jedná se o interakivní intepretované prostředí a je ve své podstatě (notně) vylepšeným příkazovým řádkem. Přestože ho tak lze používat, notebook tedy není skript v pravém slova smyslu, ale spíše kolekcí bloků kódu (cells), jež lze spouštět v libovolném pořadí. To zvyšuje interaktivitu výuky a zjednodušuje testování nových myšlenek, zároveň ovšem komplikuje debugování a není příliš vhodné pro produkční nasazení.

Kakždá buňka má dva módy:
1. editační
2. příkazový

Do **editačního módu** se dostaneme označením buňky a stisknutím `enter`, příp. dvojkliknutím dovnitř.

Do **příkazového módu** se pak dostaneme např. stisknutím `escape` nebo spuštěním kódu buňky pomocí `ctrl + enter`.

Kromě editačního a příkazového módu jupyter ve výchozím nastavení podporuje tři základní typy buněk, mezi nimiž lze přepínat v příkazovém módu.

| typ buňky | klávesa | popis |
| :--- | :---: | :--- |
| **python** | `y` | jupyter bude považovat buňku za python kód |
| **markdown** | `m` | po spuštění se buňka zformátuje dle pravidel jazyka [markdown](https://www.markdownguide.org/basic-syntax/) |
| **raw** | `r` | nelze spustit, jupyter obsah nijak nezpracuje |

Pokud se nacházíme v příkazovém režimu, lze vytvořit novou buňku *za* aktuálně označenou zmáčnkutím `b`. Výchozím typem buňky je python kód.

In [None]:
print('hello jupyter')

## Našeptávač

Doplňování kódu v jupyter notebooku funguje na stisk `tab`. Např. `"pr" --> tab` nabídne možnosti začínající na `"pr"`, přičemž první bude `print`.

Nápovědu a dokumentaci k funkcím lze zobrazit pomocí `shift + tab`. Kombinaci lze zmáčknout jednou či vícekrát za sebou:
- 1x ... jednoduché zobrazení parametrů
- 2x ... zobrazí parametry i dokumentací funkce
- 3x ... dtto, ale nezmizí při posunu kurzoru
- 4x ... zobrazí dokumentaci funkce v samostatném okně

## Zobrazení výstupu buňky

Jupyter notebook zobrazuje výstup pod buňkou, která byla spuštěna. Kromě explicitního výstupu určeného kódem, tedy např. funkcí `print`, zároveň zobrazuje výstup (hodnotu) *posledního* příkazu buňky.

In [None]:
# zobrazi vysledek pouze druhe operace
3 + 3
2 ** 5

Toto chování lze zablokovat středníkem, podobně jako v MATLABu.

In [None]:
# nezobrazi nic, protoze posledni prikaz je zakoncen strednikem
3 + 3
2 ** 5;

## Odkazy pro práci s jupyter notebook

To je prozatím vše, co budeme potřebovat. Další informace najdete např. na následujících odkazech.

Stručný přehled zkratek: https://www.cheatography.com/weidadeyue/cheat-sheets/jupyter-notebook/

Zkratky a další užitečné tipy pro práci s notebookem: https://www.dataquest.io/blog/jupyter-notebook-tips-tricks-shortcuts/

# Knihovna numpy

Knihovna [numpy](https://www.numpy.org/) slouží pro numerické výpočty s vektory, maticemi a tensory. Je součástí distribuce Anaconda a není tedy třeba ji doinstalovávat. Importuje se obvykle takto:

In [None]:
import numpy as np

## numpy vs MATLAB

Numpy má velice podobné API jako MATLAB. Nalezneme zde většinu známých funkcí jako `zeros`, `ones`, `randn` apod. a mají téměř shodné chování. Všechny matice, vektory, i vícerozměrné tensory v numpy jsou typu `numpy.ndarray` (*n*-dimenzionální pole). Incializují se podobně jako v MATLABu:

In [None]:
# vektor 3 nul, vychozi dat. typ je double (float64)
np.zeros(3)

In [None]:
# vektor 4 jednicek a typu 8-bit integer
np.ones((4,), dtype=np.uint8)

Numpy se MATLABu velice podobá, ale několik rozdílů najdeme. Už v předcházejícím příkladu se chová jinak. V MATLABu by totiž příkaz `zeros(3)` namísto vektoru 3 nul vytvořil 3x3 *matici* nul.

### Rozdíl: dimenzionalita vektorů a matic

Zřejmě nejásadnějším rozdílem mezi MATLABem a numpy je, že **v numpy jsou vektory jednorozměrné pole**, zatímco v MATLABu jsou to matice s jedním řádkem či sloupcem.

In [None]:
a = np.ones((3, ))
a

In [None]:
a.shape

Atribut `.shape` je `tuple` udávající velikost tensoru v jednotlivých rozměrech (dimenzích). Vektor je proto "1-tice", jelikož má pouze jeden rozměr. Matice bude mít dvojici (2-tici) čísel značící počet řádků, resp. sloupců. Tu musíme zadat i při vytváření např. pomocí funkcí `zeros` či `ones`.

In [None]:
# matice s 3 radky a 2 sloupci na nuly:
A = np.zeros((3, 2))
A

In [None]:
A.shape

In [None]:
a.reshape(1, 3)

V numpy je drobná nekonzistence, kdy funkce jako zeros či ones přebírají rozměry jako `tuple`, zatímco `rand` a `randn` postupně jako argumenty funkce. `np.random.randn((3, 2))` tedy nebude fungovat. Inicializovat musíme následovně:

In [None]:
# nahodne hodnoty z gaussovskeho (normalniho) rozlozeni
np.random.randn(3, 2)

In [None]:
# nahodne hodnoty z rovnomerneho rozlozeni (na konci neni n) 0 ... 1
np.random.rand(3, 2)

### Rozdíl: manuální inicializace

Manuální inicializace se namísto hranatých závorek a středníků provádí příkazem `np.array`. Funkce převezme standardní pythonovské pole a automaticky ho převede na `np.ndarray`.

In [None]:
a = np.array([7, 6, 1, 5, 3, 4, 2, 1, 2, 8, 9])
a

Při manuální iniclizaci 2D matic se do funkce `np.array` zadává pole polí, kde každé vnořené pole musí mít stejnou velikost.

In [None]:
# matice 2x3
A = np.array([
    [1, 4, 2.],
    [5, 3, 6],
])

print(A.shape, A.dtype)
print(A)

### Rozdíl: přístup k prvkům

Dalším zásadním rozdílem oproti MATLABu je, že **numpy indexuje od nuly**, zatímco MATLAB od jedničky.

In [None]:
a[0], a[1], a[2]

Tzv. slicing, aneb přístup k více prvkům najednou.

In [None]:
# prvni 3 prvky, tj. prvky s indexy 0, 1, a 2; posledni (index 3) NENI zahrnut
a[:3]

In [None]:
# od 7 (tedy od 8. prvku) dale
a[7:]

In [None]:
# od 2 do predposledniho po 3 (vsimneme si -1)
a[2:-1:3]

In [None]:
# vsechny, ale pozpatku
a[::-1]

In [None]:
# manualni vyber
a[[2, 3, 0, 6, -1]]

U matic je podobně jako v MATLABu **první souřadnice vždy řádek, druhá sloupec**.

In [None]:
# druhy radek, treti sloupec
A[1, 2]

V Pythonu lze indexovat i od konce tak, že použijeme záporné znaménko. Numpy tuto funkcionalitu také implementuje.

In [None]:
# druhy radek, druhy sloupec (matice je 2x3)
A[-1, 1]

Pokud vybereme řádek či sloupec, bude výsledek vektor a tudíž jednorozměrný. **Nezachová tedy "sloupcovost".**

In [None]:
# cely druhy sloupec
A[:, 1]

Při výběru nemusíme vždy specifikovat indexy pro všechny dimenze:

In [None]:
# prvni radek matice A = ekvivalent A[0, :]
A[0]

### Rozdíl: náhled vs kopie

V numpy se při indexování defaultně vrací *náhled* do pole, nikoliv kopie. Pokud tedy něco změníte, změna se projeví i v původním poli. Např.:

In [None]:
row = A[0, :]  # row je pouze nahled, nikoliv kopie radku
row[-1] = 10   # posledni element je zmenen i v puvodni matici
A

Pokud tedy **nechceme** modifikovat původní matici, musíme zavolat metodu `.copy()`.

In [None]:
row = A[0, :].copy()  # vytvori kopii
row[-1] = 20
A

Jen pro pořádek, v následujícím problém s náhledem nenastane.

In [None]:
row = A[0, :]
row = np.random.randn(2)
A

První řádek se nezmění, protože proměnné `row`, která je jako všechny proměnné v Pythonu pouhou referencí, byl prostě jen přiřazen nový objekt, který bude cílem odkazu. S původními hodnotami se tedy nijak nemanipulovalo. Přepisu celého řádku dosáhneme např. takto:

In [None]:
# to same jako `R[0, :] = np.random.randn(2)`
row = A[0, :]
row[:] = np.random.randint(10, size=3)
A

**Náhled vrací numpy i jako výsledek funkcí téměř kdykoliv to jde**, tj. např. i `.reshape()` či `.ravel()`.

In [None]:
A_ravel = A.ravel()
A_ravel

In [None]:
A_ravel[0] = -1
A

Ale ne vždy, např. funkce `flatten()` je definovaná tak, aby vždy vracela kopie.

In [None]:
A_flat = A.flatten()
A_flat[0] = -2
A

# Knihovna PyTorch

PyTorch **nahrazuje numpy** pro práci s tensory a přidává navíc vlastní funkcionalitu, především:
1. automatický výpočet gradientu pro zpětnou propagaci
2. a akceleraci výpočtů na grafické kartě.

PyTorch bohužel nezachovává API a některé funkce mají jiný název než jejich ekvivalenty v numpy. Zde je dobré zmínit, že existují i další knihovny, které numpy API implementují beze změn a slouží tedy jako jeho přímá náhrada. Mezi nejznámější takové projekty patří [cupy](https://github.com/cupy/cupy), který je spjat s knihovnou pro neuronové sítě [chainer](https://github.com/chainer/chainer) (již nevyvíjenou), a [jax](https://github.com/google/jax) vyvíjený Googlem. Tyto nástroje však zatím nedosáhly takové popularity jako PyTorch a proto se jimi nebudeme dále zabývat.

**Pozn.:** zkontrolujte verzi PyTorch; měla by být $\ge$ 1.0.

In [None]:
import torch
torch.__version__

## Porovnání s numpy

Jak bylo zmíněno, pytorch neimplementuje numpy API, ale svoje vlastní. Spíše než numpy se pytorch snaží blížit MATLABu. Mezi pytorch a numpy knihovnami je však i velký překryv, viz následující. Přehled rozdílů naleznete na: https://github.com/wkentaro/pytorch-for-numpy-users.

Podobně jako v numpy je vše `ndarray`, v pytorch je základním kamenem třída `Tensor`. Velmi se `numpy.ndarray` podobá: má atributy `.shape` a `.dtype` se shodným významem. Podporuje také konverzi mezi a numpy a pytorch a to oběma směry.

In [None]:
T = torch.ones(3)
T

In [None]:
T.shape, T.dtype

Atribut `.shape` je typu `torch.Size`, ale pro běžné potřeby se chová stejně jako `tuple`. Všimněme si rovněž, že výchozím typem (datatype, dtype) je `float32`. Je tomu tak kvůli potenciální akceleraci na GPU, kde se kvůli efektivitě pracuje právě se single precision namísto double, jak tomu je v numpy.

In [None]:
# pozadovany tvar matice neni `tuple` ani `list`, ale seznam parametru
torch.zeros(2, 3, dtype=torch.int)

In [None]:
torch.randn(3, 2)

## Přístup k prvkům

Přístup k prvkům je shodný s numpy.

In [None]:
T = torch.arange(12).reshape(4, 3)
T

In [None]:
T[1, 2]

In [None]:
T[:, 1]

In [None]:
T[1]

In [None]:
# vice radku najednou
T[[1, 3]]

In [None]:
# -1 ... indexovani od konce jako v numpy
T[:, [1, -1]]

## Konverze numpy $\leftrightarrow$ pytorch

In [None]:
arr = np.arange(12).reshape(3, 4)
arr

In [None]:
# vysledny tensor ma SDILENOU PAMET!
ten = torch.from_numpy(arr)
arr[0, 0] = -1
ten

In [None]:
# konverze zept do numpy: opet SDILENA PAMET!
ten.numpy()

In [None]:
# numpy --> pytorch: bez sdileni pameti (deep copy)
ten = torch.tensor(arr)
arr[0, 0] = -2
ten

In [None]:
# pytorch --> numpy: bez sdileni pameti (deep copy)
np.array(ten)

## Náhled vs kopie

PyTorch má podobně jako numpy rád náhledy, ne kopie. K vytvoření kopie zde slouží metoda `.clone()`.

In [None]:
ten_ = ten
ten_.data_ptr() == ten.data_ptr()

In [None]:
ten_ = ten.clone()
ten_.data_ptr() == ten.data_ptr()

In [None]:
ten.flatten().data_ptr() == ten.data_ptr()

In [None]:
ten.reshape(4, 3).data_ptr() == ten.data_ptr()

## Násobení matic a vektorů

Zatímco v numpy je stěžejní operací `np.dot`, která umí pracovat i vícerozměrnými poli, v pytorchi je operací pro násobení matic a vektorů více.

- `torch.dot` ... pouze násobení vektorů, tj. jednorozměrných vstupů. Pokud je vstup vícerozměrný, je "zploštěn" na vektor funkcí jako u `flatten()`
- `torch.mm` ... násobení 2D matic. Nepodporuje 1D a více-D vstupy.
- `torch.bmm` ... dávkové násobení matic. Oba vstupy jsou 3D, stejně dlouhé "seznamy" matic, které tvoří dvojice pro vynásobení `torch.mm`.
- `torch.matmul` ... funkce, která automaticky provede jednu z předchozích variant v závislosti na rozměru vstupů. Tato funkce se chováním nejvíce podobá `np.dot`, **ale není její ekvivalent**.

In [None]:
a = torch.tensor([2, 3, 4])
b = torch.tensor([5, 3, 1])

**Vektor x vektor:**

In [None]:
# operace 2*5 + 3*3 + 4*1
torch.dot(a, b)

**Matice x vektor:**

In [None]:
A = torch.tensor([
    [2, 3, 4],
    [-1, -2, -3]
])

In [None]:
# dva radky:
# 2*5 + 3*3 + 4*1 = 23
# (-1)*5 + (-2)*3 + (-3)*1 = -14
torch.mm(A, b.reshape(-1, 1))  # oba parametry musi byt min. 2D, proto transpozice `reshape` na sloupcovy vektor

**Matice x matice**:

Všimněme si, že musí sedět rozměry tak, aby šlo matice násobit! Jelikož je druhý operand dvourozměrný, musí být původní vektor (5, 3, 1) zapsán skutečně jako sloupec. Druhý sloupec pak je (-4, -2, 0).

In [None]:
B = torch.tensor([
    [5, -4],
    [3, -1],
    [1, 0]
])

In [None]:
torch.mm(A, B)

**Použití funkce `matmul`:**

In [None]:
torch.matmul(a, b)

In [None]:
torch.matmul(A, b)

In [None]:
torch.matmul(A, B)

**Operátor `@`**

V Pythonu $\ge$ 3.5 lze použít také operátor `@`, který byl [navržen speciálně](https://www.python.org/dev/peps/pep-0465/) pro násobení matic v knihovnách jako numpy a pytorch. Je implementován metodou `matmul`, kromě syntaxe se od ní tedy nijak neliší.

In [None]:
a @ b

In [None]:
A @ b

In [None]:
A @ B