
# Práce s Jupyter notebooky


# Co je Jupyter a IPython?

<img src="https://upload.wikimedia.org/wikipedia/commons/3/38/Jupyter_logo.svg" style="width: 250px;"/>

Jupyter notebook je webová aplikace pro interaktivní programování, zaznamenávání, vizualizaci a prezentace výsledků. Typicky se používá při analýze dat, problémech počítačového vidění, ale také pro matematické úkoly a třeba i trénovaní neurónových sítí.

Jupyter je platforma kolem Jupyter notebooku, která se kromě notebooku stará o různá rozšírení, kolaboraci a nasazení do různých prostrředí. Více detailů na webu [jupyter.org](https://jupyter.org)

Jupyter vznikl jako nadstavba nad IPython notebook, který v "data" světě začali používat také programátori v Julii a Rku. Proto Ju(lia) - Py(thon) - e(R) = Jupyter.

V Jupyter notebooku se používají dva typy buněk — textové a kód. Kód je v našem případe Pythoní, no ve standardní instalaci Jupyteru je možné přepnout na jazyk Julia a nebo R. Existují také rozšíření do pro další jazyky.

Kromě kódu a text v markdownu je možné použít HTML a zpouštět také systémové příkazy.

## Zkratky

Jupyter rozlišuje dva módy - **Command** a **Edit**. V Command módu jsou jedno a více-písmenové zkratky na zrychlení práce pro úpravu buněk, evaluaci a pod.

- přístup ke všem příkazům `CTRL`+`SHIFT`+`P`


- přepnutí mezi módy Command -> Edit `ENTER`


- přepnutí mezi módy Edit -> Command `ESC`


- šipky zaručí pohyb mezi buňkami


- vložení buňky
  - `A` nad aktuální
  - `B` pod aktuální
  - `SHIFT`+`M` spojení buňek


- zmazání buňky `d d`


- změna typu buňky
  - `M` markdown
  - `Y` code
  - `1` nadpis 1
  - `2` nadpis 2


- evaluace
  - `SHIFT`+`ENTER` evaluace aktuální buňky
  - `CTRL`+`ENTER` evaluace označených buněk

## IPython triky

- magické příkazy
  - load externého skriptu (třeba s definicemi funkcí)
  - interaktivní matplotlib
  - timing
  - html
  - aliasy, makra, debugger, pip, conda
  - celý seznam [v dokumentaci](https://ipython.readthedocs.io/en/stable/interactive/magics.html)


- snapshoty a uložení výsledků

- nápověda příkazem `?`

In [2]:
%%html
<!-- ukázka magického příkazu a html v notebooku -->

<div>
  <b>HTML v notebooku:</b>
  <br />
  <div style="height: 200px; width: 200px; background: #f00"></div>
</div>

## Jupyter extensions

Umožňují rozšíření funkcí notebooku, jako třeba možnosti skrýt bloky textu a kódu, hezky zobrazit určité typy dat, měřit čas evaluaci buňky, a pod.

Instalace:

```
pip install jupyter_nbextensions_configurator jupyter_contrib_nbextensions
jupyter contrib nbextension install --user
jupyter nbextensions_configurator enable --user
```

Ukázka: Codefolding, Collapsible Headings - [Nbextensions](http://localhost:8888/tree#nbextensions_configurator)

## Google Colab

- Jupyter prostředí na steroidech v Google Cloudu
- propojení přes GitHub
- dostupné zdroje na běh zdarma, pro univerzity a výzkum navyše dostupné extra zdroje


- trénovaní NNs na GPU/TPU
  - MNIST + jednoduchá konvoluční neurónová síť


- dotazování na BigQuery datasety
  - počet .js filů ve všetch JS repozitářích na GitHubu
  - zkoumání variantů genómů

In [3]:
%%html
<b>Open in Colab badge:</b>
<a target="_blank" href="https://colab.research.google.com/github/jakubzitny/colab-tests/blob/master/tf-gpu-test.ipynb"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open in Colab" title="Open and Execute in Google Colaboratory"></a>

# Příklady


## Vektor a vypsaní grafu z minulého cvičení

In [None]:
import numpy as np

def generate_vector(start, end, step):
    return np.arange(start, end, step)

start = -4*np.pi
end = 4*np.pi
step = 0.01

x = generate_vector(start, end, step)

In [None]:
# magický příkaz v akci
%matplotlib inline

import numpy as np
import matplotlib.pyplot as plt

y = np.sin(x)
plt.title('Funkce sin(x)')
plt.plot(x, y)

### Systémové příkazy

In [None]:
pwd

In [None]:
# znovu magický příkaz
%cd ..

In [None]:
pwd

In [None]:
cd "H:\\Documents\\bi-svz\\tutorials\\files\\2\\"

In [None]:
alias home cd "H:\\Documents\\bi-svz\\tutorials\\files\\2\\"

In [None]:
home

### Načení obrázku z disku

Vyzkoušíme si načíst obrázek z disku a jednoduché transformace pomocí knihoven matplotlib a OpenCV. V BI-SVZ budeme používat OpenCV hodně, takže je vhodné se s ní seznámit.

Můžete se podívat na široké možnosti knihovny v její [dokumentaci](https://docs.opencv.org/master/). OpenCV je napsaná v C++, proto definice její API je zdokumentovaná taky pro C++. My budeme používat wrapper pro Python (`opencv-python`), který podporuje ty samé funkce.

In [None]:
imgPath = 'images/metal.jpg'

In [None]:
import matplotlib.pyplot as plt
import matplotlib.image as mpimg

img = mpimg.imread(imgPath)
imgplot = plt.imshow(img)

plt.colorbar()
plt.show() 

In [None]:
lum_img = img[:,:,0]
imgplot = plt.imshow(lum_img)
plt.show()

In [None]:
plt.imshow(lum_img, cmap="hot")
plt.colorbar()
plt.show()

In [None]:
plt.hist(img.ravel())
plt.show()

In [None]:
# přes OpenCV (z minulého cvičení)

import cv2
image = cv2.imread(imgPath)

cv2.cvtColor(image, cv2.COLOR_BGR2RGB, image)

plt.imshow(image, interpolation='bilinear')
plt.show()

In [None]:
# histogram

color = ('b','g','r')
for i,col in enumerate(color):
    histr = cv2.calcHist([image],[i],None,[256],[0,256])
    plt.plot(histr,color = col)
    plt.xlim([0,256])
    plt.ylim([0,8000])

plt.show()

# Zdroje pro samostudium

- Python zpracování obrazu — [opencv](https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_imgproc/py_geometric_transformations/py_geometric_transformations.html#geometric-transformations), [tesseract](https://github.com/tesseract-ocr/tesseract)
- Python data a strojové učení — pandas, matplotlib, numpy, scipy, scikit, pytorch, tensorflow
- [Markdown cheatsheet](https://www.markdownguide.org/cheat-sheet)