# Python Data, 2025

---

* [Prezentace](https://docs.google.com/presentation/d/1v5WVcslwtmLhXUnRaYXsh3DvK_oU1kSfmgxhNgPY0hM/edit?usp=drive_link),
* [Úvod k datům](#Úvod-k-datům),
* [pracovní prostředí](#Pracovní-prostředí),
* [příkazový řádek, ipython](#Příkazový-řádek),
    - [dokumentace](#Nápověda,-ipython),
    - [zdrojový kód](#Zobraz-zdroj),
    - [našeptávání](#Našeptávání).
* [notebook, systémové příkazy](#Systémové-příkazy),
* [notebook, magické příkazy](#Magické-příkazy),
    - [spusť skript](#Spusť-soubor),
    - [změř průběh](#Stopuj-průběh),
    - [debugging](#Debugování),
    - [profilování](#Profilování),
    - [použití paměti](#Využití-paměti),

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse1.mm.bing.net%2Fth%3Fid%3DOIP.bQLV3m2t29a0dfG9qnVMgwHaHa%26pid%3DApi&f=1&ipt=b73c31ec28f2f95373feda2df32b17cdefb18fde0965d876db76a69bd8c03fba&ipo=images" width="120" style="margin-left:auto; margin-right:auto"/>

## Úvod k datům

---



Jak roky přibývají a technologie se neustále zlepšuje, neustále roste potřeba sbírat a uchovávat informace.

Naprostá většina předních firem ví, jakou cenu mají data. Ty menší si to začínají uvědomovat.

### Kdo to má hlídat

---

Také proto roste poptávka po lidech, kteří **dovedou s daty zacházet**.

Pozice, které jsou jakkoliv spojované s daty jsou obory jako:
* data **analyst**,
* data **engineering**,
* data **science**.

Kdy každá z pozic výše má svoje specifikace.

### Jak pracovat s daty

---

Informace, nebo také data, je proto potřeba řádné **spravovat a obsluhovat**.

Nástroje pro takovou činnost mají různou podobu, ale obecně se potřebuješ soustředit na tyto oblasti:

<img src="https://i.imgur.com/XwMu9Oq.png" width="900" style="margin-left:auto; margin-right:auto"/>

* **data samotná**, kde je vezmeš a v jaké podobě,
* **prostředí**, kde můžeš s daty pracovat,
* **technologie**, které ti umožní s daty pracovat.

### Cíle školení

---

Cílem kurzu **není** řešit dopodrobna **povahu nebo náplň** jakékoliv z výše vypsaných pozic.

Budeš se věnovat založení **solidních znalostí**, která všechny tyto odvětví, pracující s daty, spojuje. 

Než se ale vůbec začneš učit nástroje, bude vhodné, seznámit tě **s prostředími**, kde následně budeš moct s těmito nástroji pracovat.

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse3.mm.bing.net%2Fth%3Fid%3DOIP.H2BkU9bqGfzRSMZ3S3Sx0QHaHa%26pid%3DApi&f=1&ipt=4cf9116d27fba72ce0224dba99b4ff36a1867aa0351c892e1c8ede5793e267e7&ipo=images" width="120" style="margin-left:auto; margin-right:auto"/>

## Pracovní prostředí

---

<img src="https://i.imgur.com/OjMPaZT.png" width="900" style="margin-left:auto; margin-right:auto"/>

Konkrétních variant je více, ale jako chvalitebný všeobecný základ můžeš použít následující:
1. **Interpret** `python`, **interaktivní interpret** `IPython`, jednoduché, všude dostupné prostředí,
2. **editor**/**IDE** `pycharm`, nástroj pro rozsáhlejší činnost, tvorba skriptů, modulů, balíčků,
3. **Hub**/**Notebooky** `jupyter`, nástroj pro jednodušší vizuální a analytickou část,
4. **(pokročilé)** kontejnery `docker`, možnost nastavení vlastního "pracovního stolu".

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse1.mm.bing.net%2Fth%3Fid%3DOIP.KbBPoDRtOSRt9UfoXNQHNgHaHa%26pid%3DApi&f=1&ipt=d38af54cd32cc45e5aa344d10d1f63e2c1dfc03488007104ea842a7bb1f41e5d&ipo=images" width="120" style="margin-left:auto; margin-right:auto"/>



## Příkazový řádek

---

Prvním velkým pomocníkem je obyčejný **příkazový řádek**.

Nehledě na tvůj vlastní operační systém (dále jen OS).

<br>

Kromě klasické rychlé navigace a obsluhy můžeš i v rámci Pythonu využít:
* *interpret* `python`,
* *interaktivní interpret* `ipython`.

Ačkoliv jsou tato prostředí jednoduchá, přesto jsou velmi **všestranná a nápomocná**.

Jejich hlavní síla spočívá **v přenositelnosti**.

<br>

Ne všude budeš mít k dispozici nějaké **grafické prostředí** (~*graphical user interface*, dále jen GUI).

<br>

Instalaci *interaktivního interpreta* `ipython` je možné provést pomocí příkazu:

In [None]:
!pip install ipython

<br>

..s následnou kontrolou pomocí výpisu verze **IPythonu**:

In [None]:
!ipython --version

<br>

Pokud chceš používat přímo *Hub* nebo Notebooky, stačí nainstalovat:

In [None]:
!pip install jupyter

..a `ipython` se ti nainstaluje automaticky také.

Pomocné prvky `ipython`, které si projdeš:
* nápověda,
* zdrojový kód,
* našeptávání,
* systémové příkazy.

<br>

### Nápověda, `ipython`

V rámci obyčejného *interpreta* můžeš pracovat s nápovědou pomocí funkce `help()`:

In [None]:
help(list.copy)

<br>

U *interaktivního interpreta* můžeš používat nápovědů také a daleko elegantněji:

In [1]:
list.copy?

[31mSignature:[39m list.copy(self, /)
[31mDocstring:[39m Return a shallow copy of the list.
[31mType:[39m      method_descriptor

K tomu ti postačí za libovolný výraz dopsat otazník `?`.

Výsledek bude praktický stejný s tím, že podle verze IPythonu se místo textového výstupu objeví **vyskakovací okno**.

In [2]:
len?

[31mSignature:[39m len(obj, /)
[31mDocstring:[39m Return the number of items in a container.
[31mType:[39m      builtin_function_or_method

In [3]:
jmena = ["Matouš", "Lukáš", "Marek"]
jmena.append?

[31mSignature:[39m jmena.append(object, /)
[31mDocstring:[39m Append object to the end of the list.
[31mType:[39m      builtin_function_or_method

<br>

Stejně jako funkce `help` můžeš nápovědu používat pro *uživ. funkce*:

In [4]:
import datetime

In [5]:
def vypis_zpravu_s_casem(cas: str, zprava: str) -> str:
    """
    Vrať výstup jako naformátovanou zprávu s aktuálním časem.
    
    :param cas: údaj s časem.
    :type cas: str
    :param zprava: zadaný text.
    :type zprava: str
    
    :Example:
    >>> import datetime
    >>> vypis_zpravu(
    ...     "18:43:15",
    ...     "Ahoj na první lekci"
    ... )
    18:43:15, Ahoj na první lekci
    """
    return f"{cas}, {zprava}"

In [6]:
vypis_zpravu_s_casem(
    datetime.datetime.now().strftime("%H:%M:%S"),
    "Ahoj na první lekci"
)

'11:17:32, Ahoj na první lekci'

In [7]:
vypis_zpravu_s_casem?

[31mSignature:[39m vypis_zpravu_s_casem(cas: str, zprava: str) -> str
[31mDocstring:[39m
Vrať výstup jako naformátovanou zprávu s aktuálním časem.

:param cas: údaj s časem.
:type cas: str
:param zprava: zadaný text.
:type zprava: str

:Example:
>>> import datetime
>>> vypis_zpravu(
...     "18:43:15",
...     "Ahoj na první lekci"
... )
18:43:15, Ahoj na první lekci
[31mFile:[39m      /tmp/ipykernel_17211/1407219951.py
[31mType:[39m      function

Zapisování *docstringů* lze uplatnit při zobrazování dokumentace.

### Zobraz zdroj

Někdy může být nápomocné, získat kromě popisku, také náhled na objekt samotný:

In [8]:
vypis_zpravu_s_casem??

[31mSignature:[39m vypis_zpravu_s_casem(cas: str, zprava: str) -> str
[31mSource:[39m   
[38;5;28;01mdef[39;00m vypis_zpravu_s_casem(cas: str, zprava: str) -> str:
    [33m"""[39m
[33m    Vrať výstup jako naformátovanou zprávu s aktuálním časem.[39m

[33m    :param cas: údaj s časem.[39m
[33m    :type cas: str[39m
[33m    :param zprava: zadaný text.[39m
[33m    :type zprava: str[39m

[33m    :Example:[39m
[33m    >>> import datetime[39m
[33m    >>> vypis_zpravu([39m
[33m    ...     "18:43:15",[39m
[33m    ...     "Ahoj na první lekci"[39m
[33m    ... )[39m
[33m    18:43:15, Ahoj na první lekci[39m
[33m    """[39m
    [38;5;28;01mreturn[39;00m f"{cas}, {zprava}"
[31mFile:[39m      /tmp/ipykernel_17211/1407219951.py
[31mType:[39m      function

<br>

U takových jednoduchých *uživ. funkcí* je zdroj poměrně přímočarý.

U jiných knihoven může být naopak **trochu upovídaný**:

In [11]:
import pandas

In [None]:
pandas.read_csv??

[31mSignature:[39m
pandas.read_csv(
    filepath_or_buffer: [33m'FilePath | ReadCsvBuffer[bytes] | ReadCsvBuffer[str]'[39m,
    *,
    sep: [33m'str | None | lib.NoDefault'[39m = <no_default>,
    delimiter: [33m'str | None | lib.NoDefault'[39m = [38;5;28;01mNone[39;00m,
    header: [33m"int | Sequence[int] | None | Literal['infer']"[39m = [33m'infer'[39m,
    names: [33m'Sequence[Hashable] | None | lib.NoDefault'[39m = <no_default>,
    index_col: [33m'IndexLabel | Literal[False] | None'[39m = [38;5;28;01mNone[39;00m,
    usecols: [33m'UsecolsArgType'[39m = [38;5;28;01mNone[39;00m,
    dtype: [33m'DtypeArg | None'[39m = [38;5;28;01mNone[39;00m,
    engine: [33m'CSVEngine | None'[39m = [38;5;28;01mNone[39;00m,
    converters: [33m'Mapping[Hashable, Callable] | None'[39m = [38;5;28;01mNone[39;00m,
    true_values: [33m'list | None'[39m = [38;5;28;01mNone[39;00m,
    false_values: [33m'list | None'[39m = [38;5;28;01mNone[39;00m,
    skipinitial

A někdy nápověda pomocí `??` nezobrazí vůbec nic.

Důvod je, že objekt, na který chceš vidět nápovědu není v Pythonu zavedený (implementovaný).

Je používaný objekt z jiného jazyku (v případě tohoto *interpreta* v C).

<br>

### Našeptávání

Pokud se ti občas stane, že si nepamatuješ jméno různých objektů, můžeš vyzkoušet nápovědu.

In [12]:
prijmeni = list()

In [13]:
prijmeni.sort()

Stačí napsat jméno objektu, `prijmeni` a tečku.

Následně stačí stisknout klávesu `TAB` a `ipython` ti zobrazovazí **vyskakovací nabídku**.

<br>

Někdy je potřeba doplnit **méně patrnou metodu** nebo **konstantu** *z knihoven třetích stran*:

In [14]:
from collections import namedtuple

In [15]:
mesta = namedtuple("Souradnice", ["delka", "sirka"])

In [None]:
mesta.

<br>

Další pomůckou může být napovídání **při nahrávání** jak knihoven, tak konkrétních modulů:

In [16]:
from itertools import chain

### Systémové příkazy

Další sérií příkazů, které *IPython* a *notebooky* podporují, jsou příkazy **z příkazového řádku** (~*Shellu*).

V tomto případě půjde o skupinu příkazu z OS Linux:

##### Ve kterém adresáři se zrovna nacházím?

In [18]:
!pwd

/home/viegorova/Documents/ENGETO/python-data-2024-master/shared/notebooks


##### Jaké soubory a složky se v aktuálním adresáři vyskytují?

In [20]:
!ls

agg.jpg    arrcreate.png   lesson01.ipynb	     lesson04.ipynb  order.png
arr2.png   block.png	   lesson01_reordered.ipynb  lesson06.ipynb  size.png
arr4.png   empty.png	   lesson02.ipynb	     memory.png      zeros.png
array.png  lesson00.ipynb  lesson03.ipynb	     ndarray.png


##### Jsou tu nějaké skryté soubory?

In [21]:
!ls -a

.	  array.png	  lesson01.ipynb	    lesson06.ipynb  zeros.png
..	  arrcreate.png   lesson01_reordered.ipynb  memory.png
agg.jpg   block.png	  lesson02.ipynb	    ndarray.png
arr2.png  empty.png	  lesson03.ipynb	    order.png
arr4.png  lesson00.ipynb  lesson04.ipynb	    size.png


##### Jaké soubory a složky najdu a složku výše (v rodičovské složce)?

In [22]:
!ls ../

notebooks  onsite


<br>

Grafické prostředí (~*GUI*) *OS* jsou někdy **pohodlnější** a **vizuálně přívětivěší**.

Často jsou ale **pomalé** a postupné přesouvání a **přepínání nepraktické**.

<br>

Proto je velice výhodné, kombinovat symbol `!` a tyto jednotlivé příkazy uvnitř *IPythonu*. 

<br>

V rámci *Notebooku* si konečně můžeš kombinovat **klasickou syntaxi Pythonu** a **příkazy operačního systému**:

In [21]:
aktualni_cesta = !pwd

In [22]:
print(aktualni_cesta)

['/home/viegorova/Documents/ENGETO/python-data-2024-master/shared/notebooks']


In [23]:
print(type(aktualni_cesta))

<class 'IPython.utils.text.SList'>


In [24]:
print(dir(aktualni_cesta))

['__add__', '__annotations__', '__class__', '__class_getitem__', '__contains__', '__delattr__', '__delitem__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getstate__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__module__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'append', 'clear', 'copy', 'count', 'extend', 'fields', 'get_list', 'get_nlstr', 'get_paths', 'get_spstr', 'grep', 'index', 'insert', 'l', 'list', 'n', 'nlstr', 'p', 'paths', 'pop', 'remove', 'reverse', 's', 'sort', 'spstr']


In [25]:
print(aktualni_cesta[0])

/home/viegorova/Documents/ENGETO/python-data-2024-master/shared/notebooks


Ačkoliv jde o jiný datový typ, než obyčejný `list`, přesto můžeš provést klasické indexování a podobné metody jako pro pythonovský `list`.

<br>

In [26]:
dostupne_soubory = !ls -l

In [27]:
print(dostupne_soubory)

['total 1676', '-rw-rw-r-- 1 viegorova viegorova   4401 bře 10 08:27 bonus_venvs.ipynb', '-rw-rw-r-- 1 viegorova viegorova     35 bře  9 11:24 example_magic_run.py', 'drwxrwxr-x 2 viegorova viegorova   4096 bře 10 08:26 img', '-rw-rw-r-- 1 viegorova viegorova 240763 bře 10 08:26 lesson00.ipynb', '-rw-rw-r-- 1 viegorova viegorova 145278 bře 10 08:28 lesson01.ipynb', '-rw-rw-r-- 1 viegorova viegorova  50557 bře  9 11:54 lesson01_old.ipynb', '-rw-rw-r-- 1 viegorova viegorova 121484 pro  2 18:23 lesson02.ipynb', '-rw-rw-r-- 1 viegorova viegorova 233636 pro  2 18:23 lesson03.ipynb', '-rw-rw-r-- 1 viegorova viegorova 138971 pro  2 18:23 lesson04.ipynb', '-rw-rw-r-- 1 viegorova viegorova 746848 pro  2 18:23 lesson06.ipynb', '-rw-rw-r-- 1 viegorova viegorova    246 bře  9 11:59 mprun_test.py', 'drwxrwxr-x 2 viegorova viegorova   4096 bře  9 11:59 __pycache__']


In [28]:
from pprint import pprint

In [29]:
pprint(dostupne_soubory)

['total 1676',
 '-rw-rw-r-- 1 viegorova viegorova   4401 bře 10 08:27 bonus_venvs.ipynb',
 '-rw-rw-r-- 1 viegorova viegorova     35 bře  9 11:24 example_magic_run.py',
 'drwxrwxr-x 2 viegorova viegorova   4096 bře 10 08:26 img',
 '-rw-rw-r-- 1 viegorova viegorova 240763 bře 10 08:26 lesson00.ipynb',
 '-rw-rw-r-- 1 viegorova viegorova 145278 bře 10 08:28 lesson01.ipynb',
 '-rw-rw-r-- 1 viegorova viegorova  50557 bře  9 11:54 lesson01_old.ipynb',
 '-rw-rw-r-- 1 viegorova viegorova 121484 pro  2 18:23 lesson02.ipynb',
 '-rw-rw-r-- 1 viegorova viegorova 233636 pro  2 18:23 lesson03.ipynb',
 '-rw-rw-r-- 1 viegorova viegorova 138971 pro  2 18:23 lesson04.ipynb',
 '-rw-rw-r-- 1 viegorova viegorova 746848 pro  2 18:23 lesson06.ipynb',
 '-rw-rw-r-- 1 viegorova viegorova    246 bře  9 11:59 mprun_test.py',
 'drwxrwxr-x 2 viegorova viegorova   4096 bře  9 11:59 __pycache__']


##### 🧠 CVIČENÍ 🧠, získej jména souborů a datumy poslední otevření pro jednotlivé soubory

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse1.mm.bing.net%2Fth%3Fid%3DOIP.yc6WsKyuODmoJlic69zUeQHaHa%26pid%3DApi&f=1&ipt=d3a1e2a99dd014f3690cccb8875ff686678588a0a9c16af26a1e2e228d71a512&ipo=images" width="120" style="margin-left:auto; margin-right:auto"/>

## Magické příkazy

Mimo klíčové prvky samotného `ipythonu`, můžeš pracovat pomocí tzv. *magických příkazů*.

Magický příkaz zajišťuje další pomocné nástroje v `ipython`.

Magický příkaz zapíšeš/ poznáš pomocí operátoru `%` nebo `%%`, ihned na začátku buňky:

In [None]:
%run

<br>

Základní rozdíl mezi `%` a `%%`:
* `%`, **jednořádkový příkaz** (*~line magics*),
* `%%`, **víceřádkový příkaz** (*~cell magics*).

##### Seznam magických některých defaultních magických příkazů ([zdroj](https://ipython.readthedocs.io/en/stable/interactive/magics.html#))

| Příkaz | Popis | Ukázka | Víceřádková varianta |
| :- | :- | :- | :-: |
| `%run` | spusť mi zadaný soubor | `%run muj_skript.py` | ✅ |
| `%timeit` | změř mi dobu běhu (s pomůckami) | `%timeit <statement>` | ✅ |
| `%time` | změř mi dobu běhu (bez pomůcek) | `%time <statement>` | ✅ |
| `%debug` | zapni *debugger* | `%debug` | ⛔️ |
| `%lsmagic` | zobraz všechny magické příkazy | `%lsmagic` | ⛔️|
| `%magic` | zobraz dokumentaci | `%magic` | ⛔️ |
| `%prun` | profiluj mi ohlášení | `%prun <statement>` | ⛔️ |
| `%mem` | zobraz mi využití paměti | `%mem` | ⛔️ |
| `%load_ext` | načti rozšíření 3tí strany | `%load_ext sql` | ⛔️ |

### Spusť soubor

Časem začneš více experimentovat jak v prostředí *skriptu* (spustitelného souboru), tak v prostředím *notebooku*.

Obzvlášť později se budeš snažit separovat logiku *skriptu* mimo *notebook*.

Pokud budeš chtít **z aktivního notebooku spustit skript**, můžeš použít jednořádkový příkaz `%run`:

In [36]:
%run example_magic_run.py

Hello from IPython magic!


Pokud potřebuješ doladit spuštění souboru, můžeš mrknout na dokumentaci a popis rozšiřujících možností [zde](https://ipython.readthedocs.io/en/stable/interactive/magics.html#magic-run).

### Stopuj průběh

Dalším užitečným *magickým příkazem* je `%timeit`.

Ten se ti bude hodit, pokud budeš potřebat určit délku běhu **jednořádkového příkazu**:

In [42]:
%timeit umocnene_hodnoty = [cislo ** 2 for cislo in range(100)]

9.54 μs ± 520 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)


Výhodou tohoto *jednořádkového magického příkazu* je, že pro krátké příkazy automaticky spouští několikrát.

Tím zajistí **větší množství výsledků** a z nich stanoví průměr, odchylky.

<br>

Pokud zadáš **víceřádkový magický příkaz**, můžeš napočítat průběh pro delší zápis.

Zde můžeš vidět patrný rozdíl mezi iterací **s** a **bez komprehence**:

In [37]:
%%timeit
umocnene_hodnoty = list()

for cislo in range(100):
    umocnene_hodnoty.append(cislo ** 2)

12.8 μs ± 1 μs per loop (mean ± std. dev. of 7 runs, 100,000 loops each)


Oba tyto příkaz se hodí, pokud spouštíš **sérii ohlášení**.

### Debugování

Odstraňovat chybný zápis můžeš také v prostředí `ipythonu` a Notebooků.

Stačí použít jednořádkový příkaz `%debug`:

In [45]:
def vydel_hodnotu_delitelem(hodnota: float, delitel: int) -> float:
    return hodnota / delitel

In [44]:
def del_dvema(*args, delitel: int = 2) -> None:
    for hodnota in args:
         print(vydel_hodnotu_delitelem(hodnota, delitel))

In [46]:
del_dvema(2, 3, 4, 5, 6)

1.0
1.5
2.0
2.5
3.0


In [47]:
del_dvema(2, 3, 4, "5", 6)

1.0
1.5
2.0


TypeError: unsupported operand type(s) for /: 'str' and 'int'

In [48]:
%debug del_dvema(2, 3, 4, "5", 6)

NOTE: Enter 'c' at the ipdb>  prompt to continue execution.
> [32m<string>[39m([92m1[39m)[36m<module>[39m[34m()[39m

1.0
1.5
2.0
[31m---------------------------------------------------------------------------[39m
[31mTypeError[39m                                 Traceback (most recent call last)
[36mCell[39m[36m [39m[32mIn[44][39m[32m, line 3[39m, in [36mdel_dvema[39m[34m(delitel, *args)[39m
[32m      1[39m [38;5;28;01mdef[39;00m[38;5;250m [39m[34mdel_dvema[39m(*args, delitel: [38;5;28mint[39m = [32m2[39m) -> [38;5;28;01mNone[39;00m:
[32m      2[39m     [38;5;28;01mfor[39;00m hodnota [38;5;129;01min[39;00m args:
[32m----> [39m[32m3[39m          [38;5;28mprint[39m([43mvydel_hodnotu_delitelem[49m[43m([49m[43mhodnota[49m[43m,[49m[43m [49m[43mdelitel[49m[43m)[49m)

[36mCell[39m[36m [39m[32mIn[45][39m[32m, line 2[39m, in [36mvydel_hodnotu_delitelem[39m[34m(hodnota, delitel)[39m
[32m      1[39m [38;5;28;01mdef[39

Příkaz `%debug` spustí debugger `pdb`.

Následně si organizuješ průběh stejně jako v prostředí knihovny `pdb`.

### Seznam magických příkazů

Pomocí nápovědy `%lsmagic`, si můžeš nechat vypsat seznam **všech příkazů**:

In [49]:
%lsmagic

Available line magics:
%alias  %alias_magic  %autoawait  %autocall  %automagic  %autosave  %bookmark  %cat  %cd  %clear  %code_wrap  %colors  %conda  %config  %connect_info  %cp  %debug  %dhist  %dirs  %doctest_mode  %ed  %edit  %env  %gui  %hist  %history  %killbgscripts  %ldir  %less  %lf  %lk  %ll  %load  %load_ext  %loadpy  %logoff  %logon  %logstart  %logstate  %logstop  %ls  %lsmagic  %lx  %macro  %magic  %mamba  %man  %matplotlib  %micromamba  %mkdir  %more  %mv  %notebook  %page  %pastebin  %pdb  %pdef  %pdoc  %pfile  %pinfo  %pinfo2  %pip  %popd  %pprint  %precision  %prun  %psearch  %psource  %pushd  %pwd  %pycat  %pylab  %qtconsole  %quickref  %recall  %rehashx  %reload_ext  %rep  %rerun  %reset  %reset_selective  %rm  %rmdir  %run  %save  %sc  %set_env  %store  %sx  %system  %tb  %time  %timeit  %unalias  %unload_ext  %uv  %who  %who_ls  %whos  %xdel  %xmode

Available cell magics:
%%!  %%HTML  %%SVG  %%bash  %%capture  %%code_wrap  %%debug  %%file  %%html  %%javascript  %%

<br>

Pokud potřebuješ detailnější nápovědu, vyzkoušej spíše `%magic`:

In [50]:
%magic


IPython's 'magic' functions

The magic function system provides a series of functions which allow you to
control the behavior of IPython itself, plus a lot of system-type
features. There are two kinds of magics, line-oriented and cell-oriented.

Line magics are prefixed with the % character and work much like OS
command-line calls: they get as an argument the rest of the line, where
arguments are passed without parentheses or quotes.  For example, this will
time the given statement::

        %timeit range(1000)

Cell magics are prefixed with a double %%, and they are functions that get as
an argument not only the rest of the line, but also the lines below it in a
separate argument.  These magics are called with two arguments: the rest of the
call line and the body of the cell, consisting of the lines below the first.
For example::

        %%timeit x = numpy.random.randn((100, 100))
        numpy.linalg.svd(x)

will time the execution of the numpy svd routine, running the assignment 

<br>

### Profilování

Pokud potřebuješ změřit dobu běhu tvého skriptu, můžeš použít *magický příkaz* `%prun`:

In [None]:
from math import pi
from random import choices

In [32]:
def plocha_kruhu(polomer: int) -> int:
    return pi * (polomer ** 2)

In [33]:
def secti_vsechny_plochy(args) -> int:
    """
    Inkrementuj postupně jednotlivé plochy kruhů do celkového výsledku.
    """
    suma_ploch = 0

    for polomer in args:
        suma_ploch += plocha_kruhu(polomer)
    
    return suma_ploch

In [35]:
%prun secti_vsechny_plochy([1.1, 2.2, 3.3, 4.4])

 

         8 function calls in 0.000 seconds

   Ordered by: internal time

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.000    0.000 {built-in method builtins.exec}
        1    0.000    0.000    0.000    0.000 91293611.py:1(secti_vsechny_plochy)
        4    0.000    0.000    0.000    0.000 3963437021.py:1(plocha_kruhu)
        1    0.000    0.000    0.000    0.000 <string>:1(<module>)
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}

In [9]:
%prun secti_vsechny_plochy(choices(range(1, 100), k=1_000_000))

 

         3000007 function calls in 1.225 seconds

   Ordered by: internal time

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.425    0.425    0.635    0.635 random.py:490(<listcomp>)
        1    0.349    0.349    0.587    0.587 91293611.py:1(secti_vsechny_plochy)
  1000000    0.239    0.000    0.239    0.000 3963437021.py:1(plocha_kruhu)
  1000000    0.106    0.000    0.106    0.000 {method 'random' of '_random.Random' objects}
  1000000    0.103    0.000    0.103    0.000 {built-in method math.floor}
        1    0.002    0.002    1.224    1.224 <string>:1(<module>)
        1    0.000    0.000    1.225    1.225 {built-in method builtins.exec}
        1    0.000    0.000    0.635    0.635 random.py:477(choices)
        1    0.000    0.000    0.000    0.000 {built-in method builtins.len}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}

In [10]:
%prun secti_vsechny_plochy(choices(range(1, 100), k=1_000_000))

 

         3000007 function calls in 1.232 seconds

   Ordered by: internal time

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.405    0.405    0.607    0.607 random.py:490(<listcomp>)
        1    0.372    0.372    0.624    0.624 91293611.py:1(secti_vsechny_plochy)
  1000000    0.252    0.000    0.252    0.000 3963437021.py:1(plocha_kruhu)
  1000000    0.103    0.000    0.103    0.000 {method 'random' of '_random.Random' objects}
  1000000    0.099    0.000    0.099    0.000 {built-in method math.floor}
        1    0.001    0.001    1.232    1.232 <string>:1(<module>)
        1    0.000    0.000    1.232    1.232 {built-in method builtins.exec}
        1    0.000    0.000    0.607    0.607 random.py:477(choices)
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}
        1    0.000    0.000    0.000    0.000 {built-in method builtins.len}

Takové chování může být přínosné, ale programátor více ocení pochopitelnější, **názornější výstup pomocí řádků**.

<br>

Musíš si nainstalovat ručně knihovnu `line_profiler`:

In [11]:
!pip install line_profiler

Collecting line_profiler
  Downloading line_profiler-4.2.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (750 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m750.2/750.2 kB[0m [31m2.0 MB/s[0m eta [36m0:00:00[0m00:01[0m00:01[0m
[?25hInstalling collected packages: line_profiler
Successfully installed line_profiler-4.2.0

[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip available: [0m[31;49m22.3.1[0m[39;49m -> [0m[32;49m25.0.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


..následně musíš načíst rozšíření v rámci notebooku.

<br>

Vždy, když instaluješ knihovnu nebo **rozšíření třetích stran**, musíš tuto knihovnu *načíst*.

To provedeš pomocí magického příkazu `%load_ext`, ve formátu:  `%load_ext <jmeno_ext>`

In [12]:
%load_ext line_profiler

<br>

..a nakonec spustíš knihovnu pro jméno funkce a následně konkrétní ohlášení: `%lprun -f <funkce> <funkční_volání>`

In [13]:
%lprun -f secti_vsechny_plochy secti_vsechny_plochy(choices(range(1, 100), k=1_000_000))

Timer unit: 1e-09 s

Total time: 1.12689 s
File: /tmp/ipykernel_19408/91293611.py
Function: secti_vsechny_plochy at line 1

Line #      Hits         Time  Per Hit   % Time  Line Contents
     1                                           def secti_vsechny_plochy(args) -> int:
     2                                               """
     3                                               Inkrementuj postupně jednotlivé plochy kruhů do celkového výsledku.
     4                                               """
     5         1       1053.0   1053.0      0.0      suma_ploch = 0
     6                                           
     7   1000001  237112150.0    237.1     21.0      for polomer in args:
     8   1000000  889778545.0    889.8     79.0          suma_ploch += plocha_kruhu(polomer)
     9                                               
    10         1        324.0    324.0      0.0      return suma_ploch

Čas v **mikrosekundách** ti lépe popíše, ve kterých částech kódu a jak dlouho *interpret* strávil.

### Využití paměti

Stejně jako s časem, můžeš měřit, kolik paměti běh tvého skriptu potřebuje.

Opět bude potřeba, nainstalovat **knihovnu třetí strany**:

In [14]:
!pip install memory-profiler psutil



[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip available: [0m[31;49m22.3.1[0m[39;49m -> [0m[32;49m25.0.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


<br>

Potom tuto knihovnu nahrát v prostředí *notebooku*:

In [15]:
%load_ext memory_profiler

The memory_profiler extension is already loaded. To reload it, use:
  %reload_ext memory_profiler


<br>

Nyní můžeš pomocí magického příkazu tuto knihovnu zapnout:

In [16]:
%memit secti_vsechny_plochy(choices(range(1, 100), k=1_000_000))

peak memory: 99.24 MiB, increment: 0.00 MiB


Pokud je pro tebe tato informace moc obecná a potřebuješ znát využití paměti **v konkrétních místech zápisu**, vyzkoušej magický příkaz `%%mprun`.

<br>

Bohužel, tento magický příkaz **v notebooku nespustíš**.

Musíš jej naimportovat ze souboru. Proto ulož zápis z buňky do souboru pomocí `%%file`:

In [17]:
%%file mprun_test.py
from math import pi

def plocha_kruhu(polomer: int) -> int:
    return pi * (polomer ** 2)

def secti_vsechny_plochy(args) -> int:
    suma_ploch = 0
    for polomer in args:
        suma_ploch += plocha_kruhu(polomer)
    
    return suma_ploch

Overwriting mprun_test.py


<br>

Pomocí mag. příkazu `%%file` vytvořím Pythoní skript, který můžu následně využít:

In [18]:
from mprun_test import secti_vsechny_plochy

In [19]:
%mprun -f secti_vsechny_plochy secti_vsechny_plochy(choices(range(1, 100), k=1_000_000))




Filename: /home/viegorova/Documents/ENGETO/python-data-2024-master/shared/notebooks/mprun_test.py

Line #    Mem usage    Increment  Occurrences   Line Contents
     6     99.3 MiB     99.3 MiB           1   def secti_vsechny_plochy(args) -> int:
     7     99.3 MiB      0.0 MiB           1       suma_ploch = 0
     8     99.3 MiB      0.0 MiB     1000001       for polomer in args:
     9     99.3 MiB      0.0 MiB     1000000           suma_ploch += plocha_kruhu(polomer)
    10                                             
    11     99.3 MiB      0.0 MiB           1       return suma_ploch

Zobrazeního posledního běhu měření paměti pro lepší ilustraci:
```
Filename: /home/jovyan/work/shared/notebooks/mprun_test.py

Line #    Mem usage    Increment  Occurrences   Line Contents
=============================================================
     6    112.4 MiB    112.4 MiB           1   def secti_vsechny_plochy(args) -> int:
     7    112.4 MiB      0.0 MiB           1       suma_ploch = 0
     8    112.4 MiB -18859.9 MiB     1000001       for polomer in args:
     9    112.4 MiB -18859.9 MiB     1000000           suma_ploch += plocha_kruhu(polomer)
    10                                             
    11    112.4 MiB     -0.0 MiB           1       return suma_ploch
```

Často je velmi důležité nejenom znát svoje pracovní nástroje, ale ovládat také prostředí, ve kterém je používáš.

Pokud to ale dokážeš, ušetříš si spoustu času.