# Jupyter magics a další
Jupyter magics jsou speciální příkazy spustitelné v Jupyter noebooku, které umožňují využívat různé funkce mimo prostředí Pythonu. 

Jupyter magics se spouští pomocí prefixu `%` (pro jednořádkové magics) nebo `%%` (pro víceřádkové magics).

Příkazů je obrovské množství, viz například [tento seznam](https://ipython.readthedocs.io/en/stable/interactive/magics.html). Zde si uvedeme pouze pár.

Nápovědu (docstring) lze k magics získat pomocí `?` za příkazem.

**Jednořádkové magics:**
- `%time` - zobrazí čas, který trvalo vykonat příkaz
- `%timeit` - pokročilejší verze příkazu `%time`, který spustí příkaz vícekrát a zobrazí statistiku
- `%magic` - zobrazí nápovědu k magics (výpis všech dostupných magics)
- `%lsmagic` - zobrazí seznam dostupných magics
- `%load` - načte zdrojový kód z externího souboru do aktuální buňky
- `%run` - spustí externí skript
- `%less` / `%more` / `%cat` / `%pycat` - zobrazí externí soubor v textovém editoru
- `%system` / `!!` - spustí příkaz v systémovém terminálu - s vazbou na Jupyter (chová se jinak než `!`)
- `%pwd` / `%cd` - zobrazí / změní aktuální pracovní adresář
- `%who` / `%whos` - zobrazí seznam proměnných
- `%ls` / `%ll` - zobrazí obsah aktuálního adresáře


**Víceřádkové magics:**
Týkají se celé buňky, ne jen jednoho příkazu.
- `%%time` - zobrazí čas, který trvalo vykonat obsah buňky
- `%%timeit` - pokročilejší verze příkazu `%%time`, který spustí buňku vícekrát a zobrazí statistiku
- `%%writefile` / `%%file` - zapsat obsah buňky do externího souboru
- `%%bash` / `%%html` / `%%javascript` / `%%latex` / ... - spustí buňku s kódem v daném jazyce
- `%%prun` - spustí buňku pomocí profilovacího modulu `cProfile`


In [None]:
%magic

In [None]:
seznam_magickych_funkci = %lsmagic
print(type(seznam_magickych_funkci))
print(seznam_magickych_funkci)


In [None]:
!mkdir test

In [None]:
!!ls

In [None]:
%cd test

In [None]:
%pwd

In [None]:
%%writefile?

In [None]:
%%writefile test.py
def funkce():
    a = 2
    print("Ahoj")
funkce()

In [None]:
%ll

In [None]:
%less test.py

In [None]:
%run test.py

In [None]:
%who

In [None]:
%time funkce()

In [None]:
def najdi_prvocisla(n):
    prvocisla = [2]
    i = prvocisla[-1]
    while len(prvocisla) < n:
        i += 1
        for prvocislo in prvocisla:
            if i % prvocislo == 0:
                break
        else:
            prvocisla.append(i)
    return prvocisla

In [None]:
%%timeit
najdi_prvocisla(100)
najdi_prvocisla(10)

In [None]:
%%prun
najdi_prvocisla(1000)


In [None]:
print(najdi_prvocisla(100))

In [None]:
%cd ..
%rm -rf test
%pwd

In [None]:
%ll

# Práce s řetězci
S řetězci jsme se už setkali, řekli jsme si také, že `str` objekt je immutable (neměnitelný).

## Základní operace
* `+` - spojení dvou řetězců
* `*` - opakování řetězce
* `in` - zjištění, zda je řetězec podřetězcem jiného řetězce
* `[]` - indexování (přístup k jednotlivým znakům)
* `[:]` - slicing (přístup k podřetězcům)
* `len()` - délka řetězce
* `str()` - převod na řetězec


In [None]:
# ukázky základních operací s řetězci
retezec = "ahoj"
retezec2 = "svete"
retezec3 = "tak tedy ahoj zeměkoule" 

print(retezec + retezec2)
print(retezec * 3)
print(retezec[0:2])
print(len(retezec))
print(retezec in retezec3)
print(retezec2 in retezec3)

## Vestavěné metody řetězců
Velká/malá písmena:
* `str.capitalize()` - první znak velký, ostatní malé
* `str.swapcase()` - velká písmena na malá, malá na velká
* `str.title()` - první znak každého slova velký, ostatní malé
* `str.lower()` - malá písmena
* `str.upper()` - velká písmena

Ořezávání:
* `str.strip([chars])` - ořezání bílých znaků (mezera, tabulátor, nový řádek) na začátku a na konci
* `str.lstrip([chars])` - ořezání bílých znaků na začátku
* `str.rstrip([chars])` - ořezání bílých znaků na konci
* `str.center(width[, fillchar])` - vycentrování řetězce
* `str.ljust(width[, fillchar])` - zarovnání vlevo
* `str.rjust(width[, fillchar])` - zarovnání vpravo

Nahrazování/řezání/spojování řetězců:
* `str.format(*args, **kwargs)` - umožňuje definovat placeholdery v řetězci `{}` a ty pak naplnit hodnotami
* `str.replace(old, new[, count])` - nahrazení všech výskytů podřetězce
* `str.split([sep[, maxsplit]])` - rozdělení řetězce na seznam řetězců
* `str.splitlines([keepends])` - rozdělení řetězce na řádky
* `str.partition(sep)` - rozdělení řetězce na 3 části (před, sep, za)
* `str.join(iterable)` - spojení řetězců v seznamu
* `str.expandtabs(tabsize=8)` - nahrazení tabulátorů mezerami

Počítání výskytů/znaků/...:
* `str.count(sub[, start[, end]])` - počet výskytů podřetězce
* `str.find(sub[, start[, end]])` - index prvního výskytu podřetězce nebo -1 pokud není nalezen
* `str.index(sub[, start[, end]])` - index prvního výskytu podřetězce nebo vyhodí výjimku `ValueError` pokud není nalezen

Zjištění některých vlastností řetězců:
* `str.startswith(prefix[, start[, end]])` - zjištění, zda řetězec začíná daným podřetězcem
* `str.endswith(suffix[, start[, end]])` - zjištění, zda řetězec končí daným podřetězcem
* `str.isalnum()` - zjištění, zda řetězec obsahuje pouze alfanumerické znaky
* `str.isalpha()` - zjištění, zda řetězec obsahuje pouze písmena
* `str.isdecimal()` - zjištění, zda řetězec obsahuje pouze desetinná čísla
* `str.isdigit()` - zjištění, zda řetězec obsahuje pouze čísla
* `str.isidentifier()` - zjištění, zda řetězec je platným identifikátorem
* `str.islower()` - zjištění, zda řetězec obsahuje pouze malá písmena
* `str.isnumeric()` - zjištění, zda řetězec obsahuje pouze čísla
* `str.isprintable()` - zjištění, zda řetězec je tisknutelný
* `str.isspace()` - zjištění, zda řetězec obsahuje pouze bílé znaky
* `str.istitle()` - zjištění, zda řetězec obsahuje pouze velká písmena


In [None]:
retezec = "ahoj Svete toto je retezec"
print(retezec.capitalize())
print(retezec.swapcase())
print(retezec.title())
print(retezec.lower())
print(retezec.upper())

In [None]:
retezec = "  ahoj Svete toto je retezec      "
print(retezec.strip())
print(retezec.lstrip())
print(retezec.rstrip())
print(retezec.center(50, "-"))
print(retezec.ljust(50, "."))
print(retezec.rjust(50, " "))

In [None]:
# Základní formátování
jmeno = "Jan"
print("Ahoj, {}!".format(jmeno))
# Výstup: Ahoj, Jan!

# Formátování s formátovacím specifikátorem
vek = 30
print("{} je {} let starý.".format(jmeno, vek))
# Výstup: Jan je 30 let starý.

# Formátování s pozicemi argumentů
print("{0} je {1} let starý. Nejlepším přítelem {0} je {2}.".format(jmeno, vek, "Jana"))
# Výstup: Jan je 30 let starý. Nejlepším přítelem Jan je Jana.

# Formátování s klíčovými argumenty
print("{jmeno} je {vek} let starý. Nejlepším přítelem {jmeno} je {pritel}.".format(
    jmeno=jmeno, vek=vek, pritel="Jana"))
# Výstup: Jan je 30 let starý. Nejlepším přítelem Jan je Jana.

In [None]:
text = "Ahoj světe, \njak se máš?"
print(text)

print(text.replace("Ahoj", "Nazdar"))
print(text.split())
print(text.splitlines())
print(text.partition(", "))

In [None]:
seznam = ['Ahoj', 'světe']
print(', '.join(seznam))

text = "Ahoj\tsvěte"
print(text.expandtabs())

In [None]:
text = "Ahoj světe, jak se máš?"
print(text.count("e"))
print(text.find("světe"))
print(text.index("světe"))


In [None]:
text = "Ahoj světe, jak se máš?"
print(text.startswith("Ahoj"))
print(text.startswith("Nazdar"))
print(text.endswith("?"))
print(text.endswith("!"))

## f-strings
F-stringy (formatovací řetězce) jsou speciální syntaxe, která umožňuje vložit proměnné do řetězce pomocí zápisu {} a začínají znakem "f".

In [None]:
# f-strings
jmeno = "Jan"
vek = 30
print(f"{jmeno} je {vek} let starý.")

f-strings umožňují formátovat hodnoty pomocí specifikátorů, podrobnosti viz [dokumentace](https://docs.python.org/3/library/string.html#format-specification-mini-language).

In [None]:
# f-strings s formátovacím specifikátorem
jmeno = "Jan"
vek = 30
print(f"{jmeno} je {vek:.2f} let starý.")
print(f"{jmeno:<10} má {vek + 3:>3} let")
print(f"{jmeno =}, {vek =}")


In [None]:
# formátování pomocí > a < můžeme využít pro zarovnání tabulky
print(f"{'číslo':>6} {'mocnina':>8} {'třetí mocnina':>14}")
for i in range(1, 20):
    print(f"{i:.>6} {i**2:.>8} {i**3:.>14}")

Možnosti formátování f-stringu jsou vestavěné do třídy kterou vypisujeme, konkrétně metoda `__format__`. Více si ukážeme příště.

# Základní práce se soubory
Pro práci se sounory je základní příkaz `open`, který vrací instanci `file`

In [None]:
%%writefile test.txt
Ahoj, jak se máš?
To se mi líbí!
To ne.
To ano.
To ne.
To ano.

In [None]:
# ukázka otevření souboru
soubor = open("test.txt", "r")
print(soubor)

In [None]:
# metody file
print([m for m in dir(soubor) if not m.startswith("_")])

In [None]:
print(soubor.read())
soubor.close()

Soubor se dá procházet jakožto iterovatelný objekt, který vrací řádky souboru. Pozor na "\n" na konci řádku.

In [None]:
# procházení řádků souboru
soubor = open("test.txt", "r")
for idx_radku, radek in enumerate(soubor):
    print(f"{idx_radku = }, {radek = }")
soubor.close()

Pro práci se soubory je velice užitečný (*a jednoznačně preferovaný*) blok [`with`](https://docs.python.org/3/reference/compound_stmts.html#with), který používá tzv. context managery. 

Context manager je objekt, který implementuje metody `__enter__` a `__exit__`. Což jsou metody, které jsou volány při vstupu a výstupu z bloku `with`. V případě metody `open` je to otevření a zavření souboru.

Použití je velice jednoduché, předchozí příklad by vypadal takto:

In [None]:
# ukázka užití with
with open("test.txt", "r") as soubor:
    for idx_radku, radek in enumerate(soubor):
        print(f"{idx_radku = }, {radek = }")

Zapisování do souboru je velice podobné, pouze je potřeba přidat parametr `w` (write) nebo `a` (append).

In [None]:
# vytvoření csv souboru s čísly a jejich mocninami
with open("mocniny.csv", "w", newline="") as soubor:
    soubor.write("čislo, mocnina \n")
    for i in range(1, 10):
        soubor.write(f"{i}, {i*i} \n")

In [None]:
%less mocniny.csv
