### Úvod

---

1. [Prezentace](https://docs.google.com/presentation/d/1PONQS4yth1bRy1-9AdYYwiElo89eEnWW9ZtAcV24kQ0/edit?usp=sharing),
1. [Úvod do IO](#Úvod-do-IO),
2. [Textové soubory](#Textové-soubory),
3. [Tabulkové soubory](#Tabulkové-soubory),
4. [JSON soubory](#JSON-soubory),
5. [Domácí úkol](#Domácí-úkol).

<br>

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse4.mm.bing.net%2Fth%3Fid%3DOIP.BPYuvKj05Xo_oF_oXiL1yAHaHa%26pid%3DApi&f=1" width="250">


## Úvod do IO

---

Nyní pracuješ pouze s objekty **Pythonu vlastními** nebo **s jeho knihovnami**.

Všechny tyto *objekty* jsi vytvoříš a zpracováváš **v rámci paměti RAM** (*random access memory*).

*Paměť RAM* je **velmi rychlá**, ale současně náročná a vyžaduje **neustálý zdroj** (není elektřina, ztratíš data).

Takový **disk počítače** je o dost **pomalejší** než paměť *RAM*, ale umožňuje ti uchovávat tebou získaná, zpracovaná data.

Proto je dobré osvojit si pravidla a postupy v Pythonu, jak vytvořit **persistentní data**.

<br>

### File Input/Output (~vstupní soubor, výstupní soubor)

Klasickou cestou, jak vytvořit obyčejný soubor, (což je v podstatě jen *sekvence bajtů*), je poskládat údaje za nějakým **jménem souboru**.

Než ale začneš se souborem pracovat, potřebuješ si v Pythonu vytvořit *pomocný objekt*, který jej bude **zastupovat** (nebo se na něj odkazovat):

```python
muj_soubor = open(jmeno_souboru, pravidla)  # pomocný objekt

# ... libovolná ohlášení

muj_soubor.close()
```

1. `muj_soubor`, je odkaz spojující **soubor** a **Pythonovský objekt**,
2. `open()`, *zabudovaná funkce*, která **vytváří spojení** (*stream*) mezi objektem a souborem,
3. `jmeno_souboru`, jméno souboru (*relativní* cesta/*absolutní* cesta),
4. `pravidla`, výběr argumentů upřesňujících, **jak soubor otevřít**,
5. `muj_soubor.close`, způsob, kterým **ukončíš spojení** mezi objektem a souborem.

<br>

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse2.mm.bing.net%2Fth%3Fid%3DOIP.JhMJc09m94e9V3oKtb_n3AHaHa%26pid%3DApi&f=1" width="200">

## Textové soubory

---

Nejlepším souborem na začátek bude prostý **textový soubor**.

Textovým souborem rozuměj jakýkoliv soubor, který má příponu `.txt`.

##### Demo: Ukázka textového souboru

In [3]:
!echo -e "Prvni radek,\ndruhy radek,\ntreti radek." > prvni_soubor.txt
!head prvni_soubor.txt

Prvni radek,
druhy radek,
treti radek.


### Úvod k souborům

Základními procesy pro práci se soubory obecně jsou:
1. **Čtení** souborů,
2. **Zápis** do souborů.

### Čtení souborů

Otevřít a přečíst *textový soubor* pomocí *editorů* ovládáš.

Teď se podívej, jak můžeš naučit otevírání a čtení souborů také **interpreta Pythonu**.

Než se pustíš do otevírání, zkus omrknout, jestli **neexistuje nějaká pomůcka**, která ti [práci usnadní](https://docs.python.org/3/library/functions.html):

In [None]:
# omrkni nápovědu k funkci
help()

In [None]:
muj_txt_soubor = open(prvni_soubor.txt)

Dávej pozor, jakým způsobem **jméno souboru** používáš. Python potřebuje pracovat s takovým datovým typem, který dobře zná.

<br>

Proto musíš ze jména vytvořit `string`:

In [9]:
muj_txt_soubor = open("prvni_soubor.txt")

In [8]:
!ls -l | grep *.txt

-rw-r--r-- 1 jovyan users     26 Jan 19 15:09 prvni_soubor.txt


Další kolizí může být **umístění souboru**.

<br>

*Interpret* standardně pracuje **v aktuálním umístění**.

Takže buď soubor přesuneš, nebo na něj odkážeš pomocí:
1. **Relativní cesty** (kratší zápis, vzhledem k aktuálnímu umístění),
2. **absolutní cesty** (delší zápis, celá cesta od *roota* nebo *jména disku*).

##### Relativní cesta:
```
"prvni_soubor.txt"                # v aktuální složce
"../prvni_soubor.txt"             # v rodičovské složce
"shared/onsite/prvni_soubor.txt"  # v dceřinné složce 'shared', v dceřinné složce 'onsite'
```

##### Absolutní cesta, Windows:
```
"C:\users\admin\docs\prvni_soubor.txt"
```

##### Absolutní cesta, unix:
```
"/home/user/project/shared/onsite/prvni_soubor.txt"
```

In [10]:
print(muj_txt_soubor)

<_io.TextIOWrapper name='prvni_soubor.txt' mode='r' encoding='UTF-8'>


In [11]:
print(type(muj_txt_soubor))

<class '_io.TextIOWrapper'>


Metody **pro čtění obsahu** *TextIOWrapper* objektu:

1. `read()` - přečte celý soubor jako jeden `string`
2. `readline()` - přečte pouze první řádek jako `string`
3. `readlines()` - přečte celý soubor jako `list` (co řádek, to údaj)

In [None]:
obsah_txt = muj_txt_soubor.readlines()

Jakmile tvoje práce s textovými souborem skončí, **nezapomeň soubor zavřít**.

In [None]:
muj_txt_soubor.close()

Pokud budeš mít pochybnosti, jestli se spojení *interpreta* a **souboru** skutečně ukončené, vyzkoušej:

In [4]:
muj_txt_soubor.closed

NameError: name 'muj_txt_soubor' is not defined

Výstupem ti bude `bool` hodnota, která vrací `True` v případě, že objekt skutečně zanikl. Jinak `False`.

### Zápis do souborů

Pokud ovšem žádný textový soubor nemáš, nebo jej chceš naopak **vytvořit**, musíš jej prvně **zapsat**:

In [None]:
muj_txt = "Toto je můj nový soubor^.^"

*String* `muj_txt` máš aktuálně k dispozici pouze jako nějaký objekt Pythonu.

<br>

Opět je potřeba nejprve spojit **objekt v Pythonu** se skutečným souborem na disku.

In [None]:
# help(open)

In [None]:
muj_soubor = open("../onsite/lesson07/muj_textovy_soubor.txt", mode="w")  # vybrat vhodný režim

Soubor si následně můžeš otevřít, ale zjistíš, že je **v tento moment prázdný**.

Funkce `open` pouze vytvoří (*~iniciuje*) nový objekt `muj_novy_soubor`.

Příslušný text teprve musíme zapsat, pomocí vhodné *funkce* `write`:

In [None]:
help(muj_soubor.write)

In [None]:
muj_soubor.write(muj_txt)

Pokud si budeš chtít nyní prohlédnout **zapsaný soubor na disku**, zjistíš, že je stále prázdný.

Protože *stále není ukončený*, nedovedeš s ním nijak manipulovat.

Pokud zjistíš, že není ukončený, ukončíš jej pomocí metody `close`.

In [None]:
muj_soubor.closed

In [None]:
muj_soubor.close()

Teprve po ukončení *streamu* (nebo také zápisu) objektu, můžeš soubor `muj_novy_soubor.txt` prozkoumat.

### Opakovaný zápis do souboru

Máš situaci, kdy tebou vytvořený soubor existuje a ty jej chceš **znovu otevřít** a **rozšířit**:

In [None]:
dalsi_text = "\nRád čtu a hraji na klavír"

Opět potřebuješ inicializovat **pomocný objekt**, jako v předchozích scénářích:

In [None]:
muj_soubor = open("../onsite/lesson07/muj_textovy_soubor.txt", mode="w")
muj_soubor.write(dalsi_text)
muj_soubor.close()

Nyní zkontroluj aktualizovaný **nově přidaný text**. Copak se to stalo?

<br>

Pokud opětovně načteš **stejný soubor** v režimu `w`, přesuneš "zapisovač" (*představ si jej jako blikající kurzor v editoru*) opět **na začátek souboru**.

*Interpret* zapisuje od místa, kde se zapisovač nachází, takže dojde **k přepsání původního obsahu**.

<br>

Pokud chceš automaticky zapisovat **od konce souboru**, otevři soubor s argumentem `mode="a"`, tedy v režimu `append`.

In [None]:
dalsi_txt = ("Ahoj, ja jsem Matous (:\n", "Rad ctu, hraji na klavir\n")

In [None]:
muj_soubor = open("../onsite/lesson07/muj_textovy_soubor.txt", mode="a")
muj_soubor.writelines(dalsi_txt)
muj_soubor.close()

Pokud budeš někdy pracovat se stejným souborem tak, že jej budeš současně:
1. **číst** soubor,
2. **zapisovat** do něj.
    
Vyzkoušej režim `r+`.

### Kontextový manažer `with`

---

to-do

<br>

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse4.mm.bing.net%2Fth%3Fid%3DOIP.0iOsXQOxAJaT_DiVOf8zgwHaGy%26pid%3DApi&f=1&ipt=221ea3dac1c977db61c17e64a7f59579c7f2d09c8ff49065302dddb12a84f8b1&ipo=images" width="250">

## Formátování stringů

---


Doposud **formátování stringů** probíhalo většinou pomocí *spojování* (*~concatenation*):

In [8]:
zprava = "Ahoj, jmenuji se " + jmeno + " a je mi " + str(vek) + " let." 

In [9]:
print(zprava)

Ahoj, jmenuji se Matouš a je mi 99 let.


<br>

Případně jako **argumenty** pro funkci `print`:

In [10]:
jmeno = "Matouš"
vek = 99

In [11]:
print("Ahoj, jmenuji se", jmeno, "a je mi", vek, "let." )

Ahoj, jmenuji se Matouš a je mi 99 let.


<br>

Obecně řečeno, je **formátování stringů** způsob, jakým zkombinuješ:
* libovolný neměnný `str`,
* hodnoty uchované **v proměnných**.

Vidíš, že *formátování* je tedy užitečné. Jaké způsoby formátování máš v Pythonu k dispozici:
1. Formátovací výraz (`%`-formatting c-style),
2. formátovací metoda (`str.format()`),
3. formátovaný string (`f"{}"`).

<br>

### Formátovací výraz

Jde prakticky o původní způsob formátování stringu v Pythonu už od uplného začátku (od první verze Pythonu):

In [7]:
jmeno = "Lukas"
vek = 27

print("Ahoj, jmenuji se %s a je mi %d let" % (jmeno, vek))

Ahoj, jmenuji se Lukas a je mi 27 let


Formátování má tři částí:
1. Výrazy `%s` a `%d` (někdy také **konverzní operátory**),
2. operátor `%`,
3. `tuple` proměnných `(jmeno, vek)`.

Výrazy ti pomohou označit místa, kam se hodnota v proměnné zapíše.

Můžeš pracovat s těmito typy:
* `%d` výraz formátuješ jako **celé číslo**,
* `%f` výraz formátuješ jako **desetinné číslo**,
* `%s` výraz formátuješ jako **textový znak**.

Nezapomeň na operátor `%`, bez něj ti nebude výraz fungovat.

Nakonec přidáš `tuple` proměnných, ze kterých budeš hodnoty do konverzních operátorů předávat.

Další doplňující možnosti formátování `str`:

| typ formátování | ukázka | výstup | popis |
| :- | :- | :- | :- |
| Šířka | `print("\|%4d\|" % (54,))` |`  54`| Při formátování výrazu můžeš zadat pevnou šířku stringu |
| výplň | `print('\|%04d\|' % (54,))` |`0054`| Výstup o šířce 4 znaků, které jsou vyplněné nulami |
| zarovnání vlevo | `print("\|%-5d\|" % (54,))` |`54  `| pro zarovnání vlevo |
| zarovnání vpravo | `print(""\|%5d\|" % (54,))` |`  54`| pro zarovnání vpravo (defaultně) |
| přesnost | `print("\|%.2f\|" % (54.653,))` |`54`| Pro zaokrouhlení potřebuješ udat počet platných číslic. Dále je rozdíl zaokrouhlení u celých a desetinných čísel |

<br>

**Dávej pozor!**
Dnes se tento způsob formátování již oficiálně nedoporučuje.

Jelikož často selhává, nesprávně zobrazuje datové typy `tuple` nebo `dict` a vypisování není příliš praktické.

<br>

### Formátovací metoda

Mladší metodou, je metoda `str`, která se jmenuje `format`.

Je dostupná **v Pythonu 2.6<**. Její použití je docela podobné *formátovacímu výrazu*:

In [15]:
jmeno = "Lukáš"
vek = 27

In [16]:
print("Ahoj, jmenuji se {} a je mi {} let.".format(jmeno, vek))

Ahoj, jmenuji se Lukáš a je mi 27 let


Formátování má nyní tři částí:
1. Místo, kam chceš hodnotu umístit `{}` (pomocí složených závorek),
2. samotná metoda `format`,
3. **argumenty metody**, tedy jsou samotné proměnné.

**Do složených závorek** můžeš vkládat podle:
1. **pořadí argumentů** v závorkách,
2. nebo **pomocí indexů**.

In [18]:
print("Ahoj, jmenuji se {} a je mi {} let.".format(jmeno, vek))  # dle pořadí argumentů

Ahoj, jmenuji se Lukáš a je mi 27 let.


In [20]:
print("Ahoj, jmenuji se {1} a je mi {0} let.".format(jmeno, vek))  # dle pořadí argumentů

Ahoj, jmenuji se 27 a je mi Lukáš let.


Rozšiřující možnosti formátovací metodou `str`:

| účel formátování | ukázka | výstup | popis |
| :- | :- | :- | :- |
| Šířka | `print("\|{:15}\|".format("desktop"))` |`\|desktop        \|`| pomocí dvojtečky a celého čísla zadáš, jak dlouhý má výstup být |
| zarovnání vlevo | `print("\|{:<15}\|".format("desktop"))` |`\|desktop    \|`| zarovnání vlevo (defaultní) pomocí dvojtečky, šipky a celého čísla pro šířku pole |
| zarovnání na střed | `print("\|{:^15}\|".format("desktop"))` |`\|    desktop    \|`| zarovnání na střed |
| zarovnání vpravo | `print("\|{:>15}\|".format("desktop"))` |`\|        desktop\|`| pro zarovnání doprava |
| Výplň | `print("\|{:#>15}\|".format("desktop"))` |`\|########desktop|\`| před zapiš znak pro výplň |
| Přesnost | `print("\|{:.4}\|".format(12.356))` |`\|12.36\|`| zaokrouhlení čísel na čtyři platné číslice |
| Řádový oddělovač | `print("\|{0:,}\|".format(123456789))` |`\|123,456,789\|`| oddělovač tisíců pomocí čárky |
| Znaménka | `print("\|{0:+}\|".format(280))` |`\|+280\|`| doplnění znaků `+`, `-` |

In [24]:
print("|{:15}|".format("desktop"))

|desktop        |


Použití je pořád poměrně upovídané.

Dále docela náročné na sledování třeba při zápisu více proměnných.

Má ovšem více možností formátování, které se ti můžou hodit.

<br>

### Stringová interpolace a.k.a. f-string

Toto složitě znějící jméno je odvozené od úvodního písmene `f`, které předchází výrazům.

Je to nejmladší varianta, dostupná od verze **Pythonu 3.6+**.

<br>

Pokud si vzpomeneš na větu zapsanou v Zenu Pythonu:
`There should be one-- and preferably only one --obvious way to do it.`

Potom se u formátování stringů zastav hlavně u tohoto způsobu:

In [26]:
jmeno = "Ondřej"
cislo_lekce = 9

In [27]:
print(f"Toto je {jmeno}, který vás víta na {cislo_lekce}. lekci!")

Toto je Ondřej, který vás víta na 9. lekci!


*Stringová interpolace* funguje tak, že *interpret* **rozbije celý string** na:
* konstanty (defaultní string),
* výrazy (proměnné),

.. které ze kterých nasbírá hodnoty a vše spojí dohromady.

Pokud chceš lépe pochopit, jak to probíhá:
```python
f"Toto je {jmeno}, který vás víta na {cislo_lekce}. lekci!"                   # f-string,

"Toto je " + jmeno + ", který vás víta na " + str(cislo_lekce) + ". lekci!"   # concatenation,
```

Narozdíl od samotného procesu spojení, f-string na pozadí pracuje s optimalizovanou metodou `BUILD_STRING`, která celý postup [mírně urychluje](https://bugs.python.org/issue27078).

In [29]:
import dis

In [30]:
def formatovani_f_stringem(jmeno, cislo_lekce):
    return f"Toto je {jmeno}, který vás víta na {cislo_lekce}. lekci!"

In [31]:
dis.dis(formatovani_f_stringem)

  2           0 LOAD_CONST               1 ('Toto je ')
              2 LOAD_FAST                0 (jmeno)
              4 FORMAT_VALUE             0
              6 LOAD_CONST               2 (', který vás víta na ')
              8 LOAD_FAST                1 (cislo_lekce)
             10 FORMAT_VALUE             0
             12 LOAD_CONST               3 ('. lekci!')
             14 BUILD_STRING             5
             16 RETURN_VALUE


Navíc podporuje všechny **formátovací úpravy**, které máš dostupné v rámci formátovací metody `.format()`.

Při práci se slovníkem dávej pozor **na uvozovky**:

In [33]:
osoba = {"jmeno": "Filip", "telefon": "+420777666555"}

In [36]:
print(f"Je to {osoba['jmeno']}, s tel. číslem: {osoba["telefon"]}")

SyntaxError: invalid syntax (<ipython-input-36-366348715ed3>, line 1)

In [37]:
print(f"Je to {osoba['jmeno']}, s tel. číslem: {osoba['telefon']}")

Je to Filip, s tel. číslem: +420777666555


Další velkou výhodou je možnost spouštět uživatelské funkce uvnitř stringů.

Proměnné je možné psát ihned do složených závorek, takže není nutné sledovat proměnné na konci řádku.

<br>

Další alternativou formátování (např. newslettery uvnitř mailů) jsou stringové šablony:

In [39]:
from string import Template

In [41]:
sablona = Template('Ahoj, $jmeno!')
sablona.substitute(jmeno="Matouš")

'Ahoj, Matouš!'


<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse1.mm.bing.net%2Fth%3Fid%3DOIP.GMJvJ-GG0YS8H5JmHR3CbwHaHm%26pid%3DApi&f=1" width="200">


## Domácí úkol

---