# Python akademie

---

<br>

## Obsah lekce
---

1. [Úvod do souborů](#Úvod-do-souborů),
2. [Soubory CSV](#Soubory-CSV),
3. [Soubory JSON](#Soubor-JSON),
4. [Spouštění s ARGS](#Spouštění-skriptu-s-argumenty).

---

<br>

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse1.mm.bing.net%2Fth%3Fid%3DOIP.8jGQ1dJfUljV9kn_Vq8legHaHa%26pid%3DApi&f=1&ipt=f522baaf36bd4a4e9df7274eb105d86b11fcfdc5435921fd74de1c7564d77a83&ipo=images" width="220" style="margin-left:auto; margin-right:auto">

### Úvod do souborů

---

Pracovat **s textovými soubory** je velkou výhodou. Obzvláště, pokud potřebuješ **uchovat data**.

Občas ale není na škoda, ovládat také mírně složitější formáty.

Ty ti totiž umožní vytvořit **přehlednější struktury** souborů.

Pokud jeden potřebuje:
* **mapovat atributy** na jejich hodnoty,
* evidovat **záznamy v tabulce**.

Práce s těmito typy souborů **je podobná práci** s textovými soubory.

Navíc ovšem existují nějaká **pravidla** (předpisy), která tyto soubory dělají tím, čím jsou.

Další změnou bude práce **za pomocí příslušných knihoven**, které ti umožní takové objekty chystat.
<br>

### File Input/Output (~vstupní soubor, výstupní soubor)

---
Opět bude potřeba vytvořit soubor (což je v podstatě jen *sekvence bajtů*) a schovat je za **jméno souboru**.

Dále potom připravit objekt v Pythonu, který bude reprezentovat most mezi daty a souborem na disku.

<br>

Nejprve si tedy zkus práci **s tabulkovými soubory**.

<br>

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse2.mm.bing.net%2Fth%3Fid%3DOIP.3vUw9kaVMOQPBQOvNZ9OkgHaHa%26pid%3DApi&f=1&ipt=5d535e2a1b28bb87b209c1395babc2cf0a51f8fafe7e55085f8b7643f2e8c554&ipo=images" width="200" style="margin-left:auto; margin-right:auto">

### Soubory CSV

---

**CSV soubor** (*Comma Separated Values*) ukládá *tabulková data*, podobně jako například soubory **.xlsx** (*MS Excel* nebo *LibreOffice*), které pravděpodobně znáš.

<a href="https://imgur.com/3zomtvk" style="margin-left:auto; margin-right:auto"><img src="https://i.imgur.com/3zomtvk.png" title="source: imgur.com" width="600" /></a>

Rozdíl spočívá v tom, že soubor **CSV** je ukládá v **textové podobě**.

<br>

**CSV soubor** je tedy mnohem univerzálnější, můžeš ho normálně otevřít prakticky ve všech tabulkových procesorech:
* *MS Excel*,
* *LibreOffice Calc*,
* v textových editorech jako je *Notepad* nebo *Poznámkový blok*,
* a navíc se s ním dobře pracuje v Pythonu.

### Struktura

---

Přesto, že v různých softwarových řešeních najdeš data úhledně graficky naformátovaná do:
1.  **řádků** *(na obrázku 1, 2, 3)*,
2.  **a sloupců** *(na obrázku A, B, C, D)*.

.., reprezentované hodnoty **v jednoduchém editoru** vypadají jinak:
```
jmeno;prijmeni;email;projekt
Matous;Holinka;m.holinka@firma.cz;hr
Petr;Svetr;p.svetr@firma.cz;devops
```

Aby měl takový **CSV** konzistentní vzhled a formát, potřebuje zadaná pravidla, tedy **dialekt**.

### Dialekt CSV souborů

---
Dialektem rozuměj nějaký **formátovací pravidla**, podle kterých je tvůj **CSV** soubor zadaný.

**Dialekt** udává jakými znaky jsou:
1. oddělované **jednotlivé buňky** (na obrázku výše středník `;`),
2. oddělované **řádky** (na obrázku není vybraný žádný symbol).

Další možnosti **upřesnění dialektu** jako výběr *escape znaků*, použití uvozovek, aj. můžeš najít <a href="https://docs.python.org/3/library/csv.html#dialects-and-formatting-parameters" target="_blank">zde</a>.

Ať už konkrétně typ souboru **.csv** nebo jeho příbuzní **.xls** nebo **.xlsx** aj., pracuje tento typ souboru výborně pro ukládání jednotlivých záznamů řádek po řádku.

<br>

Protože se u **CSV souborů** nejedná o nativní formát Pythonu, jako takový jej nemůžeš v Pythonu napsat.

Platí, že pokud budeš chtít pracovat **s CSV soubory** v Pythonu, musíš *nahrát* k tomu určenou **built-in knihovnu**:

In [1]:
import csv

#### Vyzkoušej si následující

---

| jméno objektu | účel metody |
| :-| :- |
| `csv.writer(m)` | funkce zapíše objekt do souboru (+ `writerows`)|
| `csv.reader(m)` | funkce vrátí iterovatelný objekt (co cyklus, to řádek) |
| `csv.DictWriter(m)` | třída pro zápis slovníku do souboru |
| `csv.DictReader(m)` | třída pro čtení souboru do slovníku |

<br>


*pozn* `m` je objekt (proměnná)

<br>

Základní dva procesy (obdobně jako pro textové soubory), které budeš provádět jsou:
1. __čtení__ souboru `csv`
2. __zápis__ do souboru `csv`

<br>

### Vytvoříš soubor s příponou `.csv`

---

Nejprve nahraj potřebnou knihovnu:

In [2]:
import csv

Vytvoř údaje, ze kterých soubor založíš.

Tedy *záhlaví* a dva řádky *záznamů* v tabulce.

In [6]:
hlavicka = ("jmeno", "prijmeni", "vek")
osoba_1 = ("Matous", "Holinka", "28")
osoba_2 = ("Petr", "Svetr", "27")

<br>

Při tvorbě objektu je nutné zadat znak, který se bude objevovat **na konci řádků**:

In [4]:
csv_soubor = open(
    "../onsite/prvni_tabulka.csv",
    mode="w",
    encoding="UTF-8"
)

In [5]:
print(csv_soubor)

<_io.TextIOWrapper name='../onsite/prvni_tabulka.csv' mode='w' encoding='UTF-8'>


<br>

Jakmile vytvoříš **spojovací objekt**, můžeš definovat, co do něj zapíšeš.

U knihovny `csv` se využívá tzv. *zapisovací* (*writer*) funkce.

Ten je zase specifický tím, že zadáš oddělovač, který oddělí **jednotlivé buňky** v tabulce:

In [9]:
zapisovac = csv.writer(csv_soubor, delimiter=";")

In [10]:
zapisovac.writerow(hlavicka)
zapisovac.writerow(osoba_1)
zapisovac.writerow(osoba_2)

15

In [None]:
zapisovac.writerows((hlavicka, osoba_1, osoba_2))

Po zaznamenání údajů a na konci workflow nezapomeň objekt načtený *interpretem* **ukončit**.

In [11]:
csv_soubor.close()

Pokud si nebudeš jistý, jestli je *stream* zavřený, vyzkoušej metodu `closed`.

Ta vrací `True`, pokud je *spojení* opravdu **ukončené**:

In [12]:
csv_soubor.closed  # isclosed

True

### DictWriter

---

Objekty v Pythonu, použité před chvílí, byly **sekvenčního typu**.

Pokud ovšem dostaneš mapovaný objekt, můžeš vyzkoušet další typ zapisovače, `DictWriter`:

In [14]:
# namedTuple
osoba_1 = {"jméno": "Matouš", "příjmení": "Holinka", "věk": "28"}
osoba_2 = {"jméno": "Petr", "příjmení": "Svetr", "věk": "27"}

Pokud argument `newline` nepotřebuješ, můžeš pracovat s jeho defaultní hodnotou `None`:

In [15]:
dalsi_csv = open(
    "../onsite/druha_tabulka.csv",
    mode="w",
    encoding="UTF-8"
)

Objektu zapisovače opět předáš přichystaný proměnnou `dalsi_csv` a **jména sloupečků** (záhlaví):

In [17]:
csv.DictWriter?

[0;31mInit signature:[0m
[0mcsv[0m[0;34m.[0m[0mDictWriter[0m[0;34m([0m[0;34m[0m
[0;34m[0m    [0mf[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0mfieldnames[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0mrestval[0m[0;34m=[0m[0;34m''[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0mextrasaction[0m[0;34m=[0m[0;34m'raise'[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0mdialect[0m[0;34m=[0m[0;34m'excel'[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0;34m*[0m[0margs[0m[0;34m,[0m[0;34m[0m
[0;34m[0m    [0;34m**[0m[0mkwds[0m[0;34m,[0m[0;34m[0m
[0;34m[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0;31mDocstring:[0m      <no docstring>
[0;31mFile:[0m           /usr/lib/python3.8/csv.py
[0;31mType:[0m           type
[0;31mSubclasses:[0m     

In [16]:
zapisovac = csv.DictWriter(dalsi_csv)

TypeError: __init__() missing 1 required positional argument: 'fieldnames'

In [20]:
zahlavi = tuple(osoba_1.keys())

In [21]:
print(zahlavi)

('jméno', 'příjmení', 'věk')


In [22]:
zapisovac = csv.DictWriter(dalsi_csv, fieldnames=zahlavi)

<br>

Můžeš záznamy zapsat **postupně**:

In [23]:
zapisovac.writeheader()

20

In [None]:
zapisovac.writerow(osoba_1)
zapisovac.writerow(osoba_2)

eventuálně zapsat také **hromadně**:

In [24]:
zapisovac.writerows((osoba_1, osoba_2))

a nakonec *stream* zase důsledně uzavřít:

In [25]:
dalsi_csv.closed

False

In [26]:
dalsi_csv.close()

In [27]:
dalsi_csv.closed

True

### Přečti obsah souboru `.csv`

---

In [28]:
!ls ../onsite/

async_scrape.py		 prvni_JSON.json    vloz_jmeno.py
debug_sample_2.py	 prvni_tabulka.csv  vloz_jmeno_sys_opt.py
debug_sample.py		 recur.py	    vloz_jmeno_sys.py
druha_tabulka.csv	 uloha_1.py	    zakaznici.csv
prvni_den_treti_ukol.py  uloha_2.py


In [29]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


In [30]:
obsah_prvni_csv = open(
    "../onsite/prvni_tabulka.csv",
    encoding="UTF-8",
    mode="r"  # Default
)

In [32]:
cteni = csv.reader(obsah_prvni_csv)

Obsah souboru je možné vrátit **jako sekvenci**:

In [33]:
obsah_souboru = tuple(cteni)

(['jmeno;prijmeni;vek'], ['Matous;Holinka;28'], ['Petr;Svetr;27'])

Případně pro další processing **procházet smyčkou**:

In [None]:
for radek in cteni:
    print(radek)

In [34]:
obsah_prvni_csv.close()

<br>

Pomocí `with` manažeru:

In [35]:
with open("../onsite/prvni_tabulka.csv",
          mode='r',
          encoding='UTF-8'
) as csv_soubor:
    cteni = csv.reader(csv_soubor)
    obsah = tuple(cteni)

In [40]:
print(obsah[0][0].split(';')[1])

prijmeni


In [41]:
csv_soubor.closed

True

<br>

### DictReader

---

Analogicky je možnost data obsažená v *CSV* souboru reprezentovat s *interpretem* jako `dict`:

In [None]:
moje_csv = open(
    "../onsite/druha_tabulka.csv",
    encoding="utf-8",
    mode="r"
)

In [None]:
obsah = csv.DictReader(moje_csv)

In [None]:
print(tuple(obsah))

In [None]:
moje_csv.close()

<br>

### Kontextový manažer

---

Prakticky neustále se postup pro manipulaci se soubory kombinuje s manažerem `with`:

In [42]:
jmeno_csv = "../onsite/druha_tabulka.csv"

In [43]:
with open(jmeno_csv,
          mode="r",
          encoding="UTF-8"
) as csv_soubor:
    cteni = csv.DictReader(csv_soubor)
    obsah = tuple(cteni)

In [46]:
print(obsah[0].keys())

dict_keys(['jméno', 'příjmení', 'věk'])


In [53]:
obsah

({'jméno': 'Matouš', 'příjmení': 'Holinka', 'věk': '28'},
 {'jméno': 'Petr', 'věk': '27'})

In [57]:
for zaznam in obsah:
    print(zaznam.get('jméno'), zaznam.get('příjmení', '<neznámé příjmení>'))

Matouš Holinka
Petr <neznámé příjmení>


In [58]:
csv_soubor.closed

True

Takže tabulkový formát je zpracovaný, co když budeš potřebovat soubor **organizovaný pomocí klíčů**.

<br>

### 🧠 CVIČENÍ 🧠, Vyzkoušej si práci s *CSV soubory*:

1. Vytvoř funkci `zpracuj_vsechny_uzivatele` s parametrem `zadane_hodnoty` a `nezadouci`,
2. funkci zadám sekvenci slovníkových hodnot, ona je projde jednu po druhé a zpracuje pomocí další funkce,
3. ..výstup potom uloží do `tuple`,
4. vytvoř funkci `filtruj_nezadouci_sloupce` s parametrem `zadany_slovnik` a `nezadouci`,
5. tato funkce prochází klíče ve slovníku a pokud jsou i mezi argumenty v parametru `nezadouci`, přeskočí je,
6. .. pokud nejsou součástí, přidá je do mezivýsledku `vysledny_slovnik`, ten po iteraci vrátí z funkce,
7. vytvoř funkci `zapis_jako_csv_soubor` s parametrem `data` a `cesta_k_souboru`,
8. funkce zapíše vyfiltrované hodnoty **do CSV souboru**.

In [None]:
data = [  # namedtuple
    {"name": "Alice", "age": 23, "score": 85},
    {"name": "Bob", "age": 27, "score": 90},
    {"name": "Charlie", "age": 22, "score": 87},
    {"name": "Diana", "age": 24, "score": 92},
    {"name": "Edward", "age": 29, "score": 88}
]

In [None]:
import csv
from typing import List, Dict, Any  # Volitelné

In [None]:
zapis_jako_csv_soubor(data=data,
                     cesta_k_souboru='../onsite/zakaznici.csv')

In [None]:
tuple(indexovana_pismena)

<details>
  <summary>▶️ Klikni zde pro zobrazení řešení</summary>
   
```python
import csv
from typing import List, Dict, Union, Tuple


def zapis_jako_csv_soubor(data: List[Dict[str, Union[str, int]]], cesta_k_souboru: str) -> None:
    with open(cesta_k_souboru, mode='w', newline='') as csv_soubor:
        zapisovac = csv.DictWriter(csv_soubor, fieldnames=data[0].keys())
        zapisovac.writeheader()
        zapisovac.writerows(data)

def zpracuj_vsechny_uzivatele(zadane_hodnoty: List[Dict[str, str]], nezadouci: Tuple[str, ...]):
    vysledny_list_slovniku = list()

    for slovnik in zadane_hodnoty:
        vysledny_list_slovniku.append(filtruj_nezadouci_sloupce(slovnik, nezadouci))

    return tuple(vysledny_list_slovniku)
    

def filtruj_nezadouci_sloupce(zadany_slovnik: Dict[str, str], nezadouci: Tuple[str, ...]):
    vysledny_slovnik = dict()

    for klic, hodnota in zadany_slovnik.items():
        if klic in nezadouci:
            continue
        vysledny_slovnik[klic] = hodnota

    return vysledny_slovnik

zpracuj_vsechny_uzivatele(data, ("age"))
```
</details>

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse1.mm.bing.net%2Fth%3Fid%3DOIP.HE9t18rjtPfxKI4noPxHiwHaHa%26pid%3DApi&f=1&ipt=75010c912a1bd645939e0cce59df21f5842a62439ba97cda758a4c7002f40ae6&ipo=images" width="150" style="margin-left:auto; margin-right:auto">

### Soubor JSON

---

Tento typ souboru možná ještě neznáš. Jedná se o příponu u souborů **.json**.

Celé jméno souboru může vypadat třeba jako `uzivatele.json`.

**JSON** si můžeš představit následovně:
```python
{
    "jmeno": "Chuck Norris",
    "neuspech": null,
    "kliky": "vsechny",
    "konkurence": false,
}
```

Na první pohled můžeš říct, že se hodně podobá **Pythonovskému slovníku**.

Nicméně má svoji vlastní charakteristickou **sadu pravidel** pro převod datových typů.

Níže jsou uvedená některá pravidla, která se týkají ukázky výše (všechna pravidla najdeš [zde](https://docs.python.org/3/library/json.html#encoders-and-decoders)):


| JSON | Python |
| :-: | :-: |
| string | str |
| true | True |
| false | False |
| null | None |

Účelem tohoto souboru je zejména **přenos dat** (*JavaScript Object Notation*).

Jde o záměrně zjednodušený formát, který **není standardním datovým typem pro Python**.

Poměrně často se s ním setkáš u **webových aplikací** různých *eshopů*, které ti vykresují nabídku na základě informací získaných z databází.

Protože **JSON** není standardním datovým typem, jako takový jej nemůžeš v Pythonu použít.

Pokud budeš chtít pracovat s JSON v Pythonu, musíš *nahrát* k tomu určenou **built-in knihovnu**.


V rámci <a href="https://docs.python.org/3/library/index.html" target="_blank">seznamu dokumentace Pythonu</a>  najdeš knihovnu `json`.

Právě tato knihovna ti umožní pomocí *interpretu* Pythonu *vytvořit* nebo *načíst* JSON.

In [59]:
import json

<br>

V rámci **základní manipulace** se zaměř hlavně na tyto funkce:

| Funkce | Účel |
| :- | :- |
| `json.dump(m, n)` | zapíše objekt do souboru JSON |
| `json.dumps(m)` | zapíše objekt do `str` |
| `json.load(m)` | načte JSON data ze souboru |
| `json.loads(m)` | načte JSON data ze `str` |

Detail tabulky:
- `m` představuje jméno objektu,
- `n` představuje jméno souboru.

###  Vytvořím JSON jako string

---

Obecně se při práci se soubory typu `json` mluví o procesech *serialization* a *deserialization* (tedy čtení a zápis), ke kterým patří příslušné funkce uvedené výše v tabulce.

In [60]:
chuckuv_slovnik = {
    "jmeno": "Chuck Norris",
    "neuspech": None,
    "kliky": "vsechny",
    "konkurence": False,
    "doplneni": "Łukasz",
}

In [61]:
print(type(chuckuv_slovnik))

<class 'dict'>


In [62]:
vypis_json = json.dumps(chuckuv_slovnik)  # Výstup pouze jako str

In [63]:
print(vypis_json)

{"jmeno": "Chuck Norris", "neuspech": null, "kliky": "vsechny", "konkurence": false, "doplneni": "\u0141ukasz"}


In [64]:
print(type(vypis_json))

<class 'str'>


Jakmile se podíváš na výstup, všimni si následujícího:
1. `null`, klíč `neuspech` už neobsahuje `None`,
2. `false`, klíč `konkurence` už neobsahuje `False`,
3. `"\u0141ukasz"`, klíč `doplneni` se nějak zkomolil.

Důvodem pro výše **zdůrazněné změny** je právě změna *Python objektů* na *JSON objekty*.

<br>

V klíči `doplneni` dostaneš string `"\u0141ukasz"`, jak je to možné?

Defaultně totiž funkce `dump` všechny *non-ASCII* znaky (které nenajdeš v ASCII tabulce) převede na znaky doplněné **zpětným lomítkem** (tedy `Ł` na `\u0141`).

### Vytvoření souboru `.json`

---

In [None]:
json_soubor = open(
    "../onsite/prvni_JSON.json",
    mode="w",
    encoding="UTF-8"
)

In [None]:
json.dump(chuckuv_slovnik, json_soubor)

In [None]:
json_soubor.close()

In [None]:
json_soubor.closed

#### Kontextový manažer


---

In [67]:
# json.dump?

In [65]:
with open("../onsite/prvni_JSON.json",
          mode="w",
          encoding="utf-8") as json_soubor:
    json.dump(chuckuv_slovnik, json_soubor)  # CO, KAM

In [68]:
json_soubor.closed

True

### Načti existující soubor `.json`

---

In [69]:
existujici_json = open("../onsite/prvni_JSON.json",
                       encoding="utf-8",
                       mode="r")

In [None]:
print(existujici_json)

In [None]:
obsah_json = json.load(existujici_json)

In [None]:
print(obsah_json)

In [70]:
existujici_json.close()

#### Kontextový manažer

---

In [72]:
# json.load?

In [73]:
with open("../onsite/prvni_JSON.json",
          mode="r",
          encoding="UTF-8") as existujici_json:
    obsah_json = json.load(existujici_json)

In [74]:
existujici_json.closed

True

In [75]:
print(type(obsah_json))

<class 'dict'>


In [76]:
print(obsah_json)

{'jmeno': 'Chuck Norris', 'neuspech': None, 'kliky': 'vsechny', 'konkurence': False, 'doplneni': 'Łukasz'}


In [None]:
chuck_sl = {
    "jmeno": "Chuck Norris",
    "neuspech": "null",
    "kliky": "vsechny",
    "konkurence": "false",
    "doplneni": "\u0141ukasz"
}

##### Doplňující argumenty:
1. `indent=4` - odsadí zapsaný `json` o 4 mezery
2. `sort_keys` - seřadí klíče (`True`/`False`)
3. `ensure_ascii` - `False` zapíše původní znak, `True` zapíše reprezentaci znaku pomocí lomítek.

In [None]:
json_str = json.dumps(
    chuckuv_slovnik,
    ensure_ascii=False,
    indent=4
)

In [None]:
print(json_str)

In [None]:
print(type(json_str))

### Zápis s kontextovým manažerem

---

Nejenom *textové soubory*, ale i JSON můžeš zapsat pomocí **kontextového manažeru** a klíčového slova `with`:

In [77]:
chuckuv_slovnik = {
    "jmeno": "Chuck Norris",
    "neuspech": None,
    "kliky": "vsechny",
    "konkurence": False,
    "doplneni": "Łukasz"
}

In [79]:
with open("../onsite/druhy_JSON.json", mode="w", encoding='utf-8') as json_soubor:
    json.dump(
        chuckuv_slovnik,
        json_soubor,
        ensure_ascii=False,
        indent=4,
        sort_keys=True
    )

In [86]:
json_soubor.closed

True

In [82]:
# json.load?

In [83]:
with open("../onsite/druhy_JSON.json", mode="r", encoding='utf-8') as json_soubor:
    obsah = json.load(json_soubor)

In [90]:
print(obsah)

{'fanousek': 'Łukasz', 'jmeno': 'Chuck Norris', 'kliky': 'vsechny', 'konkurence': False, 'neuspech': None}


In [89]:
# csv.DictWriter?

In [92]:
with open('../onsite/vysledek_z_JSON.csv',
          mode='w',
          encoding='UTF-8') as csv_soubor:
    zapisovac = csv.DictWriter(csv_soubor, fieldnames=obsah.keys())
    zapisovac.writeheader()
    zapisovac.writerow(obsah)

<br>

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse1.mm.bing.net%2Fth%3Fid%3DOIP._kpwh7Nlbd9zz581knhxIgHaHa%26pid%3DApi&f=1&ipt=8b3537d53bff97aa8ee01b5f42a34e5740448207c5c479158e94be6a62b75cdc&ipo=images" width="220" style="margin-left:auto; margin-right:auto" />

## Spouštění skriptu s argumenty

---

Jak předávat hodnoty tvému modulu nebo skriptu?

Co, když potřebuješ zadat jméno souboru, nebo jinou hodnotu?

In [1]:
%%file ../onsite/vloz_jmeno.py

# ^- magická funkce ipynb.
from typing import Optional


def pozdrav_uzivatele(jmeno: str) -> Optional[str]:
    if not jmeno:
        return None

    return f'Ahoj, {jmeno}, jak se vede?'


if __name__ == '__main__':
    print(pozdrav_uzivatele(jmeno=input('ZADEJ JMÉNO:')))

Overwriting ../onsite/vloz_jmeno.py


Funkce `input` je výborná pro různé výukové materiály a ukázky kódů.

Pro skutečný skript ale není vhodná. Testování a práce s ní není jednoduchá.

Zejména kvůli:
* **nepraktickému** chování (funkce zkrátká čeká),
* následnému **testování** (potřeba přepisovat *"mockovat"* funkcionalitu).

Proto ji **v produkčním prostředí** prakticky nepotkáš.

Jak tedy jinak předat hodnoty do souboru?

<br>

#### knihovna `sys`

---

Knihovna umí zajistit práci, některé systémové příkazy a systémové proměnné.

<br>


Dále umí také doplnit **spuštění tvého skriptu**:

In [2]:
import sys
print(sys.platform)

linux


In [3]:
%%file ../onsite/vloz_jmeno_sys.py

import sys
from typing import Optional


def pozdrav_uzivatele(jmeno: str) -> Optional[str]:
    if not jmeno:
        return None

    return f'Ahoj, {jmeno}, jak se vede?'


if __name__ == '__main__':
    print(sys.argv)
    # print(pozdrav_uzivatele(jmeno=input('ZADEJ JMÉNO:')))  # Nyní nepotřebujeme

Overwriting ../onsite/vloz_jmeno_sys.py


Takový výstup je podivný.

Můžeš si všimnout sekvence, která obsahuje jen nultý index. Tedy jméno spuštěního skriptu.

<br>

Co se stane, pokud spuštění souboru ještě doplníš o následnou hodnotu jako:
```bash
python3 ../onsite/vloz_jmeno_sys.py "a" "b"
```

#### Demo: příkazový řádek, `python <jmeno_souboru>.py "a" "b"`

<br>

Tentokrát sekvence (`list`) obsahuje více obsazených indexů.

Můžeš použít i samotné jméno:
```bash
python3 ../onsite/vloz_jmeno_sys.py "Matouš"
```

#### Demo: příkazový řádek, `python <jmeno_souboru>.py "Matouš"`

Uprav nyní původní skript tak, aby pracoval se jménem (resp. druhým argumentem).

In [4]:
%%file ../onsite/vloz_jmeno_sys_opt.py

import sys
from typing import Optional


def pozdrav_uzivatele(jmeno: str) -> Optional[str]:
    if not jmeno:
        return None

    return f'Ahoj, {jmeno}, jak se vede?'


if __name__ == '__main__':
    try:
        vyplnene_jmeno = sys.argv[1]

    except IndexError:
        print("Chybí argument se jménem")
    else:
        print(pozdrav_uzivatele(jmeno=sys.argv[1]))

Overwriting ../onsite/vloz_jmeno_sys_opt.py


<br>

Tímto způsobem můžeš práci tvého skriptu ještě vylepšit.

Můžeš použít samozřejmě i **více systémových argumentů**.

Tam už je ale složitější sledovat pořadí.

In [None]:
import sys

if len(sys.argv) != 3:
    print(
        "Chybné spuštění",
        "Příklad: python jmeno.py 'arg1' 'arg2'",  # Kdy zapsat který systémový argument
        sep="\n"
    )
else:
    print("Pokračuji")

<br>

#### Více argumentů a pořádně

---

Pokud budeš potřebovat **zadat a utřídit více argumentů**, jsou vhodné další knihovny.

Další varianty:
1. Knihovny `argparse` ([dokumentace](https://docs.python.org/3/library/argparse.html?highlight=argparse#module-argparse)), *zabudovaná* knihovna,
2. knihovna `click` ([dokumentace](https://pypi.org/project/click/)), knihovna *třetích stran*.

#### **Demo: ukázka `argparse`**

In [None]:
import argparse

parser = argparse.ArgumentParser()
parser.add_argument(dest='jmeno', help="Argument, ktery vyzaduje 'jmeno'")
parser.add_argument(dest='strana', choices=['prava', 'leva'], help='')

args = parser.parse_args()
print(
    args.jmeno,
    args.strana,
    sep="\n"
)

<br>

#### **Demo: ukázka `click`**

In [None]:
import click


@click.command()
@click.option("-t", "--token", required=True)
@click.argument("tabulky", nargs=-1)
def upload(token: str, tabulky) -> None:
    if token:
        print(f"Získávám tabulky: {tabulky}")
    else:
        print("Neplatný token.")


upload()

In [None]:
# python muj_modul.py -u 'adr1' 'adr2'
# python muj_modul.py 'all'

In [None]:
# python muj_modul.py "muj_soubor.json"

<br>

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse3.mm.bing.net%2Fth%3Fid%3DOIP.GMJvJ-GG0YS8H5JmHR3CbwHaHm%26pid%3DApi&f=1&ipt=110157bae9409977a59d895a970a6d51afa8a31e0c7fca53a1f95fd2402f9a35&ipo=images" width="200">

## Domácí úloha

---

Napiš *skript*, který:

1. Načte soubor typu `JSON`,
2. rozdělí obsah **podle klíčů**,
3. zapíšeš rozdělená data do sloupečků **v CSV souboru**,
4. (nepovinné), zadávání vstupního a výstupního jména souborů proběhne pomocí spouštěcích argumentů.

Vstupní **JSON** soubor:

```
    {
        "id": 1,
        "first_name": "Dorri",
        "last_name": "Di Bernardo",
        "email": "ddibernardo0@nba.com",
        "gender": "Female",
        "ip_address": "158.223.131.8"
    },
    {
        "id": 2,
        "first_name": "Nisse",
        "last_name": "Noye",
        "email": "nnoye1@theatlantic.com",
        "gender": "Female",
        "ip_address": "252.57.218.72"
    },
    ...
```

Výstupní **CSV**:
```
["id", "first_name", "last_name", "email", "gender", "ip_address"],
["1", "Dorri", "Di Bernardo", "ddibernardo0@nba.com", "Female", "158.223.131.8"],
["2", "Nisse", "Noye", "nnoye1@theatlantic.com", "Female", "252.57.218.72"],
...
```

---