### Praktická úloha, `json2csv`

---

V dnešní hodině budeme chtít načíst obsah různých souborů typu `json` a uložit je do tabulkového formátu `csv`.

<br>

Všechny potřebné json-y najdeme v adresáři `solution`, odkud je budeme chtít přečíst a kam budeme chtít uložit výsledný soubor, `solution/vysledky.csv`.

<br>

Celá úloha se bude skládat z těchto na sebe navazujících kroků:
1. *Načíst* všechny potřebné jména textových souborů,
2. *načíst* obsah všech textových souborů,
3. *vybrat* data, která nás zajímají,
4. *uložit* obsah do souboru `solution/vysledky.csv`.

<br>

<br>

#### Obecné spuštění

---

```
python json_to_csv.py
> Spoustim prevadec...
> prevadim.
```

In [2]:
!dir /b solution

.ipynb_checkpoints
nakup.xlsx
ORIG_1.json
ORIG_2.json
ORIG_3.json
ORIG_4.json
solution11.py


In [None]:
# zapič funkci hlavní(main) a řídící(json_to_csv)

<details>
  <summary>▶️  Klikni zde pro zobrazení</summary>
   
```python
def hlavni() -> None:
    print("> Spoustim prevadec...")
    
def json_to_csv() -> None:
    """
    1. Nacist vsechny potrebne .json soubory,
    2. nacist obsah vsech nalezenych .json,
    3. upravit obsah podle naseho vyberu,
    4. ulozit soubory do lokalniho souboru.
    """
    print("> prevadim.")

import os

def najdi_soubor_json(adresar: str) -> list:  # TODO
    return [jmeno for jmeno in os.listdir(adresar)
             if os.path.splitext(jmeno)[1] == ".json" and "_" in jmeno]
```
</details>

<br>

#### Načti potřebné jména souborů

---

```
python json_to_csv.py
{'ORIG.json', 'ORIG_2.json', 'ORIG_1.json', 'ORIG_3.json', 'ORIG_4.json'}
```

<details>
  <summary>▶️  Klikni zde pro zobrazení</summary>
   
```python
# Načti jména všech .json souborů
import os

def hlavni() -> None:
    rel_cesta = "solution/"
    json_to_csv(rel_cesta)
    
def json_to_csv(adresar: str) -> None:
    """
    1. Nacist vsechny potrebne .json soubory,
    2. nacist obsah vsech nalezenych .json,
    3. upravit obsah podle naseho vyberu,
    4. ulozit soubory do lokalniho souboru.
    """
    jsony = najdi_json_soubory(adresar)
    print(jsony)
    
def najdi_json_soubory(adresar: str) -> set:
    return {
        json_soubor
        for json_soubor in os.listdir(adresar)
        if os.path.splitext(json_soubor)[1] == ".json"
    }

hlavni()

import os
import json
import traceback


def najdi_soubor_json(adresar: str) -> list:  # TODO
    return [jmeno for jmeno in os.listdir(adresar)
             if os.path.splitext(jmeno)[1] == ".json" and "_" in jmeno]
    

def precti_json(jmeno: str):
    try:
        soub_json = open(
            os.path.join("solution", jmeno), "r", encoding="utf-8"
        )
    except FileNotFoundError:
        exc = traceback.format_exc()
        obsah = exc
    else:
        zamestnanci = json.load(soub_json)
        soub_json.close()
    finally:
        return obsah
```
</details>


<br>

#### Načti obsah souborů

---

```
python json_to_csv.py
[[{'email': 'epragnall6y@elpais.com',
   'first_name': 'Eyde',
   'gender': 'Female',
   'id': 251,
   'ip_address': '161.96.16.83',
   'last_name': 'Pragnall'},
  {'email': 'dferroni6z@indiatimes.com',
  ...
```

In [None]:
# Zapiš funkci pro načítání obsahu

<details>
  <summary>▶️  Klikni zde pro zobrazení</summary>
   
```python
# Zapiš funkci pro načítání obsahu
# Zapiš funkci pro upravení načteného obsahu
import os
import json


def hlavni() -> None:
    rel_cesta = "solution/"
    zadouci_klice = ("first_name", "last_name", "email")
    json_to_csv(rel_cesta, zadouci_klice)


def json_to_csv(adresar: str, zadouci: tuple) -> None:
    """
    1. Nacist vsechny potrebne '.json' soubory (fce:'najdi_json_soubory()'),
    2. ^- nacist obsah vsech nalezenych '.json' (fce:'nacti_obsah_jsonu()'),
    3. ^- upravit nact. obs. podle naseho vyberu (fce:'filtruj_nepotrebne_klice()'),
    4. ^- ulozit upr. obs. do lokalniho souboru (fce:'zapis_upravene_do_csv()').
    """
    jsony = najdi_json_soubory(adresar)
    obsah_jsonu = [
        print(slovnik)
        for json_soubor in jsony
        for slovnik in nacti_obsah_jsonu(adresar, json_soubor)
    ]


def najdi_json_soubory(adresar: str) -> set:
    """
    V seznamu vsech souboru zadaneho adresare najdi jen soubory s priponou '.json'.
    """
    return {
        json_soubor
        for json_soubor in os.listdir(adresar)
        if os.path.splitext(json_soubor)[1] == ".json"
    }


def nacti_obsah_jsonu(adresar: str, soubor: str) -> list:
    with open(os.path.join(adresar, soubor)) as json_s:
        return json.load(json_s)


hlavni()
```
</details>

<br>

#### Uprav obsah souborů

---

```
python json_to_csv.py
{'first_name': 'Dorri', 'last_name': 'Di Bernardo', 'email': 'ddibernardo0@nba.com'}
{'first_name': 'Nisse', 'last_name': 'Noye', 'email': 'nnoye1@theatlantic.com'}
{'first_name': 'Fitzgerald', 'last_name': 'Tejero', 'email': 'ftejero2@businessinsider.com'}
{'first_name': 'Nappie', 'last_name': 'Claricoats', 'email': 'nclaricoats3@ucoz.com'}
{'first_name': 'Dolph', 'last_name': 'Pie', 'email': 'dpie4@joomla.org'}
...
```

In [None]:
# Zapiš funkci pro upravení načteného obsahu

<details>
  <summary>▶️  Klikni zde pro zobrazení</summary>
   
```python
# Zapiš funkci pro upravení načteného obsahu
import os
import json


def hlavni() -> None:
    rel_cesta = "solution/"
    zadouci_klice = ("first_name", "last_name", "email")
    json_to_csv(rel_cesta, zadouci_klice)


def json_to_csv(adresar: str, zadouci: tuple) -> None:
    """
    1. Nacist vsechny potrebne '.json' soubory (fce:'najdi_json_soubory()'),
    2. ^- nacist obsah vsech nalezenych '.json' (fce:'nacti_obsah_jsonu()'),
    3. ^- upravit nact. obs. podle naseho vyberu (fce:'filtruj_nepotrebne_klice()'),
    4. ^- ulozit upr. obs. do lokalniho souboru (fce:'zapis_upravene_do_csv()').
    """
    jsony = najdi_json_soubory(adresar)
    obsah_jsonu = [
        print(filtruj_nepotrebne_klice(zadouci, slovnik))
        for json_soubor in jsony
        for slovnik in nacti_obsah_jsonu(adresar, json_soubor)
    ]


def najdi_json_soubory(adresar: str) -> set:
    """
    V seznamu vsech souboru zadaneho adresare najdi jen soubory s priponou '.json'.
    """
    return {
        json_soubor
        for json_soubor in os.listdir(adresar)
        if os.path.splitext(json_soubor)[1] == ".json"
    }


def nacti_obsah_jsonu(adresar: str, soubor: str) -> list:
    with open(os.path.join(adresar, soubor)) as json_s:
        return json.load(json_s)


def filtruj_nepotrebne_klice(zadouci: tuple, puvodni_sl: dict) -> dict:
    """
    Zapis do noveho slovniku vsechny klice v par. 'zadouci' z puvodniho slovniku.
    """
    upravene_klice = dict()

    for klic in puvodni_sl.keys():
        if klic not in zadouci:
            continue
        upravene_klice[klic] = puvodni_sl[klic]

    return upravene_klice


hlavni()
```
</details>

<br>

#### Ulož upravený obsah do výsledného `.csv` souboru

---

```
python json_to_csv.py
> Soubor 'vysledky.csv' zapsan na disk
```

In [None]:
# Zapiš funkci pro upravení načteného obsahu

<details>
  <summary>▶️  Klikni zde pro zobrazení</summary>
   
```python
# Zapiš funkci pro upravení načteného obsahu
import os
import csv
import json


def hlavni() -> None:
    rel_cesta = "solution/"
    zadouci_klice = ("first_name", "last_name", "email")
    json_to_csv(rel_cesta, zadouci_klice)

    
def json_to_csv(adresar: str, zadouci: tuple) -> None:
    """
    1. Nacist vsechny potrebne '.json' soubory (fce:'najdi_json_soubory()'),
    2. ^- nacist obsah vsech nalezenych '.json' (fce:'nacti_obsah_jsonu()'),
    3. ^- upravit nact. obs. podle naseho vyberu (fce:'filtruj_nepotrebne_klice()'),
    4. ^- ulozit upr. obs. do lokalniho souboru (fce:'zapis_upravene_do_csv()').
    """
    jsony = najdi_json_soubory(adresar)
    obsah_jsonu = [
        filtruj_nepotrebne_klice(zadouci, slovnik)
        for json_soubor in jsony
        for slovnik in nacti_obsah_jsonu(adresar, json_soubor)
    ]

    zapis_upravene_do_csv("vysledky.csv", obsah_jsonu)

    
def najdi_json_soubory(adresar: str) -> set:
    """
    V seznamu vsech souboru zadaneho adresare najdi jen soubory s priponou '.json'.
    """
    return {
        json_soubor
        for json_soubor in os.listdir(adresar)
        if os.path.splitext(json_soubor)[1] == ".json"
    }


def nacti_obsah_jsonu(adresar: str, soubor: str) -> list:
    with open(os.path.join(adresar, soubor)) as json_s:
        return json.load(json_s)


def filtruj_nepotrebne_klice(zadouci: tuple, puvodni_sl: dict) -> dict:
    """
    Zapis do noveho slovniku vsechny klice v par. 'zadouci' z puvodniho slovniku.
    """
    upravene_klice = dict()
    
    for klic in puvodni_sl.keys():
        if klic not in zadouci:
            continue
        upravene_klice[klic] = puvodni_sl[klic]
    
    return upravene_klice


def zapis_upravene_do_csv(soubor: str, udaje: list) -> None:
    """
    Do zadaneho souboru (par. 'soubor') zapis filtrovane udaje (par. 'udaje').
    
    Z prvniho indexu par. 'udaje' zkus vzit jmena klicu a vytvorit z nich
    zahlavi souboru.
    """
    with open(soubor, "w", encoding="utf-8") as csv_vystup:
        try:
            sloupecky = udaje[0].keys()
        except IndexError:
            print(f"Problem s indexem u {type(udaje)}")
        except FileExistsError:
            print("Nemuzu prepsat existujici soubor")
        else:
            zapis = csv.DictWriter(csv_vystup, fieldnames=sloupecky)
            zapis.writeheader()
            zapis.writerows(udaje)
            print(f"Soubor {soubor} zapsan na disk")

            
hlavni()
```
</details>

---