# JSON - práce s daty

V této lekci se naučíte pracovat s formátem JSON, který je standardem pro výměnu dat mezi různými systémy.

## Co je JSON?

**JSON** (JavaScript Object Notation) je formát pro ukládání a přenos komplexních dat.

- Je to textový formát, který je snadno čitelný pro lidi i počítače
- Většina programovacích jazyků umí s JSON pracovat
- Název pochází z JavaScriptu, ale není na něj omezen

## Co může JSON obsahovat?

JSON může obsahovat:
- **řetězce** (strings)
- **čísla** (integers a floats)
- **logické hodnoty** (`true`, `false`)
- **seznamy** (lists)
- **slovníky** (dictionaries)
- hodnotu `null` (odpovídá Python `None`)

## Proč potřebujeme JSON?

Datové struktury jako slovníky a seznamy existují pouze v paměti počítače (RAM), když běží Python.

**Problém:** Nelze je přímo uložit na disk nebo poslat po internetu.

**Řešení:** JSON převede tyto struktury na řetězec, který lze:
- uložit do souboru
- poslat po internetu
- sdílet mezi různými programy

## Základní struktura JSON

Nejjednodušší JSON objekt jsou prázdné složené závorky:

In [1]:
prazdny_slovnik = {}
print(prazdny_slovnik)

{}


In [2]:
# Toto je prázdný JSON objekt jako řetězec
prazdny_json = '{}'
print(prazdny_json)

{}


In [3]:
type(prazdny_json)

str

JSON objekt obsahuje páry klíč-hodnota oddělené čárkami:

In [4]:
# Jednoduchý JSON objekt s daty osoby
osoba_json = '''
{
    "firstname": "John",
    "lastname": "Smith",
    "age": 18,
    "status": true
}
'''
print(osoba_json)


{
    "firstname": "John",
    "lastname": "Smith",
    "age": 18,
    "status": true
}



In [5]:
type(osoba_json)

str

JSON může obsahovat vnořené objekty:

In [8]:
# JSON s vnořeným objektem (adresa)
osoba_s_adresou = '''
{
    "firstname": "John",
    "lastname": "Smith",
    "age": 18,
    "status": true,
    "address": {
        "city": "Austin",
        "state": "TX",
        "street": "Nowhere"
    }
}
'''
print(osoba_s_adresou)


{
    "firstname": "John",
    "lastname": "Smith",
    "age": 18,
    "status": true,
    "address": {
        "city": "Austin",
        "state": "TX",
        "street": "Nowhere"
    }
}



JSON může obsahovat seznamy:

In [None]:
# JSON se seznamem aut
osoba_kompletni = '''
{
    "firstname": "John",
    "lastname": "Smith",
    "age": 18,
    "status": true,
    "address": {
        "city": "Austin",
        "state": "TX",
        "street": "Nowhere"
    },
    "cars": [
        "ford",
        "honda",
        "fiat"
    ]
}
'''
print(osoba_kompletni)

## JSON a Python - modul json

Pro práci s JSON v Pythonu používáme modul `json`.

JSON je v Pythonu reprezentován jako **řetězec** (string).

In [9]:
# Import modulu json
import json

## Konverze slovníku na JSON - json.dumps()

Funkce `json.dumps()` převede Python slovník na JSON řetězec.

(dumps = "dump string")

In [10]:
# Python slovník
kniha = {
    "author": "Stephen King",
    "title": "The Gunslinger",
    "is_ok": True
}

In [11]:
type(kniha)

dict

In [12]:
# Převod na JSON
kniha_json = json.dumps(kniha)

In [13]:
type(kniha_json)

str

In [14]:
kniha_json

'{"author": "Stephen King", "title": "The Gunslinger", "is_ok": true}'

**Všimněte si:** Python `True` → JSON `true`

### ÚLOHA / DOPLNĚNÍ

Doplňte chybějící část kódu pro převod slovníku na JSON:

In [15]:
student = {
    "jmeno": "Anna",
    "vek": 20,
    "aktivni": True
}

In [16]:
student_json = json.dumps(student)
type(student_json)

str

In [None]:
# Doplňte správnou funkci pro převod na JSON
student_json = student.
print(student_json)

## Konverze JSON na slovník - json.loads()

Funkce `json.loads()` převede JSON řetězec na Python slovník.

(loads = "load string")

In [None]:
# JSON řetězec
json_retezec = '{"author": "Stephen King", "title": "The Gunslinger", "is_ok": true}'

In [None]:
# Převod na slovník
kniha_dict = json.loads(json_retezec)

**Všimněte si:** JSON `true` → Python `True`, JSON `null` → Python `None`

### ÚLOHA / DOPLNĚNÍ

Doplňte chybějící část kódu pro převod JSON na slovník:

In [None]:
json_data = '{"jmeno": "Petr", "vek": 25, "mesto": "Praha"}'

# Doplňte správnou funkci pro převod na slovník
data_dict = 

In [None]:
# Vypište jméno 

## Rozdíl mezi slovníkem a JSON

I když vypadají podobně, **slovník a JSON nejsou totéž**:
- **Slovník** = Python datová struktura (můžeme dotazovat klíče)
- **JSON** = textový řetězec (nemůžeme dotazovat klíče)

In [None]:
# Python slovník
data_as_dict = {'Harry Potter': 'Gryffindor', 'Draco Malfoy': 'Slytherin'}

In [None]:
print("Přístup ke klíči:")
print(data_as_dict['Harry Potter'])

In [None]:
# Převod na JSON
data_as_json = json.dumps(data_as_dict)

In [None]:
print("Výřez řetězce [10:25]:")
print(data_as_json[10:25])  # JSON je jen text, takže můžeme dělat jen operace s řetězci

### ÚLOHA / OPRAVA CHYBY

Následující kód obsahuje chybu. Najděte ji a opravte:

In [None]:
data = {"jmeno": "Eva", "vek": 30}
data_json = json.dumps(data)

print(data_json["jmeno"]) 

## Příklad: Komplexní JSON data

In [None]:
# Příklad komplexního JSON objektu s klienty
str_data = '''
{
    "clients": [
        {
            "guid": "68c625a8-8558-4e8d-bd07-dccf028aaf9a",
            "isActive": false,
            "name": "Bennett Walter",
            "tags": ["occaecat", "adipisicing"],
            "friends": [
                {"id": 0, "name": "Perez Thornton"}
            ]
        },
        {
            "guid": "6c8202a0-a6e6-47af-ac1a-ba5b4feadf60",
            "isActive": true,
            "name": "Sarah Connor",
            "tags": ["tech", "future"],
            "friends": []
        }
    ]
}
'''

print(str_data)

Převedeme tento JSON na slovník a zkusíme z něj získat data:

In [None]:
json_data

In [None]:
# Převod JSON na slovník
json_data = json.loads(str_data)

In [None]:
with open('xxx.json', 'w', encoding='utf-8') as file:
    file.write(json.dumps(json_data, indent=2))


In [None]:
# Získání jména prvního klienta
prvni_klient = json_data['clients'][0]['name']
print(f"První klient: {prvni_klient}")

In [None]:
# Získání tagů druhého klienta
tagy_druheho = json_data['clients'][1]['tags']
print(f"Tagy druhého klienta: {tagy_druheho}")

## Čtení JSON ze souboru

Pro čtení JSON ze souboru:
1. Otevřeme soubor
2. Přečteme jeho obsah pomocí `read()`
3. Převedeme na slovník pomocí `json.loads()`

In [None]:
# Příklad čtení JSON souboru



## JSON může být slovník i seznam!

Dosud jsme pracovali hlavně se slovníky, ale **JSON může být také seznam**.

JSON podporuje dva hlavní typy na nejvyšší úrovni:
- **Objekt** (slovník) - začína `{` a končí `}`
- **Pole** (seznam) - začína `[` a končí `]`

### JSON jako slovník

In [None]:
slovnik = # dopln
 
# konverze

print(json_slovnik)

### JSON jako seznam

In [None]:
seznam = # dopln

print(json_seznam)

### JSON jako seznam slovníků (velmi časté!)

In [None]:
seznam_slovniku = # dopln 


print(json_seznam_slovniku)

## Zápis JSON do souboru

Pro zápis JSON do souboru:
1. Převedeme data na JSON pomocí `json.dumps()`
2. Otevřeme soubor v módu zápisu ('w')
3. Zapíšeme JSON řetězec pomocí `write()`

In [None]:
# Vytvoření dat
orders = [
    {'item': 'Bread', 'quantity': 1},
    {'item': 'Butter', 'quantity': 1},
    {'item': 'Tomato', 'quantity': 4},
]

In [None]:
# Zápis do souboru
with open('orders.json', 'w', encoding='utf-8') as file:
    file.write(json.dumps(orders))

In [None]:
# parameter indent
with open('orders.json', 'w', encoding='utf-8') as file:
    file.write(json.dumps(orders, indent=2))

Ověření, že soubor byl vytvořen:

In [None]:
# Čtení zpět
with open('orders.json', 'r', encoding='utf-8') as file:
    nacitana_data = json.loads(file.read())

print("Načtená data:")
print(nacitana_data)

### ÚLOHA / KOMPLETNÍ KÓD

Vytvořte slovník s informacemi o vašem oblíbeném filmu (název, rok, režisér, hodnocení). Převeďte ho na JSON a uložte do souboru `film.json`.

In [None]:
# Zde napište váš kód


### ÚLOHA / KOMPLETNÍ KÓD

Vytvořte seznam studentů (každý student má jméno, věk a seznam oblíbených předmětů). Uložte tento seznam jako JSON do souboru a pak jej načtěte zpět a vypište jméno prvního studenta.

In [None]:
# Zde napište váš kód


### ÚLOHA / ANALÝZA DAT

Máte JSON s daty o knihách. Vypište názvy všech knih, které mají hodnocení vyšší než 4.0.

In [None]:
knihy_json = '''
{
    "knihy": [
        {"nazev": "1984", "autor": "George Orwell", "hodnoceni": 4.5},
        {"nazev": "Hobit", "autor": "J.R.R. Tolkien", "hodnoceni": 4.8},
        {"nazev": "Malý princ", "autor": "Antoine de Saint-Exupéry", "hodnoceni": 3.9},
        {"nazev": "Harry Potter", "autor": "J.K. Rowling", "hodnoceni": 4.6}
    ]
}
'''

# Zde napište váš kód


### ÚLOHA / OPRAVA CHYBY

Následující kód má několik chyb. Najděte je a opravte:

In [None]:
# JSON řetězec s chybou
data = "{'jmeno': 'Karel', 'vek': 25}" 

slovnik = json.loads(data)
print(slovnik['jmeno'])

## Cvičení 1: Filtrování dat z JSON souboru

Prohlédněte si obsah souboru `clients.json`. Vaším úkolem je zobrazit několik seznamů:

1. Seznam jmen a příjmení žen
2. Seznam jmen mužů
3. Seznam aktivních klientů
4. Seznam klientů s tagem `adipisicing`
5. Seznam klientů se zelenýma očima
6. Seznam klientů s polským telefonním číslem

**Nápověda k bodu 1:**

Nejprve vytvořte prázdný seznam pro uložení jmen žen.

Načtěte soubor `clients.json` a převeďte ho na slovník. Všimněte si, že tento slovník obsahuje pouze jeden prvek - seznam slovníků reprezentujících osoby. Seznam je uložen pod klíčem `clients`.

Jakmile máte seznam klientů, projděte ho cyklem `for`. Uvnitř cyklu použijte `if` pro kontrolu, zda je daná osoba muž nebo žena (informace je dostupná pod klíčem `gender`). Pokud je to žena, přidejte jméno do seznamu (informace je dostupná pod klíčem `name`).

Další podúkoly budou analogické k prvnímu.

**Nápověda k bodu 4:**
Použijte klíčové slovo `in` pro kontrolu, zda se prvek nachází v seznamu.

**Nápověda k bodu 6:**
Můžete použít regulární výraz pro kontrolu čísla. Příklad regulárního výrazu, který kontroluje, zda je číslo polské: `\+48[0-9 ]{9,12}`. Tento výraz:
1. Kontroluje, zda číslo začíná +48 (nezapomeňte, že znak `+` znamená "jedno nebo více opakování", pokud chcete najít samotný znak, musíte použít `\+`)
2. Následně kontroluje, že za předvolbou je 9 až 12 znaků z rozsahu: mezery a číslice od 0 do 9

In [None]:
print("Seznam jmen a příjmení žen:")

# Zde napište své řešení

# očekávaný výsledek: Alexandra Garrison, Jane Nash, Edwina Whitley

In [None]:
print("Seznam jmen a příjmení mužů:")

# Zde napište své řešení

# očekávaný výsledek: Bennett Walter, Burris Rodriquez

In [None]:
print("Seznam aktivních klientů:")

# Zde napište své řešení

# očekávaný výsledek: Burris Rodriquez

In [None]:
print("Seznam klientů s tagem 'adipisicing':")

# Zde napište své řešení

# očekávaný výsledek: Bennett Walter, Alexandra Garrison, Burris Rodriquez

In [None]:
print("Seznam klientů se zelenýma očima:")

# Zde napište své řešení

# očekávaný výsledek: Alexandra Garrison, Jane Nash, Burris Rodriquez

In [None]:
print("Seznam klientů s polským telefonním číslem:")

# Zde napište své řešení

# očekávaný výsledek: Bennett Walter

## Cvičení 2: Práce s TODO seznamem v JSON

Otevřete soubor `todo.json` a seznamte se s jeho formátem a obsahem. Poté ve třech samostatných buňkách naprogramujte:

**1.** Kód, který zobrazí obsah souboru pomocí funkce `print`, formátovaný jako:
```
<JMÉNO UŽIVATELE>, your job today is to <ÚKOL #1>
<JMÉNO UŽIVATELE>, your job today is to <ÚKOL #2>
...
```

Pro zadaný příklad to bude:
```
John, your job today is to buy bread
John, your job today is  je to buy butter
```

**2.** Kód, který se zeptá uživatele na jeho jméno (pomocí funkce `input`) a poté vytvoří soubor `todo.json` s obsahem:
```json
{
  "owner": "<JMÉNO ZADANÉ UŽIVATELEM>",
  "tasks": []
}
```
Pokud soubor již existuje, měl by být přepsán.

**3.** Kód, který se zeptá na popis nového úkolu (opět funkce `input`), načte aktuální obsah souboru a zapíše nový úkol jako řetězec do seznamu `"tasks"` v souboru. Opakované spuštění této buňky uloží několik úkolů do seznamu:
```json
{
  "owner": "John",
  "tasks": ["to buy bread", "to buy butter", "to buy milk", "to add oil to Honda"]
}
```

Pokud soubor již existuje, měl by být přepsán.

In [None]:
# Načtěte soubor a zobrazte jeho obsah zde



In [None]:
# Zeptejte se uživatele na jméno a vytvořte soubor `todo.json` s odpovídajícím obsahem



In [None]:
# Zeptejte se na nový úkol a přidejte ho do souboru

