# Ćwiczenia 5 - JSON i inne formaty plików

Innym, bardzo popularnym formatem obok XML jest format **JSON (JavaScript Object Notation)**. JSON jest lekkim formatem tekstowym, bazującym na podzbiorze języka JavaScript. Bardzo podobną strukturą danych w Pythonie jest poznany przez nas słownik. 

Format JSON jest bardzo użyteczny. Powodem tego jest po pierwsze jego prostota (parowanie klucz-wartość ułatwia zapisanie jak i odczytanie informacji) i lekkość (poza istotnymi informacjami występują tylko przecinki, cudzysłowy, dwukropki i nawiasy klamrowe). Format ten jest często używany do transferu danych w sieci. 

Jak widzimy format JSON to nic innego jak zbiór zagnieżdżonych słowników i list.

![image-2.png](attachment:image-2.png)

Używając <a href="https://jsonformatter.org/">walidatora</a> można sprawdzić, czy plik JSON jest poprawnie zapisany. W Pythonie dane przechowywane w słownikach możemy przekazać do pliku *json* za pomocą biblioteki *json*. Dane przekazujemy za pomocą funkcji *dump*, która przyjmuje jako parametry słownik oraz zmienną plikową.

In [5]:
import json

data = {
    'user_1': {
        'user_name': 'Marcelek_1999',
        'password': 'haselko',
        'number_of_posts': 10
        },
    'user_2': {
        'user_name': 'Nikoś_2006',
        'password': 'qwertyuio',
        'number_of_posts': 18        
        
    }
}



with open(file='forum.json', mode='w') as file:
    json.dump(data, file)

Spróbujmy teraz otworzyć zapisany plik:

In [6]:
with open(file='forum.json', mode='r') as file:
    forum = json.load(file)
    
print(forum)

{'user_1': {'user_name': 'Marcelek_1999', 'password': 'haselko', 'number_of_posts': 10}, 'user_2': {'user_name': 'Nikoś_2006', 'password': 'qwertyuio', 'number_of_posts': 18}}


Widzimy, że dane do pliku są przechowywane prawidłowo. Spróbujmy zatem wykonać proste ćwiczenie, aby zobaczyć funkcjonalność tego formatu.

**Zadanie 1.** Utworzyć narzędzia umożliwiające wykonanie prostego programu, do przechowywania i modyfikacji danych (wraz z przykładowymi początkowymi danymi) w prostym dzienniku elektronicznym. Wykorzystać format JSON. 

In [62]:
import json
import random

random.seed(44)

students_name = ['Rzeczkowski Michał',
                 'Kowalski Jan',
                 'Zieliński Mateusz',
                 'Wiśniewski Tomasz',
                 'Andrzej Kura',
                 'Ronald Fus']

classes = ['matematyka', 'j. polski', 'j. angielski', 'historia', 'geografia', 'w-f']




# Tworzymy dziennik klasowy w której każdy uczeń jest kluczem słownika,
# którego wartościami jest następujący słownik - przedmiot (klucz), wartość - lista ocen
# Następnie należy uzupełnić słownik w ten sposób , aby z każdego przdmiotu uczeń miał  od 1 do 4 losowych ocen tworzących listę.
# Każdemu uczniowi dodać nowy klucz - średnia ze wszystkich średnich z przedmiotów przybliżonych do wartości całkowitych.
# przy czym ocena z pojedynczego przedmiotu
# Utworzyć nowy słownik uczeń-średnia.


students = dict()


for name in students_name:
    students[name] = {cl : [] for cl in classes}
    
print(students)  # pojawi się pusty dziennik

{'Rzeczkowski Michał': {'matematyka': [], 'j. polski': [], 'j. angielski': [], 'historia': [], 'geografia': [], 'w-f': []}, 'Kowalski Jan': {'matematyka': [], 'j. polski': [], 'j. angielski': [], 'historia': [], 'geografia': [], 'w-f': []}, 'Zieliński Mateusz': {'matematyka': [], 'j. polski': [], 'j. angielski': [], 'historia': [], 'geografia': [], 'w-f': []}, 'Wiśniewski Tomasz': {'matematyka': [], 'j. polski': [], 'j. angielski': [], 'historia': [], 'geografia': [], 'w-f': []}, 'Andrzej Kura': {'matematyka': [], 'j. polski': [], 'j. angielski': [], 'historia': [], 'geografia': [], 'w-f': []}, 'Ronald Fus': {'matematyka': [], 'j. polski': [], 'j. angielski': [], 'historia': [], 'geografia': [], 'w-f': []}}


Wypełnijmy dziennik ocenami.

In [63]:
for name in students.keys():
    for cl in students[name].keys():
        numb_grades = random.randint(1,4)  #wstawiamy od 1 do 4 ocen z danego przedmiotu (wybieramy liczbę ocen)
        for _ in range(numb_grades):
            students[name][cl].append(random.randint(1,6)) # wstawiamy (losujemy) oceny z konkretnego przedmiotu
print(students)

{'Rzeczkowski Michał': {'matematyka': [5, 5, 6, 1], 'j. polski': [4, 2], 'j. angielski': [1, 2, 1], 'historia': [1], 'geografia': [5, 6], 'w-f': [6, 6, 4]}, 'Kowalski Jan': {'matematyka': [6, 6, 3, 3], 'j. polski': [3], 'j. angielski': [5, 2, 1], 'historia': [5], 'geografia': [3], 'w-f': [1, 6, 3]}, 'Zieliński Mateusz': {'matematyka': [3], 'j. polski': [1, 4, 4, 2], 'j. angielski': [2, 3], 'historia': [1, 1], 'geografia': [6, 1, 6, 6], 'w-f': [3, 4, 6]}, 'Wiśniewski Tomasz': {'matematyka': [5, 5, 2, 2], 'j. polski': [4, 6, 6, 3], 'j. angielski': [3], 'historia': [1, 2], 'geografia': [5], 'w-f': [3, 5, 2]}, 'Andrzej Kura': {'matematyka': [1, 3, 3, 1], 'j. polski': [5, 6], 'j. angielski': [4], 'historia': [6], 'geografia': [1, 2, 2, 6], 'w-f': [5]}, 'Ronald Fus': {'matematyka': [6, 1, 3], 'j. polski': [1], 'j. angielski': [3, 2, 6, 5], 'historia': [1, 3], 'geografia': [3, 1, 5, 5], 'w-f': [5, 4, 1]}}


Spróbujmy policzyć średnią ocen dla każdego ucznia (średnia ze średnich).

In [64]:
#tworzymy nową funkcjonalność - średnia globalna

for name in students.keys():
    s = 0
    for cl in students[name].keys():
        s += round(sum(students[name][cl]) / len(students[name][cl]))
    s = s / len(students[name])
    students[name]['średnia'] = round(s,2)
    


means = {name : students[name]['średnia'] for name in students.keys()}

In [65]:
print(students)


print('='*125)
print('='*125)
print('Same średnie:')

print(means)

{'Rzeczkowski Michał': {'matematyka': [5, 5, 6, 1], 'j. polski': [4, 2], 'j. angielski': [1, 2, 1], 'historia': [1], 'geografia': [5, 6], 'w-f': [6, 6, 4], 'średnia': 3.33}, 'Kowalski Jan': {'matematyka': [6, 6, 3, 3], 'j. polski': [3], 'j. angielski': [5, 2, 1], 'historia': [5], 'geografia': [3], 'w-f': [1, 6, 3], 'średnia': 3.5}, 'Zieliński Mateusz': {'matematyka': [3], 'j. polski': [1, 4, 4, 2], 'j. angielski': [2, 3], 'historia': [1, 1], 'geografia': [6, 1, 6, 6], 'w-f': [3, 4, 6], 'średnia': 3.0}, 'Wiśniewski Tomasz': {'matematyka': [5, 5, 2, 2], 'j. polski': [4, 6, 6, 3], 'j. angielski': [3], 'historia': [1, 2], 'geografia': [5], 'w-f': [3, 5, 2], 'średnia': 3.67}, 'Andrzej Kura': {'matematyka': [1, 3, 3, 1], 'j. polski': [5, 6], 'j. angielski': [4], 'historia': [6], 'geografia': [1, 2, 2, 6], 'w-f': [5], 'średnia': 4.33}, 'Ronald Fus': {'matematyka': [6, 1, 3], 'j. polski': [1], 'j. angielski': [3, 2, 6, 5], 'historia': [1, 3], 'geografia': [3, 1, 5, 5], 'w-f': [5, 4, 1], 'średn

Załadujmy dane do nowej zmiennej, aby widzieć, że dane pozostają niezmienione po załadowaniu pliku (format JSON "współpracuje z typem słownikowym").

In [66]:
with open(file='dziennik.json', mode='w') as file:
    json.dump(students, file)


with open(file='dziennik.json', mode='r') as file:
    students1 = json.load(file)

print(students1)

{'Rzeczkowski Michał': {'matematyka': [5, 5, 6, 1], 'j. polski': [4, 2], 'j. angielski': [1, 2, 1], 'historia': [1], 'geografia': [5, 6], 'w-f': [6, 6, 4], 'średnia': 3.33}, 'Kowalski Jan': {'matematyka': [6, 6, 3, 3], 'j. polski': [3], 'j. angielski': [5, 2, 1], 'historia': [5], 'geografia': [3], 'w-f': [1, 6, 3], 'średnia': 3.5}, 'Zieliński Mateusz': {'matematyka': [3], 'j. polski': [1, 4, 4, 2], 'j. angielski': [2, 3], 'historia': [1, 1], 'geografia': [6, 1, 6, 6], 'w-f': [3, 4, 6], 'średnia': 3.0}, 'Wiśniewski Tomasz': {'matematyka': [5, 5, 2, 2], 'j. polski': [4, 6, 6, 3], 'j. angielski': [3], 'historia': [1, 2], 'geografia': [5], 'w-f': [3, 5, 2], 'średnia': 3.67}, 'Andrzej Kura': {'matematyka': [1, 3, 3, 1], 'j. polski': [5, 6], 'j. angielski': [4], 'historia': [6], 'geografia': [1, 2, 2, 6], 'w-f': [5], 'średnia': 4.33}, 'Ronald Fus': {'matematyka': [6, 1, 3], 'j. polski': [1], 'j. angielski': [3, 2, 6, 5], 'historia': [1, 3], 'geografia': [3, 1, 5, 5], 'w-f': [5, 4, 1], 'średn

Spróbujmy teraz napisać prostą funkcję, która dodaje ocenę do dziennika zapisując w pliku.

In [67]:
file_path = 'dziennik.json'

def insert_grade(student, cl, n, file_path='dziennik.json'):
    with open(file=file_path, mode='r') as file:
        grade_book = json.load(file)
    grade_book[student][cl].append(n)
    with open(file=file_path, mode='w') as file:
        json.dump(grade_book, file)    

In [68]:
students

{'Rzeczkowski Michał': {'matematyka': [5, 5, 6, 1],
  'j. polski': [4, 2],
  'j. angielski': [1, 2, 1],
  'historia': [1],
  'geografia': [5, 6],
  'w-f': [6, 6, 4],
  'średnia': 3.33},
 'Kowalski Jan': {'matematyka': [6, 6, 3, 3],
  'j. polski': [3],
  'j. angielski': [5, 2, 1],
  'historia': [5],
  'geografia': [3],
  'w-f': [1, 6, 3],
  'średnia': 3.5},
 'Zieliński Mateusz': {'matematyka': [3],
  'j. polski': [1, 4, 4, 2],
  'j. angielski': [2, 3],
  'historia': [1, 1],
  'geografia': [6, 1, 6, 6],
  'w-f': [3, 4, 6],
  'średnia': 3.0},
 'Wiśniewski Tomasz': {'matematyka': [5, 5, 2, 2],
  'j. polski': [4, 6, 6, 3],
  'j. angielski': [3],
  'historia': [1, 2],
  'geografia': [5],
  'w-f': [3, 5, 2],
  'średnia': 3.67},
 'Andrzej Kura': {'matematyka': [1, 3, 3, 1],
  'j. polski': [5, 6],
  'j. angielski': [4],
  'historia': [6],
  'geografia': [1, 2, 2, 6],
  'w-f': [5],
  'średnia': 4.33},
 'Ronald Fus': {'matematyka': [6, 1, 3],
  'j. polski': [1],
  'j. angielski': [3, 2, 6, 5],
  

Dopiszmy ocenę:

In [69]:
student = 'Rzeczkowski Michał'
cl = 'matematyka'
n = 9
insert_grade(student, cl, n, file_path='dziennik.json')

In [70]:
with open(file=file_path, mode='r') as file:
    grade_book = json.load(file)
print(grade_book)

{'Rzeczkowski Michał': {'matematyka': [5, 5, 6, 1, 9], 'j. polski': [4, 2], 'j. angielski': [1, 2, 1], 'historia': [1], 'geografia': [5, 6], 'w-f': [6, 6, 4], 'średnia': 3.33}, 'Kowalski Jan': {'matematyka': [6, 6, 3, 3], 'j. polski': [3], 'j. angielski': [5, 2, 1], 'historia': [5], 'geografia': [3], 'w-f': [1, 6, 3], 'średnia': 3.5}, 'Zieliński Mateusz': {'matematyka': [3], 'j. polski': [1, 4, 4, 2], 'j. angielski': [2, 3], 'historia': [1, 1], 'geografia': [6, 1, 6, 6], 'w-f': [3, 4, 6], 'średnia': 3.0}, 'Wiśniewski Tomasz': {'matematyka': [5, 5, 2, 2], 'j. polski': [4, 6, 6, 3], 'j. angielski': [3], 'historia': [1, 2], 'geografia': [5], 'w-f': [3, 5, 2], 'średnia': 3.67}, 'Andrzej Kura': {'matematyka': [1, 3, 3, 1], 'j. polski': [5, 6], 'j. angielski': [4], 'historia': [6], 'geografia': [1, 2, 2, 6], 'w-f': [5], 'średnia': 4.33}, 'Ronald Fus': {'matematyka': [6, 1, 3], 'j. polski': [1], 'j. angielski': [3, 2, 6, 5], 'historia': [1, 3], 'geografia': [3, 1, 5, 5], 'w-f': [5, 4, 1], 'śr

## API

Format JSON jest również często wykorzystywany, gdy korzystamy z **API (Application Programming Interface)**. 

**API** to zbiór zbiór poleceń, funkcji, protokołów i obiektów wykorzystywanych przez programistów do tworzenia programu lub interakcji z systemem zewnętrznym.

![image.png](attachment:image.png)

W wyniku "powyższej rozmowy" otrzymujemy najczęściej dane, które możemy wykorzystać w naszym systemie. API stanowi również rodzaj "zapory", która pozwala korzystać ze stworzonego systemu w kontrolowany sposób. Nasze zapytanie (tzw. *request*) musi spełniać określone reguły, jeśli tak jest, otrzymujemy odpowiedź (tzw. *response*) systemu zewnętrznego. 

### API w Pythonie

Zobaczymy teraz na kilku przykładach jak korzysta się API wybranych serwisów. Ponieważ systemy są tworzone przez różne (i różnorodne) podmioty i dostarczają przeróżnych danych więc nie ma tu jakiejś uniwersalnej metody. Przykładowo z API popularnego `ChatGPT` stworzonego przez `OpenAI`  możemy korzystać za pomocą osobnych bibliotek w różnych językach programowania. 

Z reguły jednak jeśli zapytania i odpowiedź serwisu nie jest bardzo złożona, odbywa się to za pośrednictwem protokołu http (więcej o tym powiemy przy okazji sieci).

Skorzystajmy najpierw z bardzo prostego <a href="http://api.open-notify.org/iss-now.json">API</a> <a href="https://pl.wikipedia.org/wiki/Mi%C4%99dzynarodowa_Stacja_Kosmiczna">Międzynarodowej Stacji Kosmicznej</a> (<a href="http://open-notify.org/Open-Notify-API/ISS-Location-Now/">ISS</a>). API zwraca położenie stacji w czasie.

In [77]:
import requests

resp = requests.get('http://api.open-notify.org/iss-now.json')

In [78]:
resp

<Response [200]>

Kod 200 mówi, że odpowiedź zakończyła się sukcesem. Gdyby link zawierał błąd otrzymalibyśmy kod 404, co oznacza, że serwer nie został znaleziony.

In [79]:
resp = requests.get('http://api.open-notify.org/is-now.json')
resp

<Response [404]>

In [80]:
resp = requests.get('http://api.open-notify.org/iss-now.json')

In [81]:
resp.text

'{"message": "success", "iss_position": {"longitude": "-48.8899", "latitude": "-41.7798"}, "timestamp": 1699130817}'

In [83]:
resp.json()

{'message': 'success',
 'iss_position': {'longitude': '-48.8899', 'latitude': '-41.7798'},
 'timestamp': 1699130817}

In [84]:
resp.json()['iss_position']['longitude']

'-48.8899'

Zobaczmy nieco bardziej złożone API dostępnego na stronie <a href="https://sunrise-sunset.org/api">Sunrise Sunset</a>.  

In [93]:
resp1 = requests.get('https://api.sunrise-sunset.org/json')
resp1.text

'{"results":{"sunrise":"5:38:59 AM","sunset":"5:48:08 PM","solar_noon":"11:43:33 AM","day_length":"12:09:09","civil_twilight_begin":"5:18:40 AM","civil_twilight_end":"6:08:27 PM","nautical_twilight_begin":"4:53:45 AM","nautical_twilight_end":"6:33:22 PM","astronomical_twilight_begin":"4:28:47 AM","astronomical_twilight_end":"6:58:20 PM"},"status":"OK"}'

Widzimy, że tym razem należy przekazać w zapytaniu niezbędne parametry. Długość i szerokość geograficzną można pozyskać ze <a href="https://www.latlong.net/">strony</a>.

In [97]:
parameters = {
    'lat': 52.406376,
    'lng': 16.925167
    
}

resp1 = requests.get('https://api.sunrise-sunset.org/json', params=parameters)
resp1.json()

{'results': {'sunrise': '5:51:30 AM',
  'sunset': '3:20:12 PM',
  'solar_noon': '10:35:51 AM',
  'day_length': '09:28:42',
  'civil_twilight_begin': '5:17:08 AM',
  'civil_twilight_end': '3:54:35 PM',
  'nautical_twilight_begin': '4:36:38 AM',
  'nautical_twilight_end': '4:35:05 PM',
  'astronomical_twilight_begin': '3:57:03 AM',
  'astronomical_twilight_end': '5:14:39 PM'},
 'status': 'OK'}

In [99]:
print(resp1.json()['results']['sunrise'])
print(resp1.json()['results']['sunset'])
print(resp1.json()['results']['solar_noon'])


5:51:30 AM
3:20:12 PM
10:35:51 AM


Oczywiście istnieje bardzo wiele ciekawych serwisów z różnymi danymi, z których możemy podbrać rozmaite dane za pomocą API (dane pogodowe, dane sportowe), ale również np. wysyłać SMSy i korzystać z innych ciekawych możliwości. Naszym celem było oczywiście zasygnalizowanie takich możliwości i wskazanie, że częstym formatem wykorzystywanym w tym celu jest JSON.

## Format CSV

**CSV (comma-separated values)**, to inny bardzo ważny format, w którym przechowujemy dane. Pliki CSV przechowują dane tabelaryczne. Każdy wiersz ma taką samą długość, poszczególne jego elementy odpowiadają kolejnycm kolumnom i są rozdzielnone przecinkami (średnikiem lub tabulatorem). Pierwszy wiersz zawiera nagłówki. 

<a href="https://pl.wikipedia.org/wiki/CSV_(format_pliku)">Szczegółowa specyfikacja formatu.</a> 

Dane z plików CSV obsługiwane są w arkuszach kalkulacyjnym. W Pythonie wykorzystuje się bibliotekę csv, ale chyba najpopularniejszą biblioteką do pracy z danymi tej postaci jest biblioteka `Pandas`, w której obiekt klasy `DataFrame` jest odpowiednikiem arkusza kalkulacyjnego. Każdy taki obiekt możemy eksportować do pliku csv. 

 Stwórzmy prostą ramkę i eksportujmy ją do pliku csv.

In [100]:
import pandas as pd

df = pd.DataFrame(data={'Imię':['Mariusz', 'Dariusz', 'Klaudiusz', 'Bartosz', 'Miłosz'],
                        'Nazwisko': ['Nowak', 'Robak', 'Bobak', 'Kołpak', 'Cwaniak'],
                         'Zaległość w PLN': [10, 100, 1000, 10000, 100000]})

df

Unnamed: 0,Imię,Nazwisko,Zaległość w PLN
0,Mariusz,Nowak,10
1,Dariusz,Robak,100
2,Klaudiusz,Bobak,1000
3,Bartosz,Kołpak,10000
4,Miłosz,Cwaniak,100000


Na obiektach DataFrame (tzw. ramkach) bardzo łatwo i szybko można wykonywać różne operacje.

In [101]:
df['Zaległość w PLN'] = df['Zaległość w PLN'] * 0.5
df

Unnamed: 0,Imię,Nazwisko,Zaległość w PLN
0,Mariusz,Nowak,5.0
1,Dariusz,Robak,50.0
2,Klaudiusz,Bobak,500.0
3,Bartosz,Kołpak,5000.0
4,Miłosz,Cwaniak,50000.0


In [103]:
df[df['Zaległość w PLN'] > 100]

Unnamed: 0,Imię,Nazwisko,Zaległość w PLN
2,Klaudiusz,Bobak,500.0
3,Bartosz,Kołpak,5000.0
4,Miłosz,Cwaniak,50000.0


Biblioteka `Pandas` daje wiele możliwości w pracy z danymi tabelarycznymi. Przyjrzymy się im później, przy okazji pracy z arkuszami kalkulacyjnymi.

In [111]:
df.to_csv('dluznicy.csv')
df.to_excel('dluznicy.xlsx', index=False)

In [112]:
df1 = pd.read_csv('dluznicy.csv')

In [113]:
df1

Unnamed: 0.1,Unnamed: 0,Imię,Nazwisko,Zaległość w PLN
0,0,Mariusz,Nowak,5.0
1,1,Dariusz,Robak,50.0
2,2,Klaudiusz,Bobak,500.0
3,3,Bartosz,Kołpak,5000.0
4,4,Miłosz,Cwaniak,50000.0


In [114]:
df2 = pd.read_excel('dluznicy.xlsx')
df2

Unnamed: 0,Imię,Nazwisko,Zaległość w PLN
0,Mariusz,Nowak,5
1,Dariusz,Robak,50
2,Klaudiusz,Bobak,500
3,Bartosz,Kołpak,5000
4,Miłosz,Cwaniak,50000


Wykonajmy jeszcze jedno proste zadanie ilustrujące możliwości. 

**Zadanie 2.** Firma X chce za pół roku otworzyć nową filię w pewnym państwie, w której będzie pracować 1000 pracowników. Musi przygotować dla nich specjalne uniformy. Nie są jednak znane dane pracowników, a wiadomo, że uniformy są w 4 rozmiarach w zależności od wzrostu $h$ pracowników:

- $h < 170$ cm - S,
- $170 \leq h < 180$ cm - M,
- $180 \leq h < 190$ cm - L,
- $ h \geq 190$ cm - XL.

Wykonać kilka symulacji, zliczyć ilości poszczególnych rozmiarów i przekazać dane do pliku csv. Przy symulacjach przyjąć, że wzrost ma rozkład normalny z parametrami $\mu =178$ cm, $\sigma=8$ cm.

In [171]:
import random

random.normalvariate(178, 8)

176.7113386451272

In [172]:
height_list = [round(random.normalvariate(178, 8)) for i in range(1000)]
ord_l = list(range(1000))

In [173]:
df = pd.DataFrame(data={'w_id':ord_l, 'height': height_list})

In [174]:
def indicate_size(x):
    if x < 170:
        return 'S'
    elif x < 180:
        return 'M'
    elif x < 190:
        return 'L'
    else:
        return 'XL'

df['size'] = df['height'].apply(indicate_size)

In [175]:
df

Unnamed: 0,w_id,height,size
0,0,171,M
1,1,179,M
2,2,156,S
3,3,186,L
4,4,175,M
...,...,...,...
995,995,170,M
996,996,163,S
997,997,163,S
998,998,175,M


In [176]:
df.describe()

Unnamed: 0,w_id,height
count,1000.0,1000.0
mean,499.5,178.043
std,288.819436,8.301088
min,0.0,153.0
25%,249.75,172.0
50%,499.5,178.0
75%,749.25,184.0
max,999.0,203.0


In [177]:
df['size'].value_counts()

M     421
L     328
S     159
XL     92
Name: size, dtype: int64

In [157]:
df.to_csv('uniforms.csv', index=False)

Prosta symulacja pozwala (przy znajomości rozkładu) w miarę celnie przewidzieć zapotrzebowanie na nowe uniformy, porównać to ze swoimi zasobami, a następnie oszacować koszty, czy ogólnie podjąć odpowiednie decyzje biznesowe.

## Format YAMLE

**YAMLE** (patrz <a href="https://pl.wikipedia.org/wiki/YAML">Wikipedia</a>) kolejny format przeznaczony do przechowywania danych w ustrukuryzowany sposób.
Poszczególne elementy struktury danych są w tym formacie oddzielane znakami nowej linii, a ich hierarchia ustalana jest na podstawie wcięcia linii. W YAMLE mamy trzy podstawowe struktury danych: listy, słowniki i skalary. Patrz także: https://yaml.org/.

YAMLE miał w założeniu twórców realizować następujące cele:

- YAML ma być czytelny dla człowieka.
- YAML ma realizować struktury danych wbudowane w języki programowania.
- Dokumenty YAML mają być przenośne pomiędzy językami programowania.
- YAML ma być przyjazny dla typowych narzędzi do przetwarzania tekstu.
- Dokument YAML ma być przetwarzany przez narzędzia w pojedynczym przejściu.
- YAML ma mieć dużą siłę wyrazu i być łatwo rozszerzalny.
- YAML ma być prosty w użyciu.

Przykładowa postać pliku yml:

![image.png](attachment:image.png)
*źródło - Wikipedia*

W plikach yml zapisywane są np. modele uczenia głębokiego (sieci neuronowe).

## Zadania domowe

**Zadanie 1.** (1 pkt.) Wykorzystując dane z zadania 1 z poprzedniego zestawu (dane sklepu w modelu xml) stworzyć podobny model danych w formacie JSON.

**Zadanie 2.** (2 pkt.) Napisać prosty program, który pozwoli dodawać nowy asortyment do danych z zadania 1.

**Zadanie 3.** (1 pkt.) Przygotowujesz pytania do quizu z wiedzy ogólnej. Skorzystaj z API bazy danych serwisu <a href="https://opentdb.com/api_config.php">TRIVIA</a> i napisz kod do wygenerowania 15 pytań z wiedzy ogólnej na łatwym poziomie trudności. Jako output powinny pojawić się kolejne pytania i odpowiedzi.

**Wskazówka.** Do polecenia *requests.get()* przekaż dane, które wydobędziesz z wygenerowanego linku wg następującego schematu: dla linku https://opentdb.com/api.php?amount=10&difficulty=medium&type=boolean - część do znaku zapytania (bez ?) to link przekazywany do *requests.get()*, zaś pozostałe dane oddzielone ampresandem to klucz (lewa strona znaku równości) i wartość (prawa strona równości), które należy dodać do słownika i przekazać do requesta.

**Zadanie 4.** (1 pkt.) Utworzyć plik csv, który zawierać będzie fikcyjne dane $1000$ poborowych według schematu: numer poborowego, wzrost, waga, przyznana kategoria (A, B, C, D, E).