<a href="https://colab.research.google.com/github/CodeHunterOfficial/Python_Basics/blob/main/Lecture_6_JSON%2C_XML_%D0%B8_Pickle_%D1%81%D0%B5%D1%80%D0%B8%D0%B0%D0%BB%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F_%D0%B8_%D0%B4%D0%B5%D1%81%D0%B5%D1%80%D0%B8%D0%B0%D0%BB%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### Что такое JSON?

JSON, что является сокращенной аббревиатурой JavaScript Object Notation, — это удобный формат для обмена данными. Он прост для чтения и записи людьми, а также для машинного анализа и генерации. Это делает его одним из самых популярных форматов данных. В частности, JSON стал настоящим веб-языком, который широко используется для передачи данных между серверами и веб-приложениями через API.  

Вот пример JSON:



```
{
    "kwarg1": "value_1",
    "kwarg2": "value_2",
    "kwarg3": "value_3",
    "additional": ["value_4", "value_5", "value_6", ]
}
```



## Сериализация и десериализация
В Python есть множество библиотек, чтобы работать с JSON, но мы рассмотрим встроенную библиотеку JSON Python. Она позволяет приводить любые структуры данных к JSON-объекту — вплоть до пользовательских классов. А из него получать совместимую для работы в Python сущность — объект языка.

Упаковка объектов в байтовую последовательность называется сериализацией. А распаковка байтов в объекты языка программирования, приведение последовательности назад к типам и структурам, — десериализацией.
Python-р

В байты данные необходимо переводить, чтобы отправлять их по сети или локально другому приложению, так как иной формат передать невозможно. Вот так преобразовывают данные из объектов Python в JSON и обратно:

In [3]:
# Импортируем библиотеку
import json

# Объявляем переменные
string = "Some test string"
integer = 211
array = [1, 2, 3, 4, 5]

# Создаем словарь
mydict = {"title": string, "code": integer, "data": array}

# Сериализуем его в JSON-структуру, как строку
x = json.dumps(mydict)
print(x)


# Проводим десериализацию JSON-объекта
y = json.loads(x)
print(y)

print(y["title"])

{"title": "Some test string", "code": 211, "data": [1, 2, 3, 4, 5]}
{'title': 'Some test string', 'code': 211, 'data': [1, 2, 3, 4, 5]}
Some test string


### Функции

Dumps позволяет создать JSON-строку из переданного в нее объекта. Loads — преобразовать строку назад в объекты языка.

Dump и load используют, чтобы сохранить результат в файл или воссоздать объект. Работают они схожим образом, но требуют передачи специального объекта для работы с файлом — filehandler.

In [7]:
import json

# Создаем filehandler с помощью контекстного менеджера
with open("data.json", "w") as fh:
    json.dump([1, 2, 3, 4, 5], fh) # записываем структуру в файл

# Открываем тот же файл, но уже на чтение
with open("data.json", "r") as fh:
    json_res=json.load(fh) # загружаем структуру из файла
    print(json_res)

[1, 2, 3, 4, 5]


## Примеры

**Пример 1:** Запись и чтение строки:

In [8]:
import json

# Запись строки в JSON-файл
with open("string_data.json", "w") as file:
    json.dump("Hello, world!", file)

# Чтение строки из JSON-файла
with open("string_data.json", "r") as file:
    data = json.load(file)
    print(data)  # Вывод: Hello, world!

Hello, world!


**Пример 2:** Запись и чтение кортежа:

In [9]:
import json

# Запись кортежа в JSON-файл
my_tuple = (1, 2, 3)
with open("tuple_data.json", "w") as file:
    json.dump(my_tuple, file)

# Чтение кортежа из JSON-файла
with open("tuple_data.json", "r") as file:
    data = json.load(file)
    print(data)  # Вывод: [1, 2, 3]

[1, 2, 3]


**Пример 3:** Запись и чтение словаря (dictionary):

In [10]:
import json

# Запись словаря в JSON-файл
my_dict = {"name": "Alice", "age": 30}
with open("dict_data.json", "w") as file:
    json.dump(my_dict, file)

# Чтение словаря из JSON-файла
with open("dict_data.json", "r") as file:
    data = json.load(file)
    print(data)  # Вывод: {'name': 'Alice', 'age': 30}

{'name': 'Alice', 'age': 30}


**Пример 4:** Запись и чтение списка (list):

In [11]:
import json

# Запись списка в JSON-файл
my_list = ["Alice","Zukha", "Arina", "Karina"]
with open("list_data.json", "w") as file:
    json.dump(my_list, file)

# Чтение списка из JSON-файла
with open("list_data.json", "r") as file:
    data = json.load(file)
    print(data)

['Alice', 'Zukha', 'Arina', 'Karina']


**Пример 5:** Запись и чтение числа (integer):

In [12]:
import json

# Запись числа в JSON-файл
my_number = 42
with open("number_data.json", "w") as file:
    json.dump(my_number, file)

# Чтение числа из JSON-файла
with open("number_data.json", "r") as file:
    data = json.load(file)
    print(data)  # Вывод: 42

42


## Как работать с пользовательскими объектами
Пользовательские классы не относятся к JSON-сериализуемым. Это значит, что просто применить к ним функции dumps, loads или dump и load не получится:

In [14]:
import json

class Test:
    def __init__(self, title, body):
        self.title = title
        self.body = body

t = Test("Some string", "Here is a bit more text, but still isn't enough")

# пытаемся сериализовать его в JSON, но...
json.dumps(t)
# получаем ошибку TypeError, что класс несериализуем

TypeError: ignored

Решить эту проблему можно тремя способами.

### Написать функцию
Чтобы сериализовать пользовательский объект в JSON-структуру данных, нужен аргумент default. Указывайте вызываемый объект, то есть функцию или статический метод.

Чтобы получить аргументы класса с их значениями, нужна встроенная функция __dict__, потому что любой класс — это словарь со ссылками на значения по ключу.

Чтобы сериализовать аргументы класса и их значения в JSON, напишите функцию:

In [17]:
import json

class Test:
    def __init__(self, title, body):
        self.title = title
        self.body = body

t = Test("Some string", "Here is a bit more text, but still isn't enough")

# используем анонимную функцию (лямбду), которая
# в качестве сериализуемых данных указывает полученный __dict__ объекта
json.dumps(t, default=lambda x: x.__dict__)

'{"title": "Some string", "body": "Here is a bit more text, but still isn\'t enough"}'

Но можно создать отдельную функцию и указать ее в качестве аргумента:

In [18]:
import json

class Test:
    def __init__(self, title, body):
        self.title = title
        self.body = body

t = Test("Some string", "Here is a bit more text, but still isn't enough")


def to_json(obj):
     if isinstance(obj, Test):
         result = obj.__dict__
         result["className"] = obj.__class__.__name__
         return result

json.dumps(t, default=to_json)

'{"title": "Some string", "body": "Here is a bit more text, but still isn\'t enough", "className": "Test"}'

 Мы добавили название класса в получаемую структуру. Такой подход позволяет безошибочно понять: сущность какого класса нужно десериализовать в объект.

### Создать расширение классов
Такого же результата добьетесь, если примените расширения специальных классов библиотеки:

In [20]:
import json

class Test:
    def __init__(self, title, body):
        self.title = title
        self.body = body

class TestEncoder(json.JSONEncoder):
     def default(self, o):
         return {"TITLE": o.title, "BODY": o.body, "CLASSNAME": o.__class__.__name__}


t = Test("Some string", "Here is a bit more text, but still isn't enough")

x = json.dumps(t, cls=TestEncoder)
print(x)

y = json.loads(x)
print(y)
print(y["TITLE"])

{"TITLE": "Some string", "BODY": "Here is a bit more text, but still isn't enough", "CLASSNAME": "Test"}
{'TITLE': 'Some string', 'BODY': "Here is a bit more text, but still isn't enough", 'CLASSNAME': 'Test'}
Some string


Этот код почти верен, но есть одна важная деталь, которую нужно учесть. При использовании пользовательского JSON-кодера (JSONEncoder), вам также нужно обеспечить правильную десериализацию при загрузке JSON обратно в объекты Python.

Вот исправленный код с добавленным методом from_json для десериализации:

In [21]:
import json

class Test:
    def __init__(self, title, body):
        self.title = title
        self.body = body

class TestEncoder(json.JSONEncoder):
    def default(self, o):
        if isinstance(o, Test):
            return {"TITLE": o.title, "BODY": o.body, "CLASSNAME": o.__class__.__name__}
        return super().default(o)

def from_json(json_obj):
    if "CLASSNAME" in json_obj and json_obj["CLASSNAME"] == "Test":
        return Test(json_obj["TITLE"], json_obj["BODY"])
    return json_obj

t = Test("Some string", "Here is a bit more text, but still isn't enough")

# Сериализация
x = json.dumps(t, cls=TestEncoder)
print(x)

# Десериализация
y = json.loads(x, object_hook=from_json)
print(y)
print(y.title)

{"TITLE": "Some string", "BODY": "Here is a bit more text, but still isn't enough", "CLASSNAME": "Test"}
<__main__.Test object at 0x7ae6420ec8b0>
Some string


Такой подход можно использовать и в том случае, если класс состоит из нескольких других.

## Применить паттерн «Адаптер»
Идея в том, чтобы написать класс, который приводит к JSON пользовательские объекты и восстанавливает их. Определите класс фигуры, формы и цвета:

In [22]:
class Figure:
    def __init__(self, title, form, color):
        self.title = title
        self.form = form
        self.color = color

    def __str__(self):
        return f"Figure: {self.title}, {repr(self.form)}, {repr(self.color)}"

class Form:
    def __init__(self, name):
        self.name = name

    def __repr__(self):
        return f"<Form: {self.name}>"

class Color:
    def __init__(self, name):
        self.name = name

    def __repr__(self):
        return f"<Color: {self.name}>"

Теперь напишим класс, который будет приводить объекты фигуры к JSON, а из JSON воссоздавать полученный объект:

In [23]:
class JSONDataAdapter:
    @staticmethod
    def to_json(o):
        if isinstance(o, Figure):
            return json.dumps({
              "title": o.title,
              "form": o.form.name,
              "color": o.color.name,
            })

    @staticmethod
    def from_json(o):
        o = json.loads(o)

        try:
            form = Form(o["form"])
            color = Color(o["color"])
            figure = Figure(o["title"], form, color)
            return figure
        except AttributeError:
            print("Неверная структура")

Протестируйем решение:

In [25]:
if __name__ == '__main__':
    # создадим несколько цветов
    black = Color("Black")
    yellow = Color("Yellow")
    green = Color("Green")

    # несколько форм
    rountt = Form("Rounded")
    square = Form("Squared")

    # объекты фигур
    figure_one = Figure("Black Square", form=square, color=black)
    figure_two = Figure("Yellow Circle", form=rountt, color=yellow)

    print("Отображение объектов")
    print(figure_one)
    print(figure_two)
    print()

    # преобразуем данные в JSON
    jone = JSONDataAdapter.to_json(figure_one)
    jtwo = JSONDataAdapter.to_json(figure_two)

    print("Отображение JSON")
    print(jone)
    print(jtwo)
    print()

    # восстановим объекты
    restored_one = JSONDataAdapter.from_json(jone)
    restored_two = JSONDataAdapter.from_json(jtwo)

    print("Отображение восстановленных объектов")
    print(restored_one)
    print(restored_two)


Отображение объектов
Figure: Black Square, <Form: Squared>, <Color: Black>
Figure: Yellow Circle, <Form: Rounded>, <Color: Yellow>

Отображение JSON
{"title": "Black Square", "form": "Squared", "color": "Black"}
{"title": "Yellow Circle", "form": "Rounded", "color": "Yellow"}

Отображение восстановленных объектов
Figure: Black Square, <Form: Squared>, <Color: Black>
Figure: Yellow Circle, <Form: Rounded>, <Color: Yellow>


## Примеры

**Пример 1.** Создайте класс Student с реализацией сериализации и десериализации.

In [27]:
import json

class Student:
    def __init__(self, name, age, major):
        self.name = name
        self.age = age
        self.major = major

    def to_json(self):
        return {
            "name": self.name,
            "age": self.age,
            "major": self.major
        }

    @staticmethod
    def from_json(data):
        return Student(data["name"], data["age"], data["major"])

# Создаем экземпляр класса Student
student1 = Student("Alice", 20, "Computer Science")

# Сериализация экземпляра класса Student
json_str = json.dumps(student1.to_json())
print(json_str)

# Десериализация JSON в объект Student
json_data = '{"name": "Bob", "age": 21, "major": "Engineering"}'
restored_student = Student.from_json(json.loads(json_data))
print(restored_student.name, restored_student.age, restored_student.major)


{"name": "Alice", "age": 20, "major": "Computer Science"}
Bob 21 Engineering


**Пример 2.** Если класс Student унаследуется от класса Person, то вы можете включить это в определение класса Student следующим образом:

In [32]:
import json
from typing import Dict, Any

class Person:
    def __init__(self, name: str, age: int) -> None:
        self.name = name
        self.age = age

    def to_json(self) -> Dict[str, Any]:
        return {"name": self.name, "age": self.age}

class Student(Person):
    def __init__(self, name: str, age: int, major: str) -> None:
        super().__init__(name, age)
        self.major = major

    def to_json(self) -> Dict[str, Any]:
        data = super().to_json()
        data["major"] = self.major
        return data

    @staticmethod
    def from_json(data: Dict[str, Any]) -> 'Student':
        return Student(data["name"], data["age"], data["major"])

# Создаем экземпляр класса Student
student1 = Student("Alice", 20, "Computer Science")

# Сериализация экземпляра класса Student
json_str = json.dumps(student1.to_json())
print(json_str)

# Десериализация JSON в объект Student
json_data = '{"name": "Bob", "age": 21, "major": "Engineering"}'
restored_student = Student.from_json(json.loads(json_data))
print(restored_student.name, restored_student.age, restored_student.major)

{"name": "Alice", "age": 20, "major": "Computer Science"}
Bob 21 Engineering


**Пример 3.**  У вас есть JSON-объект, который содержит информацию о командах, игроках и их результаты. Вам нужно извлечь значение "score" для первого игрока первой команды из этого JSON-объекта с использованием сериализации и десериализации. JSON-объект должен быть сохранен в файле, и вы должны использовать модуль json в Python для записи и чтения данных из файла.

Задача состоит из следующих шагов:

1. Создание JSON-объекта с информацией о командах, игроках и их результаты.
2. Сериализация (запись) JSON-объекта в файл с использованием модуля json.
3. Чтение и десериализация JSON-объекта из файла с использованием модуля json.
4. Извлечение значения "score" для первого игрока первой команды из десериализованного JSON-объекта.

In [35]:
import json

# Создаем и записываем JSON в файл
data = {
    "data": {
        "teamStanding": [
            {
                "id": "team_1",
                "score": 103,
                "players": [
                    {
                        "user": {
                            "name": "player_1",
                            "id": "player_1"
                        },
                        "score": 35
                    }
                ]
            }
        ]
    }
}

# Записываем JSON в файл
with open('data.json', 'w') as file:
    json.dump(data, file)

# Чтение и десериализация JSON из файла
with open('data.json', 'r') as file:
    data_from_file = json.load(file)

# Извлечение значения score для первого игрока первой команды
player_score = data_from_file["data"]["teamStanding"][0]["players"][0]["score"]
print(player_score)  # Выведет: 35

35
