# dataclasses

`@dataclass` - это декоратор из модуля `dataclasses` в Python, который позволяет автоматически создавать классы для хранения данных (data classes). Он предоставляет удобный способ определения классов, которые служат для хранения данных, с автоматической генерацией основных методов, таких как `__init__`, `__repr__`, `__eq__` и других.

Использование `@dataclass` позволяет упростить создание классов данных и автоматически генерировать код, который обычно приходится писать вручную. Это улучшает читаемость кода, сокращает количество повторяющегося кода и упрощает сравнение, хеширование и преобразование экземпляров класса.

Основные преимущества использования `@dataclass`:

1. Автоматическое создание методов `__init__`, `__repr__`, `__eq__`, `__ne__`, `__hash__` и других.
2. Предоставление простого способа определения полей данных с типами и значениями по умолчанию.
3. Гибкость настройки поведения класса данных с помощью параметров декоратора и функций модуля `dataclasses`.
4. Возможность создания неизменяемых объектов (frozen=True) и поддержки сравнения и сортировки (order=True).

В целом, `@dataclass` упрощает работу с классами данных, делая код более ясным, кратким и поддерживаемым.

"Поле данных" (data field) относится к атрибутам, определенным в классе данных (@dataclass). Это переменные, которые хранят значения данных в экземплярах класса.

Каждое поле данных обычно определяется как атрибут класса с определенным именем, типом и (опционально) значением по умолчанию. Например, в классе данных может быть поле "name" типа str, поле "age" типа int, и так далее.

Давайте познакомимся с относительно новой идеей «быстрого» описания классов (классов данных – Data Classes). О чем здесь речь? Довольно часто при объявлении классов в программах на Python приходится прописывать инициализатор, например, следующим образом:
```Py
class Thing:
    def __init__(self, name, weight, price):
        self.name = name
        self.weight = weight
        self.price = price
```

То есть, передается несколько полей: name, weight, price, которые предполагается сохранять в объектах класса Thing. И это довольно типовая ситуация. Мало того, если создать объект этого класса и вывести его в консоль:
```Py
t = Thing("Учебник по Python", 100, 1024)
print(t)
```
то увидим нечто неинформативное, вроде:
```
<__main__.Thing object at 0x0000014B7D29A7D0>
```
Поэтому, опять же нередко, в таких классах с данными приходится прописывать магический метод ```__repr__()```, например, так:
```Py
    def __repr__(self):
        return f"Thing: {self.__dict__}"
```

In [1]:
class Thing:
    def __init__(self, name, weight, price):
        self.name = name
        self.weight = weight
        self.price = price
    def __repr__(self):
        return f"Thing: {self.__dict__}"

t = Thing("Учебник по Python", 100, 1024)
print(t)

Thing: {'name': 'Учебник по Python', 'weight': 100, 'price': 1024}


Видите, сколько писанины приходится делать для описания классов, подобных классу Thing?! И это лишь необходимый минимум. Представьте объем рутиной работы для описания всего лишь нескольких таких классов.

Так как программист, зачастую, существо ленивое, но творческое, уже давно предпринимались попытки автоматизировать этот процесс. 

Начиная с версии Python 3.7, появилась возможность «из коробки» использовать инструмент для оптимизации объявления классов, содержащих произвольные данные, то есть,  Data Classes. Для этого, в самом простом варианте, достаточно импортировать специальный декоратор, который так и называется dataclass:
```Py
from dataclasses import dataclass
```
И с его помощью объявим в программе еще один класс ThingData, который будет эквивалентен ранее объявленному классу Thing:
```Py
@dataclass
class ThingData:
    name: str
    weight: int
    price: float
```
Смотрите, какое у нас получилось компактное объявление класса ThingData! Давайте разберемся, что здесь к чему. Вначале должен идти декоратор dataclass, который будет формировать описание класса ThingData с инициализатором и магическим методом ```__repr__()```. Внутри класса следует описание параметров для инициализатора. Да, все приведенные атрибуты внутри класса ThingData впоследствии, с помощью декоратора dataclass, преобразуются в набор параметров инициализатора. При этом атрибуты обязательно должны быть аннотированы соответствующими типами данных.

Давайте детальнее посмотрим, что в итоге будет содержать класс ThingData. Для этого мы импортируем функцию pprint() для лучшего отображения данных из коллекций:
```Py
from pprint import pprint
```
и вызовем ее для коллекции ```__dict__``` класса ThingData:

pprint(ThingData.```__dict__```)

In [3]:
from pprint import pprint
from dataclasses import dataclass

@dataclass
class ThingData:
    name: str
    weight: int
    price: float

pprint(ThingData.__dict__)

mappingproxy({'__annotations__': {'name': <class 'str'>,
                                  'price': <class 'float'>,
                                  'weight': <class 'int'>},
              '__dataclass_fields__': {'name': Field(name='name',type=<class 'str'>,default=<dataclasses._MISSING_TYPE object at 0x1018bf1d0>,default_factory=<dataclasses._MISSING_TYPE object at 0x1018bf1d0>,init=True,repr=True,hash=None,compare=True,metadata=mappingproxy({}),kw_only=False,_field_type=_FIELD),
                                       'price': Field(name='price',type=<class 'float'>,default=<dataclasses._MISSING_TYPE object at 0x1018bf1d0>,default_factory=<dataclasses._MISSING_TYPE object at 0x1018bf1d0>,init=True,repr=True,hash=None,compare=True,metadata=mappingproxy({}),kw_only=False,_field_type=_FIELD),
                                       'weight': Field(name='weight',type=<class 'int'>,default=<dataclasses._MISSING_TYPE object at 0x1018bf1d0>,default_factory=<dataclasses._MISSING_TYPE object

Видим, что ```__dict__``` ссылается на объект типа mappingproxy, внутри которого имеется инициализатор ```__init__()``` и магический метод ```__repr__()```. То есть, в класс ThingData автоматически были добавлены эти два метода. Кроме того, имеется магический метод ```__eq__()``` для выполнения операции сравнения на равенство объектов класса ThingData. Также имеется специальный словарь ```__dataclass_fields__```, содержащий указанные нами атрибуты при описании класса ThingData. Таким образом, класс ThingData обладает необходимым базовым функционалом при работе с атрибутами: name, weight и price. Давайте в этом убедимся. Создадим объект этого класса:
```Py
td = ThingData("Учебник по Python", 100, 1024)
```
Обратите внимание, в качестве первого аргумента я указал строку, а вторые два – это вес и цена. То есть, параметры в инициализаторе следуют в том же порядке, что и атрибуты, указанные при описании класса ThingData. И это чаще всего так. Порядок, как правило, не изменяют и оставляют по умолчанию.

Далее, выведем на экран объект td с помощью функции print():
```Py
print(td)
```

In [6]:
from pprint import pprint
from dataclasses import dataclass

@dataclass
class ThingData:
    name: str
    weight: int
    price: float

td = ThingData("Учебник по Python", 100, 1024)
print(td)
# pprint(ThingData.__dict__)

ThingData(name='Учебник по Python', weight=100, price=1024)


Увидим в консоли информацию:
```
ThingData(name='Учебник по Python', weight=100, price=1024)
```
Видите, как информативно отображается объект td класса ThingData?! Это, как раз, благодаря переопределению магического метода ```__repr__()``` внутри класса ThingData. Для уверенности, мы можем даже явно его вызвать в функции print() следующим образом:
```Py
print(repr(td))
```

и увидим тот же самый результат. И это очень здорово! Нам теперь не нужно тратить время на написание типового, рутинного кода. Да и само объявление класса в программе, чисто визуально, выглядит куда лучше. Главное, правильно понимать это объявление.

Давайте попробуем протестировать еще один магический метод ```__eq__()```, который также был добавлен в класс ThingData. Для этого мы создадим в программе второй объект этого класса:
```Py
td_2 = ThingData("Python ООП", 80, 512)
```
и выполним сравнение двух объектов:
```Py
print(td == td_2)
```

In [8]:
td = ThingData("Учебник по Python", 100, 1024)
td_2 = ThingData("Python ООП", 80, 512)
print(td == td_2)
td_3 = ThingData("Python ООП", 80, 512)
print(td_2 == td_3)

False
True


Увидим ожидаемое значение False. Но, если создать еще один экземпляр с тем же набором данных:
```Py
td_3 = ThingData("Python ООП", 80, 512)
```
то операция сравнения:
```Py
print(td_2 == td_3)
```
вернет значение True.

Я, думаю, из этих примеров вы уже поняли, как работает переопределенный магический метод  ```__eq__()```? Он перебирает значение указанных нами атрибутов ```(name, weight, price)``` первого объекта и сравнивает с соответствующими значениями этих же атрибутов второго объекта. Это эквивалентно сравнению следующих кортежей на равенство:
```Py
(name, weight, price) == (name, weight, price)
```
Кстати, если нас это поведение не устраивает и нужно сравнивать, например, объекты только по весу (полю weight), то, как вариант, никто не запрещает внутри класса ThingData объявить свой вариант магического метода ```__eq__()```:
```Py
@dataclass
class ThingData:
    name: str
    weight: int
    price: float
 
    def __eq__(self, other):
        return self.weight == other.weight
```
В этом случае существующий метод (который был объявлен нами) не меняется декоратором dataclass. И теперь сравнение происходит именно по весу:
```Py
td_2 = ThingData("Python ООП", 80, 640)
td_3 = ThingData("Python ООП 2", 80, 512)
print(td_2 == td_3)
```

In [9]:
from pprint import pprint
from dataclasses import dataclass

@dataclass
class ThingData:
    name: str
    weight: int
    price: float

    def __eq__(self, other):
        return self.weight == other.weight

td_2 = ThingData("Python ООП", 80, 640)
td_3 = ThingData("Python ООП 2", 80, 512)
print(td_2 == td_3)
# pprint(ThingData.__dict__)

True


Так происходит работа с методами: ```__init__(), __repr__(), __eq__()```. Если они существуют внутри класса, то остаются неизменными.

Следующий важный базовый момент, при определении Data Classes, состоит в порядке объявления атрибутов с начальными значениями. Давайте предположим, что цена по умолчанию принимает значение 0. В этом случае класс ThingData можно определить так:
```Py
@dataclass
class ThingData:
    name: str
    weight: int
    price: float = 0
```
И, затем, создать объект этого класса:
```Py
td = ThingData("Учебник по Python", 100)
print(td)
```
В консоли увидим значение 0 для локального атрибута price. Если же будет передано какое-либо другое значение, например:
```Py
td = ThingData("Учебник по Python", 100, 512)
```
то price будет ссылаться на это новое значение.

Но здесь есть один маленький нюанс: все атрибуты со значениями по умолчанию должны идти последними. Например, если поменять атрибуты weight и price местами:
```Py
@dataclass
class ThingData:
    name: str
    price: float = 0
    weight: int
```
то интегрированная среда нам сразу подчеркнет атрибут price, а при попытке выполнить программу появится ошибка. Почему так произошло? И почему атрибуты с начальными значениями обязательно должны быть последними? Так как эти атрибуты, по сути, являются параметрами метода ```__init__()``` и идут в том порядке, в котором записаны в классе, то при данной записи получаем следующее объявление инициализатора:
```Py
def __init__(self, name: str, price: float = 0, weight: int)
```
Видите в чем тут ошибка? Параметры со значениями по умолчанию должны идти последними, а здесь это не так. Отсюда и возникает ошибка определения. Поэтому, когда мы объявляем класс как Data Class  с декоратором dataclass, то все атрибуты с начальными значениями должны быть записаны последними.

Второй тонкий момент со значениями по умолчанию связан с изменяемыми и неизменяемыми объектами. Я напомню вам одно важное поведение функций и методов в языке Python. Предположим, что мы в инициализатор класса Thing добавляем еще один параметр dims (размерность) следующим образом:
```Py
class Thing:
    def __init__(self, name, weight, price, dims=[]):
        self.name = name
        self.weight = weight
        self.price = price
        self.dims = dims
```
И, затем, создаем объект этого класса:
```Py
t = Thing("Учебник по Python", 100, 1024)
t.dims.append(10)
```
Если сейчас вывести список dims, то увидим вполне ожидаемый результат:
```Py
print(t.dims)
```
Но, если после этого создать еще один объект класса Thing, например, так:
```Py
t2 = Thing("Учебник по Python", 100, 1024)
```
и выведем у него список dims:
```Py
print(t2.dims)
```
то увидим не пустой список, а с одним уже существующим значением 10. Чаще всего такое поведение приводит к непредвиденным ошибкам в работе программы, т.к. начальный пустой список подразумевается независимым для каждого объекта класса Thing. Тогда как в показанном примере он оказывается общим.

В Python значения по умолчанию для аргументов функций вычисляются только один раз при определении функции, а не при каждом вызове. Поэтому использование изменяемых объектов, таких как список или словарь, в качестве значения по умолчанию может привести к нежелательному поведению.

Рекомендуется вместо этого использовать неизменяемый объект, например None, в качестве значения по умолчанию и в конструкторе создавать новый изменяемый объект при необходимости. Например:
```Py
class Thing:
    def __init__(self, name, weight, price, dims=None):
        self.name = name
        self.weight = weight
        self.price = price
        self.dims = [] if dims is None else dims
```
Такой подход гарантирует, что каждый объект Thing будет иметь свой собственный список dims, и изменения, внесенные в dims одного объекта, не будут влиять на другие объекты.

По этой причине при объявлении Data Classes атрибутам нельзя присваивать изменяемые объекты в качестве значений по умолчанию. Например, следующее объявление приведет к ошибке:
```Py
@dataclass
class ThingData:
    name: str
    weight: int
    price: float = 0
    dims: list = []
```
Тогда спрашивается, как нам определить, например, список в качестве значения по умолчанию и так, чтобы он был независимым для каждого объекта класса ThingData? Для этого следует воспользоваться специальной функцией field() из модуля dataclasses:
```Py
from dataclasses import dataclass, field
```
и определить через нее значение по умолчанию следующим образом:
```Py
@dataclass
class ThingData:
    name: str
    weight: int
    price: float = 0
    dims: list = field(default_factory=list)
```

Здесь через параметр default_factory указывается, какой объект следует создавать в момент вызова инициализатора класса ThingData и присваивать атрибуту dims. В данном примере – это объект list (список). Теперь, при создании объекта этого класса:
```Py
td = ThingData("Учебник по Python", 100, 512)
print(td)
```
мы увидим, что dims ссылается на пустой список, как это и ожидалось.

Вообще с помощью функции field() можно довольно тонко настраивать поведение атрибутов в Data Classes.

In [13]:
from dataclasses import dataclass, field

@dataclass
class ThingData:
    name: str
    weight: int
    price: float = 0
    dims: list = field(default_factory=list)

td = ThingData("Учебник по Python", 100, 512)
# print(td)
td.dims.append(10)
print(td)
t2 = ThingData("Учебник по Python", 100, 512)
print(t2)

ThingData(name='Учебник по Python', weight=100, price=512, dims=[10])
ThingData(name='Учебник по Python', weight=100, price=512, dims=[])


Основные параметры функции field():

**default:** Если указано, это будет значение по умолчанию для данного поля. Это необходимо, потому что сам вызов field() заменяет обычную позицию значения по умолчанию.

**default_factory:** Если указано, это должна быть вызываемая функция без аргументов, которая будет вызвана, когда требуется значение по умолчанию для данного поля. Среди других целей это может использоваться для указания полей с изменяемыми значениями по умолчанию, как обсуждалось ниже. Нельзя указывать и default, и default_factory одновременно.

**init:** Если true (по умолчанию), это поле включается в качестве параметра в сгенерированный метод init().

**repr:** Если true (по умолчанию), это поле включается в строку, возвращаемую сгенерированным методом repr().

**compare:** Если true (по умолчанию), это поле включается в генерируемые методы сравнения и сортировки (eq(), gt() и т. д.).

## Преобразование в кортеж или словарь

Модуль dataclasses предоставляет функции astuple() и asdict(), которые преобразуют экземпляр класса данных в кортеж и словарь соответственно. Например:

In [66]:
from dataclasses import dataclass, astuple, asdict


@dataclass
class Person:
    name: str
    age: int
    iq: int = 100


p = Person('John Doe', 25)

print(astuple(p))
print(asdict(p))

('John Doe', 25, 100)
{'name': 'John Doe', 'age': 25, 'iq': 100}


Ранее мы в целом научились объявлять такие классы данных с помощью декоратора dataclass и определять набор необходимых атрибутов:
```Py
@dataclass
class ThingData:
    name: str
    weight: int
    price: float = 0
    dims: list = field(default_factory=list)
```
Но давайте представим, что нам нужно в некотором классе, например, Vector3D при инициализации формировать вычисляемое свойство:
```Py
class Vector3D:
    def __init__(self, x: int, y: int, z: int):
        self.x = x
        self.y = y
        self.z = z
        self.length = (x * x + y * y + z * z) ** 0.5
```
Здесь локальный атрибут length вычисляется на основе параметров x, y, z. Как это можно сделать при объявлении Data Classes?

В этом нам поможет метод следующий метод:

## Метод ```__post_init__()```

Вначале, очевидно, нужно прописать класс с тремя атрибутами следующим образом:
```Py
@dataclass
class V3D:
    x: int
    y: int
    z: int
```
Но как определить локальный атрибут length внутри объекта класса V3D? Для этого существует следующая хитрость. Инициализаторы классов, сформированные с помощью декоратора dataclass, в конце своего вызова вызывают специальный метод ```__post_init__()```. 
Если вы хотите инициализировать атрибут, зависящий от значения другого атрибута, вы можете использовать метод ```__post_init__```. Как следует из его названия, Python вызывает метод ```__post_init__``` после метода ```__init__```.
Именно в этом методе можно формировать любые вычисляемые свойства, например, так:
```Py
@dataclass
class V3D:
    x: int
    y: int
    z: int
 
    def __post_init__(self):
        self.length = (self.x * self.x + self.y * self.y + self.z * self.z) ** 0.5
```
Если далее мы сформируем объект этого класса и выведем его в консоль:
```Py
v = V3D(1, 2, 3)
print(v)
```
то увидим:
```
V3D(x=1, y=2, z=3)
```
Спрашивается, почему здесь не видно свойства length? В действительности, оно присутствует в объекте v и мы в этом легко можем убедиться:
```Py
print(v.__dict__)
```
увидим:

In [14]:
from dataclasses import dataclass

@dataclass
class V3D:
    x: int
    y: int
    z: int
 
    def __post_init__(self):
        self.length = (self.x * self.x + self.y * self.y + self.z * self.z) ** 0.5

v = V3D(1, 2, 3)
print(v)
print(v.__dict__)

V3D(x=1, y=2, z=3)
{'x': 1, 'y': 2, 'z': 3, 'length': 3.7416573867739413}


```
{'x': 1, 'y': 2, 'z': 3, 'length': 3.7416573867739413}
```
Но тогда почему оно не выводится функцией repr()? Дело в том, что магический метод ```__repr__()``` выводит только те атрибуты, которые были указаны при объявлении класса. Все остальные, что создаются в процессе формирования объекта, не учитываются в методе ```__repr__()```. Как тогда выйти из этой ситуации и указать, что локальный атрибут length также следует отображать? Очень просто! Давайте укажем этот атрибут при объявлении класса с небольшим уточнением:
```Py
@dataclass
class V3D:
    x: int
    y: int
    z: int
    length: float = field(init=False)
 
    def __post_init__(self):
        self.length = (self.x * self.x + self.y * self.y + self.z * self.z) ** 0.5
```
Мы здесь воспользовались функцией field() и отметили, что атрибут length не следует использовать в качестве параметра инициализатора.
Теперь, при отображении объекта v класса, мы увидим и параметр length.
Если вы не хотите инициализировать атрибут в методе ```__init__```, вы можете использовать функцию field() из модуля dataclasses. field(init=False)

In [16]:
from dataclasses import dataclass

@dataclass
class V3D:
    x: int
    y: int
    z: int
    length: float = field(init=False)
 
    def __post_init__(self):
        self.length = (self.x * self.x + self.y * self.y + self.z * self.z) ** 0.5

v = V3D(1, 2, 3)
print(v)
# print(v.__dict__)

V3D(x=1, y=2, z=3, length=3.7416573867739413)


## Функция field()

Для обычных и простых случаев использования не требуется никакой дополнительной функциональности. Однако существуют некоторые возможности dataclass, которые требуют дополнительной информации для каждого поля. Чтобы удовлетворить эту потребность в дополнительной информации, вы можете заменить значение поля по умолчанию вызовом функции field(), предоставленной в модуле dataclasses. 

Вообще функция field() предоставляет богатый функционал по управлению объявляемых атрибутов в Data Classes. Мы увидели, как работают два ее параметра: init и default_factory. Довольно часто можно встретить использование еще трех:
```
repr – булевое значение True/False указывает использовать ли атрибут в магическом методе ```__repr__()``` (по умолчанию True);
compare – булевое значение True/False указывает использовать ли атрибут при сравнении объектов (по умолчанию True);
default – значение по умолчанию (начальное значение).
```
Смысл их вполне понятен. Давайте исключим атрибут x из метода ```__repr__()``` и из операций сравнения атрибуты z и length. Получим следующее объявление класса:
```Py
@dataclass
class V3D:
    x: int = field(repr=False)
    y: int
    z: int = field(compare=False)
    length: float = field(init=False, compare=False)
 
    def __post_init__(self):
        self.length = (self.x * self.x + self.y * self.y + self.z * self.z) ** 0.5
```
Тогда при отображении и сравнении двух объектов:
```Py
v = V3D(1, 2, 3)
v2 = V3D(1, 2, 5)
print(v)
print(v == v2)
```
мы увидим только три атрибута: y, z, length и результат True, т.к. координаты x, y объектов v и v2 совпадают.

С остальными параметрами функции field() можно познакомиться на странице официальной документации:

https://docs.python.org/3/library/dataclasses.html

In [19]:
from dataclasses import dataclass

@dataclass
class V3D:
    x: int = field(repr=False)
    y: int
    z: int = field(compare=False)
    length: float = field(init=False , compare=False)
 
    def __post_init__(self):
        self.length = (self.x * self.x + self.y * self.y + self.z * self.z) ** 0.5

v = V3D(1, 2, 3)
print(v)
# print(v.__dict__)

v = V3D(1, 2, 3)
v2 = V3D(1, 2, 5)
print(v)
print(v == v2)

V3D(y=2, z=3, length=3.7416573867739413)
V3D(y=2, z=3, length=3.7416573867739413)
True


## Объявление параметров типа InitVar

Давайте теперь предположим, что мы бы хотели вычислять длину вектора в зависимости от значения некоторого параметра, например, calc_len. При описании обычного инициализатора это можно было бы сделать следующим образом:
```Py
class Vector3D:
    def __init__(self, x: int, y: int, z: int, calc_len: bool = True):
        self.x = x
        self.y = y
        self.z = z
        self.length = (x * x + y * y + z * z) ** 0.5 if calc_len else 0
```
А как это сделать при объявлении Data Classes? Для определения параметров, участвующих в инициализации (таких, как calc_len) в модуле dataclasses есть специальный класс типа InitVar:
```Py
from dataclasses import dataclass, field, InitVar
```
Если при объявлении атрибут аннотируется этим классом, то он автоматически передается как параметр в метод ```__post_init__()```, чтобы им можно было воспользоваться при формировании вычисляемых свойств:
```Py
@dataclass
class V3D:
    x: int = field(repr=False)
    y: int
    z: int = field(compare=False)
    calc_len: InitVar[bool] = True
    length: float = field(init=False, compare=False, default=0)
 
    def __post_init__(self, calc_len: bool):
        if calc_len:
            self.length = (self.x * self.x + self.y * self.y + self.z * self.z) ** 0.5
```
Обратите внимание, я здесь для атрибута length добавил параметр default=0 в функции field(). То есть, начальное значение атрибута length равно нулю. Если параметр calc_len равен True, то в методе ```__post_init__()``` будет пересчитано и сформировано новое значение локального атрибута length.

Поля только для инициализации добавляются в качестве параметров в сгенерированный метод init() и передаются в необязательный метод post_init. В остальном они не используются dataclasses.

In [22]:
from dataclasses import dataclass, InitVar

@dataclass
class V3D:
    x: int = field(repr=False)
    y: int
    z: int = field(compare=False)
    calc_len: InitVar[bool] = True
    length: float = field(init=False, compare=False, default=0)
 
    def __post_init__(self, calc_len: bool):
        if calc_len:
            self.length = (self.x * self.x + self.y * self.y + self.z * self.z) ** 0.5

v = V3D(1, 2, 3)
print(v)
print(v.__dict__)

V3D(y=2, z=3, length=3.7416573867739413)
{'x': 1, 'y': 2, 'z': 3, 'length': 3.7416573867739413}


## Параметры декоратора dataclass

До сих пор мы с вами использовали декоратор dataclass с параметрами по умолчанию. Однако ему можно передавать различные аргументы и управлять процессом формирования итогового класса. Вот основные параметры, которые принимает декоратор dataclass.

<table class="MsoTableGrid" border="1" cellspacing="0" cellpadding="0" style="border-collapse:collapse;border:none">
 <tbody><tr>
  <td width="187" valign="top" style="width:140.1pt;border:solid black 1.0pt;    padding:0cm 5.4pt 0cm 5.4pt">
  <p><b>Параметр</b>
  </p></td>
  <td width="451" valign="top" style="width:338.45pt;border:solid black 1.0pt;    border-left:none;padding:0cm 5.4pt 0cm 5.4pt">
  <p><b>Описание</b>
  </p></td>
 </tr>
 <tr>
  <td width="187" valign="top" style="width:140.1pt;border:solid black 1.0pt;    border-top:none;padding:0cm 5.4pt 0cm 5.4pt">
  <p>init = [True | False]
  </p></td>
  <td width="451" valign="top" style="width:338.45pt;border-top:none;border-left:    none;border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;    padding:0cm 5.4pt 0cm 5.4pt">
  <p>Принимает
  булево значение, по умолчанию True.
  Если значение True, то в классе
  объявляется инициализатор, иначе – не объявляется.
  </p></td>
 </tr>
 <tr>
  <td width="187" valign="top" style="width:140.1pt;border:solid black 1.0pt;    border-top:none;padding:0cm 5.4pt 0cm 5.4pt">
  <p>repr = [True | False]
  </p></td>
  <td width="451" valign="top" style="width:338.45pt;border-top:none;border-left:    none;border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;    padding:0cm 5.4pt 0cm 5.4pt">
  <p>Принимает
  булево значение, по умолчанию True.
  Если значение True, то в классе
  объявляется магический метод __repr__(),
  иначе – не объявляется.
  </p></td>
 </tr>
 <tr>
  <td width="187" valign="top" style="width:140.1pt;border:solid black 1.0pt;    border-top:none;padding:0cm 5.4pt 0cm 5.4pt">
  <p>eq = [True | False]
  </p></td>
  <td width="451" valign="top" style="width:338.45pt;border-top:none;border-left:    none;border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;    padding:0cm 5.4pt 0cm 5.4pt">
  <p>Принимает
  булево значение, по умолчанию True.
  Если значение True, то в классе
  объявляется магический метод __eq__(),
  иначе – не объявляется.
  </p></td>
 </tr>
 <tr>
  <td width="187" valign="top" style="width:140.1pt;border:solid black 1.0pt;    border-top:none;padding:0cm 5.4pt 0cm 5.4pt">
  <p>order = [True | False]
  </p></td>
  <td width="451" valign="top" style="width:338.45pt;border-top:none;border-left:    none;border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;    padding:0cm 5.4pt 0cm 5.4pt">
  <p>Принимает
  булево значение, по умолчанию False.
  Если значение True, то в классе
  объявляются магические методы для операций сравнения &lt;; &lt;=; &gt;; &gt;=,
  иначе – не объявляются.
  </p></td>
 </tr>
 <tr>
  <td width="187" valign="top" style="width:140.1pt;border:solid black 1.0pt;    border-top:none;padding:0cm 5.4pt 0cm 5.4pt">
  <p>unsafe_hash
  = [True | False]
  </p></td>
  <td width="451" valign="top" style="width:338.45pt;border-top:none;border-left:    none;border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;    padding:0cm 5.4pt 0cm 5.4pt">
  <p>Влияет
  на формирование магического метода __hash__()
  </p></td>
 </tr>
 <tr>
  <td width="187" valign="top" style="width:140.1pt;border:solid black 1.0pt;    border-top:none;padding:0cm 5.4pt 0cm 5.4pt">
  <p>frozen
  = [True | False]
  </p></td>
  <td width="451" valign="top" style="width:338.45pt;border-top:none;border-left:    none;border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;    padding:0cm 5.4pt 0cm 5.4pt">
  <p>Принимает
  булево значение, по умолчанию False.
  Если значение True, то атрибуты
  объектов класса становятся неизменными (можно только проинициализировать один
  раз в инициализаторе).
  </p></td>
 </tr>
 <tr>
  <td width="187" valign="top" style="width:140.1pt;border:solid black 1.0pt;    border-top:none;padding:0cm 5.4pt 0cm 5.4pt">
  <p>slots = [True | False]
  </p></td>
  <td width="451" valign="top" style="width:338.45pt;border-top:none;border-left:    none;border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;    padding:0cm 5.4pt 0cm 5.4pt">
  <p>Принимает
  булево значение, по умолчанию False.
  Если значение True, то атрибуты
  объявляются в коллекции __slots__.
  </p></td>
 </tr>
</tbody></table>

Существуют и другие параметры декоратора dataclass. Подробно о них можно почитать на странице официальной документации:

https://docs.python.org/3/library/dataclasses.html

Давайте рассмотрим основные из них. Первые параметры init, repr, eq я, думаю, понятны. Если в декоратор передать аргумент init=False:
```Py
@dataclass(init=False)
```
то класс будет сформирован без собственного инициализатора (будет использован инициализатор базового класса). В результате у нас не получится создать объект с передачей значений аргументов:
```Py
v = V3D(1, 2, 3, False)
```
Это бывает полезно, когда все описанные атрибуты принимают значения по умолчанию и не предполагается их сразу переопределять в инициализаторе. Например, если класс в дальнейшем будет использован как базовый для построения других дочерних классов.

Следующий параметр:
```Py
@dataclass(repr=False)
```
запрещает формирование магического метода ```__repr__()``` внутри текущего класса. В результате, будет использован аналогичный метод базового класса. В этом легко убедиться, если создать объект и вывести его в консоль:
```Py
v = V3D(1, 2, 3, False)
print(v)
```
Увидим что то похожее на:
```
<__main__.V3D object at 0x00000236FAD67D50>
```

По аналогии работает параметр eq:
```Py
@dataclass(repr=False, eq=False)
```
Он запрещает формирование собственного магического метода ```__eq__()``` для сравнения объектов между собой на равенство. Теперь объекты сравниваются по их идентификаторам, и так как они разные, то при сравнении:
```Py
v = V3D(1, 2, 3, False)
v2 = V3D(1, 2, 3)
print(v == v2)
```
получаем значение False.

Следующий параметр order может быть установлен в True только совместно с eq=True. Например, следующая строчка приведет к ошибке:
```Py
@dataclass(eq=False, order=True)
```
Поэтому нам нужно или убрать параметр eq (по умолчанию он True), либо явно прописать у него значение True:
```Py
@dataclass(eq=True, order=True)
```

Это связано с тем, что операции сравнения на больше или равно, меньше или равно используют магический метод ```__eq__()```. Поэтому он должен присутствовать.

После включения параметра order, у нас появляется возможность сравнивать объекты класса на больше, меньше и больше или равно и меньше или равно:
```Py
@dataclass(eq=True, order=True)
class V3D:
    x: int
    y: int
    z: int
 
 
v = V3D(1, 2, 5)
v2 = V3D(1, 2, 3)
 
print(v < v2)  # False
print(v > v2)  # True
```

Сравнение выполняется на уровне кортежей, содержащих значения атрибутов (x, y, z) в порядке их объявления в классе. В данном случае происходит последовательное сравнение сначала значений x между собой, затем, y и потом – z. Как только встречается пара, для которой можно вычислить значение True или False, проверка завершается. Фактически, в приведенном примере, сравниваются между собой только последние числа 5 и 3, остальные равны, поэтому операции < и > их пропускают.

Если нам нужно исключить какие-либо атрибуты из операций сравнений, то для этого следует использовать функцию field() и в ней через параметр compare исключить соответствующее поле:
```Py
@dataclass(eq=True, order=True)
class V3D:
    x: int = field(compare=False)
    y: int
    z: int
```
Теперь сравниваться будут объекты только по двум локальным атрибутам y и z.

Здесь следует обратить внимание на то, что если в классе объявить какой-либо метод сравнения на больше, меньше или больше либо равно или меньше либо равно, ```(__lt__, __le__, __gt__, __ge__)``` то возникнет исключение TypeError: Cannot overwrite attribute ```__lt__``` in class V3D.
```Py
@dataclass(order=True)
class V3D:
    x: int = field(compare=False)
    y: int
    z: int
 
    def __lt__(self, other):
        return self.x < other.x and self.y < other.y
```

In [26]:
from dataclasses import dataclass

@dataclass(order=True)
class V3D:
    x: int = field(compare=False)
    y: int
    z: int
 
    def __lt__(self, other):
        return self.x < other.x and self.y < other.y

TypeError: Cannot overwrite attribute __lt__ in class V3D. Consider using functools.total_ordering

Вы можете установить аргумент order=True. 
Таким образом, dataclass будет сортировать объекты по каждому полю, пока не найдет значение, которое не равно.

На практике часто требуется сравнивать объекты по конкретному атрибуту, а не по всем атрибутам. Для этого вам необходимо определить поле с именем sort_index и установить его значение в атрибут, по которому вы хотите сортировать.
Например, предположим, у вас есть список объектов класса Person и вы хотите отсортировать их по возрасту:

```
members = [
    Person('John', 25),
    Person('Bob', 35),
    Person('Alice', 30)
]

```

Для этого необходимо:

* Передать параметр order=True в декоратор @dataclass.
* Определить атрибут sort_index и установить его параметр init в False.
* В методе ```__post_init__``` установить sort_index в атрибут age, чтобы сортировать объекты класса Person по возрасту.

Ниже приведен код для сортировки объектов класса Person по возрасту:

In [67]:
from dataclasses import dataclass, field


@dataclass(order=True)
class Person:
    sort_index: int = field(init=False, repr=False)

    name: str
    age: int
    iq: int = 100
    can_vote: bool = field(init=False)

    def __post_init__(self):
        self.can_vote = 18 <= self.age <= 70
        # sort by age
        self.sort_index = self.age


members = [
    Person(name='John', age=25),
    Person(name='Bob', age=35),
    Person(name='Alice', age=30)
]

sorted_members = sorted(members)
for member in sorted_members:
    print(f'{member.name}(age={member.age})')

John(age=25)
Alice(age=30)
Bob(age=35)


Последний параметр, который мы рассмотрим – frozen, позволяет «замораживать» значения атрибутов класса.
Для создания объектов только для чтения из класса данных вы можете установить аргумент frozen декоратора dataclass в значение True. Например:
```Py
@dataclass(frozen=True)
class V3D:
    x: int
    y: int
    z: int
 
 
v = V3D(1, 2, 3)
print(v)
v.x = 5
```
Приведет к ошибке в последней строчке, т.к. менять локальные атрибуты при frozen=True в объектах класса нельзя.

Теперь затронем тему наследования классов, объявленных с помощью декоратора dataclass. 

При создании dataclass с использованием декоратора dataclass() происходит обход всех базовых классов данного класса в обратном порядке в соответствии c MRO (начиная с object), и для каждого найденного dataclass добавляются поля из этого базового класса в упорядоченное отображение полей. После добавления всех полей базовых классов добавляются собственные поля в это упорядоченное отображение. Все сгенерированные методы будут использовать это объединенное упорядоченное отображение полей. Поскольку поля упорядочены в порядке добавления, классы-наследники переопределяют поля базовых классов. 

В качестве примера мы сформируем базовый класс с именем Goods для представления различных товаров:
```Py
from dataclasses import dataclass, field, InitVar
from typing import Any
 
 
@dataclass
class Goods:
    uid: Any
    price: Any = None
    weight: Any = None
```
А ниже, на его основе объявим дочерний класс Book для описания книг:
```Py
@dataclass
class Book(Goods):
    title: str = ""
    author: str = ""
    price: float = 0
    weight: int | float = 0
```

Здесь в дочернем классе повторяются атрибуты price и weight. Спрашивается, какие инициализаторы в итоге будут формироваться в первом и во втором классах? Для первого базового класса Goods все очевидно. Будет объявлен инициализатор со следующей сигнатурой:
```Py
def __init__(self, uid: Any, price: Any = None, weight: Any = None):
```
А в дочернем классе будем иметь такой инициализатор:
```Py
def __init__(self, uid: Any, price: float = 0, weight: int | float = 0, title: str = "", author: str = ""):
```
То есть, уникальные атрибуты добавляются в конец, а переопределенные (по типу данных в аннотации и начальному значению) остаются в своих позициях, но с указанными типами и начальными значениями. Поэтому, если далее мы создадим объект класса Book и выведем его на экран:
```Py
b = Book(1)
print(b)
```
то увидим строчку:
```
Book(uid=1, price=0, weight=0, title='', author='')
```

Или же, можно создать объект, указав весь набор аргументов:
```Py
b = Book(1, 1000, 100, "Python ООП", "Author")
print(b)
```
Тогда в консоль будет выведена информация:
```Py
Book(uid=1, price=1000, weight=100, title='Python ООП', author='Author')
```

Учитывая порядок атрибутов и параметров в инициализаторах, мы в дочернем классе у всех атрибутов должны указывать начальные значения. Иначе, получим ошибку, что параметры со значениями по умолчанию price и weight идут до обычных позиционных параметров.

In [34]:
from dataclasses import dataclass, field, InitVar
from typing import Any
 
 
@dataclass
class Goods:
    uid: Any
    price: Any = None
    weight: Any = None

@dataclass
class Book(Goods):
    title: str = ""
    author: str = ""
    price: float = 0
    weight: int | float = 0

b = Book(1)
print(b)
b2 = Book(1, 1000, 100, "Python ООП", "Author")
print(b2)

Book(uid=1, price=0, weight=0, title='', author='')
Book(uid=1, price=1000, weight=100, title='Python ООП', author='Author')



Обратите внимание, что для формирования локальных атрибутов нам не нужно самим вызывать инициализатор базового класса. Это уже автоматически закладывается при наследовании, когда классы формируются через декоратор dataclass. 
В общем случае вызывать сгенерированные методы init() от dataclass необязательно, поскольку производный dataclass будет инициализировать все поля любого базового класса, который сам является dataclass.
Если бы мы сами формировали цепочку наследования без использования декоратора dataclass (классическим способом), то вызов инициализаторов базовых классов нужно было бы явно указывать.

## Пользовательские методы в параметре default_factory функции field

Давайте еще несколько усложним нашу программу и добавим в дочерний класс Book еще один атрибут measure следующим образом:
```Py
@dataclass
class Book(Goods):
    title: str = ""
    author: str = ""
    price: float = 0
    weight: int | float = 0
    measure: list = field(default_factory=GoodsMethodsFactory.get_init_measure)
 
    def __post_init__(self):
        super().__post_init__()
        print("Book: post_init")
```
По смыслу это свойство содержит габариты предмета, в данном случае книги. Так как всего габаритных размера три: высота, длина и ширина, то нам бы хотелось сразу сформировать список из трех числовых значений. И пусть эти значения по умолчанию равны нулю. Для этого достаточно передать ссылку на функцию, которая будет возвращать список из трех значений. Эта функция будет вызываться в момент создания объекта класса Book.

Глядя сейчас на эту строчку, у вас может возникнуть вопрос: почему бы эту функцию (метод) не объявить внутри класса Book, а потом указать в параметре default_factory? Но если мы сейчас попробуем это сделать:
```Py
measure: list = field(default_factory=Book.get_init_measure)
```
и определим метод get_init_measure() как статический внутри класса Book:
```Py
    @staticmethod
    def get_init_measure():
        return [0, 0, 0]
```
то получим ошибку, что имя Book не определено. Хороший выход из этой ситуации – это объявить еще один самостоятельный класс, в котором определять методы, используемые в функции field, например, так:
```Py
class GoodsMethodsFactory:
    @staticmethod
    def get_init_measure():
        return [0, 0, 0]
```
Тогда никаких ошибок не будет и локальный атрибут measure сформируется с нужными нам начальными значениями:
```
Book(uid=1, price=1000, weight=100, title='Python ООП', author='Author', measure=[0, 0, 0])
```

In [65]:
from dataclasses import dataclass, field, InitVar
from typing import Any
 
class GoodsMethodsFactory:
    @staticmethod
    def get_init_measure():
        return [0, 0, 0] 

 
@dataclass
class Goods:
    current_uid = 0
 
    uid: int = field(init=False)
    price: Any = None
    weight: Any = None
 
    def __post_init__(self):
        print("Goods: post_init")
        Goods.current_uid += 1
        self.uid = Goods.current_uid

@dataclass
class Book(Goods):
    title: str = ""
    author: str = ""
    price: float = 0
    weight: int | float = 0
    measure: list = field(default_factory=GoodsMethodsFactory.get_init_measure)

    def __post_init__(self):
        super().__post_init__()
        print("Book: post_init")

b = Book(1000, 100, "Python ООП", "Author")
print(b)

Goods: post_init
Book: post_init
Book(uid=1, price=1000, weight=100, title='Python ООП', author='Author', measure=[0, 0, 0])


## Функция make_dataclass

Есть еще один способ объявления Data Classes с помощью функции make_dataclass(), которая имеет следующие наборы параметров:
```Py
dataclasses.make_dataclass(cls_name, fields, *, bases=(), namespace=None, init=True, repr=True, eq=True, order=False, unsafe_hash=False, frozen=False, match_args=True, kw_only=False, slots=False, weakref_slot=False)
```
Основные из них следующие:
```
cls_name – название нового класса (в виде строки);
fields – поля (локальные атрибуты) объектов класса;

bases – список базовых классов;
namespace – словарь для определения атрибутов самого класса (например, так можно объявлять методы класса).
```
Некоторые остальные параметры вам уже известны, они совпадают с параметрами декоратора dataclass.

Давайте для примера объявим класс аналогичный следующему:

```Py
class Car:
    def __init__(self, model, max_speed, price):
        self.model = model
        self.max_speed = max_speed
        self.price = price
 
    def get_max_speed(self):
        return self.max_speed
```
С помощью функции make_dataclass() это можно сделать так:
```Py
CarData = make_dataclass("CarData", [("model", str),
                                     "max_speed",
                                     ("price", float, field(default=0))],
                         namespace={'get_max_speed': lambda self: self.max_speed})
```

Если указано только имя, то для типа используется typing.Any.

Создадим объект этого класса:
```Py
c = CarData("BMW", 256, 4096)
```
и выведем его на экран:
```Py
print(c)
print(c.get_max_speed())
```
Как видите, все отработало как надо.

Обычно, функцию make_dataclass() используют, если требуется сформировать класс данных в процессе работы программы. Если же нам нужно обычное объявление (а это наиболее частая ситуация), то гораздо удобнее использовать декоратор dataclass.

Вот основные возможности формирования классов данных на языке Python. Более подробную информацию, как всегда, можно посмотреть на странице официальной документации:

https://docs.python.org/3/library/dataclasses.html