# https://metanit.com/python/tutorial/2.10.php
# Модули
### Определение и подключение модулей

Модуль в языке Python представляет отдельный файл с кодом, который можно повторно использовать в других программах.

Для создания модуля необходимо создать собственно файл с расширением `*.py`, который будет представлять модуль. Название файла будет представлять название модуля. Затем в этом файле надо определить одну или несколько функций.

Допустим, основной файл программы называется __main.py__. И мы хотим подключить к нему внешние модули.

Для этого сначала определим новый модуль: создадим в той же папке, где находится main.py, новый файл, который назовем `message.py`. По умолчанию интерпретатор Python ищет модули по ряду стандартных путей, один из которых - это папка главного, запускаемого скрипта. Поэтому, чтобы интерпретатор подхватил модуль message.py, для простоты оба файла поместим в один проект.

Соответственно модуль будет называться __message__. Определим в нем следующий код:

In [1]:
# message.py

hello = "Hello all"
 
def print_message(text):
    print(f"Message: {text}")

Здесь определена переменная hello и функция print_message, которая в качестве параметра получает некоторый текст и выводит его на консоль.

В основном файле программы - __main.py__ используем данный модуль:

In [None]:
# main.py

import message      # подключаем модуль message
 
# выводим значение переменной hello
print(message.hello)        # Hello all
# обращаемся к функии print_message
message.print_message("Hello work")  # Message: Hello work

Для использования модуля его надо импортировать с помощью оператора __import__, после которого указывается имя модуля: 

> import message.

Чтобы обращаться к функциональности модуля, нам нужно получить его пространство имен. По умолчанию оно будет совпадать с именем модуля, то есть в нашем случае также будет называться message.

Получив пространство имен модуля, мы сможем обратиться к его функциям по схеме

> пространство_имен.функция

Например, обращение к функции print_message() из модуля message:

In [None]:
message.print_message("Hello work")

И после этого мы можем запустить главный скрипт main.py, и он задействует модуль message.py. В частности, консольный вывод будет следующим:
```
Hello all
Message: Hello work
```
### Подключение функциональности модуля в глобальное пространство имен

Другой вариант настройки предполагает импорт функциональности модуля в глобальное пространство имен текущего модуля с помощью ключевого слова from:

In [None]:
# main.py

from message import print_message
 
# обращаемся к функии print_message из модуля message
print_message("Hello work")  # Message: Hello work
 
# переменная hello из модуля message не доступна, так как она не импортирована
# print(message.hello)   
# print(hello) 

В данном случае мы импортируем из модуля message в глобальное пространство имен функцию print_message(). Поэтому мы сможем ее использовать без указания пространства имен модуля как если бы она была определена в этом же файле.

Все остальные функции, переменные из модуля недоступны (как например, в примере выше переменная hello). Если мы хотим их также использовать, то их можно подключить по отдельности:

In [None]:
# main.py

from message import print_message
from message import hello
 
# обращаемся к функции print_message из модуля message
print_message("Hello work")  # Message: Hello work
 
# обращаемся к переменной hello из модуля message
print(hello)    # Hello all

Если необходимо импортировать в глобальное пространство имен весь функционал, то вместо названий отдельных функций и переменных можно использовать символ зводочки `*`:

In [None]:
# main.py

from message import *
 
# обращаемся к функции print_message из модуля message
print_message("Hello work")  # Message: Hello work
 
# обращаемся к переменной hello из модуля message
print(hello)    # Hello all

Но стоит отметить, что импорт в глобальное пространство имен чреват коллизиями имен функций. Например, если у нас том же файле определена функция с тем же именем до ее вызова, то будет вызываться функция, которая определена последней:

In [None]:
# main.py

from message import *
  
print_message("Hello work")  # Message: Hello work - применяется функция из модуля message
 
def print_message(some_text):
    print(f"Text: {some_text}")

print_message("Hello work")  # Text: Hello work - применяется функция из текущего файла

Таким образом, одноименная функция текущего файла скрывает функцию из подключенного модуля.
Установка псевдонимов

При импорте модуля и его функциональности мы можем установить для них псевдонимы. Для этого применяется ключевое слово as, после которого указывается псевдоним. Например, установим псевдоним для модуля:

In [None]:
# main.py

import message as mes  # модуль message проецируется на псевдоним mes
 
# выводим значение переменной hello
print(mes.hello)        # Hello all
# обращаемся к функии print_message
mes.print_message("Hello work")  # Message: Hello work

В данном случае пространство имен будет называться mes, и через этот псевдоним можно обращаться к функциональности модуля.

Подобным образом можно установить псевдонимы для отдельной функциональности модуля:

In [None]:
# main.py

from message import print_message as display
from message import hello as welcome
 
print(welcome)          # Hello all - переменная hello из модуля message
display("Hello work")   # Message: Hello work - функция print_message из модуля message

Здесь для функции print_message из модуля message устанавливается псевдоним display, а для переменной hello - псевдоним welcome. И через эти псевдонимы мы сможем к ним обращаться.

Псевдонимы могут быть полезны, когда нас не устраивают имена функций и переменных, например, они слишком длинные, и мы хотим их сократить, либо мы хотим дать им более описательные, с нашей точки зрения, имена. Либо если в текущем файле уже есть функциональность с теми же именами, и с помощью установки псевдонимов мы можем избежать конфликта имен. Например:

In [None]:
# main.py

from message import print_message as display
 
def print_message(some_text):
    print(f"Text: {some_text}")

# функция print_message из модуля message
display("Hello work")       # Message: Hello work
 
# функция print_message из текущего файла
print_message("Hello work")  # Text: Hello work

### Имя модуля

В примере выше модуль main.py, который является главным, использует модуль message.py. При запуске модуля main.py программа выполнит всю необходимую работу. Однако, если мы запустим отдельно модуль message.py сам по себе, то ничего на консоли не увидим. Ведь модуль message просто определяет функцию и переменную и не выполняет никаких других действий. Но мы можем сделать так, чтобы модуль message.py мог использоваться как сам по себе, так и подключаться в другие модули.

При выполнении модуля среда определяет его имя и присваивает его глобальной переменной `__name__ `(с обеих сторон по два подчеркивания). Если модуль является запускаемым, то его имя равно `__main__` (также по два подчеркивания с каждой стороны). Если модуль используется в другом модуле, то в момент выполнения его имя аналогично названию файла без расширения py. И мы можем это использовать. Так, изменим содержимое файла message.py:

In [None]:
# message.py

hello = "Hello all"
 
 
def print_message(text):
    print(f"Message: {text}")
 
 
def main():
    print_message(hello)
 
 
if __name__ == "__main__": 
    main()

В данном случае в модуль message.py для тестирования функциональности модуля добавлена функция main. И мы можем сразу запустить файл message.py отдельно от всех и протестировать код.

Следует обратить внимание на вызов функции main:

In [None]:
if __name__ == "__main__":
    main()

Переменная `__name__` указывает на имя модуля. Для главного модуля, который непосредственно запускается, эта переменная всегда будет иметь значение `__main__` вне зависимости от имени файла.

Поэтому, если мы будем запускать скрипт message.py отдельно, сам по себе, то Python присвоит переменной `__name__` значение `__main__`, далее в выражении if вызовет функцию main из этого же файла.

Однако если мы будем запускать другой скрипт, а этот - message.py - будем подключать в качестве вспомогательного, для message.py переменная `__name__` будет иметь значение message. И соответственно метод main в файле message.py не будет работать.

Данный подход с проверкой имени модуля является более рекомендуемым подходом, чем просто вызов метода main.

В файле main.py также можно сделать проверку на то, является ли модуль главным (хотя в прицнипе это необязательно):

In [None]:
# main.py

import message
 
def main(): 
    message.print_message("Hello work")  # Message: Hello work
 
 
if __name__ == "__main__":
    main()
    

Python предоставляет ряд встроенных модулей, которые мы можем использовать в своих программах. В следующих статьях рассмотрим основные из них.

# Генерация байткода модулей

При выполнении скрипта на языке Python все выполнение в общем случае разбивается на две стадии:

- Файл с кодом (файл с расширением .py) компилируется в промежуточный байткод.

- Далее скомпилированный байткодом интерпретируется, то есть происходит собственно выполнение программы

При этом нам не надо явным образом генерировать никакой байткод, он создается неявно при выполнении скрипта Python. Если программа импортирует внешние модули/библиотеки и они импортируются первый раз, то их скомпилированный байткод сохраняется в файле с расширением `.pyc` и кэшируется в каталоге `__pycache__` в папке, где расположен файл с кодом python. Если мы вносим в исходный файл библиотеки изменения, то Python перекомпилирует файл байткода. Если изменений в коде нет, то загружается ранее скомпилированный байткод из файла `*.pyc`. Это позволяет оптимизировать работу с приложением, быстрее его компилировать и выполнять.

Однако байткод основного скрипта, который представляет основной файл программы и который передается интерпретатору python, не сохраняется в файле `*.pyc` и перекомпилируется каждый раз при запуске приложения.

Допустим, в папке проекта у нас размещен файл user.py со простейшей функцией, которая принимает два параметра и выводит их значения:

In [4]:
def printUser(username, userage):
    print(f"Name: {username}  Age:{userage}")

Подключим этот файл в главном модуле программы, который пусть называется app.py:

In [None]:
import user
username = "Tom"
userage = 39

 
user.printUser(username, userage)

При выполнении этого скрипта в папке проекте (где располагается модуль "user.py") будет создан каталог `__pycache__`. А в нем будет сгенерирован файл байткода, который будет наподобие следующего `user.cpython-версия.pyc`, где в качестве версии будет применяться версия используемого интерпретатора, например, 311 (для версии Python 3.11). Сгенерированный pyc-файл является бинарным, поэтому текстовом редакторе нет смысла его открывать.

### Ручная компиляция байткода

Хотя файл байткода создается автоматически, мы вручную можем его сгенерировать. Для этого есть несколько способов: 
- компиляция с помощью скрипта py_compile 
- компиляция с помощью модуля compileall.

Скрипт `py_compile` применяется для компиляции отдельных файлов. Для компиляции произвольного скрипта user.py в файл с байткодом мы могли бы использовать следующую программу:

In [None]:
import py_compile
 
py_compile.compile("user.py")   # передаем путь к скрипту

Для компиляции в функцию `compile()` передаем путь к скрипту. После выполнения программы в текущей папке также будет сгенерирован каталог `__pycache__`, а в нем файл `user.cpython-311.pyc`

Модуль compileall применяется для компиляции всех файлов Python по определенным путям. Например, скомпилируем все файлы в каталоге C:/python/files

> python -m compileall c:\python\files

По умолчанию компилируются даже те файлы, которые содержатся в подкаталогах. Если надо скомпилировать только те файлы, которые располагаются непосредственно в указанно папке, то применяется опция -l

> python -m compileall c:\python\files -l

# Модуль random
Модуль random управляет генерацией случайных чисел. Его основные функции:

- random(): генерирует случайное число от 0.0 до 1.0

- randint(): возвращает случайное число из определенного диапазона

- randrange(): возвращает случайное число из определенного набора чисел

- shuffle(): перемешивает список

- choice(): возвращает случайный элемент списка

Функция __random()__ возвращает случайное число с плавающей точкой в промежутке от 0.0 до 1.0. Если же нам необходимо число из большего диапазона, скажем от 0 до 100, то мы можем соответственно умножить результат функции random на 100.

In [6]:
import random
 
number = random.random()  # значение от 0.0 до 1.0
print(number)
number = random.random() * 100  # значение от 0.0 до 100.0
print(number)

0.008312863829425976
51.91287269527815


Функция __randint(min, max)__ возвращает случайное целое число в промежутке между двумя значениями min и max.

In [7]:
import random
 
number = random.randint(20, 35)  # значение от 20 до 35
print(number)

27


Функция __randrange()__ возвращает случайное целое число из определенного набора чисел. Она имеет три формы:

- __randrange(stop)__: в качестве набора чисел, из которых происходит извлечение случайного значения, будет использоваться диапазон от 0 до числа stop

- __randrange(start, stop)__: набор чисел представляет диапазон от числа start до числа stop

- __randrange(start, stop, step)__: набор чисел представляет диапазон от числа start до числа stop, при этом каждое число в диапазоне отличается от предыдущего на шаг step

In [8]:
import random
 
number = random.randrange(10)  # значение от 0 до 10 не включая
print(number)
number = random.randrange(2, 10)  # значение в диапазоне 2, 3, 4, 5, 6, 7, 8, 9
print(number)
number = random.randrange(2, 10, 2)  # значение в диапазоне 2, 4, 6, 8
print(number)

4
4
2


### Работа со списком

Для работы со списками в модуле random определены две функции: функция __shuffle()__ перемешивает список случайным образом, а функция __choice()__ возвращает один случайный элемент из списка:

In [9]:
numbers = [1, 2, 3, 4, 5, 6, 7, 8]
random.shuffle(numbers)
print(numbers)  
random_number = random.choice(numbers)
print(random_number)

[6, 1, 8, 3, 4, 2, 7, 5]
1


# Модуль math
Встроенный модуль __math__ в Python предоставляет набор функций для выполнения математических, тригонометрических и логарифмических операций. Некоторые из основных функций модуля:

- __pow(num, power)__: возведение числа num в степень power

- __sqrt(num)__: квадратный корень числа num

- __ceil(num)__: округление числа до ближайшего наибольшего целого

- __floor(num)__: округление числа до ближайшего наименьшего целого

- __factorial(num)__: факториал числа

- __degrees(rad)__: перевод из радиан в градусы

- __radians(grad)__: перевод из градусов в радианы
- __cos(rad)__: косинус угла в радианах

- __sin(rad)__: синус угла в радианах
- __tan(rad)__: тангенс угла в радианах

- __acos(rad)__: арккосинус угла в радианах

- __asin(rad)__: арксинус угла в радианах

- __atan(rad)__: арктангенс угла в радианах
- __log(n, base)__: логарифм числа n по основанию base
- __log10(n)__: десятичный логарифм числа n

Пример применения некоторых функций:

In [10]:
import math
 
# возведение числа 2 в степень 3
n1 = math.pow(2, 3)
print(n1)  # 8
 
# ту же самую операцию можно выполнить так
n2 = 2**3
print(n2)
 
# квадратный корень числа
print(math.sqrt(9))  # 3
 
# ближайшее наибольшее целое число
print(math.ceil(4.56))  # 5
 
# ближайшее наименьшее целое число
print(math.floor(4.56))  # 4
 
# перевод из радиан в градусы
print(math.degrees(3.14159))  # 180
 
# перевод из градусов в радианы
print(math.radians(180))   # 3.1415.....
# косинус
print(math.cos(math.radians(60)))  # 0.5
# cинус
print(math.sin(math.radians(90)))   # 1.0
# тангенс
print(math.tan(math.radians(0)))    # 0.0
 
print(math.log(8,2))    # 3.0
print(math.log10(100))    # 2.0

8.0
8
3.0
5
4
179.9998479605043
3.141592653589793
0.5000000000000001
1.0
0.0
3.0
2.0


Также модуль math предоставляет ряд встроенных констант, такие как PI и E:

In [11]:
import math
radius = 30
# площадь круга с радиусом 30
area = math.pi * math.pow(radius, 2)
print(area)
 
# натуральный логарифм числа 10
number = math.log(10, math.e)
print(number)

2827.4333882308138
2.302585092994046


# Модуль locale
При форматировании чисел Python по умолчанию использует англосаксонскую систему, при которой разряды целого числа отделяются друг от друга запятыми, а дробная часть от целой отделяется точкой. В континентальной Европе, например, используется другая система, при которой разряды разделяются точкой, а дробная и целая часть - запятой:

In [12]:
# англосаксонская система
1,234.567
# европейская система
1.234,567

(1.234, 567)

И для решения проблемы форматирования под определенную культуру в Python имеется встроенный модуль locale.

Для установки локальной культуры в модуле locale определена функция setlocale(). Она принимает два параметра:

> setlocale(category, locale)

Первый параметр указывает на категорию, к которой применяется функция - к числам, валютам или и числам, и валютам. В качестве значения для параметра мы можем передавать одну из следующих констант:

- `LC_ALL`: применяет локализацию ко всем категориям - к форматированию чисел, валют, дат и т.д.

- `LC_NUMERIC`: применяет локализацию к числам

- `LC_MONETARY`: применяет локализацию к валютам

- `LC_TIME`: применяет локализацию к датам и времени

- `LC_CTYPE`: применяет локализацию при переводе символов в верхний или нижний регистр

- `LC_COLLIATE`: применяет локаль при сравнении строк

Второй параметр функции setlocale указывает на локальную культуру, которую надо использовать. На ОС Windows можно использовать код страны по ISO из двух символов, например, для США - "us", для Германии - "de", для России - "ru". Но на MacOS необходимо указывать код языка и код страны, например, для английского в США - "en_US", для немецкого в Германии - "de_DE", для русского в России - "ru_RU". По умолчанию фактически используется культура "en_US".

Непосредственно для форматирования чисел и валют модуль locale предоставляет две функции:

- __currency(num)__: форматирует валюту

- __format_string(str, num)__: подставляет число num вместо плейсхолдера в строку str

Применяются следующие плейсхолдеры:

- `d`: для целых чисел

- `f`: для чисел с плавающей точкой

- `e`: для экспоненциальной записи чисел

Перед каждым плейсхолдером ставится знак процента %, например:

> "%d"

При выводе дробных чисел перед плейсхолдером после точки можно указать, сколько знаков в дробной части должно отображаться:

In [13]:
%.2f        # два знака в дробной части

UsageError: Line magic function `%.2f` not found.


Применим локализацию чисел и валют в немецкой культуре:

In [None]:
import locale
 
locale.setlocale(locale.LC_ALL, "de")        # для  Windows
# locale.setlocale(locale.LC_ALL, "de_DE")   # для MacOS
 
number = 12345.6789
formatted = locale.format_string("%f", number)
print(formatted)    # 12345,678900
 
formatted = locale.format_string("%.2f", number)
print(formatted)    # 12345,68
 
formatted = locale.format_string("%d", number)
print(formatted)    # 12345
 
formatted = locale.format_string("%e", number)
print(formatted)    # 1,234568e+04
 
money = 234.678
formatted = locale.currency(money)
print(formatted)    # 234,68 €

Если вместо конкретного кода в качестве второго параметра передается пустая строка, то Python будет использовать культуру, которая применяется на текущей рабочей машине. А с помощью функции getlocale() можно получить эту культуру:

In [15]:
import locale
 
locale.setlocale(locale.LC_ALL, "")
 
number = 12345.6789
formatted = locale.format_string("%.02f", number)
print(formatted)    # 12345,68
print(locale.getlocale())   
# ('Russian_Russia', '1251') - Windows
# ('ru_RU', 'UTF-8')  - MacOS

12345,68
('en_US', 'UTF-8')


Стоит отметить, что в зависимости от системы вывод может отличаться.

# Модуль decimal
При работе с числами с плавающей точкой (то есть float) мы сталкиваемся с тем, что в результате вычислений мы получаем не совсем верный результат:

In [16]:
number = 0.1 + 0.1 + 0.1
print(number)       # 0.30000000000000004

0.30000000000000004


Проблему может решить использование функции __round()__, которая округлит число. Однако есть и другой способ, который заключается в использовании встроенного модуля decimal.

Ключевым компонентом для работы с числами в этом модуле является класс Decimal. Для его применения нам надо создать его объект с помощью конструктора. В конструктор передается строковое значение, которое представляет число:

In [17]:
from decimal import Decimal
 
number = Decimal("0.1")

После этого объект Decimal можно использовать в арифметических операциях:

In [18]:
from decimal import Decimal
 
number = Decimal("0.1")
number = number + number + number
print(number)       # 0.3

0.3


В операциях с Decimal можно использовать целые числа:

In [19]:
number = Decimal("0.1")
number = number + 2

Однако нельзя смешивать в операциях дробные числа float и Decimal:

In [20]:
number = Decimal("0.1")
number = number + 0.1   # здесь возникнет ошибка

TypeError: unsupported operand type(s) for +: 'decimal.Decimal' and 'float'

С помощью дополнительных знаков мы можем определить, сколько будет символов в дробной части числа:

In [None]:
number = Decimal("0.10")
number = 3 * number
print(number)       # 0.30

Строка "0.10" определяет два знака в дробной части, даже если последние символы будут представлять ноль. Соответственно "0.100" представляет три знака в дробной части.
Округление чисел

Объекты Decimal имеют метод __quantize()__, который позволяет округлять числа. В этот метод в качестве первого аргумента передается также объект Decimal, который указывает формат округления числа:

In [21]:
from decimal import Decimal
 
number = Decimal("0.444")
number = number.quantize(Decimal("1.00"))
print(number)       # 0.44
 
number = Decimal("0.555678")
print(number.quantize(Decimal("1.00")))       # 0.56
 
number = Decimal("0.999")
print(number.quantize(Decimal("1.00")))       # 1.00

0.44
0.56
1.00


Используемая строка "1.00" указывает, что округление будет идти до двух знаков в дробной части.

По умолчанию округление описывается константой ROUND_HALF_EVEN, при котором округление происходит до ближайшего четного числа, если округляемая часть равна 5. Например:

In [22]:
from decimal import Decimal, ROUND_HALF_EVEN
 
number = Decimal("10.025")      # 2 - ближайшее четное число
print(number.quantize(Decimal("1.00"), ROUND_HALF_EVEN))       # 10.02
 
number = Decimal("10.035")      # 4 - ближайшее четное число
print(number.quantize(Decimal("1.00"), ROUND_HALF_EVEN))       # 10.04

10.02
10.04


Стратегия округления передается в качестве второго параметра в quantize.

Строка "1.00" означает, что округление будет идти до двух чисел в дробной части. Но в первом случае "10.025" - вторым знаком идет 2 - четное число, поэтому, несмотря на то, что следующее число 5, двойка не округляется до тройки.

Во втором случае "10.035" - вторым знаком идет 3 - нечетное число, ближайшим четным числом будет 4, поэтому 35 округляется до 40.

Данное поведение при округлении, возможно, не всем покажется желательным, и в этом случае его можно переопределить, использовав одну из следующих констант:

- `ROUND_HALF_UP`: округляет число в сторону повышения, если после него идет число 5 или выше

- `ROUND_HALF_DOWN`: округляет число в сторону повышения, если после него идет число больше 5

In [23]:
number = Decimal("10.026")
print(number.quantize(Decimal("1.00"), ROUND_HALF_DOWN))       # 10.03
number = Decimal("10.025")
print(number.quantize(Decimal("1.00"), ROUND_HALF_DOWN))       # 10.02

ROUND_05UP: округляет 0 до единицы, если после него идет число 5 и выше

print(number.quantize(Decimal("1.00"), ROUND_05UP))       # 10.01
number = Decimal("10.025")
print(number.quantize(Decimal("1.00"), ROUND_05UP))       # 10.02
ROUND_CEILING: округляет число в большую сторону вне зависимости от того, какое число идет после него

number = Decimal("10.021")
print(number.quantize(Decimal("1.00"), ROUND_CEILING))       # 10.03
     
number = Decimal("10.025")
print(number.quantize(Decimal("1.00"), ROUND_CEILING))       # 10.03

SyntaxError: invalid syntax (1212015768.py, line 6)

ROUND_FLOOR: не округляет число вне зависимости от того, какое число идет после него

In [24]:
number = Decimal("10.021")
print(number.quantize(Decimal("1.00"), ROUND_FLOOR))       # 10.02

number = Decimal("10.025")
print(number.quantize(Decimal("1.00"), ROUND_FLOOR))       # 10.02

NameError: name 'ROUND_FLOOR' is not defined

# Модуль dataclass. Data-классы
Модуль dataclasses предоставляет декоратор dataclass, который позволяет создавать data-классы - подобные позволяют значительно сократить шаблонный код классов. Как правило, такие классы предназначены для хранения некоторого состояния, некоторых данных и когда не требуется какое-то поведение в виде функций.

Рассмотрим простейший пример:

In [25]:
class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age
        
tom = Person("Tom", 38)
print(f"Name: {tom.name}  Age: {tom.age}")      # Name: Tom  Age: 38

Name: Tom  Age: 38


Здесь определен __класс Person__, у которого в функции конструктора определены два атрибута: `name` и `age`. Далее создаем один объект этого класса и выводим значения его атрибутов на консоль.

Теперь изменим эту программу, сделав класс Person data-классом:

In [26]:
from dataclasses import dataclass
 
@dataclass
class Person:
    name: str
    age: int

tom = Person("Tom", 38)
print(f"Name: {tom.name}  Age: {tom.age}")      # Name: Tom  Age: 38

Name: Tom  Age: 38


Для создания data-класса импортируем из модуля dataclasses декоратор dataclass и применяем его к классу Person. И в этом случае в самом классе нам уже не надо указывать конструктор - функцию `__init__`. Мы просто указываем атрибуты. А Python потом сам сгенерирует конструктор, в который также мы можем передать значения для атрибутов объекта.

Таким образом, мы уже сократили определение класса и сделали его более простым. Но генерацией метода `__init__` функциональность декоратора dataclass не ограничивается. В реальности data-класс

In [27]:
@dataclass
class Person:
    name: str
    age: int

будет аналогичен следующему:

In [28]:
class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age
 
    def __repr__(self):
        return f"Person(name={self.name!r}, age={self.age!r}"
     
    def __eq__(self, other):
        if other.__class__ is self.__class__:
            return (self.name, self.age) == (other.name, other.age)
        return NotImplemented

В данном случае мы видим, что кроме функции `__init__`, также определяется функция `__repr__()` для возвращения строкового представления и функция `__eq__()` для сравнения двух объектов. Применение данных функций:

In [29]:
from dataclasses import dataclass
 
@dataclass
class Person:
    name: str
    age: int
 
 
tom = Person("Tom", 38)
bob = Person("Bob", 42)
tomas = Person("Tom", 38) 
print(tom == tomas)     # True
print(tom == bob)       # False
print(tom)              # Person(name="Tom", age=38)

True
False
Person(name='Tom', age=38)


Параметры декоратора __dataclass__

С помощью параметров декоратор dataclass позволяет сгенерировать дополнительный шаблонный код и вообще настроить генерацию кода:

In [30]:
def dataclass(cls=None, /, *, init=True, repr=True, eq=True, order=False,
              unsafe_hash=False, frozen=False, match_args=True,
              kw_only=False, slots=False)

SyntaxError: invalid syntax (1549309686.py, line 3)

Рассмотрим базовые параметры:

- __init__: если равно True, то генерируется функция `__init__()`. По умолчанию равно True

- __repr__: если равно True, то генерируется функция `__repr__()`, которая возвращает строковое представление объекта. По умолчанию равно True

- __eq__: если равно True, то генерируется функция ``__eq__()`, которая сравнивает два объекта. По умолчанию равно True

- __order__: если равно True, то генерируются функции `__lt__` (операция <), `__le__` (<=), `__gt__` (>), `__ge__` (>=), которые применяются для упорядочивания объектов. По умолчанию равно False

- __unsafe_hash__: если равно True, то генерируется функция `__hash__()`, которая возвращает хеш объекта. По умолчанию равно False

Кроме того, те функции, которые создаются по умолчанию, могут быть переопределены.

Применение параметров:

In [31]:
from dataclasses import dataclass
 
@dataclass(unsafe_hash=True, order=True)
class Person:
    name: str
    age: int
    def __repr__(self):
        return f"Person. Name: {self.name}  Age: {self.age}"
 
 
tom = Person("Tom", 38)
print(tom.__hash__())   # -421667297069596717
print(tom)              # Person. Name: Tom  Age: 38

4516051812125656423
Person. Name: Tom  Age: 38


В данном случае включаем генерирование хеша и функций упорядочивания, а также явным образом переопределяем функцию `__repr__` для создания строкового представления объекта.
значения по умолчанию

При необходимости атрибутам можно присвоить значения по умолчанию, если в конструкторе им не передаются значения:

In [32]:
from dataclasses import dataclass
 
@dataclass
class Person:
    name: str
    age: int = 18
 
 
tom = Person("Tom", 38)
print(tom)              # Person(name="Tom", age=38)
 
bob = Person("Bob")
print(bob)              # Person(name="Bob", age=18)

Person(name='Tom', age=38)
Person(name='Bob', age=18)


Добавление дополнительного функционала

Хотя data-классы предназначены прежде всего для хранения различных данных, но также в них можно определять поведение с помощью дополнительных функций:

In [33]:
from dataclasses import dataclass
 
@dataclass
class Person:
    name: str
    age: int
 
    def say_hello(self):
        print(f"{self.name} says hello")
 
 
tom = Person("Tom", 38)
tom.say_hello()     # Tom says hello

Tom says hello
