# <center>  Python for biologists

## Lecture 18, Decorators and FP


---

# Функциональное программирование

**OOP:** *x* $\rightarrow$  `x.f()` & `x.g()` & `x.h()` $\rightarrow$ *result* </br>
Модификация данных методами. Говорят что *"исходные данные изменяемы"*.

**FP:** *x* $\rightarrow f(x) \rightarrow g(f(x)) \rightarrow h(g(f(x))) \rightarrow$ *result* </br>
Передача данных через функции. Говорят что *"исходные данные* ***не*** *изменяемы"*.

## Некоторые базовые определения 

+ **Функции высшего порядка** - это функции, которые принимают в качестве аргумента или возвращают в качестве результата другие функции
+ **Чистая функция** - функция, которая при один и тех же входных параметрах возвращает один и тот же результат, не вызывая побочных эффектов

    ```python
    total = 0 
    
    def add_pure(a, b):
        total = a + b
        return total
        
    def add_impure(a, b)
        global total # результат функции зависит не только от аргументов a и b
        total += a + b # побочный эффект - изменение глобальной переменной
        return total
    ```
    
    За счет своих преимуществ, чистые функции удобно тестировать, параллелизовать, переиспользовать в любой части проекта, кэшировать и просто читать :)
 
## Инструменты функционального программирования

### `map`


`map` - один из ключевых элементов ФП-стороны python. Он как раз занимается тем чтобы применять функции к данным, при чем делает это "экономно" - хранит результат в виде итератора. Существуют также еще `filter` и целая уйма всего в модуле [functools](https://docs.python.org/3/library/functools.html). Например, если интересно, можете обратить внимание на `reduce` и `partial`.

Вот задания которые может быть полезно сделать если вам интерено ФП:

1) Напишите функцию `sequential_map` - функция должна принимать в качестве аргументов любое количество функций (позиционными аргументами, не списком), а также контейнер с какими-то значениями. Функция должна возвращать список результатов последовательного применения переданных функций к значениям в контейнере. Например:

```python
res = sequential_map(np.square, 
                     np.sqrt, 
                     lambda x: x**3, 
                     [1, 2, 3, 4, 5])
print(res)
>>> [1, 8, 27, 64, 125]
```

2) Напишите функцию `consensus_filter` -  функция должна принимать в качестве аргументов любое количество функций (позиционными  аргументами, НЕ списком), возвращающих True или False, а также контейнер с какими-то значениями. Функция должна возвращать список значений, которые при передаче их во все функции дают True. Например:

```python
res = consensus_filter(lambda x: x > 0, 
                       lambda x: x > 5, 
                       lambda x: x < 10, 
                       [-2, 0, 4, 6, 11])
print(res)
>>> [6]
```


3) Напишите функцию `conditional_reduce` -  ункция должна принимать 2 функции, а также контейнер с значениями. Первая функция должна принимать 1 аргумент и возвращать True или False, вторая также принимает 2 аргумента и возвращает значение (как в обычной функции reduce). conditional_reduce должна возвращать одно значение - результат reduce, пропуская значения с которыми первая функция выдала False. Например:

```python
res = conditional_reduce(lambda x: x < 5, 
                         lambda x, y: x + y, 
                         [1, 3, 5, 10])
print(res)
>>> 4
```
    
Однако на практике в 90% случаях биоинформатикам нужен лишь `map` и...



### $\lambda$-функции

Это попросту альтернативный механизм создания функций. Выглядит это так:
```python
lambda x, y: print(x + y)
```

Оно состоит из 3-х частей:
1) Ключевое слово `lambda` - объявляет создание $\lambda$-функции
2) Перечесление ожидаемых аргументов
3) Тело функции

При этом как видете во всем этом деле никак не фигурирует имя функции. В теории $\lambda$-функции можно присвоить имя:
```python
f = lambda x, y: print(x + y)
```

Интересно, что здесь немного стираются границы между функциями и переменными. В python есть просто объекты и ссылки на них (имена). При этом имена вообще не знают о том, являются ли объекты под ними callable или нет.

Именования $\lambda$-функции соотвествует записи:
```python
def f(x, y):
    print(x, y)
```

Однако, **не надо именовать $\lambda$-функции**. $\lambda$-функции еще принято называть "анонимными", подчеркивая что им не принято давать имена.

#### Зачем нужны $\lambda$-функции?

Чтобы быстро и немногословно определить и сразу же использовать функцию именно там где нужно. 

#### Пример $\lambda$-1. Работа с дата-фреймами 

1) Можно лакончино что-нибудь переименовать
2) Можно лаконично что-то сделать с данными

In [8]:
import numpy as np
import pandas as pd

df = pd.DataFrame({'col1_start': [1, 2, 3],
                   'col2_end': [5, 6, 7],
                   'col3_value': [0, 0, 2]
                  })

df

Unnamed: 0,col1_start,col2_end,col3_value
0,1,5,0
1,2,6,0
2,3,7,2


In [9]:
df.rename(lambda x: x.split('_')[1], axis=1) # переименование колонок

Unnamed: 0,start,end,value
0,1,5,0
1,2,6,0
2,3,7,2


In [10]:
df.apply(lambda x: x / x.sum(), axis=0) # нормировка

Unnamed: 0,col1_start,col2_end,col3_value
0,0.166667,0.277778,0.0
1,0.333333,0.333333,0.0
2,0.5,0.388889,1.0


#### Пример $\lambda$-2. Соленый язык без проблем с регистром

In [11]:
import re

def salt(text):
    vowels = r'([ауоиэыяюеёАУОИЭЫЯЮЕЁ])'
    return re.sub(vowels, 
                  lambda x: x.group(0) + 'c' + x.group(0).lower(), 
                  text)

In [12]:
salt('Ура!') # дубликат буквы "У" в нижнем регистре

'Уcураcа!'

#### Пример $\lambda$-3. Идеальная пара: `map` и $\lambda$-функции

In [13]:
my_list = [11, 21, 51, 101]
res = map(lambda x: x//10, my_list)
list(res)

[1, 2, 5, 10]

In [None]:
seqs = ["ATGG", "GCGC", "ATA", "ATGCTACG", "ATACCGACTACGAC", "ACGAGCACGCGAGCGACG"]

def reverse(seq):
    return seq[::-1]

In [None]:
%%time

seqs_reversed = []

for seq in seqs:
    seqs_reversed.append(reverse(seq))

seqs_reversed

CPU times: user 43 µs, sys: 4 µs, total: 47 µs
Wall time: 56.5 µs


['GGTA', 'CGCG', 'ATA', 'GCATCGTA', 'CAGCATCAGCCATA', 'GCAGCGAGCGCACGAGCA']

In [None]:
%%time

[reverse(seq) for seq in seqs]

CPU times: user 14 µs, sys: 1 µs, total: 15 µs
Wall time: 21 µs


['GGTA', 'CGCG', 'ATA', 'GCATCGTA', 'CAGCATCAGCCATA', 'GCAGCGAGCGCACGAGCA']

In [None]:
%%time

list(map(reverse, seqs))

CPU times: user 18 µs, sys: 2 µs, total: 20 µs
Wall time: 24.3 µs


['GGTA', 'CGCG', 'ATA', 'GCATCGTA', 'CAGCATCAGCCATA', 'GCAGCGAGCGCACGAGCA']

In [None]:
%%time

list(map(lambda x: x[::-1], seqs))

CPU times: user 11 µs, sys: 1 µs, total: 12 µs
Wall time: 15.3 µs


['GGTA', 'CGCG', 'ATA', 'GCATCGTA', 'CAGCATCAGCCATA', 'GCAGCGAGCGCACGAGCA']

In [None]:
list(map(str.lower, seqs))

['atgg', 'gcgc', 'ata', 'atgctacg', 'ataccgactacgac', 'acgagcacgcgagcgacg']

In [None]:
list(filter(lambda x: x.startswith("A"), seqs))

['ATGG', 'ATA', 'ATGCTACG', 'ATACCGACTACGAC', 'ACGAGCACGCGAGCGACG']

In [None]:
from functools import reduce

In [None]:
reduce(lambda x, y: x + y, [1, 5, 3])

9

In [None]:
mvs = [["16:45"],
       ["09:25"],
       ["412:5646"]]

In [None]:
list(map(lambda x: list(map(int, x[0].split(":"))), mvs))

[[16, 45], [9, 25], [412, 5646]]

#### Где испольовать $\lambda$-функции, а где обычные?

- Если код функции не влезает в 1 строчку - вам нужна обычная
- Если функция используется более 1 раза - вам нужна обычная
- Если вам нужно дать функции имя - вам нужна обычная

- Если вам нужно применить небольшую функцию к набору данных - вам нужна $\lambda$-функция

- Если вы не уверены, вам нужна обычная функция

In [None]:
def fnc():
    return print

In [None]:
fnc

<function __main__.fnc()>

In [None]:
fnc()

<function print>

In [None]:
my_func = fnc()

my_func(7)

7


In [None]:
my_func = fnc()

my_func(10)

20

### Декораторы

*По простому*:
- Это специальная штука в питоне, которая возволяет как-то модифицировать поведение функции



> **Задача** - замерить время выполнения функции

In [13]:
import random

def small_work():
    for _ in range(10**4):
        random.uniform(0, 1000) ** random.uniform(0, 5)
        
def big_work():
    for _ in range(10**6):
        random.uniform(0, 1000) ** random.uniform(0, 5)

Мы хотим замерить время выполнения этих функций

Для справки `time.time()` возвращает [UNIX время](https://en.wikipedia.org/wiki/Unix_time) в секундах, само по себе это значение бесполезно, но мы можем использовать разность двух значений для измерения длительности чего-то. Вообще, для измерения времени работы чего-либо, стоит использовать `time.perf_counter()`, но мне кажется, что `time.time()` проще запомнить

In [14]:
import time


start = time.time()
small_work()
end = time.time()
print(f"Function small_work has finished in {end - start} second")


start = time.time()
big_work()
end = time.time()
print(f"Function big_work has finished in {end - start} second")

Function small_work has finished in 0.0025815963745117188 second
Function big_work has finished in 0.2594475746154785 second


In [15]:
for function in [small_work, big_work]:
    start = time.time()
    function()
    end = time.time()
    print(f"Function {function.__name__} has finished in {end - start} second")

Function small_work has finished in 0.0026433467864990234 second
Function big_work has finished in 0.25968265533447266 second


Уже лучше, мы сделали цикл по функциям, но этот способ будет очень неудобен, если наши функции будут принимать какие-то аргументы. В таком случае нам пришлось бы как-то отдельно хранить аргументы для функций, отдельно итерироватся по ним и т.д., короче сложно

#### Базовый синтаксис декораторов

Мы с вами уже знаем, что в питоне любая **функция** это **объект**. Функции можно записывать в переменные и передавать в другие функции. Такие функции (в которые мы передаём другие функции) называются **фукциями высшего порядка**. Пример - `map` (принимает функцию и коллекцию элементов).

Давайте напишем вот такую функцию:

In [20]:
def measure_time(func):
    def inner_function():
        start = time.time()
        func()
        end = time.time()
        print(f"Function {func.__name__} has finished in {end - start} seconds")
    return inner_function

In [21]:
small_work = measure_time(small_work)
big_work = measure_time(big_work)

In [22]:
small_work()
big_work()

Function small_work has finished in 0.002505064010620117 seconds
Function big_work has finished in 0.2819654941558838 seconds


Давайте разберём, что здесь произошло. Мы создали функцию `measure_time`, которая принимает на вход любую другую функцию, мы будем передавать в неё наши фунции `xxxx_work`, Внутри `measure_time` мы через `def` объявляем новую функцию `inner_function`, которую затем возвращаем. Обратите внимание, что внутри `measure_time` мы **НЕ вызываем** `inner_function`, а просто **возвращаем её как объект**. После возвращения из `measure_time` функция `inner_function` запишется в переменную `small_work` вот в этой строке
```python
small_work = measure_time(small_work)
```
Пока мы не разбирали, что происходит в `inner_function`, нам было важно лишь то, что её объявили внутри функции `measure_time` и вернули из неё.

Но всё-таки интересно, что там произошло. Ведь этой самой функцией мы по сути подменяем наши оригинальные (как в примере выше). Давайте разбираться

Внутри `inner_function` происходит знакомый нам расчёт времени выполнения функции `func`, которая изначально была передана в `measure_time`. По сути сам вызов функции не изменятся, он только "оборачивается" в дополнительный функционал вычисления времени выполнения (или иначе говоря, **"декорируется"**) и запаковывается в новую функцию `inner_function`, которая возвращается нам.

Функция `measure_time` является **декоратором**, а `func` **декорируемой** функцией. Проще говоря, декораторы просто "оборачивают" наши функции в дополнительный функционал, без изменений их кода и логики работы. Т.е. `func` отрабатывает без каких-либо изменений, но добавляется дополнительный код до и после её вызова.

На картинке обозначены основные элементы декоратора

![image.png](attachment:f64d5023-32a3-491c-8c1d-25e3e8119974.png)

Пример выше демонстрирует основной синтаксис декораторов в питоне и да, это выглядит страшно :)

#### Декорируем функции, принимающие аргументы

Мы можем сделать ещё одно улучшение и добавить возможность принимать функции с любыми аргументами, а также возвращать значение, так как в примере выше мы имеем самый простой вариант - ничего не возвращающую функцию без аргументов

In [23]:
def measure_time(func):
    def inner_function(*args, **kwargs):
        start = time.time()
        result = func(*args, **kwargs)
        end = time.time()
        print(f"Function {func.__name__} has finished in {end - start} second")
        return result
    return inner_function

Теперь функция возвращаемая из декоратора (`inner_function`) будет принимать любое количество позиционных и именованных аргументов, которые затем будут просто "пробрасываться" в внутренний вызов `func`

Результат выполнения нашей декорируемой функции мы сохранили в переменную `result` и возвращаем её в самом конце. Мы не можем сразу написать `return func(*args, **kwargs)`, так как у нас есть действия, которые мы ходим выполнить **после** вызова декорируемой функции. Сохранить результат её выполнения в переменную и вернуть в самом конце - стандартная практика

Убедимся, что всё работает на примерах

In [24]:
def add(a, b):
    return a + b

def square_list(lst):
    return [i**2 for i in lst]

def invert_dictionary(dct):
    return dict(zip(dct.values(), dct.keys()))

def repeat_string(string, n_repeats=2):
    return string * n_repeats

In [25]:
add = measure_time(add)
square_list = measure_time(square_list)
invert_dictionary = measure_time(invert_dictionary)
repeat_string = measure_time(repeat_string)


print(add(10012401204, 3893475983475), end="\n\n")
print(square_list(list(range(25))), end="\n\n")
print(invert_dictionary({"a": 1, "b": 2, "c": 3, "d": 4}), end="\n\n")
print(repeat_string("ABCDEFG*", n_repeats=10))

Function add has finished in 7.152557373046875e-07 second
3903488384679

Function square_list has finished in 2.384185791015625e-06 second
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100, 121, 144, 169, 196, 225, 256, 289, 324, 361, 400, 441, 484, 529, 576]

Function invert_dictionary has finished in 3.123283386230469e-05 second
{1: 'a', 2: 'b', 3: 'c', 4: 'd'}

Function repeat_string has finished in 9.5367431640625e-07 second
ABCDEFG*ABCDEFG*ABCDEFG*ABCDEFG*ABCDEFG*ABCDEFG*ABCDEFG*ABCDEFG*ABCDEFG*ABCDEFG*


#### Делаем запись более удобной

Всё работает! Функции выполняют свои обычные операции и при этом пишут сообщения о времени выполнения. Заметим только, что нам всё равно приходится вручную декорировать наши функции вот такой неудобной записью, передавая каждую как аргумент декоратору
```python
add = measure_time(add)
square_list = measure_time(square_list)
invert_dictionary = measure_time(invert_dictionary)
repeat_string = measure_time(repeat_string)
```
Это исправимо, в питоне для этого есть специальный очень удобный синтаксис. При объявлении функций мы как бы помечаем их следующим образом

In [26]:
@measure_time
def add(a, b):
    return a + b

@measure_time
def square_list(lst):
    return [i**2 for i in lst]

@measure_time
def invert_dictionary(dct):
    return dict(zip(dct.values(), dct.keys()))

@measure_time
def repeat_string(string, n_repeats=2):
    return string * n_repeats


print(add(10012401204, 3893475983475), end="\n\n")
print(square_list(list(range(25))), end="\n\n")
print(invert_dictionary({"a": 1, "b": 2, "c": 3, "d": 4}), end="\n\n")
print(repeat_string("ABCDEFG*", n_repeats=10))

Function add has finished in 9.5367431640625e-07 second
3903488384679

Function square_list has finished in 1.6689300537109375e-06 second
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100, 121, 144, 169, 196, 225, 256, 289, 324, 361, 400, 441, 484, 529, 576]

Function invert_dictionary has finished in 3.814697265625e-06 second
{1: 'a', 2: 'b', 3: 'c', 4: 'd'}

Function repeat_string has finished in 1.1920928955078125e-06 second
ABCDEFG*ABCDEFG*ABCDEFG*ABCDEFG*ABCDEFG*ABCDEFG*ABCDEFG*ABCDEFG*ABCDEFG*ABCDEFG*


Всё работает точно также, но синтаксис стал намного красивее. Теперь мы можем "повесить" `@measure_time` на любую функцию в нашей программе и она будет способна измерять время своего исполнения.

Как вы уже поняли записи
```python
@measure_time
def add(a, b):
    ...
```
и
```python
add = measure_time(add)
```
абсолютно равнозначны


#### Декораторы с параметрами

А что если мы захотим как-то управлять поведением декоратора, например, передавать ему какие-то параметры? Для демонстрации мы попытаемся написать декоратор, который заставит функцию выполняться, пока та не отработает без ошибок, причём мы сможем задать количество попыток запустить функцию

Но для начала напишем такую функцию

In [27]:
def problematic_function(probability_of_error):
    if random.random() < probability_of_error:
        raise RuntimeError
    else:
        return "Success"

Функция принимает один аргумент - вероятность ошибки и кидает ошибку с данной вероятностью. Наша задача написать декоратор, который заставит её выполняться определённое число попыток или же до успешного исполнения.

Без декоратора это выглядело бы примерно так

In [29]:
n_tries = 5
for _ in range(n_tries):
    try:
        print(problematic_function(0.9))
        break
    except RuntimeError:
        continue
else:   # Если мы не вышли из цикла досрочно (через break), то кидаем ошибку, так как это значит, что все попытки провалились
    raise RuntimeError

RuntimeError: 

Давайте напишем декоратор, который будет принимать число попыток (`n_tries`) в качестве аргумента, но ещё добавим возможность исполнения до успеха.

Попробуйте осознать этот код

In [30]:
def try_n_times(func, n_tries=None):
    def inner_func(*args, **kwargs):
        try_num = 0
        while try_num != n_tries:  # Если n_tries это None, то у нас будет вечный цикл пока функция успешно не выполнится
            try:
                return func(*args, **kwargs)
            except RuntimeError:
                try_num += 1
                continue
        else:
            raise RuntimeError
    return inner_func

In [31]:
@try_n_times(n_tries=5)
def problematic_function(probability_of_error):
    if random.random() < probability_of_error:
        raise RuntimeError
    else:
        return "Success"

TypeError: try_n_times() missing 1 required positional argument: 'func'

Не работает, давайте теперь попробуем стандартный синтаксис декорирования

In [35]:
problematic_function = try_n_times(problematic_function, n_tries=5)

In [36]:
problematic_function(0.9)

'Success'

На этот раз всё работает. Дело в том, что синтаксис `@` ожидает, что декоратор будет принимать всего один аргумент - **декорируемую функцию**, поэтому мы не можем передать никакие параметры. Однако, мы очень часто видим, что декораторы в различных библиотеках могут принимать параметры, вот пример из фреймворка *Flask*

![image.png](attachment:9ffdd51e-2b64-44bc-880c-389d1615bf7d.png)

Как же это работает? Давайте разберём, здесь всё будет довольно запутанно...

In [44]:
def try_n_times(n_tries=None):
    def decorator(func):
        def inner_func(*args, **kwargs):
            try_num = 0
            while try_num != n_tries:
                try:
                    return func(*args, **kwargs)
                except RuntimeError:
                    try_num += 1
                    continue
            else:
                raise RuntimeError
        return inner_func
    return decorator

In [45]:
@try_n_times(n_tries=5)
def problematic_function(probability_of_error):
    if random.random() < probability_of_error:
        raise RuntimeError
    else:
        return "Success"

In [46]:
problematic_function(0.9)

'Success'

В этот раз всё работает, разберём код

По сути здесь не произошло принципиальных изменений, мы лишь обернули наш декоратор ещё в одну функцию, но зачем?

Во-первых, стоит заметить, что то, что было декоратором в предыдущем примере (функция `decorator`) теперь принимает всего один аргумент - **декорируемую функцию**, т.е. мы удовлетворили данному условию использования `@`.

Во-вторых, у нас появилась новая функция - `try_n_times`. Обратите внимание на то, что она не является декоратором, так как не принимает на вход другую функцию, она принимает только параметр `n_tries`. Но зачем же она нужна? Последняя строка этой функции говорит сама за себя, она **возвращает декоратор**. Причём этот декоратор имеет заданные свойства, так как сохраняет в себе данные о количестве попыток, которые нужно произвести (`n_tries`)

Так что же на самом деле произошло здесь?
```python
@try_n_times(n_tries=5)
def problematic_function(probability_of_error):
```
Мы уже знаем, что `try_n_times` не является декоратором, но она **возвращает декоратор**, который будет пытаться выполнить функцию 5 раз. Т.е. запись выше в процессе выполнения раскрывается в нечто подобное
```python
decorator = try_n_times(n_tries=5)
@decorator
def problematic_function(probability_of_error):
```

То есть `try_n_times` это такой завод по производству декораторов, так можно создавать самые разные декораторы просто указывая различные аргументы

In [47]:
infinite_decorator = try_n_times(n_tries=None)
single_attempt_decorator = try_n_times(n_tries=1)
six_attempts_decorator = try_n_times(n_tries=6)

#### Замыкания

Вы уже заметили, что при использовании декораторов мы постоянно используем переменные из более внешних областей видимости во вложенных функциях. Например, параметр `n_tries` в примере выше. Декорируемая функция тоже не является исключением, так как мы используем её в более вложенных. Но это работает не только с декораторами. Рассмотрим вот такой пример...


In [48]:
a = 5

def wrapper(a):
    def func():
        return a
    return func
    
func = wrapper(a)

Мы вызываем функцию `wrapper` с одним аргументом, которая отдаёт нам функцию `func`, "запомнившую" этот аргумент и возвращающую его. Убедимся, что это работает.

In [49]:
func()

5

Здесь также важно заметить, что `func` "запоминает" НЕ переменную `a` из глобальной области видимости, а переменную `a` из локального окружения функции `wrapper`. Убедимся в этом, удалив глобальную переменную `a`

In [50]:
del a
func()

5

Функция по прежнему работает, хотя переменная была удалена, значит, что она её "запомнила". Ещё раз убедимся в этом, явно указав функции `func`, что нужно использовать глобальную переменную. После удаления переменной и вызова функции мы получим ошибку

In [51]:
a = 5

def wrapper(a):
    def func():
        global a
        return a
    return func
    
func = wrapper(a)
del a
func()

NameError: name 'a' is not defined

Такой механиханизм "запоминания" называется **замыканием (closure)**.

В питоне есть сборщик мусора, которые удаляет все объекты на которые не осталось ссылок. Команда `del` как раз таки удаляет эти ссылки (не объекты). Получается, что в замыкании создаются новые ссылки, так как функция спокойно работает после удаления внешней переменной. А если есть новые ссылки, получается, что эти данные можно как-то достать

In [52]:
a = 5
b = [1, 2, 3]
c = {1: 2, "a": "b"}

def wrapper(a, b, c):
    def func():
        return a, b, c
    return func
    
func = wrapper(a, b, c)

Ради интереса мы положили в замыкание чуть больше разных объектов. До списка этих объектов можно достучаться через атрибут `__closure__` у функции, но я не знаю где вам это может пригодиться :)

In [53]:
for element_idx in range(3):
    print(func.__closure__[element_idx].cell_contents)

5
[1, 2, 3]
{1: 2, 'a': 'b'}


#### Полезные декораторы

В этом разделе мы поговорим о библиотечных и встроенных декораторах, которые довольно полезны и рекомендуются к применению. Для удобства полный список с ссылками приведён ниже:

+ [classmethod и staticmethod](https://webdevblog.ru/obyasnenie-classmethod-i-staticmethod-v-python/) - используются постоянно, если вы работаете с ООП - знать и использовать нужно обязательно (встроенные в питон, импортировать не нужно)
+ [functools.lru_cache](https://docs-python.ru/standart-library/modul-functools-python/dekorator-lru-cache-modulja-functools/)
+ [dataclass](https://habr.com/ru/post/415829/)
+ [property](https://www.programiz.com/python-programming/property) - также часто появляется в объектно-ориентированном коде (встроен в питон)
+ [wraps](https://stackoverflow.com/questions/308999/what-does-functools-wraps-do)

##### *classmethod*

Декоратор `classmethod` необходим для того, чтобы сделать метод классовым

Допустим, что у нас есть класс, представляющий структуру данных похожую на словарь и мы хотим уметь создавать её разными способами. Для этого у нас есть отдельные методы, возвращающие экземпляр этого же класса. Создание экщемпляров класса через методы это очень часто используемая практика.

In [54]:
class MyCustomMap:
    def __init__(self, dct=None):
        self.__map = dct
        
    def from_dict(self, dct):
        return MyCustomMap(dct)
    
    def from_lists(self, list1, list2):
        return MyCustomMap(dict(zip(list1, list2)))
    
    def from_strings(self, str1, str2):
        return type(self)(dict(zip(str1, str2)))
    
    def __repr__(self):
        return f"My custom map {self.__map}"

Очевидно, что данные методы используются только для создания объектов. Они никак не взаимодействуют с данными, хранящимися в атрибутах экземпляров класса (в коде этих методов мы не видим никакого использования `self`), а значит им вовсе необязательно быть связанными с экземплярами. К тому же вызывать их мы сможем только от экземпляров, что не очень удобно.

In [56]:
MyCustomMap.from_strings("ABCD", "EFGH")   # Пытаемся вызывать метод from_strings от класса. Ничего не получается, так как метод ожидает объект данного класса (self) в качестве первого аргумента

TypeError: MyCustomMap.from_strings() missing 1 required positional argument: 'str2'

In [57]:
MyCustomMap().from_strings("ABCD", "EFGH")   # Получилось, но мы бы не хотели создавать экземпляр MyCustomMap()

My custom map {'A': 'E', 'B': 'F', 'C': 'G', 'D': 'H'}

Мы хотим, чтобы было как в пандасе с созданием датафрейма, примеры ниже

In [58]:
import pandas as pd


pd.DataFrame.from_dict({"Column1": [1, 2]})

Pyarrow will become a required dependency of pandas in the next major release of pandas (pandas 3.0),
(to allow more performant data types, such as the Arrow string type, and better interoperability with other libraries)
but was not found to be installed on your system.
If this would cause problems for you,
please provide us feedback at https://github.com/pandas-dev/pandas/issues/54466
        
  import pandas as pd


Unnamed: 0,Column1
0,1
1,2


In [59]:
pd.DataFrame.from_records([("A", "1"), ("B", 2)])

Unnamed: 0,0,1
0,A,1
1,B,2


Здесь методы `from_dict` и `from_records` являются **методами класса** `DataFrame` и для их вызова не обязательно иметь объект класса DataFrame. Сделаем также с нашими методами.

In [60]:
class MyCustomMap:
    def __init__(self, dct=None):
        self.__map = dct
    
    @classmethod
    def from_dict(cls, dct):
        return cls(dct)
    
    @classmethod
    def from_lists(cls, list1, list2):
        return cls(dict(zip(list1, list2)))

    @classmethod
    def from_strings(cls, str1, str2):
        return cls(dict(zip(str1, str2)))
    
    def __repr__(self):
        return f"My custom map {self.__map}"
    

def from_dict(dct):
    return dct

In [61]:
MyCustomMap.from_strings("ABCD", "EFGH")

My custom map {'A': 'E', 'B': 'F', 'C': 'G', 'D': 'H'}

Всё отлично работает, мы всего лишь указали декоратор `classmethod` для методов, которые мы хотели сделать классовыми.

❗Обратите внимание, что методы класса ведут себя немного по другому. Первым аргументом к ним попадает **не экземпляр** данного класса, а **сам класс**, поэтому первый аргумент у методов класса принято называть `cls` вместо `self` (cls - сокращение от **cl**as**s**). Используя эту особенность, мы также смогли избавиться от явного указания класса, экземпляр которого мы хотим создать. В нашей ситуации `cls` во всех методах это `MyCustomMap`.

При этом всём классовый метод можно вызвать и от экземпляра, ничего не поломается.

In [62]:
MyCustomMap().from_strings("ABCD", "EFGH")

My custom map {'A': 'E', 'B': 'F', 'C': 'G', 'D': 'H'}

##### *staticmethod*

Сделаем класс, собирающий информацию о загрузке и температуре процессора в течение времени, детально в коде можно не разбираться.

In [63]:
import psutil
from datetime import datetime


class CPUMonitor:
    def __init__(self):
        self._times = []
        self._loads = []
        self._temps = []
        
    def record(self, seconds):
        start_time = datetime.now()
        print("Recording started...")
        while True:
            self._times.append(datetime.now())
            cpu_load = self.get_cpu_load()
            self._loads.append(cpu_load)
            cpu_temp = self.get_cpu_temperature()
            self._temps.append(cpu_temp)
            print(f"\rRecording in progress... Current CPU load: {cpu_load}%, Current CPU temperature: {cpu_temp}", end="")
            if (self._times[-1] - start_time).total_seconds() > seconds:
                print("\nRecording stopped")
                break
                
    def reset(self):
        self._times = []
        self._loads = []
        self._temps = []
        
    def get_cpu_temperature(self):
        tdie = psutil.sensors_temperatures()["k10temp"][1].current
        return tdie
    
    def get_cpu_load(self):
        load_percent = psutil.cpu_percent()
        return load_percent

In [None]:
monitor = CPUMonitor()
monitor.record(5)

Но нас интересует не столько сам класс, сколько методы `get_cpu_temperature` и `get_cpu_load`, что же в них необычного?

Давайте посмотрим на них внимательно. Оба метода в данный момент связаны с экземпляром класса, но никак это не используют (`self` в их коде не упоминается). Логично тогда предположить, что из этих методов можно сделать методы класса при помощи декоратора о котором мы говорили раньше. В таком случае методы будут связаны с классом. Однако в таком случае они опять никак не будут использовать эту связь.

Получается так, что эти методы вообще могут не иметь никакой связи с классом и его экземплярами и, видимо, просто стоило сделать из них отдельные функции... Или всё таки нет...?

Дело в том, что эти методы действительно не связаны с экземплярами класса какими-то общими данными, однако **по смыслу** функционал методов прекрасно интегрируется в класс. Т.е. нахождение методов для получения параметров процессора в классе для мониторинга этих параметров это очень уместное решение. Если бы эти методы на самом деле были отдельными функциями, то нам не удалось бы красиво инкапсулировать всё в один класс. Они связаны с классом **по смыслу**, поэтому их всё же стоит оставить в классе

Специально для таких методов в питоне есть декоратор `staticmethod`, он позволяет превращать методы в **статические**

In [66]:
class CPUMonitor:
    def __init__(self):
        self._times = []
        self._loads = []
        self._temps = []
        
    def record(self, seconds):
        start_time = datetime.now()
        print("Recording started...")
        while True:
            self._times.append(datetime.now())
            cpu_load = self.get_cpu_load()
            self._loads.append(cpu_load)
            cpu_temp = self.get_cpu_temperature()
            self._temps.append(cpu_temp)
            print(f"\rRecording in progress... Current CPU load: {cpu_load}, Current CPU temperature: {cpu_temp}", end="")
            if (self._times[-1] - start_time).total_seconds() > seconds:
                print("\nRecording stopped")
                break
                
    def reset(self):
        self._times = []
        self._loads = []
        self._temps = []
    
    @staticmethod
    def get_cpu_temperature(format_=False):   # Мы убрали self, так как связи с объектом нет и он больше не нужен и добавили новый аргумент
        tdie = psutil.sensors_temperatures()["k10temp"][1].current
        if format_:
            tdie = str(tdie) + "°C"
        return tdie
    
    @staticmethod
    def get_cpu_load(format_=False):   # Мы убрали self, так как связи с объектом нет и он больше не нужен и добавили новый аргумент
        load_percent = psutil.cpu_percent()
        if format_:
            load_percent = str(load_percent) + "%"
        return load_percent

In [None]:
monitor = CPUMonitor()
monitor.record(5)

Статические методы работают как самые обычные функции, но привязанные к классам. Мы можем обращаться к ним через точку от класса или экземпляра класса, но никак не можем получить изнутри метода данные об экземпляре или классе.

❗Статические методы **не принимают** экземпляр или класс первым аргументом, они работают как обычные функции. Их можно вызывать от экземпляров и классов одинаково, передавая аргументы "как есть". Возможные варианты приведены ниже

In [67]:
print(CPUMonitor.get_cpu_load())  # Вызов метода от класса без аргументов (метод теперь не принимает self или cls)
print(CPUMonitor().get_cpu_load())  # Вызов метода от экземпляра без аргументов (метод теперь не принимает self или cls)

0.0
0.0


##### *functools.lru_cache*

Возьмём самый избитый пример - расчёт чисел Фиббоначи через рекурсию

In [68]:
def fibonacсi(n):
    return (fibonacсi(n - 1) + fibonacсi(n - 2)) if n > 2 else 1

In [69]:
%%time
fibonacсi(38)

CPU times: user 2.35 s, sys: 0 ns, total: 2.35 s
Wall time: 2.35 s


39088169

Все вы прекрасно знаете, что этот код работает долго и что в процессе выполнения образуется целое дерево рекурсивных вызовов, вычисляющих одно и то же.

На ум приходит одно решение - кэшировать результаты. В таком случае функция сначала проверит, есть ли в кэше данные о результате выполнения с текущими аргументами. Если такие данные есть то они возвращаются без исполнения функции.

Подобное кэширование в питоне осуществляет декоратор `lru_cache` из модуля `functools`.

In [94]:
from functools import lru_cache


@lru_cache
def fibonacсi(n):
    return fibonacсi(n - 1) + fibonacсi(n - 2) if n > 2 else 1

In [95]:
%%time
fibonacсi(38)

CPU times: user 13 µs, sys: 3 µs, total: 16 µs
Wall time: 17.2 µs


39088169

Время выполнения функции уменьшилось в $10^5$ раз за счёт кэширования результатов!

`lru_cache` так же позволяет ограничить размера кэша. В таком случае туда динамически будут загружаться самые часто используемые значения. Это может быть полезным, если есть необходимость экономить память

In [96]:
@lru_cache(maxsize=128)
def fibonacсi(n):
    return fibonacсi(n - 1) + fibonacсi(n - 2) if n > 2 else 1

In [98]:
%%time
fibonacсi(400)

CPU times: user 176 µs, sys: 41 µs, total: 217 µs
Wall time: 221 µs


176023680645013966468226945392411250770384383304492191886725992896575345044216019675

`lru_cache` мы можем использовать вообще для любых функций! Однако, если в функциях присутствует хоть какой-то элемент случайности, влияющий на возвращаемое значение, то использование этого декоратора будет неэффективным

##### *dataclass*

Очень часто получается так, что нам нужно создавать некоторые структуры данных при помощи классов. При это они не имеют никаких методов и нужны исключительно для хранения данных. Например

In [101]:
from datetime import date


class Book:
    def __init__(self, title, author, publication_year, num_pages, publisher, language, edition):
        self.title = title
        self.author = author
        self.publication_year = publication_year
        self.num_pages = num_pages
        self.publisher = publisher
        self.language = language
        self.edition = edition
        
        
book = Book(title="The Great Gatsby", author="F. Scott Fitzgerald", publication_year=1925, num_pages=180,
            publisher="Charles Scribner's Sons", language="English", edition=1)

Запись класса выглядит очень громоздко, в ней много лишних элементов, к тому же у объектов нет удобного встроенного отображения (метод `__repr__`)

In [103]:
book

<__main__.Book at 0x7ffb17c013a0>

Для упрощения создания подобных классов нам приходит на помощь декоратор `dataclass`. И да, декорировать можно не только функции, а любые *Callable* объекты, в том числе классы. Синтаксис создания классов при этом немного преображается

In [104]:
from datetime import date
from dataclasses import dataclass


@dataclass
class Book:
    title: str
    author: str
    publication_year: int
    num_pages: int
    publisher: str
    language: str
    edition: int
    
book = Book(title="The Great Gatsby", author="F. Scott Fitzgerald", publication_year=1925, num_pages=180,
            publisher="Charles Scribner's Sons", language="English", edition=1)
book

Book(title='The Great Gatsby', author='F. Scott Fitzgerald', publication_year=1925, num_pages=180, publisher="Charles Scribner's Sons", language='English', edition=1)

Мы видим, что синтаксис стал намного проще. Теперь не нужно создавать конструктор с избыточным количеством имён, к тому же у объекта сразу появляется удобное отображение, благодаря неявному добавлению метода `__repr__` в ходе декорирования.

Если вам нужны классы только для хранения каких-то структур данных &mdash; датаклассы ваш выбор!

❗Обратите внимание, что *аннотации типов* (вот этот синтаксис `<attribute>: <type>`) в датаклассах обязательны ❗

Вы по прежнему можете передать туда любые значения, но обязаны указать их предполагаемый тип при создании класса

В датаклассы можно добавлять методы, но так, как правило, не делают

In [105]:
@dataclass
class Book:
    title: str
    author: str
    publication_year: int
    num_pages: int
    publisher: str
    language: str
    edition: int
    
    def num_words(self, words_per_page=250):
        return self.num_pages * words_per_page

In [106]:
book = Book(title="The Great Gatsby", author="F. Scott Fitzgerald", publication_year=1925, num_pages=180,
            publisher="Charles Scribner's Sons", language="English", edition=1)
book.num_words()

45000

# Итог

Декораторы это полезная штука, писать их приходится не часто, но иногда они могут сильно выручить. Встроенные декораторы `classmethod` и `staticmethod` обязательно надо использовать в своих классах, про остальные достаточно просто знать и использовать при необходимости.