# Аннотации типов

## Статически и динамически типизируемые языки программирования

Python является **динамически типизируемым языком**, это значит, что за конкретной переменной (именем) не закреплён один конкретный тип данных, это позволяет нам перезаписывать значения в переменных произвольными данными

In [2]:
variable = [1, 2, 3, 4]
print(type(variable))

variable = (1, 2, 3, 4)    # Тип переменной изменился, ошибки нет
print(type(variable))

<class 'list'>
<class 'tuple'>


Пример выше не сработал бы в языках со статической типизацией, где переменная и её тип неразрывно связаны. И хотя такая связь местами бывает не очень удобна, типизированные переменные позволяют писать более **читаемый и предсказуемый** код.

Ниже приведён пример функции из статически типизируемого языка C

```c
#include <stdio.h>

int add(int a, int b) {   // Функция принимает int и int и возвращает int
    return a + b;
}

int main() {
    int num1 = 5;   // Создаём переменную num1 типа int
    int num2 = 7;   // Создаём переменную num2 типа int

    int sum = add(num1, num2);   // Создаём переменную sum типа int
    printf("The sum of %d and %d is: %d\n", num1, num2, sum);

    return 0;
}

```

Каждой переменной здесь назначен свой тип данных, в данном случае `int` и мы не можем изменить его в процессе выполнения программы. Так, следующая строка выдала бы ошибку, поскольку переменная `num1` связана с типом `int` и мы никак не можем сделать из этой переменной стркоу.

```c
num1 = "string";
```

## Типизация в Python

Python, как уже упоминалось ранее, это динамически типизируемый язык, а значит мы **не обязаны явно прописывать тип** для каждой переменной. Однако такая возможность могла бы быть очень полезной, так как код станет более понятным и предсказуемым.

К счатью, Python умеет так делать, это реализуется при помощи **аннотаций типов**

### Аннотации типов

#### Синтаксис

Синтаксис аннотаций типов очень простой. После имени переменной при её создании через двоеточие нужно указать её тип

```python
<variable_name>: <type> = <value>

string: str = "Hello world"
```

Можно также указывать **типы аргументов и возвращаемых значений** для функций через стрелочку `->` после аргументов функции

```python
def concatenate_lists(l1: list, l2: list) -> list:
    return l1 + l2
```

Если аннотированный аргумент имеет значение по-умолчанию, то синтаксис будет выглядеть вот так

```python
def add_floats(a: float = 0, b: float = 0) -> float:
    return a + b
```

**Обратите внимание на пробелы** в примерах выше. Это единственный правильный вариант, а **так как приведено ниже писать не стоит**

```python
string:str = "Hello world"
number: int=2

def concatenate_lists(l1:list, l2:list)->list:
    return l1 + l2 

def add_floats(a: float=0, b: float=0) -> float:
    return a + b
```

Вы уже немного писали простые аннотации, когда делали свои датаклассы

#### Логика аннотаций типов

**Самый важный момент**, который на этом этапе нужно усвоить &mdash; **аннотации типов в Python никак не влияют на выполнение программы, они созданы только для удобства чтения кода и документации**.

То есть, если мы попробуем записать в переменную тип данных, который противоречит типу в аннотации, то **ничего не произойдёт**

In [10]:
var: float = 2.3

var = [1, 2, 3]

print(var)     # Ошибки нет

[1, 2, 3]


In [12]:
def concatenate_lists(l1: list, l2: list) -> list:
    return l1 + l2


tuple1: tuple = (1, 2, 3)
tuple2: tuple = (4, 5, 6)

concatenate_lists(tuple1, tuple2)    # Ошибки нет

(1, 2, 3, 4, 5, 6)

Таким образом, аннотации типов носят **исключительно рекомендательный характер**, вы всё также сможете передавать любые типы в любое место (поэтому это и называется **аннотацией**).

Они используются для того, чтобы быстро и удобно сообщить пользователю, читающему код, что ожидать от тех или иных функций или переменных, а также используются IDE для генерации подсказок

#### Когда стоит использовать аннотации типов?

**По-возможности &mdash; всегда**, писать аннотации типов это крайне хорошая привычка, которая сильно улучшит качество вашего кода. Но, в конце-концов все мы люди и нам лень писать "бесполезные буковки", которые не влияют на выполнение программы, точно также как нам лень писать README для репозитория. Поэтому вас никто не будет сильно осуждать, если вы не будете этого делать, но это крайне хорошая практика.

Тем не менее, аннотации типов очень редко используются для "обычных переменных", чаще всего аннотируют (в порядке частоты встречаемости):
1. Аргументы функций
2. Возвращаемые значения функций
3. Поля в датаклассах
4. Классовые атрибуты в обычных классах
5. Атрибуты экземпляров классов (редко)

"Обычные переменные", как правило, не аннотируют

### Модуль `typing`

Встроенные возможности типизации в Python довольно скромные, но существует модуль `typing` (входит в стандартную библиотеку языка), который сильно расширяет наши возможности по использованию аннотаций типов

In [16]:
from typing import *      # Мы импортируем всё только для примера, так как в модуле очень много нужных нам переменных
                          # В реальных проектах стоит делать from typing import var1, var2, ...

Главная фишка `typing` это возможность описывать сложные типы данных и создавать новые

Для описания сложных типов данных в `typing` используются квадратные скобки. Например, `List[str]` - список из строк

#### Тип `Any`

Данный тип обозначает **любой тип**

In [18]:
import random


def return_random() -> Any:   # Функция возвращает значение любого типа
    return random.choice([1, 1.0, "1", [1], (1,), set([1])])

#### Тип `Any`

Данный тип обозначает **любой тип**

In [18]:
import random


def return_random() -> Any:   # Функция возвращает значение любого типа
    return random.choice([1, 1.0, "1", [1], (1,), set([1])])

В аннотациях можно использовать как встроенные типы данных, так и типы из модуля `typing`, но отличия состоят в том, что в `typing` находятся ненастоящие типы, при помощи них нельзя создавать экземпляры объектов

In [19]:
Any()

TypeError: Cannot instantiate typing.Any

Большинство интересующих нас типов являются составными, рассмотрим их

#### Типы `List`, `Dict`, `Set`, `Tuple`

Данные типы данных отвечают за встроенные в питон контейнерные типы данных

Типу `List` можно указать один параметр. Он показывает, из каких элементов состоит список. Тип `Set` работает полностью аналогично

In [22]:
var: List[str] = ["a", "b"]    # Список из строк
var: List[list] = [["a"], [1]]     # Список из любых списков
var: List[List] = [["a"], [1]]    # Тоже список из списков
var: List = [1, 2.0, "abc", []]         # Список из чего угодно, эквивалентно List[Any]

Типу `Dict` можно указать два параметра: типы ключей и значений

In [24]:
var: Dict[str, float] = {"a": 1, "b": 2}     # Словарь, где ключи имеют тип str, а значения тип float
var: Dict[int, Dict[str, float]] = {40: {"a": 1, "b": 2}}    # Словарь, где ключи имеют тип int, а значения тип "cловарь, где ключи имеют тип str, а значения тип float"
var: Dict[str, Any] = {"a": set(), "b": []}    # Словарь, где ключи имеют тип str, а значения любой тип
var: Dict = {1: 1, "b": 2}         # Любой словарь

Типу `Tuple` можно указать произвольное число параметров, свой тип для каждого элемента

In [25]:
var: Tuple[int, str, float]     # Кортеж из 3 элементов: первый - int, второй - str, третий - float
var: Tuple[Any, int]   # Кортеж из двух элементов, где первый элемент любой, а второй имеет тип int
var: Tuple    # Любой кортеж

❗❗Начиная с версии питона **3.9**, синтаксис составления сложных типов через квадратные скобки доступен **для встроенных типов** и является предпочтительным именно в таком варианте. Это значит, что вместо `Dict[int, Dict[str, float]]` стоит писать `dict[int, dict[str, float]]`. Но, если вы оказались на более младшей версии питона, то нужно использовать типы из `typing`

#### Тип `Callable`

Данный тип используется для аннотации вызываемых объектов (например, функций). Можно указать два набора параметров: типы аргументов и возвращаемого значения

`Callable[[<argument1>, <argument2>], <return_type>]`

In [31]:
def func(a: float, b: float) -> tuple[int, int]:
    return int(a), int(b)

def apply_func_to_list(func: Callable[[float, float], tuple[int, int]],
                       lst: list[tuple[float, float]]) -> List[tuple[int, int]]:
    return [func(a, b) for a, b in lst]


apply_func_to_list(func, [(2.1, 2.2), (3.1, 3.2), (4.1, 4.2)])

[(2, 2), (3, 3), (4, 4)]

#### Тип `Union`

Один из самых часто используемых типов из `typing`. Позволяет объединить несколько типов в один

In [33]:
var: Union[int, str, list[float]]   # Тип может быть ИЛИ int, ИЛИ str, ИЛИ список из float'ов

var = 1   # Тип соответствует аннотации
var = "str"   # Тип соответствует аннотации
var = [1.1, 2.2, 3.3]   # Тип соответствует аннотации
var = [1, 2, 3]  # Тип НЕ соответствует аннотации

Начиная с Python версии **3.10** вместо `Union` можно использовать оператор `|`

In [None]:
var: int | str | list[float]

#### Тип `Optional`

Данный тип позволяет указать, что переменная может иметь значение `None`. Это не имеет ничего общего с "опциональными" аргументами функций

In [36]:
def find_number(lst: list[Union[int, float]],
                target_num: Union[str, float]) -> Optional[int]:   # Функция может вернуть ИЛИ int, ИЛИ None
    for idx, num in enumerate(lst):
        if num == target_num:
            return idx

По своей сути `Optional[int]` это то же самое, что и `Union[int, None]`

#### Абстрактные типы (`Container`, `Mapping`, `Sequence`, `Iterable`, ...)

Часто бывает так, что нам нужно указать на тот факт, что переменная имеет определённый интерфейс. Для этого можно использовать абстрактные типы. Здесь всё аналогично встроенным типам, до версии **3.9** использовались типы из модуля `typing`, но в **3.9** добавили возможность работать с соответствующими типами из `collections.abc`

In [37]:
from collections.abc import Iterable

In [42]:
def filter_integers_from_container(iterable: Iterable[int],
                                   cont: Container[int]) -> Iterable[int]:  # В этой строке тип Container пришёл из ранее импортированного модуля typing, но в collections.abc он тоже есть
    return type(iterable)(item for item in iterable if item not in cont)


filter_integers_from_container([1, 2, 3, 4], {3})
filter_integers_from_container({1, 2, 3, 4}, [3])
filter_integers_from_container((1, 2, 3, 4), (3,))

(1, 2, 4)

Все примеры выше удовлетворяют аннотациям. Список, кортеж и множество являются итерируемыми объектами, поэтому подходят под аннотацию `Iterable[int]`, они также реализуют интерфейс `Container`, поэтому подходят под аннотацию `Container[int]` у второго аргумента

#### Тип `Literal`

Данный тип позволяет указать кокретные значения, которые может принимать переменная. Пример из документации, аргумент `mode` принимает строку, которая обозначает режим открытия файла, а значит ожидаемый список значений для этого аргумента ограничен и мы можем явно указать их всех в типе

In [None]:
def open_helper(file: str, mode: Literal['r', 'rb', 'w', 'wb']) -> str:
    with open(file, mode) as f:
        return f.read()

#### Type aliases

В один момент при написании аннотаций типов вы заметите, что они становятся слишком громоздкими, например

In [51]:
variable: List[Dict[Tuple[Union[int, float], Union[int, float]], List[Tuple[Union[int, float], Union[int, float]]]]] = [
    {(1, 2.0, 2): [(1, 2.0, 2), (3, 4.0, 2)]},
    {(1, 2.0, 3): [(5, 6.0, 2), (7, 8.0, 2)]}
]

Механизм type alias позволяет нам сохранить аннотацию в переменную для дальнейшего переиспользования

In [52]:
Number = Union[int, float]
NumberTuple = Tuple[Number, Number]
MyCustomType = List[Dict[NumberTuple, List[NumberTuple]]]

variable: MyCustomType = [
    {(1, 2.0, 2): [(1, 2.0, 2), (3, 4.0, 2)]},
    {(1, 2.0, 3): [(5, 6.0, 2), (7, 8.0, 2)]}
]

Type aliases существуют только для упрощения сложных аннотаций. Type aliases это **создание нового имени для существующего типа**

#### Создание новых типов

Класс `NewType` позволяет создавать новые типы

In [56]:
Temperature = NewType("Temperature", float)

def celsius_to_fahrenheit(celsius: Temperature):
    fahrenheit = (celsius * 9/5) + 32
    return fahrenheit

temp = Temperature(3.2)
print(type(temp))

celsius_to_fahrenheit(3.2)
celsius_to_fahrenheit(temp)

<class 'float'>


37.76

В примере выше мы создали тип `Temperature`, который является подтипом `float`, мы можем создать экземпляр этого типа, НО при этом мы получим объект типа `float`, короче всё запутано, зачем это вообще нужно?

Данные типы будут использоваться анализаторами кода, например IDE, которые будут выдавать подсказки, если вы передаёте куда-то не тот тип. Ниже приведён тот же самый код, но в PyCharm

![image.png](attachment:3ea97b3a-9f8f-42be-b504-e2a6727456d2.png)

В данном случае IDE сообщает нам, что мы передаём в функцию неправильный тип. Такая система позволяет ловить логические ошибки и делать функции более специализированными. `NewType` **создаёт новый тип**, позволяя **различать переменные одного типа с разными назначениями** по логике их использования

### Интеграция с IDE

Аннотации типов прекрасно интегрируются с различными средами разработки (IDE). Рассмотрим следующий пример:

Допустим, что мы хотим написать какую-то простую функцию, удаляющую индекс из датафрейма

```python
def delete_index(data):
    return data.reset_index(drop=True)
```

Проблема заключается в том, что при написании этой функции без аннотаций типов, IDE не может понять, какой тип имеет аргумент `data`, а следовательно не сможет предоставлять нам различные подсказки и, самое главное, не сможет сделать автодополнение.

![image.png](attachment:f2700591-004d-438a-81e6-16cf09527ad4.png)

Таким образом, если мы забыли про какой-то метод объекта, то у нас не получится просто потыкать в Tab и посмотреть, что у него есть, нам придётся лезть в интернет. Однако, если мы укажем аннотацию для аргумента `data`, то IDE поймёт с чем имеет дело и начнёт нам подсказывать.

![image.png](attachment:1c828b36-12d7-4a96-9259-dfcfb70e4cea.png)

Именно привычка писать функции сразу с аннотациями типов может помочь меньше ходить в интернет и, в целом, может повысить вашу продуктивность (не люблю это слово)

Также IDE постоянно проверяет ваш код и подсвечивает места, где используются не те типы, которые указаны в аннотациях. Просмотр таких уведомлений может помочь избавиться от разных логических ошибок, но, чтобы это работало, аннотации нужно делать бувально везде.

Это ещё один хороший принцип для работы с аннотациями &mdash; **или вы делаете аннотации для всех функций/классов, или не делаете нигде**. Выборочная аннотация не принесёт много пользы, а только потратит ваше время.

# Документация

Написание комментариев к вашему коду это ещё один хороший способ улучшить его качество и читаемость.

## Inline  комментарии

Вы уже знакомы с обычными комментариями:

In [58]:
a = 2   # This is comment

Это крайне полезная, но опасная штука. Со слишком малым количеством комментариев ваш код будет слишком непонятным, а со слишком большим количеством комментариев он станет нечитаемым, так как комментарии будут отвлекать внимание. По поводу комментариев можно сделать два основных тезиза:
1. **Хорошему коду комментарии не нужны, он хорошо читается и без них**
2. **Стоит комментировать неочевидные моменты, которые человек читающий код не может понять на уровне логики работы кода, но не синтаксиса**

Ниже приведён пример плохого комментирования кода, комментариев слишком много

In [None]:
def bubble_sort(arr):   # Function that uses bubble-sort algorithm to sort a list
    n = len(arr)    # Save list length to a variable
    for i in range(n):    # Iterate over indices of the list
        for j in range(0, n-i-1):    # Iterate over list indices up to index selected in the outer loop
            if arr[j] > arr[j+1]:    # Check if elements located at adjacent list indices are in right order 
                arr[j], arr[j+1] = arr[j+1], arr[j]    # If not, swap elements on those indices

Ниже приведён пример плохого комментирования кода, комментариев нет и нейминг в коде не очень (хотя, как правило, однобуквенный нейминг это прямо таки стандарт для алгоритмических задач), код плохо читается

In [59]:
def bubble_sort(l):
    n = len(l)
    for i in range(n):
        for j in range(0, n-i-1):
            if l[j] > l[j+1]:
                l[j], l[j+1] = l[j+1], l[j]

Ниже приведён пример хорошего комментирования кода, есть один комментарий, который обращает внимание читателя на неочевидный момент. Возможно, читатель не знает, что в питоне можно вот таким образом менять местами значения переменных, остальной код вполне можно понять

In [60]:
def bubble_sort(arr):
    n = len(arr)
    for i in range(n):
        for j in range(0, n-i-1):
            if arr[j] > arr[j+1]:
                arr[j], arr[j+1] = arr[j+1], arr[j]   # Swap elements

## Документация для функций/модулей/классов

### Докстроки

Для документации перечисленных сущностей в питоне используются **докстроки (docstrings)**, которые создаются при помощи трёх кавычек `""""`

In [66]:
class MyClass:
    """My class that does very important work"""
    
def myfunc():
    """My function that does very important work"""

Для корректной документации докстроки нужно размещать сразу после сигнатуры функции/класса или наверху модуля

Такие строки интегрированы в питон и умеют работать с IDE

Описание вашей функции из докстроки будет отображаться при вызове функции `help`

In [63]:
help(MyClass)

Help on class MyClass in module __main__:

class MyClass(builtins.object)
 |  My class that does very important work
 |  
 |  Data descriptors defined here:
 |  
 |  __dict__
 |      dictionary for instance variables (if defined)
 |  
 |  __weakref__
 |      list of weak references to the object (if defined)



In [64]:
help(myfunc)

Help on function myfunc in module __main__:

myfunc()
    My function that does very important work



Также докстроку в "сыром" виде можно получить при помощи дандер атрибута `__doc__`

In [67]:
MyClass.__doc__

'My class that does very important work'

### Что нужно писать в докстроках?

Докстроки должны понятным языком описывать то, что делает ваши функция/класс/модуль. Писать там можно что угодно, но, как обычно, в питоне существуют некоторые [рекомедации и конвенции](https://peps.python.org/pep-0257/), обязательно прочитайте про это. Тем не менее эти рекомендации не очень строгие и вы можете писать то, то вам хочется, но это должно быть полезно, а не быть просто бувами ради букв.

В докстроках, как правило, следует отразить следующее:
1. Сделать одну первую строку, коротко описывающую то, что делает функция
2. Сделать дополнительные разъяснения по аргументам и возвращаемым значениям
    + Что аргумент из себя представляет
    + Какого типа может быть аргумент (не обязательно писать, если вы сделали аннотацию типов)
    + Опциональный или обязательный
    + Значение по-умолчанию (особенно полезно в случаях, когда дефолтное значение устанавливается неявно уже внутри функции, например, когда мы делаем аргумент по-умолчанию равным `None`, но в ходе выполнения функции меняем `None` на пустой список, так как делать изменяемые значения по-умолчанию это плохо)
3. Примеры использования функции/класса


Ниже приведён пример неплохой докстроки со всеми перечисленными особенностями

In [68]:
import os


def create_directory_structure(base_directory, subdirectories=None, file_extensions=None, create_files=False):
    """
    Creates a directory structure with optional files in a given base directory.

    Parameters
    ----------
    base_directory : str
        The path of the base directory where the subdirectories should be created.
    subdirectories : list of str, optional
        A list of subdirectory names to be created within the base directory. Default is None.
    file_extensions : list of str, keyword-only argument, optional
        A list of file extensions for the files to be created within each subdirectory. Default is None.
    create_files : bool, keyword-only argument, optional
        Indicates whether files should be created within each subdirectory. Default is False.

    Returns
    -------
    bool
        True if the directory structure is created successfully, False otherwise.

    Example
    -------
    >>> success = create_directory_structure('project', ['src', 'data'], file_extensions=['.txt', '.csv'], create_files=True)
    >>> print(success)
    True
    """
    if subdirectories is None:
        subdirectories = []

    if file_extensions is None:
        file_extensions = []

    try:
        os.makedirs(base_directory, exist_ok=True)
        for subdir in subdirectories:
            subdir_path = os.path.join(base_directory, subdir)
            os.makedirs(subdir_path, exist_ok=True)

            if create_files:
                for ext in file_extensions:
                    file_path = os.path.join(subdir_path, f"{subdir}{ext}")
                    with open(file_path, 'w') as f:
                        f.write("")

        return True
    except Exception as e:
        print(f"Error creating directory structure: {e}")
        return False

### Как форматировать докстроки?

В целом, допустим произвольный формат записи докстрок, главное то, чтобы она была читаема. Тем не менее существует много устоявшихся **стилей (форматов)** записи докстрок. По своей сути они предствляют из себя определённые правила по которым можете форматировать ваши строки, такой подход имеет некоторый преимущества:
1. **Согласованность**. Если все ваши функции и классы будут задокументированы в едином стиле, то восприятие вашего кода сильно улучшится
2. **Читабельность**. Стили докстрок специально созданны для того, чтобы хорошо считываться визуально, их банально проще читать, чем кастомное форматирование
3. **Поддержка инструментов**. Разные IDE и программы умеют парсить определённые форматы докстрок и представлять их в ещё более удобном виде.
4. **Сотрудничество**. Работая в команде или внося свой вклад в проекты с открытым исходным кодом, соблюдение установленных стилей докстрок помогает поддерживать согласованный и профессиональный вид кодовой базы.

### Форматы докстрок

Различных стилей докстрок бывает очень много, среди самых популярных можно выделить:
1. **reStructuredText (reST):**
    ```python
    def add(a, b):
        """
        Return the sum of a and b.

        :param a: First input value.
        :type a: int or float
        :param b: Second input value.
        :type b: int or float
        :return: The sum of a and b.
        :rtype: int or float
        """
    ```
2. **Google:**
    ```python
    def add(a, b):
        """
        Return the sum of a and b.

        Args:
            a (int or float): First input value.
            b (int or float): Second input value.

        Returns:
            int or float: The sum of a and b.
        """
    ```
3. **NumPy/SciPy:**
    ```python
    def add(a, b):
        """
        Return the sum of a and b.

        Parameters
        ----------
        a : int or float
            First input value.
        b : int or float
            Second input value.

        Returns
        -------
        int or float
            The sum of a and b.
    """

    ```
4. **Epytext:**
    ```python
    def add(a, b):
        """
        Return the sum of a and b.

        @param a: First input value.
        @type a: int or float
        @param b: Second input value.
        @type b: int or float
        @return: The sum of a and b.
        @rtype: int or float
        """
    ```

Внутри разных библиотек и команд разработчиков могут быть свои отдельные стили документаций.

Хотя никто не запрещает вам писать документацию так, как вам больше нравится, я всё-таки советую выбрать один из популярных стилей и стараться всё время писать в нём, так, ваш код станет сильно лучше

### Как писать докстроки?

К счастью мы живём в 21 веке и сейчас уже необязательно самостоятельно заниматься такой душной работой как написание докстрок. Есть сервисы/плагины для IDE, который могут генерировать как полностью готовые докстроки, так и предоставлять шаблоны, сильно облегчая работу. Например можно воспользоваться ChatGPT для написания докстроки для данной функции, но обязательно проверив результат и внеся необходимые поправки вручную

```python
def weighted_moving_average(data, weights):
    if not (isinstance(data, list) and isinstance(weights, list)):
        raise TypeError("Both 'data' and 'weights' should be lists.")
    
    if not (all(isinstance(x, (int, float)) for x in data) and all(isinstance(x, (int, float)) for x in weights)):
        raise TypeError("Both 'data' and 'weights' lists should contain only integers or floats.")

    if len(weights) > len(data):
        raise ValueError("'weights' list should be shorter or equal in length to the 'data' list.")

    wma = []
    n = len(weights)
    denominator = sum(weights)

    for i in range(len(data) - n + 1):
        numerator = sum(data[i+j] * weights[j] for j in range(n))
        wma.append(numerator / denominator)

    return wma

```

![image.png](attachment:6210eafd-b90d-435f-ae1b-906ffcc9a4b9.png)

# Полезные ссылки

+ [Документация модуя `typing`](https://docs.python.org/3/library/typing.html). Ищем здесь нужные типы