# Модуль ```collections```

## Именованные кортежи (```namedtuple```)

У классических кортежей есть один недостаток. Для обращения к значению, находящемуся внутри него, нужно использовать индекс. Это не всегда удобно. Например, когда в кортеже хранится дата в формате ```date = (year, month, day)```, для получения значения года нужно обратиться по индексу ```date[0]```. Читаемость этого выражения не слишком высокая. Для его понимания нужно держать в голове порядок элементов кортежа и помнить, что по нулевому индексу находится год. Как развитие обычных кортежей были предложены именованные кортежи (см. [документацию](https://docs.python.org/3/library/collections.html#collections.namedtuple)) или тип ```namedtuple```. Они находятся в модуле ```collections``` стандартной библиотеки. Для начала их использования необходимо их импортировать. 

```python
form collections import namedtuple
``` 

Подробнее операция импорта будет рассмотрена в следующих разделах. 

Функция ```namedtuple``` принимает ряд аргументов. Ее сигнатура выглядит как ```namedtuple(typename, field_names, *, rename=False, defaults=None, module=None)```. Параметр ```typename``` должен быть строкой и определяет название типа создаваемого именованного кортежа. Набор полей задается с помощью параметра ```field_names```. Имена полей могут передаваться в качестве последовательности сток, например, ```['a', 'b']``` или ```('a', 'b')```, а также в одной строке, разделенные пробелом или запятой, например, ```'a b'``` или ```'a, b'```. ```defaults``` задает значение по умолчанию для всех полей кортежа.

In [3]:
from collections import namedtuple

# создание типа именованного кортежа. Желательно, 
# чтобы имя переменной и имя в строке совпадали.
Point_2d = namedtuple('Point_2d', ('x', 'y'), defaults=(0, 0))

# объект со значениями по умолчанию
point_0 = Point_2d()
# значения можно передавать явно указывая именя
point_1 = Point_2d(x=1, y=2)
# можно передавать как позиционные, тогда первое 
# значение попадет в первый параметр и т.д.
point_2 = Point_2d(1, 2)

print(f'Точка 0: {point_0 = }')
print(f'Точка 1: {point_1 = }')
print(f'Точка 2: {point_2 = }')
# тип объектов namedtuple будет совпадать со значением 
# параметра typename, в данном случае Point_2d
print(f'Тип объекта 1: {type(point_1) = }')
print(f'Тип объекта 2: {type(point_2) = }')

Точка 0: point_0 = Point_2d(x=0, y=0)
Точка 1: point_1 = Point_2d(x=1, y=2)
Точка 2: point_2 = Point_2d(x=1, y=2)
Тип объекта 1: type(point_1) = <class '__main__.Point_2d'>
Тип объекта 2: type(point_2) = <class '__main__.Point_2d'>


In [4]:
# доуступ к атрибутам namedtuple можно осуществлять через точку и имя атрибута
print(f'{point_1.x = }, {point_1.y = }')
# или через индекс
print(f'{point_1[0] = }, {point_1[1] = }')

x, y = point_1
print(f'{x = }, {y = }')

point_1.x = 1, point_1.y = 2
point_1[0] = 1, point_1[1] = 2
x = 1, y = 2


In [4]:
# namedtuple это кортеж, а значит неизменяемая коллекция
point_1.x = 0

AttributeError: can't set attribute

In [9]:
# для изменения одного или нескольких атрибутов у namedtuple есть 
# метод _replace. На самом деле он не изменяет значение атрибута, 
# а создает новый объект на основе текущего
point_3 = point_1._replace(y=0)
print(f'{point_1 = }, {point_3 = }')

point_1 = Point(x=1, y=2), point_3 = Point(x=1, y=0)


In [None]:
# создавать именованные кортежи можно с помощью метода _make. 
# Он принимает коллекцию. 
# Эквивалентно Point_2d(1, 2)
p_1 = Point_2d._make([1, 2])
# Эквивалентно Point_2d(x=1, y=2)
p_2 = Point_2d._make({'x': 1, 'y': 2})

print(f'{p_1 = }, {p_2 = }')

In [9]:
# Именованные кортежи легко можно преобразовать в словарь с 
# помощью метода _asdict
print(f'Преобразование namedtyple в словарь: {point_1._asdict() = }')
print(f'Преобразование namedtyple в кортеж: {tuple(point_1) = }')

Преобразование namedtyple в словарь: point_1._asdict() = {'x': 1, 'y': 2}
Преобразование namedtyple в кортеж: tuple(point_1) = (1, 2)


In [8]:
# namedtuple это коллекция, поэтому справедливы все операции, 
# характерные для коллекций.
print(f'{len(point_1) = }')
for value in point_1:
    print(f'{value = }')

len(point_1) = 2
value = 1
value = 2


Бывают ситуации когда необходимо создать новый тип именованного кортежа на основе уже существующего. Например, логично создать точку в трехмерном пространстве ```Point_3d``` на основе точки на двумерной плоскости ```Point_2d```. У этих двух типов есть одинаковый атрибуты ```x``` и ```y```. В этом случае писать два раза почти одну и ту же коллекцию атрибутов не хочется. Используя специальный атрибут ```_fields``` можно получить коллекцию атрибутов именованного кортежа. ```_fields``` рекомендуется использовать для создания нового типа именованного кортежа на основе существующего, если у них есть одинаковые атрибуты. С помощью этого атрибута можно создавать именованные кортежи на основе сразу нескольких других кортежей.

In [5]:
print(f'{point_1._fields = }')

point_1._fields = ('x', 'y')


In [10]:
Point_3d = namedtuple('Point_3d', Point_2d._fields + ('z', ), defaults=(0, 0, 0))

p_1 = Point_3d(1, 2, 3)

print(f'{Point_3d = }')
print(f'{Point_3d._fields = }')
print(f'{p_1 = }')
print(f'{type(p_1) = }')

Point_3d = <class '__main__.Point_3d'>
Point_3d._fields = ('x', 'y', 'z')
p_1 = Point_3d(x=1, y=2, z=3)
type(p_1) = <class '__main__.Point_3d'>


## ```Counter```

Для подсчета любых повторяющихся элементов в какой-либо коллекции существует класс ```Couter``` из модуля ```collections``` (см. [документацию](https://docs.python.org/3/library/collections.html#collections.Counter)). Итоговая коллекция очень похожа на словарь и доступ к элементам осуществляется по ключу. Ключом являются сами элементы коллекции, а значениями количество элементов в коллекции. Приятным бонусом его использования будет то, что итоговая коллекция будет отсортирована в порядке убывания их количества в строке. Ниже приведены далеко не все возможности ```Couter```, подробнее см. в [документации](https://docs.python.org/3/library/collections.html#collections.Counter).

In [15]:
from collections import Counter

s = 'Never Gonna Give You Up'

count = Counter(s)
print(f'{count = }')

print(f'{count["e"] = }')
print(f'{count[" "] = }')
print(f'{count["p"] = }')

print(f'{count.most_common(4) = }')
print(f'{list(count.elements()) = }')

count = Counter({' ': 4, 'e': 3, 'v': 2, 'G': 2, 'o': 2, 'n': 2, 'N': 1, 'r': 1, 'a': 1, 'i': 1, 'Y': 1, 'u': 1, 'U': 1, 'p': 1})
count["e"] = 3
count[" "] = 4
count["p"] = 1
count.most_common(4) = [(' ', 4), ('e', 3), ('v', 2), ('G', 2)]
list(count.elements()) = ['N', 'e', 'e', 'e', 'v', 'v', 'r', ' ', ' ', ' ', ' ', 'G', 'G', 'o', 'o', 'n', 'n', 'a', 'i', 'Y', 'u', 'U', 'p']


## ```deque```

```deque``` это реализация такой структуры данных как [двусторонняя очередь](https://en.wikipedia.org/wiki/Queue_(abstract_data_type)). Функция ```deque``` принимает коллекцию в качестве аргумента и один необязательный параметр ```maxlen```, который ограничивает длину очереди.

Она позволяет реализовать:
- ограниченную очередь (за счет дополнительного аргумента ```maxlen```);
- очередь по принципу "первый пришёл — первый вышел" или FIFO (за счет методов ```popleft``` для удаления элемента с левой части очереди и ```append``` для добавления элемента в правую часть);
- очередь по принципу "последний пришёл — первый вышел" или LIFO (за счет методов ```pop``` для удаления элемента с правой части очереди и ```append```).

Реализация очереди с помощью ```deque``` гораздо эффективнее с точки зрения производительности нежели реализация очереди на основе списков. Поэтому если существует необходимость в этой структуре данных нужно использовать ```deque```, а не списки.

Подробнее о доступных методах и подробных примерах см. в [документации](https://docs.python.org/3/library/collections.html#collections.deque).

In [17]:
from collections import deque

d = deque([1, 2, 3, 4])
print(f'{d = }')
print(f'{type(d) = }')

# Операции pop и popleft удаляют элемент из очереди и возвращают, 
# это позволяет работать с ним после удаления
left_item = d.popleft()
right_item = d.pop()
print(f'Элемент с левого конца: {left_item = }')
print(f'Элемент с правого конца: {right_item = }')

# Можно добавлять элементы в любой конец
d.append(42)
d.appendleft(196)
print(f'Очередь после добавления элементов: {d = }')

d = deque([1, 2, 3, 4])
type(d) = <class 'collections.deque'>
Элемент с левого конца: left_item = 1
Элемент с правого конца: right_item = 4
Очередь после добавления элементов: d = deque([196, 2, 3, 42])


## ```ChainMap```

[документация](https://docs.python.org/3/library/collections.html#collections.ChainMap)

In [None]:
from collections import ChainMap

## ```defaultdict```

[документация](https://docs.python.org/3/library/collections.html#collections.defaultdict)

In [None]:
from collections import defaultdict

In [None]:
def tree():
    return defaultdict(tree)

df = defaultdict(tree)
print(df[1])
print(df[1][2][3])
print(df[1][4])

# Ссылки

- [Документация](https://docs.python.org/3/library/collections.html)
