# Python-1, Лекция 5

Лектор: Хайбулин Даниэль

Итак, сегодня мы поговорим про модули `collections` и `itertools`

### Collections

`collections` — это стандартный модуль Python, предоставляющий дополнительные структуры данных, такие как `namedtuple`, `deque`, `Counter`, `OrderedDict`, `defaultdict` и другие. Эти структуры расширяют базовые возможности встроенных типов данных и позволяют более эффективно и удобно решать широкий спектр программных задач, связанных с обработкой и хранением данных.

На практике, как правило, наиболее часто используются такие структуры из модуля `collections`, как `defaultdict` и `namedtuple` (особенно актуален `namedtuple` при необходимости поддержки кода на `Python 2` или поддержки совместимости с `Python 2`).

#### defaultdict

`defaultdict` — это специализированный класс, который позволяет автоматически создавать и присваивать значения для отсутствующих ключей на основе заданной функции (или объекта, у которого определен dunder-метод `__call__`) по умолчанию (`default_factory`). При обращении к несуществующему ключу в таком словаре новый элемент автоматически добавляется и инициализируется значением, возвращаемым функцией по умолчанию, что избавляет от необходимости явно проверять наличие ключа или использовать метод get. Во всех остальных отношениях defaultdict полностью совместим с обычным словарём.

In [None]:
from collections import defaultdict


dct = defaultdict(float)

dct[2]

In [None]:
from collections import defaultdict
dct = defaultdict(list)

dct[2]

Начиная с `Python 3.12`, аргумент `default_factory` стал необязательным при создании экземпляра `defaultdict`. Теперь, если не передавать функцию по умолчанию, `defaultdict` по сути ведёт себя как обычный `dict`: не создаёт новых элементов автоматически и выбрасывает `KeyError` при обращении к отсутствующему ключу.

https://python.godbolt.org/z/rTsE7fTq4 - `python 3.13`


Но так использовать defaultdict не стоит, так как вы смутите разработчика, который будет поддерживать ваш код

In [19]:
from collections import defaultdict


dct = defaultdict()

In [None]:
counter = dict()

elements = ['apple', 'banana', 'apple', 'orange', 'banana', 'apple']

for fruit in elements:
    if fruit not in counter:
        counter[fruit] = 0
    counter[fruit] += 1

print(counter)

In [None]:
from collections import defaultdict


# Создаем defaultdict с функцией по умолчанию, которая возвращает 0
counter = defaultdict(int)

elements = ['apple', 'banana', 'apple', 'orange', 'banana', 'apple']

for fruit in elements:
    counter[fruit] += 1

print(counter)

Не рекомендуется выполнять проверки наличия ключа в defaultdict посредством обращения к элементу по индексу. Такой подход может привести к неявному созданию новых элементов для отсутствующих ключей, что, в свою очередь, увеличит размер структуры данных и может повлиять на потребление памяти и производительность

In [None]:
# неправильно

dct = defaultdict(float)

for i in range(5):
    if dct[i] == 0:
        print("Found")

dct

In [None]:
# правильно

dct = defaultdict(float)

for i in range(5):
    if i in dct:
        print("Found")

dct

#### namedtuple

`namedtuple` — это функция из модуля `collections`, позволяющая создавать неизменяемые (**immutable**) объекты-кортежи с именованными полями. Такая структура обеспечивает удобный доступ к полям как по имени, так и по индексу, сохраняя компактность и неизменяемость стандартных кортежей.

In [None]:
from collections import namedtuple

Point = namedtuple('Point', ['x', 'y'])
p1 = Point(2, 3)

print(p1.x)     # 2

# Как правило, при использовании namedtuple обращения к элементам по индексам не применяются,
# поскольку такой подход снижает читаемость и ясность кода.
# Вместо этого рекомендуется использовать доступ к значениям по именованным полям,
# что делает структуру данных более наглядной и облегчает сопровождение программы.
print(p1[1])    # 3

print(p1)       # Point(x=2, y=3)


Начиная с `Python 3.7`, был добавлен декоратор `@dataclass` в модуль `dataclasses` для удобного создания классов данных. Классы, оформленные с помощью `@dataclass` могут быть как изменяемыми, так и неизменяемыми (при использовании параметра `frozen=True`). Чуть подробнее познакомимся с этим декоратором в дальнейших лекциях. На данном этапе не обязательно подробно разбираться в понятиях "декоратор" и "класс". Это темы, которые будут рассмотрены отдельными блоками позже, и их понимание не критично для начального освоения работы с `dataclass`.

In [None]:
from dataclasses import dataclass


@dataclass(frozen=True)
class Point:
    x: int
    y: int

p2 = Point(2, 3)
print(p2.x)     # 2
print(p2)       # Point(x=2, y=3)


#### Counter

In [None]:
from collections import Counter


s = ['ab', 'ab', 'bc', 'cd', 'ab']
c = Counter(s)

print(c)

#### Deque

`Deque` — двусторонняя очередь. Является специализированной структурой данных, обеспечивающей эффективное добавление и удаление элементов с обоих концов очереди за константное время (`O(1)`). Это делает её предпочтительной для задач, связанных с реализацией стеков, очередей, а также сценариев с частым доступом к начальному и конечному элементам последовательности. В остальном `deque` поддерживает основные операции стандартных последовательностей Python.

* `Stack` - LIFO (last in first out) - гора тарелок

* `Queue` - FIFO (first in first out) - очередь в банке

* `Deque` - Двусторонняя очередь (можно добавлять и забирать как с конца, так и с начала)

In [None]:
from collections import deque


s = ['ab', 'ab', 'bc', 'cd', 'ab']
d = deque(s)
print(d)

print('-' * 30)

for elem in d:
    print(elem)

print('-' * 30)

# Добавление элементов

d.append('aa')
d.appendleft('dd')
d.extend(['hh', 'pp'])
d.extendleft(['hh', 'pp'])
print(d)

print('-' * 30)

# Удаление элементов

print(d.pop())
print(d.popleft())
print(d)

print('-' * 30)

# Обращение к элементам

print(d[0])
print(d[-2])
print(d.count('hh'))

print('-' * 30)

# Смещение очереди влево-вправо

d.rotate(1) # влево
# 1-2-3-4-5 -> rotate(1) -> 2-3-4-5-1
print(d)
d.rotate(-2) # вправо
# 1-2-3-4-5 -> rotate(-2) -> 4-5-1-2-3
print(d)
d.reverse() # перевернуть очередь
print(d)

print('-' * 30)

# вставка и удаление

d.insert(1, 'x')
print(d)
print(d.index('x'))
d.remove('x')
print(d)

#### heapq

#### OrderedDict

### Itertools