### Модуль Collections

### Рассмотрим объект Counter
Объект Counter (от англ. «счётчик») предназначен для решения часто возникающей задачи по подсчёту различных элементов.

Например, может возникнуть следующая задача: необходимо выявить наиболее частых покупателей магазина. Входные данные — список покупателей за последний месяц в хронологическом порядке, а точнее, список номеров карт постоянного покупателя (номера повторяются столько раз, сколько было посещений магазина). Понятно, что необходимо посчитать, сколько раз встретились различные номера карт и выбрать несколько наиболее частых клиентов. Для решения подобных задачи и предназначен Counter.

Вначале необходимо импортировать Counter из модуля collections, а затем создать пустой экземпляр этого объекта:

In [None]:
# Импортируем объект Counter из модуля collections
from collections import Counter
# Создаём пустой объект Counter
c = Counter()
# Теперь в переменной с хранится объект с возможностями Counter. Синтаксис похож на работу со словарем

Рассмотрим базовый синтаксис этого инструмента. Например, будем считать цвета проезжающих машин: если встретили красную машину, посчитаем её. Для этого прибавим к ключу 'red' единицу. Синтаксис очень похож на работу со словарём:

In [None]:
from collections import Counter
c = Counter()
c['red'] += 1
print(c)
# # Выводиться будет Class Counter (Который напоминает словарь), 
# # в котором ключом будет рассчитываемое значение, а значением - его количество
print(type(c))

Предположим у нас есть список машин с цветами. Мы можем посчитать каждый цвет с помощью Counter() как с использованиет цикла, так и без такового:

In [39]:
# С использованием цикла
# from collections import Counter

cars = ['red', 'blue', 'black', 'black', 'black', 'red', 'blue', 'red', 'white']
с = Counter()
for car in cars:
    c[car] += 1
print(c)

Counter({'red': 4, 'black': 3, 'blue': 2, 'white': 1})


In [40]:
# Без использования цикла
from collections import Counter

cars = ['red', 'blue', 'black', 'black', 'black', 'red', 'blue', 'red', 'white']
с = Counter(cars)
print(c)

Counter({'red': 4, 'black': 3, 'blue': 2, 'white': 1})


In [None]:
# Чтобы узнать сколько раз встретился конкретный элемент, можно обратиться к счетчику по слову,
# как по ключу в словаре
print(c['black'])

In [None]:
# Если ключ не существует, то вместо KeyError (как в словаре), 
# выведится 0 (то есть количество запрошенных элементов посчиталось как 0)
print(c['purple'])

Узнать сумму всех значений в объекте Counter можно, воспользовавшись следующей конструкцией:

In [None]:
print(sum(c.values()))

В этой конструкции мы сначала получаем элементы (число раз, когда встретился ключ) с помощью функции values (такая же функция есть и у словаря):

In [42]:
print(c.values())

# класс Counter суммируется по особому принципу. 
# Он суммируется как список, только складывает значения

dict_values([4, 2, 3, 1])


Возможности Counter не ограничиваются только подсчётом элементов. Этот объект обладает и дополнительным функционалом — например, ***счётчики можно складывать и вычитать***.

In [None]:
cars_moscow = ['black', 'black', 'white', 'black', 'black', 'white', 'yellow', 'yellow', 'yellow']
cars_spb = ['red', 'black', 'black', 'white', 'white', 'yellow', 'yellow', 'red', 'white']
counter_moscow = Counter(cars_moscow)
counter_spb = Counter(cars_spb)

print(counter_moscow)
print(counter_spb)
print()
print(counter_moscow + counter_spb)
print(counter_moscow - counter_spb)
# при вычитании нет значений меньше 1

Чтобы узнать разницу между объектами Counter, необходимо воспользоваться функцией ***subtract***, которая меняет тот объект, к которому применяется. В примере выше из значений, посчитанных для Москвы, вычитаются значения, посчитанные для Санкт-Петербурга:

In [49]:
counter_moscow.subtract(counter_spb)
print(counter_moscow)
# При нахождении разницы с помощью subtract могут быть отрицательные значения


Counter({'black': 0, 'yellow': -1, 'white': -4, 'red': -4})


Функция subtract может пригодиться, чтобы сравнить активность продаж различных позиций в двух торговых точках: здесь важно узнать не только те позиции, которые продавались активнее, но и те позиции, которые, наоборот, оказались менее популярными в первой точке по сравнению со второй.

Чтобы получить список всех элементов, которые содержатся в Counter, используется функция elements(). Она возвращает итератор, поэтому, чтобы напечатать все элементы, распакуем их с помощью *

**Важно понимать**, что элементы возвращаются в алфавитном порядке, а не в том порядке, в котором их вносили в счетчик

In [None]:
cars_moscow = ['black', 'black', 'white', 'black', 'black', 'white', 'yellow', 'yellow', 'yellow']
cars_spb = ['red', 'black', 'black', 'white', 'white', 'yellow', 'yellow', 'red', 'white']
counter_moscow = Counter(cars_moscow)
counter_spb = Counter(cars_spb)
print(*counter_moscow.elements())

- Чтобы получить список уникальных элементов, достаточно воспользоваться функцией list()
- С помощью функции dict() можно превратить Counter в обычный словарь
- Функция most_common() позволяет получить список из кортежей элементов в порядке убывания их встречаемости
- В функцию most_common() в качестве аргумента можно передать значение, которое задает желаемое число первых наиболее частых элементов (например 2)
- Функция clear() позволяет полностью обнулить счетчик


In [None]:
print(list(counter_moscow))
print(dict(counter_spb))
common = counter_moscow.most_common()
common_2 = counter_moscow.most_common(2)
print()
print(common)
print(common_2)
counter_moscow.clear()
print(counter_moscow)

### Рассмотрим объект defaultdict
Объект **defaultdict** из модуля collections. Он позволяет задавать тот тип данных, который хранится в словаре по умолчанию. Это бывает удобно в том случае, если приходится заполнять одну и ту же структуру данных, экземпляр которой должен храниться по каждому ключу в словаре.

**defaultdict** нужен для того, чтобы автоматически создавать значения по умолчанию для отсутствующих ключей в словаре, избавляя от необходимости вручную проверять их наличие и избегая ошибок KeyError. Это делает код чище, короче и более читаемым, особенно при работе с подсчётом, агрегацией данных или группировкой. 

Обратите внимание, что в скобках мы передаём именно указатель на класс объекта (например list; также можно было бы применить set, dict) без круглых скобок, которые используются для создания нового экземпляра объекта.

In [53]:
from collections import defaultdict

students = [('Ivanov',1),('Smirnov',4),('Petrov',3),('Kuznetsova',1),
            ('Nikitina',2),('Markov',3),('Pavlov',2)]

groups = (defaultdict(list))
for student, group in students:
    groups[group].append(student)
print(groups)

defaultdict(<class 'list'>, {1: ['Ivanov', 'Kuznetsova'], 4: ['Smirnov'], 3: ['Petrov', 'Markov'], 2: ['Nikitina', 'Pavlov']})


In [None]:
# обратиться к элементу можно также по ключу как в обычном словаре
print(groups[1])
# отличие от словаря в том, что если в defaultdict обратиться к несуществующему ключу он создаст пустой список
print(groups[1000])
# после этого этот список останется в defaultdict
print(groups)


### Специальный словарь, который гарантирует сохранение ключей в порядке их добавления - OrderedDict

In [None]:
from collections import OrderedDict
data = [('Ivan', 19),('Mark', 25),('Andrey', 23),('Maria', 20)]
ordered_client_ages = OrderedDict(data)
print(ordered_client_ages)
#сортировка с помощью функции sorted()
ordered_client_ages = OrderedDict(sorted(data, key=lambda x: x[1]))
print(ordered_client_ages)
# Если теперь добавить нового человека в словарь, то новая запись окажется в конце
ordered_client_ages['Nikita'] = 18
print(ordered_client_ages)
# в целом начиная с версии python старше 3.7, порядок в словарях сохраняется

### Структура данных Deque

Cуществует структура данных deque (читается как «дек», англ. double-ended queue — двухконцевая очередь). Она объединяет в себе возможности и стека, и очереди: содержит функции, которые позволяют добавлять элементы в начало или в конец очереди, а также извлекать первый или последний элемент из неё. 

В Python deque уже реализован, и им можно пользоваться для решения задач, для которых требуется как стек, так и очередь. При этом вы как разработчик уже самостоятельно решаете, каким именно функционалом из deque вы будете пользоваться для решения вашей задачи: либо вы будете обрабатывать элементы в порядке очереди, либо будете добавлять и извлекать элементы с помощью функций для стека. Также можно добавлять и извлекать данные с обеих доступных сторон: нельзя указать, что вы собираетесь использовать deque  только как стек или очередь.

In [None]:
from collections import deque
dq = deque()
print(dq)

У **deque** есть четыре ключевые функции:
- append (Добавить элемент в конец дека)
- appendleft (Добавить элемент в начало дека)
- pop (удалить и вернуть элемент из конца дека)
- popleft (удалить и вернуть элемент из начала дека)

In [None]:
from collections import deque

clients = deque()
clients.append('Ivanov')
clients.append('Petrov')
clients.append('Smirnov')
clients.append('Tikhonova')
print(clients)

Объект deque поддерживает индексацию по элементам

In [None]:
print(clients[2])

Предположим, нам надо вернуть и удалить элементы списка с обеих сторон очереди. В этом нам помогут функции: pop() и popleft(). Эти функции не просто удаляют элементы, но еще и возвращают их значения. 

*Для примера, с помощью указанных функций, занесем удаляемые элементы в переменные и выведим их на экран.*

In [None]:
first_client = clients.popleft()
last_client = clients.pop()

print(first_client)
print(last_client)
print(clients)

Добавить элементы слева или справа объекта deque можно с помощью функций appendleft() и append().

Чтобы массово добавлять элементы, можно использовать функции extend() и extendleft(). Важно отметить, что функция extendleft() аналогична многократному повторению функции appendleft(), поэтому элементы будут добавляться в обратном порядке.

In [None]:
shop = deque([1, 2, 3, 4, 5])
print(shop)

shop.extendleft([11, 12, 13, 14, 15, 16, 17])
print(shop)

При создании очереди можно также указать её максимальную длину с помощью параметра ***maxlen***. Сделать это можно как при создании пустой очереди, так и при создании очереди от заданного итерируемого объекта:

In [None]:
limited = deque(maxlen=3)
print(limited)

limited_from_list = deque([1,3,4,5,6,7], maxlen=3)
print(limited_from_list)

В очереди с ограниченной длиной сохраняются только последние элементы, а первые исчезают из памяти.

При этом, как видно из результата операции limited.append(8), удаляемый элемент не возвращается, а просто исчезает.

In [None]:
limited.extend([1,2,3])
print(limited)
# deque([1, 2, 3], maxlen=3)
 
print(limited.append(8))
# None
print(limited)
# deque([2, 3, 8], maxlen=3)

***Дополнительные функции***
- reverse() - меняет порядок элементов в очереди на обратный
- rotate(n) - переносит n заданных элементов из конца очереди в начало. Если n < 0 (отрицательное), то элементы переносятся из начала в конец.
- index(n) - позволяет найти первый индекс искомого элемента n
- count(n) - позволяет подсчитать, сколько раз элемент n встретился в deque
- clear() - очищает очередь

In [3]:
print(26*30000*12)

9360000
