# Освоения возможностей встроенного модуля **Collections**
- **Collections** позволяет упростить написание кода при решении некоторых типовых задач, таких как подсчёт числа различных элементов или создание словаря для хранения в нём списков.
- **Collections** состоит из 4-х модулей **Counter**, **defaultdict**, **deque**, **OrderedDict**
1. **Counter** - счетчик числа различных элементов;
2. **defaultdict** - словарь с заданным типом данных по умолчанию;
3. **deque** - инструмент для работы с очередями элементов;
4. **OrderedDict** - словарь, который гарантирует сохранение порядка добавления ключей в нём.

# Модуль Counter

In [1]:
# Для использования счетчика необходимо вначале импортировать объект Counter из модуля collections
from collections import Counter
# Далее создаем пустой объект Counter
c =  Counter()  # теперь в переменной c хранится объект с возможностями Counter

#### Пример расчета с использованием Counter

In [2]:
cars_spb = ['red', 'blue', 'black', 'black', 'black', 'red', 'blue', 'red', 'white']
cars_moscow = ['black', 'black', 'white', 'black', 'black', 'white', 'yellow', 'yellow', 'yellow']
counter_moscow = Counter(cars_moscow)  # Получаем счетчики на город
counter_spb = Counter(cars_spb)  # Получаем счетчики на город
from collections import Counter
c =  Counter(cars_spb)
print (c)

Counter({'red': 3, 'black': 3, 'blue': 2, 'white': 1})


#### Несколько операций с модулем Counter

In [3]:
print(c['black'])  # Узнаём, сколько раз встретился конкретный элемент
print(c['purple'])  # Обращаемся к счётчику по несуществующему ключу
print(sum(c.values()))  # Узнаём сумму всех значений в объекте
print(c.values())  # Узнаем число раз, когда встретился ключ
print(counter_moscow + counter_spb)  # Складываем счетчики
counter_moscow.subtract(counter_spb)  # Узнаем разницу между объектами Counter (Применение функции subtract)
print(counter_moscow) # Функция subtract не всегда бывает удобно использовать для вычитания, так как модифицируется исходный счётчик

3
0
9
dict_values([3, 2, 3, 1])
Counter({'black': 7, 'white': 3, 'yellow': 3, 'red': 3, 'blue': 2})
Counter({'yellow': 3, 'black': 1, 'white': 1, 'blue': -2, 'red': -3})


#### ДОПОЛНИТЕЛЬНЫЕ ФУНКЦИИ

In [4]:
print(*counter_spb.elements())  # Получаем список вссех элементов, которые содержатся в Counter. Эл-ты возвращаются в алфавитном порядке!
print(list(counter_spb))  # Получаем список уникальных элементов с помощью list()
print(dict(counter_spb))  # С помощью функции dict() превращаем Counter в обычный словарь
print(counter_spb.most_common())  # Получаем список из кортежей элементов в порядке убывания их встречаемости
print(counter_spb.most_common(2))  # Задаём желаемое число первых наиболее частых элементов, например, 2
counter_moscow.clear()  # функция clear() позволяет полностью обнулить счётчик
print(counter_moscow)

red red red blue blue black black black white
['red', 'blue', 'black', 'white']
{'red': 3, 'blue': 2, 'black': 3, 'white': 1}
[('red', 3), ('black', 3), ('blue', 2), ('white', 1)]
[('red', 3), ('black', 3)]
Counter()


# Модуль defaultdict
- defaultdict позволяет задавать тот тип данных, который хранится в словаре по умолчанию (в нашем случае это должен быть список)

Создадим defaultdict, в котором при обращении по несуществующему ключу будет автоматически создаваться новый список. Для этого при создании объекта defaultdict в круглых скобках передадим параметр list

In [1]:
students = [('Ivanov',1),('Smirnov',4),('Petrov',3),('Kuznetsova',1),
            ('Nikitina',2),('Markov',3),('Pavlov',2)]

from collections import defaultdict
groups = defaultdict(list) # также можно было бы применить set, dict
for student, group in students:
    groups[group].append(student)
    
print(groups)

defaultdict(<class 'list'>, {1: ['Ivanov', 'Kuznetsova'], 4: ['Smirnov'], 3: ['Petrov', 'Markov'], 2: ['Nikitina', 'Pavlov']})


#### Несколько операций с модулем defaultdict

In [2]:
print(groups[3])  # получаем элемент по ключу
print(groups[2021])  # если запрашиваемого ключа нет в словаре, KeyError не возникнет, но он добавится при последующем запросе

['Petrov', 'Markov']
[]


* Отличие dict от defaultdict: В dict нельзя указать хранимый в нём по умолчанию объект верно

#### Приведем несколько примеров модуля defayltdict

In [10]:
# Используя list в качестве default_factory, легко сгруппировать последовательность пар ключ-значение в словарь списков
s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
d = defaultdict(list)
for k, v in s:
    d[k].append(v)

sorted(d.items())

[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]

In [11]:
# При повторном обнаружении ключей поиск выполняется нормально (возвращая список для этого ключа), а операция list.append() 
# добавляет к списку еще одно значение. Этот метод проще и быстрее, чем эквивалентный метод с использованием dict.setdefault():
d = {}
for k, v in s:
    d.setdefault(k, []).append(v)

sorted(d.items())

[('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]

In [8]:
# Установка default_factory int делает defaultdict полезным для подсчета
s = 'mississippi'
d = defaultdict(int)
for k in s:
    d[k] += 1

sorted(d.items())

[('i', 4), ('m', 1), ('p', 2), ('s', 4)]

In [12]:
# Более быстрым и гибким способом создания константных функций является использование лямбда-функции, 
# которая может предоставить любое постоянное значение (а не только ноль)
def constant_factory(value):
    return lambda: value
d = defaultdict(constant_factory('<missing>'))
d.update(name='John', action='ran')
'%(name)s %(action)s to %(object)s' % d

'John ran to <missing>'

In [13]:
# Установка default_factory setделает defaultdict полезным для построения словаря множеств
s = [('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)]
d = defaultdict(set)
for k, v in s:
    d[k].add(v)

sorted(d.items())

[('blue', {2, 4}), ('red', {1, 3})]

# Модуль OrderedDict
Специальный словарь, который гарантирует сохранение ключей в порядке их добавления, называется OrderedDict

In [14]:
from collections import OrderedDict
data = [('Ivan', 19),('Mark', 25),('Andrey', 23),('Maria', 20)]
ordered_client_ages = OrderedDict(data)
print(ordered_client_ages)

OrderedDict([('Ivan', 19), ('Mark', 25), ('Andrey', 23), ('Maria', 20)])


#### Несколько операций с модулем OrderedDict

In [17]:
# Сортируем по второму значению из кортежа, то есть по возрасту
ordered_client_ages = OrderedDict(sorted(data, key=lambda x: x[1]))
print(ordered_client_ages)
# Если теперь добавить нового человека в словарь
ordered_client_ages['Nikita'] = 18
print(ordered_client_ages)
# Если удалить элемент, а затем добавить его снова, он также окажется в конце
del ordered_client_ages['Andrey']
print(ordered_client_ages)
ordered_client_ages['Andrey'] = 23
print(ordered_client_ages)

OrderedDict([('Ivan', 19), ('Maria', 20), ('Andrey', 23), ('Mark', 25)])
OrderedDict([('Ivan', 19), ('Maria', 20), ('Andrey', 23), ('Mark', 25), ('Nikita', 18)])
OrderedDict([('Ivan', 19), ('Maria', 20), ('Mark', 25), ('Nikita', 18)])
OrderedDict([('Ivan', 19), ('Maria', 20), ('Mark', 25), ('Nikita', 18), ('Andrey', 23)])


# Модуль Deque

- Deque (double-ended queue — двухконцевая очередь) - инструмент для работы с упорядоченными структурами данных **очереди** и **рюкзаки (стеки)** совместно.

- Очередь — это упорядоченный тип данных, который обладает двумя ключевыми функциями: добавление элемента в конец очереди и извлечение самого первого элемента из очереди. FIFO (First In — First Out, «первым пришёл — первым ушёл»).

- Стек (stack — стопка) — это упорядоченный тип данных, который обладает двумя основными функциями: добавление элемента в конец стека и извлечение элемента из конца стека. LIFO (Last In — First Out, «последним пришёл — первым ушёл»).

In [2]:
# Для создания пустого дэка(deque), необходимо импортировать его из библиотеи collections:
from collections import deque
dq = deque() # задаем название пустого дэка
print(dq) 

deque([])


#### Ключевые функции модуля **deque**

In [7]:
# append  - добавление элемента в конец дэка
# appendleft - добавление элемента в начало дэка
dq.append('last element')
dq.appendleft('first element')
print(dq)
# Объект deque поддерживает индексацию элементов
print(dq[1])
# exted - добавить несколько элементов из итерируемого объекта в конец дэка
# extedleft - добавить несколько элементов из итерируемого объекта в начало дэка
dq.extend([1, 2, 3, 4, 5, 6, 7])
dq.extendleft([8, 9, 10, 11, 12, 13, 14])
print(dq)
# pop - удалить и вернуть элемент из конца дэка
# popleft - удалить и вернуть элемент из начала дэка
del_first = dq.popleft()
print(del_first)
# del - удалить конкретный элемент по индексу
del dq[0]
print(dq)

deque(['first element', 12, 11, 10, 9, 8, 'last element', 'first element', 1, 2, 3, 4, 5, 6, 7, 'last element'])
12
deque([14, 13, 12, 11, 10, 9, 8, 'first element', 12, 11, 10, 9, 8, 'last element', 'first element', 1, 2, 3, 4, 5, 6, 7, 'last element', 1, 2, 3, 4, 5, 6, 7])
14
deque([12, 11, 10, 9, 8, 'first element', 12, 11, 10, 9, 8, 'last element', 'first element', 1, 2, 3, 4, 5, 6, 7, 'last element', 1, 2, 3, 4, 5, 6, 7])


#### Дополнительные фукции модуля deque

In [12]:
# Необходимость создания очереди с ограниченной максимальной длинной 
dq_new = deque(maxlen=3)
print(dq_new)
dq_new_limited = deque([1, 2, 3, 4, 5, 6, 7], maxlen=3)
print(dq_new_limited)
dq_new_limited.append(8)
# Отметка 1: в очередях с ограниченной длиной сохраняются только последние элементы, а первые исчезают из памяти.
print(dq_new_limited)
# Отметка 2: удаляемый элемент не возвращается, а просто исчезает
# меняем порядок элементов в очереди на обратный
dq_two = deque(['q', 'w', 'e', 'r', 't'])
dq_two.reverse()
print(dq_two)
# переносим n заданных элементов из конца очереди в начало
dq_two.rotate(2)
print(dq_two)
# или из начала в конец
dq_two.rotate(-2)
print(dq_two)
print (dq_two.index('e'))  # поиск первого идекса искомого элемента
print (dq_two.count('r'))  # посчитать сколько раз элемент встретился в очереди
dq_two.clear()  # очистить очередь
print(dq_two)


deque([], maxlen=3)
deque([5, 6, 7], maxlen=3)
deque([6, 7, 8], maxlen=3)
deque(['t', 'r', 'e', 'w', 'q'])
deque(['w', 'q', 't', 'r', 'e'])
deque(['t', 'r', 'e', 'w', 'q'])
2
1
deque([])


- Пример использования функции maxlen в модуле deque:

In [6]:
# Посчитаем динамику средней температуры с усреднением за каждые последние 7 дней для каждого рассматриваемого дня.

temps = [20.6, 19.4, 19.0, 19.0, 22.1,
        22.5, 22.8, 24.1, 25.6, 27.0,
        27.0, 25.6, 26.8, 27.3, 22.5,
        25.4, 24.4, 23.7, 23.6, 22.6,
        20.4, 17.9, 17.3, 17.3, 18.1,
        20.1, 22.2, 19.8, 21.3, 21.3,
        21.9]
days = deque(maxlen=7)
 
# Для этого воспользуемся очередью с параметром maxlen=7

for temp in temps:
    # Добавляем температуру в очередь
    days.append(temp)
    # Если длина очереди оказалась равной максимальной длине очереди (7),
    # печатаем среднюю температуру за последние 7 дней
    if len(days) == days.maxlen:
        print(round(sum(days) / len(days), 2), end='; ')
# Напечатаем пустую строку, чтобы завершить действие параметра
# end. Иначе следующая строка окажется напечатанной на предыдущей
print("")
# Результат:
# 20.77; 21.27; 22.16; 23.3; 24.44; 24.94; 25.56; 26.2; 25.97;
# 25.94; 25.57; 25.1; 24.81; 24.21; 23.23; 22.57; 21.41; 20.4;
# 19.6; 19.1; 19.04; 18.96; 19.44; 20.01; 20.67;

20.77; 21.27; 22.16; 23.3; 24.44; 24.94; 25.56; 26.2; 25.97; 25.94; 25.57; 25.1; 24.81; 24.21; 23.23; 22.57; 21.41; 20.4; 19.6; 19.1; 19.04; 18.96; 19.44; 20.01; 20.67; 
