# Collections
`Collections` - это модуль, который содержит разные полезные классы-контейнеры, которые часто удобнее использовать вместо обычных контейнеров (`dict`, `list`, `set`, `tuple`). [Документация](https://docs.python.org/3/library/collections.html)

## `deque`
`deque` = Double-Ended QUEue - это двусторонняя очередь. Ее удобно использовать, когда вам нужен класс стека или очереди. Уметь писать эти классы полезно, но легко сделать ошибку. Поэтому удобнее и надежнее на практике использовать класс `deque`.

In [5]:
from collections import deque

`deque` как стек:

In [6]:
stack = deque()
stack.append('X')  # вместо push обычный append, как у массивов
stack.append('Y')
print(stack.pop())
print(stack.pop())

Y
X


`deque` как очередь:

In [7]:
queue = deque()
queue.append('U')  # append используется и вместо enqueue
queue.append('V')
queue.append('W')
print(queue.popleft())   # вместо dequeue используется popleft
print(queue.popleft())
print(queue.popleft())

U
V
W


Еще очень удобно использовать `deque`, когда вам нужно хранить заданное количество элементов, и удалять старые при появлении новых. Например, если мы делаем сайт с какой-то поисковой формой, и на отдельной странице мы хотим показывать 6 последних запросов пользователей. Классу  `deque` можно задать максимальную длину (`maxlen`), тогда старые элементы будут удалятся при добавлении новых, если длина `deque` достигла `maxlen`.

In [8]:
recent_words = deque(['Иван', 'родил', 'девчонку', 'велел', 'тащить', 'пеленку'], 6)  # максимальная длина = 6
recent_words.append('падежи')
recent_words.append('этажи')
print(recent_words)

deque(['девчонку', 'велел', 'тащить', 'пеленку', 'падежи', 'этажи'], maxlen=6)


В классе `deque` есть и другие удобные возможности. Вот некоторые методы, которые их реализуют:

In [None]:
clear
count
extend, extendleft
index
insert
remove
reverse
rotate

## `defaultdict`
Это словарь, в котором задано значение по умолчанию. Это значит, что такой словарь никогда не упадет, если попробовать достать из него ключ, которого там нет: он скажет, что ключ там есть и вернет значение по умолчанию.

Например, если нам нужно посчитать вхождения каждого слова в тексте, мы можем вместо такого:

In [42]:
text = "Love love me do You know I love you I ll always be true So please love me do Oh love me do".lower().split()
words = {}
for word in text:
    if word not in words:
        words[word] = 0
    words[word] += 1
    
print(words)

{'do': 3, 'you': 2, 'true': 1, 'love': 5, 'always': 1, 'i': 2, 'me': 3, 'll': 1, 'so': 1, 'know': 1, 'please': 1, 'be': 1, 'oh': 1}


...написать такое:

In [20]:
from collections import defaultdict

words = defaultdict(int)
for word in text:
    words[word] += 1
    
print(words)

defaultdict(<class 'int'>, {'do': 3, 'you': 2, 'true': 1, 'love': 5, 'always': 1, 'i': 2, 'me': 3, 'll': 1, 'so': 1, 'know': 1, 'please': 1, 'be': 1, 'oh': 1})


Чтобы `defaultdict`　работал и не падал, нужно передать ему функцию, которая будет возвращать значение по умолчанию при отстутствии ключа. В примере выше используется встроенная функция `int`, которая по умолчанию возвращает 0. Кроме этого можно использовать, например, `list`, `dict` или какую-то свою функцию. 

## `OrderedDict`

Стандартные словари в питоне неупорядочены. То есть если мы будем проходить по двум одинаковым словарям циклом и, например, распечатывать значения, то мы можем получить значения в разном порядке. 

Если нам важно хранить и сами пары ключ-значение, и порядок, в котором мы их получили, то нум понадобится `OrderedDict`. То, что распечается при проходе по такому словарю, всегда легко предсказуемо - это удобно при тестировании и дебаггинге, например.

Поскольку, `OrderedDict` хранит порядок, то его можно использовать совместо с `sorted`, чтобы получить отсортированный словарь. Так что вместо такого:

In [50]:
for i in sorted(words):
    print(i, '-', words[i], end='  ')

always - 1  be - 1  do - 3  i - 2  know - 1  ll - 1  love - 5  me - 3  oh - 1  please - 1  so - 1  true - 1  you - 2  

... или такого:

In [51]:
for i in sorted(words, key=lambda t: (words[t], t)):
    print(i, '-', words[i], end='  ')

always - 1  be - 1  know - 1  ll - 1  oh - 1  please - 1  so - 1  true - 1  i - 2  you - 2  do - 3  me - 3  love - 5  

... можно написать так:

In [52]:
from collections import OrderedDict

od = OrderedDict(sorted(words.items()))
print(od)

OrderedDict([('always', 1), ('be', 1), ('do', 3), ('i', 2), ('know', 1), ('ll', 1), ('love', 5), ('me', 3), ('oh', 1), ('please', 1), ('so', 1), ('true', 1), ('you', 2)])


In [53]:
od = OrderedDict(sorted(words.items(), key=lambda t: (t[1], t[0])))
print(od)

OrderedDict([('always', 1), ('be', 1), ('know', 1), ('ll', 1), ('oh', 1), ('please', 1), ('so', 1), ('true', 1), ('i', 2), ('you', 2), ('do', 3), ('me', 3), ('love', 5)])


In [49]:
print(od['always'])

1


## `Counter`

`Counter` - это словарь, который, как следует из названия, умеет подсчитывать количество вхождений. 

`Counter` получает на вход итерируемый объект , например, массив (или строку, или итератор и т.д.), и возвращает словарь, в котором ключи - элементы массива, а значения - количество их вхождений. Значения могут принимать любое целое значение (т.е. можно отрицательные и ноль). 

Пример с текстом выше, можно было написать так:

In [58]:
from collections import Counter

words = Counter(text)
print(words)

Counter({'love': 5, 'do': 3, 'me': 3, 'you': 2, 'i': 2, 'true': 1, 'always': 1, 'll': 1, 'so': 1, 'know': 1, 'please': 1, 'be': 1, 'oh': 1})


Как `defaultdict`, `Counter` не падает, когда ключа нет в словаре, а возвращает 0.

In [56]:
c = Counter()
print(c['hello'])

0


Частые паттерны использования `Counter` (из документации):

In [None]:
sum(c.values())                 # total of all counts
c.clear()                       # reset all counts
list(c)                         # list unique elements
set(c)                          # convert to a set
dict(c)                         # convert to a regular dictionary
c.items()                       # convert to a list of (elem, cnt) pairs
Counter(dict(list_of_pairs))    # convert from a list of (elem, cnt) pairs
c.most_common()[:-n-1:-1]       # n least common elements
+c                              # remove zero and negative counts

# Задания
Для заданий понадобится взять какой-то текст.

1) Написать функцию, которая считает количество вхождений каждого символа в тексте.

2) Предположим каждое слово в тексте пронумеровано. Написать функцию, которая для каждой словоформы в тексте распечатывает все номера, соответствующие ей. Регистр нужно игнорировать. Например:
    
    вход: `Love love me do You know I love you`
    
    выход:
        