# Модуль Collections.

Модуль collections содержит специализированный контейнер типов данных, который может быть использован для замены контейнеров общего назначения Python (dict, tuple, list, и set). Мы изучим следующие части этого замечательного модуля:


    ChainMap
    defaultdict
    OrderedDict
    Counter


**ChainMap**

ChainMap – это класс, который дает возможность объединить несколько сопоставлений вместе таким образом, чтобы они стали единым целым. Если вы обратитесь к документации, то увидите, что данный класс принимает **maps*. 

Это значит, что ChainMap будет принимать любое количество сопоставлений или словарей и превращать их в единое обновляемое представление.

In [24]:
from collections import ChainMap
 
car_parts = {
    'hood': 500,
    'engine': 5000,
    'front_door': 750
}
 
car_accessories = {
    'cover': 100,
    'hood_ornament': 150,
    'seat_cover': 99
}

car_options = {
    'A/C': 1000,
    'Turbo': 2500,
    'rollbar': 300
}
 

car_pricing = ChainMap(car_accessories, car_options, car_parts)
 
print(car_pricing['hood']) # 500
car_pricing.parents # все кроме первого


500


ChainMap({'A/C': 1000, 'Turbo': 2500, 'rollbar': 300}, {'hood': 500, 'engine': 5000, 'front_door': 750})

Здесь мы импортировали ChainMap из модуля collections. Затем мы создали три словаря Python. Далее, мы создали экземпляр ChainMap, передав эти три словаря. В конце мы попытались получить доступ к одному из ключей в нашем ChainMap. После этого, ChainMap пройдет через каждое сопоставление, чтобы увидеть, существует ли данный ключ и имеет ли он значение. Если это так, тогда ChainMap вернет первое найденное значение, которое соответствует ключу. Это весьма полезно в тех случаях, когда вам нужно установить настройки по умолчанию.

**Defaultdict**



Модуль collections содержит удобный инструмент под названием defaultdict. Это наследуемый класс Python dict, который принимает default_factory как первичный аргумент. Тип default_factory — это обычный тип Python, такой как int или list, но вы также можете использовать функцию или лямбду. Давайте начнем с создания обычного словаря Python, который считает, сколько раз было использовано каждое слово в предложении:

In [28]:
sentence = "The red for jumped over the fence and ran to the zoo for food"
words = sentence.split(' ')

reg_dict = {}
for word in words:
    if word in reg_dict:
        reg_dict[word] += 1
    else:
        reg_dict[word] = 1

print(reg_dict)

{'The': 1, 'red': 1, 'for': 2, 'jumped': 1, 'over': 1, 'the': 2, 'fence': 1, 'and': 1, 'ran': 1, 'to': 1, 'zoo': 1, 'food': 1}


In [29]:
# с defaultdict
from collections import defaultdict
 
sentence = "The red for jumped over the fence and ran to the zoo for food"
words = sentence.split(' ')
 
d = defaultdict(int)
for word in words:
    d[word] += 1
print(d)

defaultdict(<class 'int'>, {'The': 1, 'red': 1, 'for': 2, 'jumped': 1, 'over': 1, 'the': 2, 'fence': 1, 'and': 1, 'ran': 1, 'to': 1, 'zoo': 1, 'food': 1})


Этот код намного проще. Это связано с тем, что defaultdict автоматически назначает ноль как значение любому ключу, который еще не имеет значения. Мы добавили одно, так что теперь в нем больше смысла, и оно также будет увеличиваться, если слово повторяется в предложении несколько раз в предложении.

Давайте попробуем использовать тип списка в качестве нашей фабрики по умолчанию. Сначала мы начнем с обычного словаря так же, как мы делали это раньше:

In [31]:
my_list = [(1234, 100.23), (345, 10.45), (1234, 75.00),
           (345, 222.66), (678, 300.25), (1234, 35.67)]
 
reg_dict = {}
for acct_num, value in my_list:
    if acct_num in reg_dict:
        reg_dict[acct_num].append(value)
    else:
        reg_dict[acct_num] = [value]
print (reg_dict)

{1234: [100.23, 75.0, 35.67], 345: [10.45, 222.66], 678: [300.25]}


In [32]:
my_list = [(1234, 100.23), (345, 10.45), (1234, 75.00),
           (345, 222.66), (678, 300.25), (1234, 35.67)]
 
d = defaultdict(list)
for acct_num, value in my_list:
    d[acct_num].append(value)
print(d)

defaultdict(<class 'list'>, {1234: [100.23, 75.0, 35.67], 345: [10.45, 222.66], 678: [300.25]})


In [33]:
# лямбда-функция
animal = defaultdict(lambda: "Monkey")
animal['Sam'] = 'Tiger'
 
print(animal['Nick']) # Monkey
 
print(animal)

Monkey
defaultdict(<function <lambda> at 0x7fbb3879c268>, {'Sam': 'Tiger', 'Nick': 'Monkey'})


Здесь мы создали defaultdict, который назначает ‘Monkey’ в качестве значения по умолчания любому ключу. Мы установили в ‘Tiger’, далее, следующий ключ мы не устанавливаем вообще. Если выведите второй ключ, вы увидите, что он был назначен как ‘Monkey’. 

**Counter**

Модуль collections также предоставляет нам небольшой аккуратный инструмент, который поддерживает быстрый и удобный в пользовании калькулятор. Этот инструмент называется Counter. Вы можете запустить его против большинства итерируемых. Давайте попробуем взглянуть на него в строке.

In [35]:
from collections import Counter
 
a = Counter('superfluous')
 
# Counter({'u': 3, 's': 2, 'e': 1, 'l': 1, 'f': 1, 'o': 1, 'r': 1, 'p': 1})
print(a)
 
counter = Counter('superfluous')
print(counter['u'])

Counter({'u': 3, 's': 2, 'p': 1, 'e': 1, 'r': 1, 'f': 1, 'l': 1, 'o': 1})
3


В данном примере мы импортировали Counter из модуля collections и передали его строке. Это возвращает нам объект Counter, который является наследуемым классом словаря Python. Когда мы запускаем эту же команду, но назначаем её счетчик переменной, чтобы доступ к словарю был несколько проще. В данном случае, мы видим, что буква “u” встречается три раза в нашем примере. Класс Counter предоставляет несколько методов, которые могут вас заинтересовать. Например, вы можете вызывать элементы, которые будут выполнять итерацию над элементами, расположенными в словаре, но в произвольном порядке.

In [37]:
print(list(counter.elements()))
print(counter.elements())

['s', 's', 'u', 'u', 'u', 'p', 'e', 'r', 'f', 'l', 'o']
<itertools.chain object at 0x7fbb387f1c88>


Еще один полезный метод это most_common. Вы можете спросить Counter о том, какие объекты являются наиболее распространенными, передав число, отображающее наиболее часто повторяющие объекты:

In [38]:
print(counter.most_common(2))

[('u', 3), ('s', 2)]


Метод substract - очень классная штука!

In [39]:
counter_one = Counter('superfluous')
 
# Counter({'u': 3, 's': 2, 'e': 1, 'l': 1, 'f': 1, 'o': 1, 'r': 1, 'p': 1})
print(counter_one)
 
counter_two = Counter('super')
counter_one.subtract(counter_two)
 
print(counter_one)

Counter({'u': 3, 's': 2, 'p': 1, 'e': 1, 'r': 1, 'f': 1, 'l': 1, 'o': 1})
Counter({'u': 2, 's': 1, 'f': 1, 'l': 1, 'o': 1, 'p': 0, 'e': 0, 'r': 0})


**OrderedDict**

Модуль Python collections имеет еще один замечательный наследуемый класс dict под названием OrderedDict. Как подразумевается в его названии, этот словарь отслеживает порядок ключей после их добавления. Если вы создадите обычный dict, вы заметите, что данные в нем неупорядоченные:

In [58]:
d = {'banana': 3, 'apple':4, 'pear': 1, 'orange': 2}


In [70]:
keys = d.keys()
keys = sorted(keys)
 
for key in keys:
    print (key, d[key])

apple 4
banana 3
orange 2
pear 1


In [2]:
from collections import OrderedDict
 
d = {'banana': 3, 'apple':4, 'pear': 1, 'orange': 2}
new_d = OrderedDict(sorted(d.items()))
 
print(new_d)


OrderedDict([('apple', 4), ('banana', 3), ('orange', 2), ('pear', 1)])


В обычных словарях разный порядок ключей не исключает равенства, в OrderedDict - исключает, что иногда бывает весьма полезно.

In [3]:
d = {'banana': 3, 'apple':4, 'pear': 1, 'orange': 2}
b = {'apple':4, 'pear': 1, 'orange': 2,'banana': 3}
print (d == b)
d_ord = OrderedDict(d)
b_ord = OrderedDict(b)
print (d_ord == b_ord)

True
False


**Дома**

deque, namedtuple