# Самурай без меча подобен самураю с мечом, но только без меча

Поэтому начнём с разновидностей словарей

# OrderedDict

In [1]:
from collections import OrderedDict

Обычный словарь, только помнит в каком порядке добавлялись элементы

имеет дополнительный метод popitem(last), который удаляет и возвращает последний добавленный элемент(last=True) или первый (last=False)

##### В целом, очень редко используется

копипаста из документации

In [2]:
d = {'banana': 3, 'apple': 4, 'pear': 1, 'orange': 2}

In [4]:
for i in d.items():
    print(i)

('banana', 3)
('apple', 4)
('pear', 1)
('orange', 2)


In [5]:
# dictionary sorted by key
OrderedDict(sorted(d.items(), key=lambda t: t[0]))

OrderedDict([('apple', 4), ('banana', 3), ('orange', 2), ('pear', 1)])

In [6]:
# dictionary sorted by length of the key string
OrderedDict(sorted(d.items(), key=lambda t: len(t[0])))

OrderedDict([('pear', 1), ('apple', 4), ('banana', 3), ('orange', 2)])

# defaultdict

Обычный словарь, но со значением по умолчанию, которое можно задавать.

In [8]:
from collections import defaultdict

### Как создать

defaultdict(default_factory)

default_factory - вызываемый объект для создания значения по умолчанию

In [6]:
print(defaultdict(int))
print(defaultdict(float))
print(defaultdict(list))
print(defaultdict(dict))
print(defaultdict(lambda: 7))

defaultdict(<class 'int'>, {})
defaultdict(<class 'float'>, {})
defaultdict(<class 'list'>, {})
defaultdict(<class 'dict'>, {})
defaultdict(<function <lambda> at 0x7f09890706a8>, {})


Чем плохо так писать?

In [10]:
default = {'id': 0}
ddict = defaultdict(lambda: default)

In [11]:
ddict['lol']['id'] = 8
ddict[1]['id'] = 'azaza'
print(ddict)

defaultdict(<function <lambda> at 0x000002030B23E840>, {'lol': {'id': 'azaza'}, 1: {'id': 'azaza'}})


In [12]:
ddict = defaultdict(lambda: {'id': 0})

In [13]:
ddict['lol']['id'] = 8
ddict[1]['id'] = 'azaza'
print(ddict)

defaultdict(<function <lambda> at 0x000002030B23E048>, {'lol': {'id': 8}, 1: {'id': 'azaza'}})


### Как обычно используют

Чтобы сгруппировать данные

In [24]:
s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
d = defaultdict(list)
for k, v in s:
    d[k].append(v)

d.items()

dict_items([('yellow', [1, 3]), ('blue', [2, 4]), ('red', [1])])

Либо когда лень писать код проверки наличия объекта в коллекции (например в рекомендациях для новых товаров нет статистики появлений)

# Counter

Counter позволяет хранить частоты объектов, по сути defaultdict(int), но предоставляет дополнительные методы для работы счётчиков за счёт ограничения на тип значений

In [35]:
from collections import Counter

### Как создать

In [36]:
c = Counter()                           # a new, empty counter
print(c)
c = Counter('gallahad')                 # a new counter from an iterable
print(c)
c = Counter({'red': 4, 'blue': 2})      # a new counter from a mapping
print(c)
c = Counter(cats=4, dogs=8)             # a new counter from keyword args
print(c)

Counter()
Counter({'a': 3, 'l': 2, 'g': 1, 'h': 1, 'd': 1})
Counter({'red': 4, 'blue': 2})
Counter({'dogs': 8, 'cats': 4})


### Наиболее полезные функции

In [37]:
c = Counter('dsgfkasgfljshdfashfgashjdfgajsgfhajksgfdalkjfgasjh')
print(c)

Counter({'s': 8, 'f': 8, 'g': 7, 'a': 7, 'j': 6, 'h': 5, 'd': 4, 'k': 3, 'l': 2})


most_common(n) - возвращает n самых частых

#### Примечание:
работает за $O(len(c) * \log n)$

In [38]:
c.most_common(3) # 3 most common elemts

[('s', 8), ('f', 8), ('g', 7)]

substract(cnt) и update(cnt)  - обновление счётчиков

In [42]:
c = Counter(a=4, b=2, c=0, d=-2)
d = Counter(a=1, b=2, c=3, d=4)
c.subtract(d)
print(c)
c.update(d)
print(c)

Counter({'a': 3, 'b': 0, 'c': -3, 'd': -6})
Counter({'a': 4, 'b': 2, 'c': 0, 'd': -2})


Можно передавать всё, от чего берётся Counter

In [44]:
c.update(a=4)
print(c)
c.update('aaaa')
print(c)
c.update({'a': 4})
print(c)

Counter({'a': 20, 'b': 2, 'c': 0, 'd': -2})
Counter({'a': 24, 'b': 2, 'c': 0, 'd': -2})
Counter({'a': 28, 'b': 2, 'c': 0, 'd': -2})


Можно читерить и делать счётчики нецелыми

In [45]:
c = Counter(a=4.1, b=-2.5, c=0.01, d=-2.3, f=0)
print(c)
print(c.most_common(2))

Counter({'a': 4.1, 'c': 0.01, 'f': 0, 'd': -2.3, 'b': -2.5})
[('a', 4.1), ('c', 0.01)]


Частые патерны использования

In [20]:
print(sum(c.values()))                 # total of all counts
print(list(c))                         # list unique elements
print(set(c))                          # convert to a set
print(dict(c))                         # convert to a regular dictionary
print(c.items())                       # convert to a list of (elem, cnt) pairs
print(Counter(dict([(1, 2), (3, 4)]))) # convert from a list of (elem, cnt) pairs
n = 3
print(c.most_common()[:-n-1:-1])       # n least common elements
c += Counter()                        # remove zero and negative counts
print(c)

-0.6900000000000004
['f', 'c', 'b', 'd', 'a']
{'f', 'c', 'b', 'd', 'a'}
{'f': 0, 'c': 0.01, 'b': -2.5, 'd': -2.3, 'a': 4.1}
dict_items([('f', 0), ('c', 0.01), ('b', -2.5), ('d', -2.3), ('a', 4.1)])
Counter({3: 4, 1: 2})
[('b', -2.5), ('d', -2.3), ('f', 0)]
Counter({'a': 4.1, 'c': 0.01})


### Как обычно используют

Как следует из названия - чтобы считать счётчики.

In [46]:
visits = [{'id': 1}, {'id': 10}, {'id': 4}, {'id': 2}, {'id': 4}, {'id': 1}]
occurences = Counter()
for item in visits:
    occurences[item['id']] += 1
print(occurences)
print(Counter(x['id'] for x in visits))

Counter({1: 2, 4: 2, 10: 1, 2: 1})
Counter({1: 2, 4: 2, 10: 1, 2: 1})


In [49]:
visits = [{'id': 1}, {'id': 10}, {'id': 4}, {'id': 2}, {'id': 4}, {'id': 1}]
[x['id'] for x in visits]

[1, 10, 4, 2, 4, 1]

# namedtuple

In [50]:
from collections import namedtuple

Как следует из названия это tuple, но вместо индексов используются слова.

Неизменяемый объект.

Нужен, когда важна читабельность кода и память. Ведёт себя как обычный tuple, просто с добавлением обращений по имени.

Особо разглагольствовать не будем, простой пример.

In [51]:
import random
import time
import sys

In [76]:
ComplexObject = namedtuple(
    'ComplexObject', 
    'first_property second_property fourth_property do_you_know_where_the_third_property_is'
)

print(ComplexObject(**{
        'first_property': 1,
        'second_property': 2,
        'fourth_property': 4,
        'do_you_know_where_the_third_property_is': False
    }))

ComplexObject(first_property=1, second_property=2, fourth_property=4, do_you_know_where_the_third_property_is=False)


In [82]:
objects_namedtuple = {
    k: ComplexObject(**v)
    for k, v in objects_dict.items()
}
print('namedtuple object size is', sys.getsizeof(objects_namedtuple[0]))

namedtuple object size is 80


In [88]:
objects_namedtuple[0]

ComplexObject(first_property=0.8493616650077048, second_property=0.6129510859223699, fourth_property=0.5369867664999318, do_you_know_where_the_third_property_is=True)

In [118]:
class MObject(object):
    __slots__ = ('first_property', 'second_property', 'fourth_property', 'do_you_know_where_the_third_property_is')
    def __init__(self, first_property, second_property, fourth_property, do_you_know_where_the_third_property_is):
        self.first_property = first_property
        self.second_property = second_property
        self.fourth_property = fourth_property
        self.do_you_know_where_the_third_property_is = do_you_know_where_the_third_property_is

In [126]:
objects_dict = {
    x: {
        'first_property': random.random(),
        'second_property': random.random(),
        'fourth_property': random.random(),
        'do_you_know_where_the_third_property_is': random.random() < 0.5,
    }
    for x in range(100000)
}
print('dict object size is', sys.getsizeof(objects_dict[0]))

ComplexObject = namedtuple(
    'ComplexObject', 
    'first_property second_property fourth_property do_you_know_where_the_third_property_is'
)

print(ComplexObject(
    first_property=1, 
    second_property=2, 
    fourth_property=4, 
    do_you_know_where_the_third_property_is=False
))
print(ComplexObject(**{
        'first_property': 1,
        'second_property': 2,
        'fourth_property': 4,
        'do_you_know_where_the_third_property_is': False
    }))

objects_namedtuple = {
    k: ComplexObject(**v)
    for k, v in objects_dict.items()
}
print('namedtuple object size is', sys.getsizeof(objects_namedtuple[0]))

class MObject(object):
    __slots__ = ('first_property', 'second_property', 'fourth_property', 'do_you_know_where_the_third_property_is')
    def __init__(self, first_property, second_property, fourth_property, do_you_know_where_the_third_property_is):
        self.first_property = first_property
        self.second_property = second_property
        self.fourth_property = fourth_property
        self.do_you_know_where_the_third_property_is = do_you_know_where_the_third_property_is
        
print(MObject(
    first_property=1, 
    second_property=2, 
    fourth_property=4, 
    do_you_know_where_the_third_property_is=False
))
print(MObject(**{
        'first_property': 1,
        'second_property': 2,
        'fourth_property': 4,
        'do_you_know_where_the_third_property_is': False
    }))

objects_class = {
    k: MObject(**v)
    for k, v in objects_dict.items()
}
print('slots class object size is', sys.getsizeof(objects_namedtuple[0]))

dict object size is 240
ComplexObject(first_property=1, second_property=2, fourth_property=4, do_you_know_where_the_third_property_is=False)
ComplexObject(first_property=1, second_property=2, fourth_property=4, do_you_know_where_the_third_property_is=False)
namedtuple object size is 80
<__main__.MObject object at 0x000002030D985D38>
<__main__.MObject object at 0x000002030D985D38>
slots class object size is 80


In [136]:
obj = objects_dict[1213]
obj['first_property']
obj['do_you_know_where_the_third_property_is']
a = True
a ^= obj['do_you_know_where_the_third_property_is']
print( obj['do_you_know_where_the_third_property_is'])
print(a)

False
True


In [141]:
a = False
b = False
b ^= a
b

False

In [143]:
%%time
total_time = 0.
first_value = 0.
second_value = 0.
fourth_value = 0.
bool_value = False
random.seed(42)
for _ in range(1000000):
    index = random.randint(0, 99999)
    obj = objects_dict[index]
    bool_value ^= obj['do_you_know_where_the_third_property_is'] # add by mod 2 
    first_value += obj['first_property']
    second_value += obj['second_property']
    fourth_value += obj['fourth_property']
    
    start = time.time()
    obj['do_you_know_where_the_third_property_is']
    obj['first_property']
    obj['second_property']
    obj['fourth_property']
    total_time += time.time() - start
    
print(first_value)
print(second_value)
print(fourth_value)
print(bool_value)

print(total_time)

500283.85902593005
500724.5181938287
500840.9708169922
True
0.20608282089233398
Wall time: 2.45 s


In [144]:
%%time
total_time = 0.
first_value = 0.
second_value = 0.
fourth_value = 0.
bool_value = False
random.seed(42)
for _ in range(1000000):
    index = random.randint(0, 99999)
    obj = objects_namedtuple[index]
    bool_value ^= obj.do_you_know_where_the_third_property_is
    first_value += obj.first_property
    second_value += obj.second_property
    fourth_value += obj.fourth_property
    
    start = time.time()
    obj.do_you_know_where_the_third_property_is
    obj.first_property
    obj.second_property
    obj.fourth_property
    total_time += time.time() - start
    
print(first_value)
print(second_value)
print(fourth_value)
print(bool_value)

print(total_time)

500283.85902593005
500724.5181938287
500840.9708169922
True
0.3136444091796875
Wall time: 2.63 s


In [146]:
%%time
total_time = 0.
first_value = 0.
second_value = 0.
fourth_value = 0.
bool_value = False
random.seed(42)
for _ in range(1000000):
    index = random.randint(0, 99999)
    obj = objects_class[index]
    bool_value ^= obj.do_you_know_where_the_third_property_is
    first_value += obj.first_property
    second_value += obj.second_property
    fourth_value += obj.fourth_property
    
    start = time.time()
    obj.do_you_know_where_the_third_property_is
    obj.first_property
    obj.second_property
    obj.fourth_property
    total_time += time.time() - start
    
print(first_value)
print(second_value)
print(fourth_value)
print(bool_value)

print(total_time)

500283.85902593005
500724.5181938287
500840.9708169922
True
0.22785377502441406
Wall time: 2.27 s


#### Мораль не используйте namedtuple если нужна производительность, используйте слоты или словари, но в последнем случае тот, кто будет читать ваш код, будет очень сильно вас не любить

### Чтобы не писать slots самому воспользуйтесь библиотекой recordclass

# deque

реализует двусторонюю очередь с быстрым индексированием объектов

Так как курс не про алгоритмы, то на этом всё :)

#### Главное помнить, что индексирование быстрое, а также добавление, удаление в начало и в конец. Всё остальное медленное и лучше это не использовать. Только если очень хочется.

Копипаста из документации:

In [147]:
from collections import deque

In [154]:
d = deque('ghi')                 # make a new deque with three items
for elem in d:                   # iterate over the deque's elements
    print(elem.upper())

G
H
I


In [151]:
d.append('j')                    # add a new entry to the right side
d.appendleft('f')                # add a new entry to the left side
d                                # show the representation of the deque

deque(['f', 'h', 'j'])

In [152]:
d.pop()                          # return and remove the rightmost item
d.popleft()                      # return and remove the leftmost item
list(d)                          # list the contents of the deque

['h']

In [155]:
d[0]

'g'

In [156]:
d[-1]

'i'

In [157]:
list(reversed(d)) 

['i', 'h', 'g']

In [158]:
'h' in d

True

In [159]:
d.extend('jkl')
d

deque(['g', 'h', 'i', 'j', 'k', 'l'])

In [160]:
d.rotate(1) 
d

deque(['l', 'g', 'h', 'i', 'j', 'k'])

In [43]:
d.rotate(-1) 
d

deque(['g', 'h', 'i', 'j', 'k', 'l'])

In [161]:
deque(reversed(d)) 

deque(['k', 'j', 'i', 'h', 'g', 'l'])

In [162]:
d.clear()                        # empty the deque
d.pop()                          # cannot pop from an empty deque

IndexError: pop from an empty deque

In [163]:
d.extendleft('abc')              # extendleft() reverses the input order
d

deque(['c', 'b', 'a'])