# Структуры данных модуля Collections

<a target="_blank" href="https://colab.research.google.com/github/sozykin/middle_python/blob/main/02/02_collections.ipynb">
  <img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/>
</a>

## Двусвязная очередь (deque)

Оптимизирована для вставки и извлечения элементов как в начало, так и в конец очереди. [Сложность выполнения операций для структур данных в Python](https://wiki.python.org/moin/TimeComplexity).

In [2]:
from collections import deque

In [34]:
queue = deque()

Добавляем людей в очередь

In [35]:
queue.append('Иван')
queue.append('Петр')
queue.append('Мария')

In [36]:
queue

deque(['Иван', 'Петр', 'Мария'])

In [37]:
queue.append('Николай')

In [38]:
queue

deque(['Иван', 'Петр', 'Мария', 'Николай'])

In [39]:
list(reversed(queue))

['Николай', 'Мария', 'Петр', 'Иван']

In [40]:
queue.rotate()

In [41]:
queue

deque(['Николай', 'Иван', 'Петр', 'Мария'])

Извлекаем людей из очереди

In [22]:
next_person = queue.popleft()

In [23]:
next_person

'Иван'

In [24]:
queue

deque(['Петр', 'Мария', 'Николай'])

In [25]:
next_person = queue.popleft()

In [26]:
next_person

'Петр'

In [27]:
queue

deque(['Мария', 'Николай'])

In [28]:
next_person = queue.pop()

In [29]:
next_person

'Николай'

In [30]:
queue

deque(['Мария'])

**Пример использования: извлекаем последние n строк из файла**

In [42]:
def tail(filename, n=10):
    with open(filename) as f:
        return deque(f, n)

In [47]:
queue = tail('sales.csv', 5)

In [48]:
queue

deque(['298923,2013-06-17,46,DELI,709.268,0\n',
       '298924,2013-06-17,46,EGGS,203.0,0\n',
       '298925,2013-06-17,46,FROZEN FOODS,249.0,0\n',
       '298926,2013-06-17,46,GROCERY I,5715.0,0\n',
       '298927,2013-06-17,46,GROCERY II,42.0,0\n'],
      maxlen=5)

## Счетчик объектов Counter

Считаем количество букв в строке с помощью обычного словаря

In [1]:
s = "Python для продвинутых специалистов"

In [3]:
counter = {}

In [4]:
for ch in s:
    if ch not in counter:
        counter[ch] = 0
    counter[ch] += 1

In [5]:
counter

{'P': 1,
 'y': 1,
 't': 1,
 'h': 1,
 'o': 1,
 'n': 1,
 ' ': 3,
 'д': 2,
 'л': 2,
 'я': 1,
 'п': 2,
 'р': 1,
 'о': 2,
 'в': 2,
 'и': 3,
 'н': 1,
 'у': 1,
 'т': 2,
 'ы': 1,
 'х': 1,
 'с': 2,
 'е': 1,
 'ц': 1,
 'а': 1}

Считаем количество букв в строке с помощью счетчика Counter

In [6]:
from collections import Counter

In [7]:
counter = Counter(s)

In [8]:
counter

Counter({' ': 3,
         'и': 3,
         'д': 2,
         'л': 2,
         'п': 2,
         'о': 2,
         'в': 2,
         'т': 2,
         'с': 2,
         'P': 1,
         'y': 1,
         't': 1,
         'h': 1,
         'o': 1,
         'n': 1,
         'я': 1,
         'р': 1,
         'н': 1,
         'у': 1,
         'ы': 1,
         'х': 1,
         'е': 1,
         'ц': 1,
         'а': 1})

In [9]:
counter.update("Python для ведущих специалистов")

In [10]:
counter

Counter({' ': 6,
         'и': 6,
         'д': 4,
         'л': 4,
         'в': 4,
         'с': 4,
         'п': 3,
         'о': 3,
         'т': 3,
         'е': 3,
         'P': 2,
         'y': 2,
         't': 2,
         'h': 2,
         'o': 2,
         'n': 2,
         'я': 2,
         'у': 2,
         'х': 2,
         'ц': 2,
         'а': 2,
         'р': 1,
         'н': 1,
         'ы': 1,
         'щ': 1})

Получаем данные из Counter

In [12]:
counter['y']

2

In [13]:
counter['p']

0

In [14]:
counter.most_common(5)

[(' ', 6), ('и', 6), ('д', 4), ('л', 4), ('в', 4)]

## Упорядоченный словарь OrderedDict

`OrderedDict` - упорядоченный словарь.

В Python 3.6 встроенный словарь `dict` также стал сохранять порядок элементов.

`OrderedDict` имеет специальные методы для эффективного изменения порядка элементов.

Создаем и используем упорядоченный словарь

In [15]:
from collections import OrderedDict

In [16]:
capitals = OrderedDict()

In [17]:
capitals['Россия'] = 'Москва'
capitals['Китай'] = 'Пекин'
capitals['Индия'] = 'Нью-Дели'

In [18]:
capitals

OrderedDict([('Россия', 'Москва'), ('Китай', 'Пекин'), ('Индия', 'Нью-Дели')])

In [19]:
capitals['Турция'] = 'Анкара'

In [20]:
capitals

OrderedDict([('Россия', 'Москва'),
             ('Китай', 'Пекин'),
             ('Индия', 'Нью-Дели'),
             ('Турция', 'Анкара')])

In [21]:
for key, value in capitals.items():
    print(key, value)

Россия Москва
Китай Пекин
Индия Нью-Дели
Турция Анкара


Создаем и используем обычный словарь

In [26]:
dict_capitals = dict()

In [27]:
dict_capitals['Россия'] = 'Москва'
dict_capitals['Китай'] = 'Пекин'
dict_capitals['Индия'] = 'Нью-Дели'

In [28]:
dict_capitals

{'Россия': 'Москва', 'Китай': 'Пекин', 'Индия': 'Нью-Дели'}

In [29]:
for key, value in dict_capitals.items():
    print(key, value)

Россия Москва
Китай Пекин
Индия Нью-Дели


Меняем порядок элементов в упорядоченном словаре

In [30]:
capitals.move_to_end('Китай')

In [31]:
capitals

OrderedDict([('Россия', 'Москва'),
             ('Индия', 'Нью-Дели'),
             ('Турция', 'Анкара'),
             ('Китай', 'Пекин')])

In [32]:
for key in reversed(capitals):
    print(key, capitals[key])

Китай Пекин
Турция Анкара
Индия Нью-Дели
Россия Москва


Сравнение словарей

In [36]:
dict1 = {'Россия': 'Москва', 'Китай': 'Пекин', 'Индия': 'Нью-Дели'}
dict2 = {'Россия': 'Москва', 'Индия': 'Нью-Дели', 'Китай': 'Пекин'}

o_dict1 = OrderedDict(Россия='Москва', Китай='Пекин', Индия='Нью-Дели')
o_dict2 = OrderedDict(Россия='Москва', Индия='Нью-Дели', Китай='Пекин', )

In [37]:
dict1 == dict2

True

In [38]:
o_dict1 == o_dict2

False

In [39]:
dict1 == o_dict1

True

In [40]:
dict2 == o_dict1

True

## ChainMap

In [54]:
from collections import ChainMap

In [49]:
default_config = {"ip": "localhost", "port": 80}
user_config = {"ip": "95.167.23.6", "proxy": "proxy.domain.ru"}
cmd_config = {"proxy": "my_proxy.domain.ru", "user": "asozykin"}

In [50]:
default_config

{'ip': 'localhost', 'port': 80}

In [51]:
user_config

{'ip': '95.167.23.6', 'proxy': 'proxy.domain.ru'}

In [52]:
cmd_config 

{'proxy': 'my_proxy.domain.ru', 'user': 'asozykin'}

In [55]:
config = ChainMap(cmd_config, user_config, default_config)

In [56]:
config

ChainMap({'proxy': 'my_proxy.domain.ru', 'user': 'asozykin'}, {'ip': '95.167.23.6', 'proxy': 'proxy.domain.ru'}, {'ip': 'localhost', 'port': 80})

In [57]:
config['user']

'asozykin'

In [60]:
config['proxy']

'my_proxy.domain.ru'

In [59]:
config['ip']

'95.167.23.6'

In [61]:
config['port']

80

## Именованные кортежи (namedtuple)

In [68]:
point_1 = (10, 5)
point_2 = (15, 3)

In [69]:
import math

In [70]:
distance = math.sqrt((point_1[0] - point_2[0])**2 + (point_1[1] - point_2[1])**2)

In [71]:
distance

5.385164807134504

Создаем именованный кортеж

In [72]:
from collections import namedtuple

In [73]:
Point = namedtuple("Point", "x y")

In [74]:
issubclass(Point, tuple)

True

In [75]:
point_1 = Point(10, 5)
point_2 = Point(15, 3)

In [76]:
distance = math.sqrt((point_1.x - point_2.x)**2 + (point_1.y - point_2.y)**2)

In [77]:
distance

5.385164807134504

## Словарь с обработкой отсутсвующих значений: defaultdict

In [78]:
from collections import defaultdict

In [79]:
s = "Python для продвинутых специалистов"

In [84]:
counter = {}

In [81]:
for ch in s:
    counter[ch] += 1

KeyError: 'P'

In [85]:
counter['P']

KeyError: 'P'

Создаем словарь, который вызывает функцию `int()` для инициализации значений отсуствующих ключей

In [86]:
counter = defaultdict(int)

In [87]:
counter['P']

0

In [88]:
counter['y']

0

In [89]:
for ch in s:
    counter[ch] += 1

In [90]:
counter

defaultdict(int,
            {'P': 1,
             'y': 1,
             't': 1,
             'h': 1,
             'o': 1,
             'n': 1,
             ' ': 3,
             'д': 2,
             'л': 2,
             'я': 1,
             'п': 2,
             'р': 1,
             'о': 2,
             'в': 2,
             'и': 3,
             'н': 1,
             'у': 1,
             'т': 2,
             'ы': 1,
             'х': 1,
             'с': 2,
             'е': 1,
             'ц': 1,
             'а': 1})

Используем свою функцию инициализации

In [91]:
def new_value():
    return 5

In [92]:
dict_5 = defaultdict(new_value)

In [93]:
dict_5['Тест']

5

In [94]:
dict_5['Новый тест'] += 1