# Словари

In [1]:
empty_dict = {}
empty_dict = dict()
print(empty_dict)

{}


In [2]:
collections_map = {
    'mutable': ['list', 'dict', 'set'],
    'immutable': ['tuple', 'frozenset']
}

print(collections_map['immutable'])

['tuple', 'frozenset']


Если мы попытаемся получить значение по несуществующему ключу, то получим исключение `KeyError`:

In [3]:
try:
    print(collections_map['another'])
except KeyError as e:
    print('Произошло исключение типа KeyError:', e)

Произошло исключение типа KeyError: 'another'


Иногда необходимо вернуть какое-то дефолтное значение, если ключа не существует:

In [4]:
print(collections_map.get('another', 'not found'))

not found


Чтобы проверить, содержится ли ключ в словаре, можно воспользоваться оператором `IN`:

In [5]:
print( 'another' in collections_map )

False


In [6]:
print( 'mutable' in collections_map )

True


## Добавление и удаление элементов

Так как словарь является изменяемой структурой данных, то мы можем добавлять, удалять элементы из него.

In [7]:
beatles_map = {
    'Paul': 'Bass',
    'John': 'Guitar',
    'George': 'Guitar'
}
print(beatles_map)

{'Paul': 'Bass', 'John': 'Guitar', 'George': 'Guitar'}


Добавление элемента:

In [8]:
beatles_map['Ringo'] = 'Drums'
print(beatles_map)

{'Paul': 'Bass', 'John': 'Guitar', 'George': 'Guitar', 'Ringo': 'Drums'}


Удаление элемента:

In [9]:
del beatles_map['John']
print(beatles_map)

{'Paul': 'Bass', 'George': 'Guitar', 'Ringo': 'Drums'}


Добавить ключ в словарь можно встроенным методом `update()`:

In [10]:
beatles_map.update({'John': 'Guitar'})
print(beatles_map)

{'Paul': 'Bass', 'George': 'Guitar', 'Ringo': 'Drums', 'John': 'Guitar'}


Чтобы удалить ключ-значение из словаря и вернуть значение, можно использовать метод `pop()`:

In [11]:
print(beatles_map.pop('Ringo'))

Drums


In [12]:
print(beatles_map)

{'Paul': 'Bass', 'George': 'Guitar', 'John': 'Guitar'}


Часто бывает необходимость проверить, существует ли ключ, и в случае отсутствия добавить новый ключ-значение:

In [13]:
unknown_dict = {}
print( unknown_dict.setdefault('key', 'default') )

default


In [14]:
print(unknown_dict)

{'key': 'default'}


Если мы попытаемся установить уже существующий ключ, то к нам вернется значение `default`:

In [15]:
print( unknown_dict.setdefault('key', 'new_default') )

default


## Итерация

Словари как и все коллекции поддерживает протокол итерации.

In [16]:
print(collections_map)

{'mutable': ['list', 'dict', 'set'], 'immutable': ['tuple', 'frozenset']}


Итерация по ключам:

In [17]:
for k in collections_map:
    print(k)

mutable
immutable


Итерация по ключам и их значениям:

In [18]:
for k, v in collections_map.items():
    print('{} - {}'.format(k, v))

mutable - ['list', 'dict', 'set']
immutable - ['tuple', 'frozenset']


Итерация по значениям:

In [19]:
for v in collections_map.values():
    print(v)

['list', 'dict', 'set']
['tuple', 'frozenset']


## OrderedDict

Словари содержат ключи в неупорядочненном виде. Существует тип `OrderedDict` модуля `collections` который гарантирует, что ключи содержаться именно в том порядке, в каком вы их добавили в словарь.

In [20]:
from collections import OrderedDict

ordered = OrderedDict()

for number in range(10):
    ordered[number] = str(number) # В индекс словаря помещаем число-значение в виде строки

print(ordered)

OrderedDict([(0, '0'), (1, '1'), (2, '2'), (3, '3'), (4, '4'), (5, '5'), (6, '6'), (7, '7'), (8, '8'), (9, '9')])


In [23]:
for key in ordered:
    print(key, end="")

0123456789

## Итоги

Словарь:
* Изменяемый неупорядоченный набор пар ключ-значение
* Быстрый доступ к значению по ключу
* Быстрая проверка на вхождение ключа в словарь

## Словари. Пример программы

Задача: Найти 3 самых часто встречающихся слова в Zen Python

In [27]:
# import this # При импортировании выводится текст Zen of Python

zen = """The Zen of Python, by Tim Peters
 
Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!
"""

zen_map = {}

for word in zen.split():
    cleaned_word = word.strip('.,!-').lower()
    if cleaned_word not in zen_map:
        zen_map[cleaned_word] = 0

    zen_map[cleaned_word] += 1

#print(zen_map)

zen_items = zen_map.items() # Получим список tuple
#print(zen_items)

# Сейчас мы можем сортировать по второму элементу кортежей (tuple) в списке,
# для этого нам понадобится модуль operator и функция sorted:
import operator
word_count_items = sorted(
    zen_items,
    key=operator.itemgetter(1), # Сортировка по первому индексу
    reverse=True # Так как нам нужны самые популярные слова, то включим разворот результатов
)
# Задача решена:
print(word_count_items[:3])

[('is', 10), ('better', 8), ('than', 8)]


Однако, как это часто бывает, в Python есть встроенный модуль для решения этой задачи:

In [28]:
from collections import Counter

cleaned_list = []
for word in zen.split():
    cleaned_list.append(word.strip('.,-!').lower())

# Получаем аналогичный результат
print( Counter(cleaned_list).most_common(3) )

[('is', 10), ('better', 8), ('than', 8)]
