Центр непрерывного образования

# Программа «Python для автоматизации и анализа данных»


# Словари (dict)
Обычный массив (в питоне это список) можно понимать как функцию, которая сопоставляет начальному отрезку натурального ряда какие-то значения.

Давайте посмотрим на списки непривычным способом. Списки - это функции (отображения), которые отображают начальный ряд натуральных чисел в объекты (проще говоря - преводят число 0,1,2,3... во что-то): 

In [None]:
l = [10, 20, 30, 'a']
print(l[0])
print(l[1])
print(l[2])
print(l[3])

В словарях отображать можно не только начала натурального ряда, а произвольные объекты. Представьте себе настоящий словарь или телефонную книжку. Имени человека соответствует номер телефона.

Классическое использование словарей в анализе данных: хранить частоту слова в тексте.

кот $\rightarrow$ 10

и $\rightarrow$ 100

Тейлора $\rightarrow$ 2

Словарь состоит из набора ключей и соответствующих им значений. Значения могут быть любыми объектами (также как и в списке, хранить можно произвольные объекты). А ключи могут быть почти любыми объектами, но только неизменяемыми. В частности числами, строками, кортежами. Список или множество не могут быть ключом.

Одному ключу соответствует ровно одно значение. Но одно и то же значение, в принципе, можно сопоставить разным ключам.

In [22]:
a = dict()
type(a)

dict

In [24]:
a = dict()
a[(2,3)] = [2,3] # кортеж может быть ключом, потому что он неизменямый
a

{(2, 3): [2, 3]}

In [36]:
b = dict()
b[[2,3]] = [2,3] # а список уже нет, получим ошибку
print(b)

TypeError: unhashable type: 'list'

### Создание словаря
В фигурных скобках (как множество), через двоеточие ключ:значение

In [37]:
d = dict()
d

{}

In [26]:
d1 = {"кот": 10, "и": 100, "Тейлора": 2}
print(d1)

{'кот': 10, 'и': 100, 'Тейлора': 2}


In [29]:
d1["кот"]

10

Через функцию dict(). Обратите внимание, что тогда ключ-значение задаются не через двоеточие, а через знак присваивания. А строковые ключи пишем без кавычек - по сути мы создаем переменные с такими названиями и присваиваим им значения (а потом функция dict() уже превратит их в строки).

In [30]:
d2 = dict(кот=10, и=100, Тейлора=2)
print(d2) # получили тот же результат, что выше

{'кот': 10, 'и': 100, 'Тейлора': 2}


И третий способ - передаем функции dict() список списков или кортежей с парами ключ-значение.

In [32]:
d3 = dict([("кот", 10), ("и", 100), ("Тейлора", 2)]) # перечисление (например, список) tuple
print(d3)

{'кот': 10, 'и': 100, 'Тейлора': 2}


Помните, когда мы говорили про списки, мы обсуждали проблему того, что важно создавать именно копию объекта, чтобы сохранять исходный список. Копию словаря можно сделать так

In [33]:
d4 = dict(d3) # фактически, копируем dict который строчкой выше
print(d4)

{'кот': 10, 'и': 100, 'Тейлора': 2}


In [34]:
d1 == d2 == d3 == d4 # Содержание всех словарей одинаковое

True

Пустой словарь можно создать двумя способами.

In [45]:
d2 = {} # это пустой словарь (но не пустое множество)
d4 = dict()
print(d2, d4)

{} {}


In [35]:
x = {}
type(x)

dict

### Операции со словарями

Как мы уже говорили, словари неупорядоченные структуры и обратиться по индексу к объекту уже больше не удастся.

In [47]:
d1[1] # выдаст ошибку во всех случах кроме того, если в вашем словаре вдруг есть ключ 1

KeyError: 1

Но можно обращаться к значению по ключу.

In [36]:
d3 = dict([("кот", 10), ("и", 100), ("Тейлора", 2)])
print(d1['кот'])

10


Можно создать новую пару ключ-значение. Для этого просто указываем в квадратных скобках название нового ключа.

In [42]:
d1['кот'] = 10
print(d1[1]) # теперь работает!

test


In [43]:
d1

{'кот': 10, 'и': 100, 'Тейлора': 2, 1: 'test'}

Внимание: если элемент с указанным ключом уже существует, новый с таким же ключом не добавится! Ключ – это уникальный идентификатор элемента. Если мы добавим в словарь новый элемент с уже существующим ключом, мы просто изменим старый – словари являются изменяемыми объектами. 

In [44]:
d3 = dict([("кот", 10), ("и", 100), ("Тейлора", 2)])
d1["кот"] = 11 # так же как в списке по индексу - можно присвоить новое значение по ключу
d1

{'кот': 11, 'и': 100, 'Тейлора': 2, 1: 'test'}

In [46]:
d1["кот"] += 1 # или даже изменить его за счет арифметической операции
d1

{'кот': 12, 'и': 100, 'Тейлора': 2, 1: 'test', 'собака': 12}

А вот одинаковые значения в словаре могут быть.

In [47]:
d1['собака'] = 12
print(d1)

{'кот': 12, 'и': 100, 'Тейлора': 2, 1: 'test', 'собака': 12}


Кроме обращения по ключу, можно достать значение с помощью метода .get(). Отличие работы метода в том, что если ключа еще нет в словаре, он не генерирует ошибку, а возвращает объект типа None ("ничего"). Это очень полезно в решении некоторых задач. 

In [55]:
d1

{'кот': 12, 'и': 100, 'Тейлора': 2, 1: 'test', 'собака': 12}

In [49]:
print(d1['кто'])

KeyError: 'кто'

In [51]:
print(d1.get("ктоо", 'такого нет')) # вернут None

такого нет


Удобство метода .get() заключается в том, что мы сами можем установить, какое значение будет возвращено, в случае, если пары с выбранным ключом нет в словаре. Так, вместо None мы можем вернуть строку Not found, и ломаться ничего не будет:

In [58]:
print(d1.get("ктоо", 'Not found')) # передаем вторым аргументом, что возвращать
print(d1.get("ктоо", False)) # передаем вторым аргументом, что возвращать

Not found
False


Также со словарями работают уже знакомые нам операции - проверка количества элементов, проверка на наличие объектов.

In [52]:
d1

{'кот': 12, 'и': 100, 'Тейлора': 2, 1: 'test', 'собака': 12}

In [54]:
print(d1)
print(12 in d1) # проверка на наличие ключа
print("ктоо" not in d1) # проверка на отстуствие ключа

{'кот': 12, 'и': 100, 'Тейлора': 2, 1: 'test', 'собака': 12}
False
True


Удалить отдельный ключ или же очистить весь словарь можно специальными операциями.

In [64]:
d1 = dict([("кот", 10), ("и", 10), ("Тейлора", 2)])

In [61]:
d1

{'кот': 10, 'и': 10, 'Тейлора': 2}

In [62]:
del d1["кот"] # удалить ключ со своим значением
print(d1)
d1.clear() # удалить все
print(d1)

{'и': 10, 'Тейлора': 2}
{}


У словарей есть три метода, с помощью которых мы можем сгенерировать список только ключей, только значений и список пар ключ-значения (на самом деле там несколько другая структура, но ведет себя она очень похоже на список).

In [65]:
print(d1.values()) # только значения
print(d1.keys()) # только ключи
print(d1.items()) # только ключ-значение

dict_values([10, 10, 2])
dict_keys(['кот', 'и', 'Тейлора'])
dict_items([('кот', 10), ('и', 10), ('Тейлора', 2)])


Ну, и раз уж питоновские словари так похожи на обычные, давайте представим, что у нас есть словарь, где все слова многозначные. Ключом будет слово, а значением ‒ целый список. 

In [66]:
my_dict = {
    'swear' : {
    'swear' : ['клясться', 'ругаться'], 'dream' : ['спать', 'мечтать']
    }, 
    'dream' : ['спать', 'мечтать']
          }

По ключу мы получим значение в виде списка:

In [74]:
my_dict['swear']['dream'][1]

'мечтать'

Так как значением является список, можем отдельно обращаться к его элементам:

In [76]:
my_dict['swear']['swear'][0]

'клясться'

Можем пойти дальше и создать словарь, где значениями являются словари! Например, представим, что в некотором сообществе проходят выборы, и каждый участник может проголосовать за любое число кандидатов. Данные сохраняются в виде словаря, где ключами являются имена пользователей, а значениями – пары *кандидат-голос*.

In [75]:
votes = {
    'user1': {
        'cand1': '+', 'cand2': '-'},
    'user2' : {
        'cand1': 0, 'cand3' : '+'}} # '+' - за, '-' - против, 0 - воздержался

In [76]:
votes

{'user1': {'cand1': '+', 'cand2': '-'}, 'user2': {'cand1': 0, 'cand3': '+'}}

По аналогии с вложенными списками по ключам мы сможем обратиться к значению в словаре, который сам является значением в `votes` (да, эту фразу нужно осмыслить):

In [81]:
votes['user1'].get('cand3', 'не голосовал') # берем значение, соответствующее ключу user1, в нем – ключу cand1

'не голосовал'

Можно использовать несколько вариантов слияния словарей. В первом случае мы используем методы .copy() и .update().

In [82]:
dict1 = {'a': 1, 'b': 2}
dict2 = {'c': 3, 'd': 4}
dict3 = dict1.copy()
dict3.update(dict2)
print(dict3)

{'a': 1, 'b': 2, 'c': 3, 'd': 4}


Во втором случае мы используем оператор `**`.

In [2]:
dict1 = {'a': 1, 'b': 2}
dict2 = {'c': 3, 'd': 4}
dict3 = {**dict1, **dict2}
print(dict3) 

{'a': 1, 'b': 2, 'c': 3, 'd': 4}
