## Словари

Словари отчасти похожи на множества, а отчасти на списки, можно сказать, что это результат скрещивания множества и списка. 

У словаря есть *ключи* и *значения*, он состоит из двух частей. 

Ключи словаря работают точно так же, как индексы списка, но могут быть любыми неизменяемыми объектами: числами, строками, кортежами. У ключей словаря такие же свойства, как у множества: они должны быть неизменяемыми, уникальными, их порядок не определен (начиная с версии питона 3.7 гарантируется порядок по времени добавления).

Значения могут быть любыми объектами вообще. Как и список, словарь может включать в качестве значений другие словари, списки и вообще все, что угодно. 

С точки зрения признаков словарь называется mapping type. По нему можно итерироваться, его можно изменять по частям. Словарь не может быть элементом множества: он изменяемый. 

Как задавать словари:

1. Явно в коде:


    dct = {'sky': 'небо', 'earth': 'земля'}

2. Преобразованием из списка кортежей:


    A = [('sky', 'небо'), ('earth', 'земля')]
    dct = dict(A)

3. Преобразованием из объектов, которые возвращают функции zip и enumerate (они как раз возвращают списки кортежей на самом деле):


    a = ['sky', 'earth']
    b = ['небо', 'земля']
    dct = dict(zip(a, b))
    m = ['jan', 'feb', 'mar'...]
    dct = dict(enumerate(m))

Функция zip берет два (может больше) списка и сопоставляет их элементы парами по индексам: a[0] + b[0], a[1] + b[1]...

Если списки разной длины, хвост более длинного отсекается. В модуле itertools есть расширенная версия zip_longest, которая позволяет сохранить хвост и приписать ему стандартные значения, но мы ее особо смотреть не будем.

Функция enumerate просто нумерует элементы в списке с 0. Иногда бывает очень полезной.

4. Тем, что называется dict comprehension (тот же генератор, только в профиль):


    dct = {x: x ** 2 for x in range(10)}
    # соберет словарь вида 0: 0, 1: 1, 2: 4...

5. Можно собрать словарь из списка специальным методом класса:


    dict.fromkeys(list)

В последнем случае обратите внимание: мы должны написать прямо dict.fromkeys()! dict здесь не переменная, а название класса словаря.

In [None]:
A = ['one', 'two', 'three']
dct = dict.fromkeys(A, 0) # нолик - это дефолтное значение, которое припишется всем нашим ключам. 
print(dct)

С помощью такого метода можно создавать словари-счетчики, но есть более интересные способы считать штуки в питоне.

Итак, мы выяснили, что словарь у нас - сложная структура, которая как бы состоит из двух частей: ключей и значений. В связи с этим у словаря есть особые штуки, которые называются view objects. Они не существуют отдельно от словаря, но мы можем попросить питон показать нам отдельно ключи и отдельно значения, например. 

Такой просмотр организован с помощью методов словаря:

dict.keys() - покажет все ключи

dict.values() - покажет все значения

dict.items() - покажет ключи и значения кортежами.

С этими объектами можно работать, но изменять их самих по себе нельзя. 

Как итерироваться по словарю?

1. Только по его ключам. 


    for key in dct.keys():
      ...

или просто:

    for key in dct:
      ...

Поскольку чаще всего программисты хотят итерироваться по ключам, в питоне считается, что если мы написали просто dct, мы хотим ключи. 

2. Только по его значениям.


    for value in dct.values():
      ...

3. По всему сразу:


    for key, value in dct.items():
      ...

Заметьте, что key и value - просто названия переменных, я могла назвать их i и j, просто по традиции обычно пишут key, value или k, v. В программировании много таких устоявшихся штук, как i в значении индекса, self в значении экземпляра класса и т.п. Они не обязательные, просто так удобно. 

In [None]:
monthslist = ['January', 'February', 'March', 'April', 'May', 'June', 'July', 'August', 'September', 'October', 'November', 'December']
months = dict(enumerate(monthslist))
print('Что-то не очень, да?', months)
months = {x + 1: y for x, y in enumerate(monthslist)}
print('Вот так уже лучше...')
for key, value in months.items(): # не забывайте про .items(), как это вечно забываю я...
  print(f'{value} is number {key}')

Что еще можно делать со словарями?

1. Чтобы добавить новый элемент, достаточно выполнить операцию присваивания (=):


    dct['rain'] = 'дождь'

Обратите внимание, что присваивание не вызывает никакой ошибки, если такого ключа еще не существует! Вот все остальные операции вызывают, например, += вызовет ошибку Key Error. 

2. Чтобы удалить элемент, можно использовать pop():


    dct.pop(key) - удалит элемент с ключом key и вернет ключ
    dct.popitem() - удалит элемент, последним добавленный в словарь 
    (если у вас питон не старше версии 3.7, иначе будете играть в русскую рулетку и удалять случайные 
    элементы), и вернет его в виде кортежа. 

Можно использовать и del:

    del dct[key]

Обратите внимание, что ключи можно передавать в словарь переменными (ну точно так же, как и индексы в списке: A[i]). 

Со словарями также умеет работать функция len(), которая вернет количество элементов в словаре. 

Также у меня уже просто не хватило сил вам рассказать, что проверять наличие ключа в словаре можно так же, как во множестве:

    key in dct
    key not in dct

А метод dct.update() добавит один словарь в другой, при этом если у них будут одинаковые ключи, то значения в этих ключах перезапишутся:

    dct1 = ...
    dct2 = ...
    dct1.update(dct2)


Наконец, если мы пытаемся совершить какую-то операцию с элементом словаря по несуществующему ключу, то питон выдаст ошибку KeyError. Как этого избежать? Можно либо проверять key in dct, либо использовать метод get():

In [None]:
dct = {'name': 'Vasya', 'age': 17}
print('Name is', dct.get('name'))
print('We have no key "gender":', dct.get('gender'))

#### defaultdict и Counter

defaultdict и Counter - удобные расширения на основе стандартных питоновских словарей, которые содержатся в библиотеке collections. 

In [None]:
from collections import defaultdict
from collections import Counter

defaultdict - это такой словарь, у которого мы при создании задаем тип данных в значениях по умолчанию; например, можем указать list, и тогда если мы обратимся даже по ключу, которого в этом словаре нет, он по умолчанию его создаст и припишет ему значение []. 

In [None]:
from collections import defaultdict

days = defaultdict(list)
for key, value in months.items():
  days[value].append(key)
printdict(days)

Counter - это словарь-счетчик. Чтобы посчитать частоты встретившихся в списке (или любом другом итерируемом объекте) элементов, достаточно этот список запихнуть в аргументы Counter при его создании. Словари-счетчики умеют складываться друг с другом и вычитаться! (Делиться не умеют)

In [1]:
from string import punctuation 
from collections import Counter

text = 'Наш русско-английский словарь должен правильно перевернуться: не потерять ни одного перевода, при этом английские переводы тоже должны быть в алфавитном порядке. Программа должна вывести новый словарь на экран: русские слова должны быть отсортированы, как и их переводы.'
text = [word.strip(punctuation).lower() for word in text.split()]
text2 = 'У нас есть два списка: в одном по порядку записаны имена людей, а в другом их дни рождения (формат неважен, можно в строках). Нам нужно объединить два списка в словарь, где ключ - имя, а значение - день рождения, причем мы знаем, что дни рождения в том же порядке, что и имена людей.'
text2 = [word.strip(punctuation).lower() for word in text2.split()]
frequency = Counter(text) + Counter(text2)
for key, value in sorted(frequency.items(), key=lambda x: (-x[1], x[0])):
  print(key, value)

в 6
рождения 3
словарь 3
 2
а 2
быть 2
два 2
дни 2
должны 2
и 2
имена 2
их 2
людей 2
переводы 2
порядке 2
списка 2
что 2
алфавитном 1
английские 1
вывести 1
где 1
день 1
должен 1
должна 1
другом 1
есть 1
же 1
записаны 1
знаем 1
значение 1
имя 1
как 1
ключ 1
можно 1
мы 1
на 1
нам 1
нас 1
наш 1
не 1
неважен 1
ни 1
новый 1
нужно 1
объединить 1
одного 1
одном 1
отсортированы 1
перевернуться 1
перевода 1
по 1
порядку 1
потерять 1
правильно 1
при 1
причем 1
программа 1
русские 1
русско-английский 1
слова 1
строках 1
тоже 1
том 1
у 1
формат 1
экран 1
этом 1
