#Dict

Словарь (Dict) — это структура данных, которая хранит элементы по принципу ключ-значение.

Это позволяет эффективно искать, вставлять, изменять и удалять любой объект связанный с ключом. Словарь в Python является реализацией абстрактной структуры данных — хеш-таблица. 

Все ключи в словарях должны быть хешируемыми. Хеш-объект имеет значение, которое никогда не изменяется в течение жизни объекта (свойство \_\_hash__), также это значение можно сравнить с другими похожими объектами (свойство __eq__).

Кстати говоря, если мы сравниваем два объекта в Python, можно говорить об их равенстве только в том случае, если их хеши и значения одинаковые.

Из свойства хешируемости следует, что в Python ключами словаря могут быть объекты, неизменяемые со временем (Immutable), — это строки, числа, пользовательские объекты, у которых реализованы свойства (__hash__, \_\_eq__). Tuple, frozen set могут быть ключами словаря — если в их составе нет изменяемых элементов, например — списки, множества.

In [1]:
d = {} # создание словаря
d = {"a":1, "abc":2}
d

{'a': 1, 'abc': 2}

In [5]:
d = dict([(1, 2), (3, 4)]) # еще один способ созлать словарь
d

{1: 4, 3: 2}

In [4]:
d.clear() # очистка словаря
d

{}

In [7]:
d = dict([(3, 2), (1, 4)])
d[1]

4

In [8]:
d[7] = 15 # добавление нового ключа
d

{1: 4, 3: 2, 7: 15}

In [9]:
d[(1, 2)] = 144 # добавление нового ключа — кортежа
d

{(1, 2): 144, 1: 4, 3: 2, 7: 15}

In [10]:
d.items() # показать пары ключ-значение

dict_items([(3, 2), (1, 4), (7, 15), ((1, 2), 144)])

In [11]:
d.keys() # только ключи

dict_keys([3, 1, 7, (1, 2)])

In [12]:
d.values() # только значения

dict_values([2, 4, 15, 144])

Dict Comprehensions — аналогично с list, set существует семантический сахар и для создания словарей.

In [13]:
d = {a: a**2 for a in range(10)}
d

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}

Для хеш-таблиц свойственно появление коллизий — это когда два разных объекта имеют одинаковый хеш. Существуют разные способы разрешения коллизий. Внутри CPython реализован метод открытой адресации.

__Как словари устроены внутри Python__

Внутри CPython словарь, как и множество, хранится в виде таблицы, а сама структура ячейки словаря описывается в CPython следующей структурой:

In [None]:
typedef struct {
    Py_hash_t me_hash;
    PyObject *me_key;
    PyObject *me_value;
} PyDictEntry;  

где:

me_hash — хеш хранимого объекта;

me_key — ключ хранимого объекта;

me_value — значение хранимого объекта.

#OrderedDict

Подкласс словаря, в котором хранится порядок добавления ключей в словарь.

Удобно использовать, когда нужно не только получать значения по ключу, но и время от времени итерироваться по структуре, зная, что вначале идут более ранние значения, а в конце более поздние:

In [14]:
import collections

d = collections.OrderedDict(one=1, two=2, three=3)
d

OrderedDict([('one', 1), ('two', 2), ('three', 3)])

In [16]:
d['four'] = 4
d

OrderedDict([('one', 1), ('two', 2), ('three', 3), ('four', 4)])

In [17]:
d.keys()

odict_keys(['one', 'two', 'three', 'four'])

Начиная с python 3.6+, обычный словарь так же хранит данный порядок и, по сути, OrderedDict можно не использовать.

#DefaultDict

Подкласс словаря, особенностью которого является возможность задать значение по умолчанию, которое будет возвращено в случае обращения к словарю по ключу, который отсутствует. 

In [21]:
from collections import defaultdict

dd = defaultdict(list)
dd['dogs'].append("Rufus")
dd['dogs'].append('Kathrin')
dd['dogs'].append('Mr Sniffles')
dd

defaultdict(list, {'dogs': ['Rufus', 'Kathrin', 'Mr Sniffles']})

In [23]:
dd['wrong']

[]