# Словари (```dict```)

Словари это еще одна фундаментальная структура данных. Другое название словарей - ассоциативные массивы или хеш-таблицы. В отличие от списков, индексируемых числами, словари индексируются ключами, которые могут быть любыми неизменяемыми или хешируемыми типами данных. Об изменяемых и неизменяемых типах данных будет подробнее рассмотрено в следующих разделах. Вот список некоторых неизменяемых типов, значения которых могут выступать в качестве ключей в словарях:
- любые числа (```int```, ```float```, ```complex```)
- ```str```
- ```None```
- ```bool```
- ```tuple``` (этот тип будет рассмотрен в следующих разделах)
- функции

Словари ставят в соответствие какому-либо ключу определенное значение, в связи с этим их называют ассоциативными массивами. Такое соответствие достигается за счет вычисления [хеша](https://en.wikipedia.org/wiki/Hash_function) от объекта. Хеш это некоторое число, которое должно быть уникально для объектов с разными значениями, но одинаковым для объектов с одинаковыми значениями. В Python, используя функцию ```hash```, можно получить число, которое выступает в качестве хеша. У малых целых чисел хеш совпадает со значением числа.

In [15]:
print(f'{hash(42) = }')
print(f'{hash(42.5) = }')
print(f'{hash("42") = }')

hash(42) = 42
hash(42.5) = 1152921504606847018
hash("42") = 4658212807576788527


Другими словами, хеш ключа выступает в качестве индекса, который указывает, где храниться определенный объект. Схематично это можно представить следующим образом:

<img src="../image/dict.png">

На сегодняшний день не существует "идеальной" хеш-функции, которая вычисляет хеш. Это приводит к тому, что не все ячейки в массиве будут заполнены. Время от времени в процессе расширения хеш-таблицы ее размер необходимо увеличивать и, соответственно, копировать в новое место в памяти. В Python поддерживается заполненность таблицы примерно на $2/3$.

Ниже приведён пример работы хеш-таблицы и проблемы "наложения" хеша или коллизий:

In [31]:
import string

# строки с повторяющимися хешами будем сохранять в список
repetitions = []

# будем искать повторения с заданной строкой
prefix = 'abcdef'
hash_s = hash(prefix) % 16

# перебор всех символов
for c in string.ascii_lowercase:
    # добавим новый символ к префиксу и сравним хеши
    if hash(prefix + c) % 16 == hash_s:
        # если совпадают, то добавим в список
        repetitions.append(prefix + c)

# таблица размером 16 будет иметь 1 совпадение
print(repetitions)

['abcdefx']


Литералом словаря или хеш-таблицы являются фигурные скобки ```{}```. Для создания пустого словаря можно использовать либо фигурные скобки, либо встроенную функцию ```dict()```:

In [None]:
d_1 = {}
d_2 = dict()
print(f'{type(d_1) = }')
print(f'{type(d_2) = }')

Создать непустой словарь можно аналогичным способом, передав пары ```ключ: значение```, разделенные между собой запятыми. В качестве значений словари могут содержать произвольные объекты.

In [None]:
d = {'a': 1, 2: 'str', None: [1, 2, 3], True: False}

In [None]:
d = {'a': 1, 'b': 2, 'a': 42}
print(f'{d = }')

Ключи в словаре должны быть уникальными. Это приводит к тому, что предыдущие значения у повторяющихся ключей будут перезаписаны. Это приводит к тому, что ```1```, ```1.0```, ```1 + 0j``` и ```True```, а также ```0```, ```0.0```, ```0 + 0j``` и ```False``` считаются одинаковыми. В этом случае, в словарь попадет первый ключ и последнее значение дублирующего ключа.

In [32]:
d = {1: 'a', 1.: 'b', 1 + 0j: 'c', True: 'd'}
print(f'{d = }')

d = {1: 'd'}


Словари можно создать из другой последовательности с помощью метода ```fromkeys```, передав ему коллекцию ключей и значение "по умолчанию". Это значение будет установлено для всех ключей. Если значение не передано, будет установлено ```None```.

In [33]:
d = dict.fromkeys('abc', 1)
print(f'{d = }')

d = {'a': 1, 'b': 1, 'c': 1}


## Операции над словарями

У словарей можно узнать длину с помощью функции ```len```:

In [34]:
d = {'a': 1, 'b': 2, 'c': 3}
print(f'{len(d) = }')

len(d) = 3


Обращение по ключу у списков осуществляется по аналогии со списками. Для этого нужно использовать квадратные скобки. Другим способом является использование метода ```get```.

In [35]:
d = {'a': 1, 'b': 2, 'c': 3}
print(f'{d["a"] = }')
print(f'{d.get("c") = }')

d["a"] = 1
d.get("c") = 3


В случае обращения по несуществующему ключу, словарь возвращает исключение ```KeyError```.

In [36]:
d = {'a': 1, 'b': 2, 'c': 3}
print(f'{d["g"] = }')

KeyError: 'g'

Метод ```get``` нужно использовать, когда не известен факт наличия ключа в словаре. Метод принимает два аргумента. Первым аргументом передается ключ. Второй является необязательным и представляет собой значение, которое будет возвращено в случае отсутствия ключа. Он имеет значение по умолчанию равное ```None```.

In [37]:
d = {'a': 1, 'b': 2, 'c': 3}
print(f'{d.get("d") = }')
print(f'{d.get("f", 42) = }')

d.get("d") = None
d.get("f", 42) = 42


In [None]:
d = {'a': 1, 'b': 2}
print(f'{d = }')

d['a'] = 0
d['c'] = 5
print(f'{d = }')

In [None]:
d = {'a': 1, 'b': 2}
print(f'{"a" in d = }')
print(f'{"c" in d = }')
print(f'{"g" not in d = }')

In [None]:
foo = {'a': 1, 'b': 2}
bar = {'c': 3, 'd': 4}
print(f'{ foo | bar = }')
print(f'{ {**foo, **bar} = }')

In [7]:
foo = {'a': 1, 'b': 2}
bar = {'c': 3, 'd': 4}
baz = {'e': 5, 'f': 6}

foo |= baz
bar.update(baz)

print(f'{foo = }')
print(f'{bar = }')

foo = {'a': 1, 'b': 2, 'e': 5, 'f': 6}
bar = {'c': 3, 'd': 4, 'e': 5, 'f': 6}


## Итерирование по словарям

In [9]:
d = {'a': 1, 'b': 2, 'c': 3}
print(f'{d.keys() = }')
print(f'{d.values() = }')
print(f'{d.items() = }')

d.keys() = dict_keys(['a', 'b', 'c'])
d.values() = dict_values([1, 2, 3])
d.items() = dict_items([('a', 1), ('b', 2), ('c', 3)])


In [10]:
d = {'a': 1, 'b': 2, 'c': 3}

for key in d:
    print(f'{key}: {d[key]}')
print('-' * 25)

for key in d.keys():
    print(f'{key}: {d[key]}')
print('-' * 25)

for value in d.values():
    print(f'{value = }')
print('-' * 25)

for key, value in d.items():
    print(f'{key}: {value}')
print('-' * 25)

for i, (k, v) in enumerate(d.items()):
    print(f'{i}: {k} - {v}')

a: 1
b: 2
c: 3
-------------------------
a: 1
b: 2
c: 3
-------------------------
value = 1
value = 2
value = 3
-------------------------
a: 1
b: 2
c: 3
-------------------------
0: a - 1
1: b - 2
2: c - 3


# Полезные ссылки

- [Что делает хеш в Python](https://stackoverflow.com/questions/17585730/what-does-hash-do-in-python)