# Словари

## Описание лекции

В этой лекции мы расскажем про:
- то, что такое `dict`;
- методы и примеры использования;
- хранение изменяемых и неизменяемых типов;
- хэширование.

## Что такое `dict`
`dict` (от английского _"dictionary"_, словарь) -- еще один тип данных в Python. Словари хранят пары `ключ`: `значение`. То есть в списках можно достать элемент, если указать его позицию в виде целого числа, а в словарях -- тот самый `ключ`. Обратите внимание, `dict` -- **неупорядоченный** тип данных, поэтому достать элемент по номеру не получится, но отображение содержимого будет **в порядке добавления** элементов. **Уникальность** ключей должна поддерживаться, чтобы всегда можно было быстро найти одно единственно верное `значение`.

В некоторых языках программирования можно встретить ассоциативные массивы -- полную аналогию `dict`. Также вспомним реляционные базы данных: в таблице можно установить первичный ключ, который уникально идентифицирует запись, как и `ключ` соответствует `значению` в словаре.

### Создание словаря

Использовать словарь стоит, когда нужно сохранять объекты с какими-то ключами и обращаться к объектам по известным ключам. Один из способов определения словаря: указание пар `ключ`: `значение` через **запятую** внутри фигурных скобок `{}`. Напоминает `set`, правда? `{}` позволяет создать **пустой** словарь, но не пустое множество.

Например, вы решили упростить себе жизнь и больше не запоминать дни рождения коллег. Вместо этого, лучше хранить их в одном месте:

In [1]:
# попробуйте поменять значение переменной dates
dates = {'Кунг Фьюри': '1968-09-09', 'Наташа Романова': '1985-03-15'}  

В примере `dates` имеет две пары значений. В первой паре строка `'Кунг Фьюри'` является _ключом_, а `'1968-09-09'` -- его _значением_.

### Получение значения по ключу

Чтобы получить значение по ключу, необходимо обратиться к переменной, содержащей словарь, и указать ключ в квадратных скобках `[]`:

```python
dates['Кунг Фьюри'] # '1968-09-09'
```

Если указать неверный ключ в `[]`, Python будет ругаться, выбросит исключение `KeyError` и перестанет выполнять код. Чуть ниже посмотрим, как можно избежать таких ситуаций.

```python
# пока этого ключа нет в словаре, будет ошибка при обращении
dates['Капитан Ямайка']
```

### Изменение и добавление значений

Синтаксис изменения значения по ключу и добавления нового ключа со значением одинаковый: в `[]` нужно указать ключ, поставить `=` и указать значение, которое теперь будет соответствовать ключу.

```python
# этот ключ уже был в примере
dates['Кунг Фьюри'] = '1960-09-09'

# а такого не было
dates['Капитан Ямайка'] = '1930-10-04'
```
Если ключ уже был в словаре, значение по нему изменится на новое, а **старое будет удалено**. Указание нового ключа со значением добавляет пару в словарь.

## Основные методы словаря

### Проверка вхождения и get()
Помните, ранее говорили, что обращение к несуществующему ключу приводит к ошибке? Пришло время посмотреть пару способов борьбы!

Можно проверить, есть ли интересующий ключ среди множества ключей словаря. Это делается при помощи бинарного оператора `in`. Слева должен быть указан ключ, справа -- переменная со словарем:

```python
# еще способ создания: пары можно передавать как аргументы dict через =
marks = dict(линал=100, английский=92)

# False
'матан' in marks

# True
'линал' in marks
```

В коде проверку можно использовать в условной конструкции `if`, чтобы принимать решение в зависимости от наличия ключа:

```python
if 'матан' in marks:
    print(marks['матан'])

else:
    print('Нет оценки по матану :(')
```

Теперь о методе `get()`: при помощи него тоже можно получать значения из словаря по ключу. `KeyError` никогда не появится: если ключа нет, по умолчанию возвращается `None`:

In [2]:
# попробуйте поменять значение
empty_dict = {}  

# None
empty_dict.get('ключ')

Вторым аргументом метода `get()` можно указать значение, которое должно возвращаться вместо None, когда ключ не был найден:

In [3]:
# попробуйте поменять значение
empty_dict = {}  

# теперь будет возвращено значение -1
empty_dict.get('ключ', -1)

-1

### Что такое "длина словаря"?
Функция len() для словаря будет возвращать количество пар `ключ`: `значение`, которое в нем содержится:

In [4]:
empty_dict = {}  

# empty_dict -- пустой словарь, поэтому длина равна 0
print(len(empty_dict))

marks = dict(линал=100, английский=92)

# marks уже содержит две пары, поэтому длина 2
print(len(marks))

0
2


### Удаление из словаря
Есть несколько способов очистки в словаре: можно убирать по ключу, а можно сразу удалить все!

Сначала рассмотрим первое:
1. при помощи инструкции del (от английского _"delete"_) можно удалить пару `ключ`: `значение` (_замечу, что удаление ключа эквивалентно удалению пары `ключ`: `значение`, так как мы теряем возможность найти то самое `значение`_), в общем виде:

```python
# таким образом из словаря "словарь" будет удален ключ "название_ключа"
# и соответствующее ему значение
del словарь[название_ключа]
```

Предположим, коллега из самого первого примера уволился и больше нет смысла хранить его день рождения:

```python
# из словаря dates удаляется ключ 'Наташа Романова'
del dates['Наташа Романова']
```

2. `pop()` -- метод, который достает значение, хранящееся по переданному ключу, и **сразу** удаляет ключ из словаря:

In [5]:
# еще один способ создания словаря из последовательности пар
holidays = dict([('January', [1, 2, 3, 4]), ('Feburary', [23]), ('March', [8])])

# pop() возвращает значение, соответствующее ключу, значит его можно присвоить
# переменной
january_days = holidays.pop('January')

# напечатается соответствующий массив
print(january_days)

[1, 2, 3, 4]


Для метода `pop()` есть возможность указать значение, которое будет возвращено при обращении к несуществующему ключу. Почти как `get()`, но все таки, без указания этого значения, `pop()` выбрасывает `KeyError` ☝️

3. `popitem()` имеет схожее название, но не путайте с предыдущим методом: этот на вход не принимает `ключ`, а возвращает пару `ключ`: `значение`, которая была добавлена последней (_такое поведение гарантируется с Python **3.7**_).

In [6]:
# еще один способ создания словаря из последовательности пар
holidays = dict([('January', [1, 2, 3, 4]), ('Feburary', [23]), ('March', [8])])

# в результате -- последняя добавленная пара
print(holidays.popitem())

('March', [8])


4. `clear()` позволяет удалить сразу все ключи словаря, то есть полностью его очистить:

In [7]:
# вернемся к предыдущему примеру
holidays = dict([('January', [1, 2, 3, 4]), ('Feburary', [23]), ('March', [8])])

# словарь становится пустой
holidays.clear()

# значит, длина равна 0
print(len(holidays))

0


Обратите внимание на то, как работают методы `pop()`, `popitem()` и `clear()`: как только вызываются, словарь меняет свой состав (_изменения происходят in place_).

### Обновление и добавление ключей
Мы уже видели, что значения в словарь можно добавлять или менять, обращаясь по ключу. Python предоставляет возможность не писать кучу присваиваний, а использовать лаконичный метод `update()`, который на вход может принимать либо
- другой словарь
- пары `ключ`: `значение` в какой-то последовательности (например, тьюплы по два значения в списке: первое -- ключ, второе -- значение)

In [8]:
# создадим два словаря: в первом уже есть два ключа
quidditch_team = {'Fred Weasley': '3rd year', 'George Weasley': '3rd year'}

# во втором -- один ключ
new_members = {'Harry Potter': '1st year'}

# добавим пары из new_members
# метод update() также работает in place, поэтому после выполнения данной
# строки кода, в словаре quidditch_team станет три ключа
quidditch_team.update(new_members)

А что, если в `update()` передать пары, ключ которых уже был в словаре? Значения по дублирующимся ключам будут **перезаписаны** на новые:

In [9]:
quidditch_team = {'Fred Weasley': '3rd year', 'George Weasley': '3rd year', 'Harry Potter': '1st year'}

# данный ключ (то, что записано первым в тьюпле) уже есть в quidditch_team
member_update = [('Harry Potter', '2nd year')]

# значение, соответствующее 'Harry Potter', будет переписано
quidditch_team.update(new_members)

## Доступ к ключам и значениям
В Python можно без проблем доставать отдельно ключи или значения или  итерироваться по элементам словарей в цикле `for`. Осталось разобраться, как это работает.

### Ключи
По умолчанию, в конструкциях вида
```python
# после in указано название переменной, хранящей словарь
for key in dict_var:
    ...
```

переменные цикла (тут -- `key`) будут принимать значения из множества **ключей** словаря. Аналогично можно использовать метод `keys()` (_позволяет достать все ключи_), который явно говорит, что ваш цикл идет по ключам, например:

In [10]:
quidditch_team = {'Fred Weasley': '3rd year', 'George Weasley': '3rd year', 'Harry Potter': '1st year'}

# словарь в качестве ключей хранит имена игроков
for player in quidditch_team:

    # на каждой итерации будет напечатан ключ и значение
    print(player, quidditch_team[player])

Fred Weasley 3rd year
George Weasley 3rd year
Harry Potter 1st year


### Значения
При помощи метода `values()` можно получить все значения, хранящиеся по всем ключам словаря:

```python
school_years = quidditch_team.values()
```

Приведем пример с циклом:

```python
# словарь в качестве значений хранит имена годы обучения
for year in quidditch_team.values():

    # на каждой итерации будет год обучения игрока
    print(year)
```

Напрямую по значению получить ключ нельзя.

### Все и сразу
Существует метод `items()`, который достает пары `ключ`: `значение` в виде последовательности тьюплов 👏 Его же часто удобно использовать в циклах, чтобы не тащить длинную запись в виде названия словаря и квадратных скобок с ключом при обращении к значению:

```python
# сразу две переменные: первая последовательно будет ключами,
# вторая -- значениями
for player, year in quidditch_team.items():

    # items() избавляет от необходимости обращаться quidditch_team[player],
    # чтобы получить значение. Оно уже в year
    print(f'Player {player} is in {year}')
```

## Сортировка
Функции `reversed()` (с Python **3.8**) и `sorted()` доступны и для словарей. По умолчанию ключи словаря поддерживают порядок, в котором были добавлены, но можно отсортировать их в нужном направлении (_в зависимости от типа_):

In [11]:
# вспомним про рабочие дни
week = {7: 'weekend', 6: 'weekend', 1: 'workday'}

# в sorted_week окажутся ключи, отсортированные в порядке возрастания
sorted_week = sorted(week)

# а тут -- наоборот
reverse_sorted_week = reversed(week)

Не забудьте, когда в функции передается просто название переменной со словарем, работа идет только над множеством ключей.

Можно ли отсортировать словарь по значениям? Да, можно попробовать самостоятельно разобраться с аргументами функции [`sorted()`](https://docs.python.org/3/howto/sorting.html) 😉

## Что можно хранить
Теперь добавим немного технических подробностей: возможно, вы уже заметили самостоятельно, что `dict` может принимать в качестве ключа не всякое значение. На самом деле только **хэшируемые** объекты _(можно вызвать функцию `hash()` и получить значение)_ могут быть ключами словаря, на значения это ограничение не распространяется. В `dict` и `set` значение хэша от объекта используется для поиска внутри структуры.

Ключом словаря нельзя сделать объект **изменяемого** типа, например, `list`, `set` или **сам `dict`**, так как значение их хэша может измениться со временем. Неизменяемый тьюпл может быть ключом только если не содержит внутри изменяемые объекты.

### Изменяемость и неизменяемость
_В англоязычной литературе изменяемые типы называют **mutable**, а неизменяемые -- **immutable**_

В Python все -- объект. Когда пользователь присваивает значение переменной, она начинает ассоциироваться с ячейкой памяти, где лежит это значение. Переменная знает адрес, откуда можно получить значение. Этот адрес в десятичном можно получить при помощи функции `id()`, а `hex()` поможет перевести в шестнадцатеричный.

По адресу лежит так называемое **внутреннее состояние** переменной:
- **неизменяемые** типы не позволяют менять внутреннее состояние, значение переменной может поменяться только вместе с адресом

- **изменяемые** типы позволяют менять внутреннее состояние переменной при сохранении адреса (возвращаемое `id()` значение не меняется, но _значение_ переменной каким-то образом преобразовывается). Изменение по ссылке называется изменением _in place_

#### Неизменяемые типы
Из стандартных неизменяемыми являются:
- `int`
- `float`
- `bool`
- `str`
- `tuple`

Давайте сразу рассмотрим пример:

In [12]:
counter = 100

# полученное вами значение адреса может отличаться
print(hex(id(counter)))

0x7f608726fd80


```{figure} /_static/pythonblock/dicts_l7/Python-Immutable-Example-1.png
:name: mutable_example1
:width: 411px

`counter` указывает на 100
```

А теперь поменяем значение `counter`:

In [13]:
counter = 200
print(counter, hex(id(counter)))

200 0x7f6087270a00


Кажется, что раз значение переменной `counter` поменялось, то и содержимое по предыдущему адресу изменилось? Нет, на самом деле `counter` теперь указывает в другое место:


```{figure} /_static/pythonblock/dicts_l7/Python-Immutable-Example-2.png
:name: mutable_example1
:width: 411px

`counter` указывает на новое значение 200 с другим адресом
```

![counter указывает на 200](https://www.pythontutorial.net/wp-content/uploads/2020/10/)

Из интересного: Python [заранее создает объекты](https://docs.python.org/3/c-api/long.html#c.PyLong_FromLong) для чисел от -5 до 256, поэтому для переменных со значением из этого диапазона берутся заранее готовые ссылки.

In [14]:
# создадим две переменные с одинаковыми значениями в диапазоне от -5 до 256
a = 20
b = 20

# a и b указывают на одно и то же место в памяти
# попробуйте поменять значение a и b на число больше 256 или меньше -5
id(a) == id(b)

True

#### Изменяемые типы
Стандартные изменяемые типы это:
- `list`
- `set`
- `dict`

У списков есть метод `append()`, позволяющий добавить в него значение:

In [15]:
# создадим список и напечатаем его адрес
ratings = [1, 2, 3]
print(hex(id(ratings)))
ratings.append(4)
print(hex(id(ratings)))

0x7f60807df5c0
0x7f60807df5c0


```{figure} /_static/pythonblock/dicts_l7/Python-Mutable-Example.png
:name: mutable_example1
:width: 402px

Начальное состояние списка содержало три элемента
```

После добавления еще одного, адрес `ratings` не изменился.

```{figure} /_static/pythonblock/dicts_l7/Python-Mutable-Example-2.png
:name: mutable_example2
:width: 402px

После добавления элемента поменялось лишь внутреннее состояние
```


## Что мы узнали из лекции
- Новый тип данных -- **словарь**! Позволяет хранить соответствие `ключ`: `значение`;
- Несколько способов создания `dict`, методы для изменения состояния или получения доступа к элементам;
- Требование к ключу: возможность хэширования, свойство ключа внутри словаря: уникальность;
- Разобрали изменяемые и неизменяемые типы данных.