# Словари

Python предоставляет другой составной тип данных, называемый `словарем`. Он похож на список в том, что представляет собой набор объектов.

Словари и списки имеют следующие общие характеристики:

- оба изменяемые.
- оба динамические. Они могут увеличиваться и уменьшаться по мере необходимости.
- оба могут быть вложенными. Список может содержать другой список. Словарь может содержать другой словарь. Словарь также может содержать список, и наоборот.

Словари отличаются от списков в первую очередь тем, как осуществляется доступ к элементам:

- доступ к элементам списка осуществляется по их положению в списке посредством индексации.
- доступ к элементам словаря осуществляется с помощью ключей.

## Определение словаря

`Словари` - это реализация структуры данных Python, более известной как `ассоциативный массив`. Словарь состоит из набора пар `ключ-значение`. Каждая пара "ключ-значение" сопоставляет ключ с соответствующим значением.

Определить словарь можно, заключив список пар `ключ-значение`, разделенных запятыми, в фигурные скобки (`{}`). Двоеточие (`:`) отделяет каждый ключ от связанного с ним значения:

`d = {`
`    <key>: <value>,`
`    <key>: <value>,`
      .
      .
      .
`    <key>: <value>`
`}`

Как обычно, синтаксис создания словаря лучше всего можно увидеть на примере.

In [None]:
my_dict = {'a': 6, 'b': 7, 'c': 27.6}
my_dict

{'a': 6, 'b': 7, 'c': 27.6}

Словарь создается с помощью фигурных скобок (`{}`). У каждой записи есть `ключ`, за которым следует двоеточие, а затем значение, связанное с ключом. 

В приведенном выше примере все ключи представляют собой строки, что является наиболее распространенным вариантом использования. Обратите внимание, что значения могут быть любого типа; в приведенном выше примере это `int` и `float`.

Мы также могли бы создать словарь, используя встроенную функцию `dict()`, которая может принимать кортеж, состоящий из кортежет, каждоый из которых содержит пару ключ-значение.

In [None]:
dict((('a', 6), ('b', 7), ('c', 27.6)))

{'a': 6, 'b': 7, 'c': 27.6}

Мы можем создать словарь с ключевыми аргументами функции `dict()`.

In [None]:
dict(a='yes', b='no', c='maybe')

{'a': 'yes', 'b': 'no', 'c': 'maybe'}

Нам не нужны строки в качестве ключей. Фактически, любой неизменяемый объект может быть ключом.

In [None]:
my_dict = {
    0: 'zero',
    1.7: [1, 2, 3],
    (5, 6, 'dummy string'): 3.14,
    'strings are immutable': 42
}

my_dict

{0: 'zero',
 1.7: [1, 2, 3],
 (5, 6, 'dummy string'): 3.14,
 'strings are immutable': 42}

Однако изменяемые объекты нельзя использовать в качестве ключей.

In [None]:
my_dict = {
    "immutable is ok": 1,
    ["mutable", "not", "ok"]: 5
}

TypeError: unhashable type: 'list'

## Индексирование словарей и доступ к значениям

Как упоминалось в начале урока, мы индексируем словари по ключам.

In [6]:
# Make a dictionary
my_dict = dict(a='yes', b='no', c='maybe')

# Pull out an entry
my_dict['b']

'no'

Поскольку словари индексируются по ключам, а не по последовательным целым числам, их нельзя разрезать; доступ к ним должен осуществляться поэлементно. 

Значение извлекается из словаря путем указания соответствующего ключа в квадратных скобках ([]):

In [1]:
my_dict = {'a': 6, 'b': 7, 'c': 27.6}
my_dict['b']

7

Если мы ссылаемся на ключ, которого нет в словаре, то Python вызывает исключение

In [2]:
my_dict = {'a': 6, 'b': 7, 'c': 27.6}
my_dict['d']

KeyError: 'd'

`Добавление записи в существующий словарь` - это просто вопрос назначения нового ключа и значения

In [4]:
my_dict = {'a': 6, 'b': 7, 'c': 27.6}
my_dict['d'] = 'new element'
my_dict

{'a': 6, 'b': 7, 'c': 27.6, 'd': 'new element'}

Чтобы удалить запись, используем оператор del, указав ключ для удаления:

In [5]:
del my_dict['d']
my_dict

{'a': 6, 'b': 7, 'c': 27.6}

## Словарь - это реализация хэш-таблицы.

Полезно остановиться и подумать, как работает словарь. Давайте создадим словарь и посмотрим, где значения хранятся в памяти.

In [7]:
# Create dictionary
my_dict = {'a': 6, 'b': 7, 'c':12.6}

# Find where they are stored
print(id(my_dict))
print(id(my_dict['a']))
print(id(my_dict['b']))
print(id(my_dict['c']))

1483531117248
140724002367424
140724002367456
1483530457296


### `Таким образом, каждая запись в словаре хранится в разных местах памяти. `

У самого словаря тоже есть свой адрес. 

Как словарь узнает, какой адрес в памяти использовать для получения интересующего нас значения?

Словари для этого используют `хеш-функцию`. Хеш-функция преобразует входные данные в целое число. Например, мы можем использовать встроенную хеш-функцию Python для преобразования ключей в целые числа.

In [8]:
hash('a'), hash('b'), hash('c')

(-2197664217336880747, -1377404527648733394, 3822376384451988386)

Затем Python преобразует эти целые числа в целые числа, которые могут соответствовать местоположениям в памяти. 

Набор элементов, которые можно индексировать таким образом, называется `хеш-таблицей`. Это очень распространенная структура данных в вычислительной технике.

## Словари изменяемы.

Словари изменяемы. Это означает, что их можно заменить на месте. 

Например, если мы хотим добавить элемент в словарь, то используем простой синтаксис:

In [8]:
my_dict = {'a': 6, 'b': 7, 'c':12.6}

# Просмотр содержимого словаря
print(my_dict)

# Добавление нового элемента
my_dict['d'] = 'Python is so much fun!'

# Снова просмотр содержимого
print(my_dict)

# Изменение существующего элемента
my_dict['a'] = 'I was not satisfied with entry a.'

# Просмотр содержимого
print(my_dict)

{'a': 6, 'b': 7, 'c': 12.6}
{'a': 6, 'b': 7, 'c': 12.6, 'd': 'Python is so much fun!'}
{'a': 'I was not satisfied with entry a.', 'b': 7, 'c': 12.6, 'd': 'Python is so much fun!'}


## Операторы присутствия в словарях.

Операторы `in` работают со словарями, `но они работают только с ключами, а не со значениями`. 

Мы убедимся в этом на примере

In [9]:
# Создание словаря
my_dict = {'a': 1, 'b': 2, 'c': 3}

# Проверка на существование в нем ключей
'b' in my_dict, 'd' in my_dict, 'e' not in my_dict

(True, False, True)

In [10]:
# Проверка на вхождение значения
2 in my_dict

False

Получаем False. Почему? Потому что 2 не является ключом в my_dict. 

Мы также можем перебирать ключи в словаре в цикле

In [11]:
for key in my_dict:
    print(key, ':', my_dict[key])

a : 1
b : 2
c : 3


Лучшим, и предпочтительным способом для перебора пар `key, value` в словаре, является использование метода `item()`.

In [12]:
for key, value in my_dict.items():
    print(key, ':', value)

a : 1
b : 2
c : 3


Обратите внимание, как и в случае списков, элементы `item` из итератора `my_dict.items()`, являются не элементами из словаря, а их копиями. 

Если внести изменения в цикл `for` это не изменит записи в словаре.

In [13]:
for key, value in my_dict.items():
    value = 'this string will not be in dictionary.'

my_dict

{'a': 1, 'b': 2, 'c': 3}

Тем не менее, мы можем внести изменения, воспользовавшись ключами.

In [14]:
for key, _ in my_dict.items():
    my_dict[key] = 'this will be in the dictionary.'

my_dict

{'a': 'this will be in the dictionary.',
 'b': 'this will be in the dictionary.',
 'c': 'this will be in the dictionary.'}

### Методы словарей

Словари имеют еще несколько встроенных методов в дополнение к знакомым `items()`. 

Ниже приведены некоторые из них (рассматривается для словаря `d`).


|Метод|Эффект|
|---|---|
|d.keys()|вернуть ключи|
|d.pop(key)|возвращаемое значение, связанное с key и удаление key из d|
|d.values()|вернуть значения в d|
|d.get(key, default=None)|получить значение d по ключу. Возврат значения по умолчанию, если key отсутствует|

Давайте посмотрим их работу.

In [18]:
my_dict = dict(a=1, b=2, c=3, d=4)

my_dict.keys()

dict_keys(['a', 'b', 'c', 'd'])

Обратите внимание, что это объект `dict_keys`. Мы не можем его проиндексировать. 

Если, мы хотим отсортировать ключи и сделать их индексируемыми, нам пришлось бы преобразовать их в список.

In [19]:
sorted(list(my_dict.keys()))

['a', 'b', 'c', 'd']

Однако это не обычный вариант использования, и выполнение этого кода может привести к ошибкам. 

Теперь попробуем вытащить сущность из словаря.

In [20]:
my_dict.pop('c')
3
my_dict

{'a': 1, 'b': 2, 'd': 4}

И, как и следовало ожидать, ключ `c` теперь удален, а его значение было возвращено при вызове `my_dict.pop('c')`. 

Теперь давайте посмотрим на значения.

In [21]:
my_dict.values()

dict_values([1, 2, 4])

Мы получаем объект `dict_values`, похожий на объект `dict_keys`, который получили с помощью метода `my_dict.keys()`. 

Наконец, давайте рассмотрим `get()`.

In [22]:
my_dict.get('d')

4

Это то же самое `my_dict['d']`, за исключением того, что если ключа `'d'` нет, он вернет значение по умолчанию. 

Попробуем использовать `my_dict.get()` с удаленной записью `'c'`.

In [23]:
my_dict.get('c')

Обратите внимание, что ошибки не было, и мы получили `None`. Мы могли бы указать значение по умолчанию.

In [24]:
my_dict.get('c', 3)

3

Дополнительную информацию о встроенных методах можно найти в [документации Python](https://docs.python.org/3/library/stdtypes.html#mapping-types-dict).

### Использование словарей как kwargs.

### `Изящная особенность словарей заключается в том, что словари можно передавать в функции в качестве аргументов. `

В дополнение к `именованным аргументам` функция может принимать произвольные аргументы - `kwargs`. Это указывается в определении функции путем включения последнего аргумента с двойной звездочкой `**`. Kwargs с двойной звездочкой передаются как словарь.

In [25]:
def concatenate_sequences(a, b, **kwargs):
    """Concatenate (combine) 2 or more sequences."""
    seq = a + b

    for key in kwargs:
        seq += kwargs[key]

    return seq

Давайте попробуем!

In [26]:
concatenate_sequences('TGACAC', 'CAGGGA', c='GGGGGGGGG', d='AAAATTTTT')

'TGACACCAGGGAGGGGGGGGGAAAATTTTT'

Теперь представьте, что у нас есть словарь, содержащий наши значения.

In [27]:
my_dict = {"a": "TGACAC", "b": "CAGGGA", "c": "GGGGGGGGG", "d": "AAAATTTTT"}

Теперь мы можем передать это прямо в функцию, поставив перед ней двойную звездочку.

In [28]:
concatenate_sequences(**my_dict)

'TGACACCAGGGAGGGGGGGGGAAAATTTTT'

### Объединение словарей.

Предположим, у нас есть два словаря (у которых нет одинаковых ключей) и я хочу объединить их вместе. 

Это может быть похоже на рассмотрение двух томов энциклопедии; у них нет ключей, и они нам нравятся, и мы могли бы рассматривать их как единый том. Как мы можем этого добиться?

Функция `dict()` в сочетании с оператором `**` в вызовах функций позволяет это сделать. Мы просто в вызове `dict()` ставим `**` перед каждым словарем-аргументом.

In [29]:
restriction_dict = {"KpnI": "GGTACC", "HindII": "AAGCTT", "ecoRI": "GAATTC"}

dict(**my_dict, **restriction_dict, another_seq="AGTGTAGTG")

{'a': 'TGACAC',
 'b': 'CAGGGA',
 'c': 'GGGGGGGGG',
 'd': 'AAAATTTTT',
 'KpnI': 'GGTACC',
 'HindII': 'AAGCTT',
 'ecoRI': 'GAATTC',
 'another_seq': 'AGTGTAGTG'}