# Словари

## Отображение объектов и словари.



Тип встроенного отображения Python - это `словарь`. Вы можете представить, что словарь русского языка можно удобно хранить в виде словаря (это очевидно). Вы не захотите хранить определения, на которые нужно ссылаться, например так

`oed[103829]`

Скорее всего вы пожелаете получить определения в виде:

`oed['computer']`

Важно отметить, что в словарях Python 3.5 и более старых отсутствует упорядоченность элементов. В Python 3.6 словари сохраняются в порядке вставки элементов, в качестве упрощения их реализации. 

В Python 3.7 и последующих версиях словари гарантированно упорядочены в том порядке, в котором были созданы их записи. Поэтому рекомендуется проявлять осторожность, полагаясь на некоторое упорядочивание в словарях.

## Синтаксис словаря.

Как обычно, синтаксис создания словаря лучше всего можно увидеть на примере.

In [1]:
my_dict = {'a': 6, 'b': 7, 'c': 27.6}
my_dict

{'a': 6, 'b': 7, 'c': 27.6}

Словарь создается с помощью фигурных скобок (`{}`). У каждой записи есть `ключ`, за которым следует двоеточие, а затем значение, связанное с ключом. 

В приведенном выше примере все ключи представляют собой строки, что является наиболее распространенным вариантом использования. Обратите внимание, что значения могут быть любого типа; в приведенном выше примере это int и float.

Мы также могли бы создать словарь, используя встроенную функцию dict(), которая может принимать кортеж, состоящий из кортежет, каждоый из которых содержит пару ключ-значение.

In [2]:
dict((('a', 6), ('b', 7), ('c', 27.6)))

{'a': 6, 'b': 7, 'c': 27.6}

Мы можем создать словарь с ключевыми аргументами функции dict().

In [3]:
dict(a='yes', b='no', c='maybe')

{'a': 'yes', 'b': 'no', 'c': 'maybe'}

Нам не нужны строки в качестве ключей. Фактически, любой неизменяемый объект может быть ключом.

In [4]:
my_dict = {
    0: 'zero',
    1.7: [1, 2, 3],
    (5, 6, 'dummy string'): 3.14,
    'strings are immutable': 42
}

my_dict

{0: 'zero',
 1.7: [1, 2, 3],
 (5, 6, 'dummy string'): 3.14,
 'strings are immutable': 42}

Однако изменяемые объекты нельзя использовать в качестве ключей.

In [5]:
my_dict = {
    "immutable is ok": 1,
    ["mutable", "not", "ok"]: 5
}

TypeError: unhashable type: 'list'

## Индексирование словарей.

Как упоминалось в начале урока, мы индексируем словари по ключам.

In [6]:
# Make a dictionary
my_dict = dict(a='yes', b='no', c='maybe')

# Pull out an entry
my_dict['b']

'no'

Поскольку словари индексируются по ключам, а не по последовательным целым числам, их нельзя разрезать; доступ к ним должен осуществляться поэлементно. 

(На самом деле есть способы разрезать ключи словарей с помощью `itertools`, но мы не будем это рассматривать.)

## Словарь - это реализация хэш-таблицы.

Полезно остановиться и подумать, как работает словарь. Давайте создадим словарь и посмотрим, где значения хранятся в памяти.

In [7]:
# Create dictionary
my_dict = {'a': 6, 'b': 7, 'c':12.6}

# Find where they are stored
print(id(my_dict))
print(id(my_dict['a']))
print(id(my_dict['b']))
print(id(my_dict['c']))

1483531117248
140724002367424
140724002367456
1483530457296


Таким образом, каждая запись в словаре хранится в разных местах памяти. У самого словаря тоже есть свой адрес. Итак, когда мы индексируем словарь с помощью ключа, как словарь узнает, какой адрес в памяти использовать для получения интересующего нас значения?

Словари для этого используют `хеш-функцию`. Хеш-функция преобразует входные данные в целое число. 

Например, мы можем использовать встроенную хеш-функцию Python для преобразования ключей в целые числа.

In [8]:
hash('a'), hash('b'), hash('c')

(-2197664217336880747, -1377404527648733394, 3822376384451988386)

Затем Python преобразует эти целые числа в целые числа, которые могут соответствовать местоположениям в памяти. 

Набор элементов, которые можно индексировать таким образом, называется `хеш-таблицей`. Это очень распространенная структура данных в вычислительной технике.

## Словари изменяемы.

Словари изменяемы. Это означает, что их можно заменить на месте. 

Например, если мы хотим добавить элемент в словарь, мы используем простой синтаксис.

In [12]:
# Remind ourselves what the dictionary is
print(my_dict)

# Add an entry
my_dict['d'] = 'Python is so much fun!'

# Look at dictionary again
print(my_dict)

# Change an entry
my_dict['a'] = 'I was not satisfied with entry a.'

# Look at it again
print(my_dict)

{'a': 'I was not satisfied with entry a.', 'b': 7, 'c': 12.6, 'd': 'Python is so much fun!'}
{'a': 'I was not satisfied with entry a.', 'b': 7, 'c': 12.6, 'd': 'Python is so much fun!'}
{'a': 'I was not satisfied with entry a.', 'b': 7, 'c': 12.6, 'd': 'Python is so much fun!'}


## Операторы присутствия в словарях.

Операторы in работают со словарями, но работают только с ключами, а не со значениями. 

Мы еще раз убедимся в этом на собственном примере

In [13]:
# Make a fresh my_dict
my_dict = {'a': 1, 'b': 2, 'c': 3}

# in works with keys
'b' in my_dict, 'd' in my_dict, 'e' not in my_dict

(True, False, True)

In [14]:
# Try it with values
2 in my_dict

False

Получаем False. Почему? Потому что 2 не является ключевым в my_dict. 

Мы также можем перебирать ключи в словаре.

In [15]:
for key in my_dict:
    print(key, ':', my_dict[key])

a : 1
b : 2
c : 3


Лучшим, и предпочтительным способом для перебора пар key, value в словаре, является использование метода словаря `item()`.

In [16]:
for key, value in my_dict.items():
    print(key, ':', value)

a : 1
b : 2
c : 3


Обратите внимание, однако, как и в случае списков, элементы item из итератора my_dict.items(), являются не элементами из словаря, а их копиями. Если вы внесете изменения в цикл for, вы не измените записи в словаре.

In [17]:
for key, value in my_dict.items():
    value = 'this string will not be in dictionary.'

my_dict

{'a': 1, 'b': 2, 'c': 3}

Тем не менее, вы это сделаете, если воспользуетесь ключами.

In [18]:
for key, _ in my_dict.items():
    my_dict[key] = 'this will be in the dictionary.'

my_dict

{'a': 'this will be in the dictionary.',
 'b': 'this will be in the dictionary.',
 'c': 'this will be in the dictionary.'}

### Встроенные функции для словарей.

Для работы со словарями доступны встроенные функции, например `len()` или `del`:
- функция `len(d)` выдает количество записей в словаре `d`.
- функция `del d[k]` удаляет запись с ключом `k` из словаря `d`.

Мы впервые встретили ключевое слово `del`. Это ключевое слово используется для удаления переменных и их значений из памяти. 

Ключевое слово `del` может быть также удалять элементы из списков. Посмотрим это на практике.

In [2]:
# Create my_list and my_dict for reference
my_dict = dict(a=1, b=2, c=3, d=4)
my_list = [1, 2, 3, 4]

# Print them
print('my_dict:', my_dict)
print('my_list:', my_list)

# Get lengths
print('length of my_dict:', len(my_dict))
print('length of my_list:', len(my_list))

# Delete a key from my_dict
del my_dict['b']

# Delete entry from my_list
del my_list[1]

# Show post-deleted objects
print('post-deleted my_dict:', my_dict)
print('post-deleted my_list:', my_list)

my_dict: {'a': 1, 'b': 2, 'c': 3, 'd': 4}
my_list: [1, 2, 3, 4]
length of my_dict: 4
length of my_list: 4
post-deleted my_dict: {'a': 1, 'c': 3, 'd': 4}
post-deleted my_list: [1, 3, 4]


Однако обратите внимание, что вы не можете удалить элемент из кортежа, поскольку он неизменяем.

In [3]:
my_tuple = (1, 2, 3, 4)
del my_tuple[1]

TypeError: 'tuple' object doesn't support item deletion

### Методы словарей

Словари имеют еще несколько встроенных методов в дополнение к знакомым items(). Ниже приведены некоторые из них (рассматривается для словаря d).


|Метод|Эффект|
|---|---|
|d.keys()|вернуть ключи|
|d.pop(key)|возвращаемое значение, связанное с key и удаление key из d|
|d.values()|вернуть значения в d|
|d.get(key, default=None)|получить значение d по ключу. Возврат значения по умолчанию, если key отсутствует|

Давайте посмотрим их работу.

In [4]:
my_dict = dict(a=1, b=2, c=3, d=4)

my_dict.keys()

dict_keys(['a', 'b', 'c', 'd'])

Обратите внимание, что это объект `dict_keys`. Мы не можем его проиндексировать. Если, скажем, мы хотим отсортировать ключи и сделать их индексируемыми, нам пришлось бы преобразовать их в список.

In [5]:
sorted(list(my_dict.keys()))

['a', 'b', 'c', 'd']

Однако это не обычный вариант использования, и имейте в виду, что выполнение этого кода может привести к ошибкам. Теперь попробуем вытащить сущность из словаря.

In [6]:
my_dict.pop('c')
3
my_dict

{'a': 1, 'b': 2, 'd': 4}

И, как и следовало ожидать, ключ 'c' теперь удален, а его значение было возвращено при вызове my_dict.pop('c'). Теперь давайте посмотрим на значения.

In [7]:
my_dict.values()

dict_values([1, 2, 4])

Мы получаем объект dict_values, похожий на dict_keys объект, который мы получили с помощью метода my_dict.keys(). Наконец, давайте рассмотрим get().

In [8]:
my_dict.get('d')

4

Это то же самое my_dict['d'], за исключением того, что если ключа 'd' нет, он вернет значение по умолчанию. Попробуем использовать my_dict.get() с удаленной записью 'c'.

In [9]:
my_dict.get('c')

Обратите внимание, что ошибки не было, и мы получили None. Мы могли бы указать значение по умолчанию.

In [10]:
my_dict.get('c', 3)

3

Вы должны подумать о том, какое поведение вы хотите видеть, когда пытаетесь получить значение из словаря по ключу. 

Вы хотите получить ошибку при отсутствии ключа? Тогда воспользуйтесь индексированием. 

Вы хотите иметь (возможно None) значение по умолчанию, если ключ отсутствует и нет ошибок? Тогда используйте my_dict.get().

Дополнительную информацию о встроенных методах можно найти в [документации Python](https://docs.python.org/3/library/stdtypes.html#mapping-types-dict).

### Список методов.

Как нетрудно догадаться, у словарного метода pop() есть аналог, который работает для списков (Почему методы словаря key() и values() не работают для списков?).
 
Мы пользуемся этой возможностью, чтобы показать еще несколько полезных методов списков. Представьте, что список называется s.

|метод|эффект|
|---|---|
|s.pop(i)|вернуть значение по индексу i и удалить его из списка|
|s.append(x)|поставить x в конец списка|
|s.insert(i, x)|вставить x по индексу i в список|
|s.remove(x)|удалить первое вхождение x из списка|
|s.reverse()|изменить порядок элементов в списке|

### Использование словарей как kwargs.

Изящная особенность словарей заключается в том, что словари можно передавать в функции в качестве аргументов. 

В дополнение к именованным аргументам ключевого слова функция может принимать произвольные аргументы ключевого слова (а не произвольные аргументы без ключевого слова). Это указывается в определении функции путем включения последнего аргумента с двойной звездочкой **. Kwords с двойной звездочкой передаются как словарь.

In [1]:
def concatenate_sequences(a, b, **kwargs):
    """Concatenate (combine) 2 or more sequences."""
    seq = a + b

    for key in kwargs:
        seq += kwargs[key]

    return seq

Давайте попробуем!

In [2]:
concatenate_sequences('TGACAC', 'CAGGGA', c='GGGGGGGGG', d='AAAATTTTT')

'TGACACCAGGGAGGGGGGGGGAAAATTTTT'

Теперь представьте, что у нас есть словарь, содержащий наши значения.

In [3]:
my_dict = {"a": "TGACAC", "b": "CAGGGA", "c": "GGGGGGGGG", "d": "AAAATTTTT"}

Теперь мы можем передать это прямо в функцию, поставив перед ней двойную звездочку.

In [4]:
concatenate_sequences(**my_dict)

'TGACACCAGGGAGGGGGGGGGAAAATTTTT'

### Объединение словарей.

У меня есть два словаря, у которых нет одинаковых ключей, и я хочу объединить их вместе. Это может быть похоже на рассмотрение двух томов энциклопедии; у них нет ключей, и они им нравятся, и мы могли бы рассматривать их как единый том. Как мы можем этого добиться?

Функция dict(), в сочетании с оператором ** в вызовах функций позволяет это сделать . Мы просто в вызове dict() ставим ** перед каждым словарем- аргументом.

In [5]:
restriction_dict = {"KpnI": "GGTACC", "HindII": "AAGCTT", "ecoRI": "GAATTC"}

dict(**my_dict, **restriction_dict, another_seq="AGTGTAGTG")

{'a': 'TGACAC',
 'b': 'CAGGGA',
 'c': 'GGGGGGGGG',
 'd': 'AAAATTTTT',
 'KpnI': 'GGTACC',
 'HindII': 'AAGCTT',
 'ecoRI': 'GAATTC',
 'another_seq': 'AGTGTAGTG'}