#### Словари (dict) и работа с ними
##### Словарь, пожалуй, является самой важной из встроенных в Python структур данных. Его также называют хешем, отображением или ассоциативным массивом. Он представляет собой коллекцию пар ключ–значение переменного размера, в которой и ключ, и значение – объекты Python. Создать словарь можно с помощью фигурных скобок {}, отделяя ключи от значений двоеточием:

In [4]:
empty_dict = {}
d1 = {'a' : 'some value', 'b' : [1, 2, 3, 4]}

##### Для доступа к элементам, вставки и присваивания применяется такой же синтаксис, как в случае списка или кортежа:

In [5]:
print(d1)
d1[7] = 'an integer'
print(d1)
d1['a'] = 55
print(d1)
print(d1['b'])

{'a': 'some value', 'b': [1, 2, 3, 4]}
{'a': 'some value', 'b': [1, 2, 3, 4], 7: 'an integer'}
{'a': 55, 'b': [1, 2, 3, 4], 7: 'an integer'}
[1, 2, 3, 4]


##### Проверка наличия ключа в словаре тоже производится как для кортежа или списка:

In [6]:
'b' in d1

True

#### Допустимые типы ключей словаря
##### Значениями словаря могут быть произвольные объекты Python, но ключами должны быть неизменяемые объекты, например скалярные типы (int, float, str) или tuple (причем все объекты кортежа тоже должны быть неизменяемыми).

In [7]:
d = {(5,6):3}
print(d[5,6])

3


Технически это свойство называется хешируемостью. Проверить, является ли объект хешируемым (и, стало быть, может быть ключом словаря), позволяет функция hash:

In [8]:
print(hash('string'))
print(hash(5))
print(hash(5.5))
print(hash((5, 6)))
print(hash((5, 6, [1, 2, 3])))

5805229049069466362
5
1152921504606846981
-7007623702649218251


TypeError: unhashable type: 'list'

In [None]:
country = {'code': 'RU', 'name': 'Russia', 'population': 144}
print(country)
for i in country:
    print(i)

Функции у словарей похожи на функции у списков:
1) d.items() - Передача словаря в виде списка кортежей (key, value)

In [None]:
print(country.items())
for key, value in country.items():
    print(f"{key} - {value}")

Выше можно заменить выражение, именуемое как f-строка:
f"{key} - {value}"

F-строки задаются с помощью литерала «f» перед кавычками и делают очень простую вещь — они берут значения переменных, которые есть в текущей области видимости, и подставляют их в строку. В самой строке вам лишь нужно указать имя этой переменной в фигурных скобках.

2. keys() и values() возвращают соответственно список ключей и список значений. Хотя точный порядок пар ключ–значение не определен, эти методы возвращают ключи и значения в одном и том же порядке:

In [None]:
print('keys:', list(country.keys()))
print('values:', list(country.values()))

Без этих функций, пришлось бы с помощью цикла заполнять массив следующим образом:

In [None]:
keys = []
values = []
for i in country:
    keys.append(i)
    values.append(country[i])
print('keys:', keys)
print('values:', values)

2) d.pop() - Удаление пары (ключ : значение) по ключу

Для удаления ключа можно использовать либо ключевое слово del, либо метод pop (который не только удаляет ключ, но и возвращает ассоциированное с ним значение):

In [None]:
print(country)
a = country.pop('name') #del country['name']
print(a, country)

4. Два словаря можно объединить методом update:
Метод update модифицирует словарь на месте, т. е. старые значения существующих ключей, переданных update, стираются.

In [None]:
print(country)
country.update({'b' : 'foo', 'population' : 100})
print(country)

3) d.popitem() - Удаление последней пары (ключ : значение)

In [None]:
print(country)
country.popitem()
print(country)

4) d.clear() - очистка списка d

In [None]:
country.clear()
print(country)

#### Создание словаря из последовательностей
##### Нередко имеются две последовательности, которые естественно рассматривать как ключи и соответствующие им значения, а значит, требуется построить из них словарь. Поскольку словарь – это, по существу, коллекция 2-кортежей, функция dict принимает список 2-кортежей:

In [None]:
k = ('a', 'b', 'c')
v = ([1, 2, 3, 4, 5], [6, 7, 8, 9, 10], [11, 12, 13, 14, 15])
d = dict(zip(k, v))
print(d)

Словари удобны для описания какого-то объекта

In [None]:
person = {
    'user_1': {
        'first_name': 'Иван',
        'last_name': 'Иванов',
        'age': '18',
        'address': ('Обнинск', 'Студгородок', '15', '3'),
    },
    'user_2': {

    }
}

print(person['user_1']['address'][1])

Такой формат данных используется в веб-запросах (JSON)

#### Множества (set и frozenset)
##### Множество – это неупорядоченная коллекция уникальных элементов. Можно считать, что это словари, не содержащие значений. Создать множество можно двумя способами: с помощью функции set или задав множество-литерал в фигурных скобках:

In [None]:
data = set('hello')
print(data)

#### Основные функции множеств:

In [None]:
data = {5, 7, 4, 3, 5}
print(data)

1) a.add(x) - Добавить элемент x в множество a

In [None]:
data.add(9)
print(data)

2) a.remove(x) - Удалить элемент x из множества a

In [None]:
data.remove(True)
print(data)

3) a.pop(x) - Удалить какой-то элемент x из множества a и возбудить
исключение KeyError, если множество пусто

In [None]:
data.pop()
print(data)

4) a.clear() - Опустошить множество, удалив из него все элементы

In [None]:
data.clear()
print(data)

##### Теоретико-множественные операции
#### Множества поддерживают теоретико-множественные операции: объединение, пересечение, разность и симметрическую разность. Рассмотрим следующие два примера множеств:

In [None]:
a = {1, 2, 3, 4, 5}
b = {3, 4, 5, 6, 7, 8}

##### Их объединение – это множество, содержащее неповторяющиеся элементы, встречающиеся хотя бы в одном множестве. Вычислить его можно с помощью метода union или бинарного оператора |:

In [None]:
print(a.union(b))
print(a | b)

##### Пересечение множеств содержит элементы, встречающиеся в обоих множествах. Вычислить его можно с помощью метода intersection или бинарного оператора &:

In [None]:
a.intersection(b)
a & b

##### Все теоретико-множественные операции представлены в таблице

![Операции над множествами](https://lh3.googleusercontent.com/s1-okXO4OSnBnmMCuWiEoly9viX0oqMnwU-L70S-eUEa7M-znS2rzCXK2BaWvzLx-0llaEcQhR069O52Ab1mx5yD-qlPCQINYxvwx-BBTjQ8-fuwhL8ZWaUZUEfpJRLZy_iMqWakeVNppyrGTk91eFrJV0KaJRPfXTyes9pp0wcn7CjYpYWtHLSM8Vflt-une-VCDJxvHV-tlxfJluMStOsV1yiLpGbGDFnHCpsxLdyvJbFpA_ASY7yiF3LcVlNJgdr4yU6tnRtTKi3IRmUmEP4LzpDjwWD5XWaAzm6MOC3ZaXswqMpxePDEAPJ5fGPM41aDV_HiDovERca61IYTyN6LotHnm9CEF-pdCeq27zwJ34F6Imk7pwlHwEhMo8QN-3UlPb0kRcGYdcma38DF6DVrHxMkcQI83FpOUKfQGAUnz02MCSeSLJGxQYLTa8xu5mIvVpH9mwTOGG7iU2Yxrs9qeA4a-rmO_0mDlmGZH8dT2vvtANTqQpUZD36v6VEri4vNDx72uiznxG-gKD8DtFSOaZ6kQZRwuNjP-BQ_-LYidofUMe8PK41YO3GDiabSVsF8R8_JTuhVDEnSsCLQu9_r0XLscHSkJkKSCliFsSJKxNqkGOyZie98M0yTZuYRd8VlvqCicozi3vNtwdAfvyVN-en90oxXTXtvFlP62ChicT49mko3ZRQGpskTMiS960m6r0SPEajqjZrEJGQnywQmiHOF6rCKrlrahiiPhuM-7Gn3x8hQuXe0hHbjhS7ux1gAEjJYNt6DrYc1ghP8gcO596YfPIaxwUZSk9oMDqqW1-YlhPxmyzblapXMzQ_wxUlji9LEyt538zmQfp332CkYyEexxcfQHqP8Sb9-fdNvwOvUt2x5TlBMMFnfAvan7C3-xeqNKLBx-S11WCL_758lP7XAOr10jpmPuA=w896-h453-no?authuser=0)

##### Как видно, у всех логических операций над множествами имеются варианты с обновлением на месте, которые позволяют заменить содержимое множества в левой части результатом операции. Для очень больших множеств это может оказаться эффективнее:

#### Списковое, словарное и множественное включения
##### Списковое включение – Это механизм, который позволяет кратко записать создание нового списка, образованного фильтрацией элементов коллекции с одновременным преобразованием элементов, прошедших через фильтр. Основная синтаксическая форма такова:
`[expr for val in collection if condition]`
##### Это эквивалентно следующему циклу for:
```
result = []
for val in collection:
    if condition:
        result.append(expr)
```

##### Например, если задан список строк, то мы могли бы выделить из него строки длиной больше 2 и попутно преобразовать их в верхний регистр:

In [9]:
strings = ['a', 'as', 'bat', 'car', 'dove', 'python']
result = [x.upper() for x in strings if len(x) > 2]
print(result)

['BAT', 'CAR', 'DOVE', 'PYTHON']


##### Используя стандартную запись это выглядело бы так:

In [10]:
strings = ['a', 'as', 'bat', 'car', 'dove', 'python']
result = []
for val in strings:
    if len(val) > 2:
        result.append(val.upper())
print(result)

['BAT', 'CAR', 'DOVE', 'PYTHON']


##### Словарное и множественное включения – естественные обобщения, которые предлагают аналогичную идиому для порождения словарей и множеств. Словарное включение выглядит так:
```dict_comp = {key-expr : value-expr for value in collection if condition}```
```set_comp = {expr for value in collection if condition}```
##### Допустим, требуется построить множество, содержащее длины входящих в коллекцию строк; это легко сделать с помощью множественного включения:

In [12]:
strings = ['a', 'as', 'bat', 'car', 'dove', 'python']
unique_lengths = {len(x) for x in strings}
print(unique_lengths)

{1, 2, 3, 4, 6}


##### В качестве простого примера словарного включения создадим словарь, сопоставляющий каждой строке ее позицию в списке:

In [15]:
strings = ['a', 'as', 'bat', 'car', 'dove', 'python']
loc_mapping = {val : index for index, val in enumerate(strings)}
print(loc_mapping)

{'a': 0, 'as': 1, 'bat': 2, 'car': 3, 'dove': 4, 'python': 5}


#### Вложенное списковое включение
##### Пусть имеется список списков, содержащий английские и испанские имена. Возможно, вы взяли эти имена из двух разных файлов и решили рассортировать их по языкам. А теперь допустим, что требуется получить один список, содержащий все имена, в которых встречается не менее двух букв e. Конечно, это можно было бы сделать с помощью вложенных циклов for:

In [24]:
all_data = [['John', 'Emily', 'Michael', 'Mary', 'Steven'],['Maria', 'Juan', 'Javier', 'Natalia', 'Pilar']]
names_of_interest = []
for names in all_data:
    enough_es = []
    for name in names:
        if name.count('e') >= 2:
            enough_es.append(name)
    names_of_interest.extend(enough_es)
print(names_of_interest)

['Steven']


##### Или же в таком цикле for:

In [25]:
all_data = [['John', 'Emily', 'Michael', 'Mary', 'Steven'],['Maria', 'Juan', 'Javier', 'Natalia', 'Pilar']]
names_of_interest = []
for names in all_data:
    enough_es = [name for name in names if name.count('e') >= 2]
    names_of_interest.extend(enough_es)
print(names_of_interest)

['Steven']


##### Но можно обернуть всю операцию одним вложенным списковым включением:

In [18]:
names_of_interest = [name for names in all_data for name in names if name.count('e') >= 2]
print(names_of_interest)

['Steven']


##### Поначалу вложенное списковое включение с трудом укладывается в мозгу. Части for соответствуют порядку вложенности, а все фильтры располагаются в конце, как и раньше. Вот еще один пример, в котором мы линеаризуем список кортежей целых чисел, создавая один плоский список:

In [19]:
some_tuples = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]
flattened = [x for tup in some_tuples for x in tup]
print(flattened)

[1, 2, 3, 4, 5, 6, 7, 8, 9]


In [20]:
flattened = []
for tup in some_tuples:
    for x in tup:
        flattened.append(x)
print(flattened)

[1, 2, 3, 4, 5, 6, 7, 8, 9]


##### Глубина уровня вложенности не ограничена, хотя, если уровней больше трех, стоит задуматься о правильности выбора структуры данных. Важно отличать показанный выше синтаксис от спискового включения внутри спискового включения – тоже вполне допустимой конструкции:

In [26]:
[[x for x in tup] for tup in some_tuples]

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]