# Лекция 3 "Словари, множества и выражения-генераторы"
##  часть 1 Словари и множества
### Финансовый университет при Правительстве РФ, лектор С.В. Макрушин

v 0.7 11.08.2021

## Разделы: <a class="anchor" id="разделы"></a>

* [Словари](#словари)
    * [Создание словаря](#создание-словаря)
    * [Операции над словарями](#операции-над-словарями)
    * [Перебор элементов словаря](#перебор-элементов-словаря)
* [Множества](#множества)

In [22]:
# загружаем стиль для оформления презентации
from IPython.display import HTML
from urllib.request import urlopen
html = urlopen("file:./lec_v1.css")
HTML(html.read().decode('utf-8'))

# Словари <a class="anchor" id="словари"></a>
* [к оглавлению](#разделы)

<em class="df"></em> __Словари__ - это наборы объектов, доступ к которым осуществляется не по индексу, а __пo ключу__.
* В качестве __ключа__ можно указать __неизменяемый объект__, например число, строку или кортеж.
* __Элементы словаря__ могут содержать объекты __nроизвольного типа данных__ и  иметь неограниченную степень  вложенности. 
* Чтобы  nолучить  элемент,  необходимо  указать ключ, который использовался при сохранении значения. 
* В словаре можно изменить элемент, хранящийся по определенному ключу.

Порядок эклментов в словаре:
* До Python 3.6 порядок хранения элементов в словаре не гарантировался. Т.е. обход элементов словаря мог привести к произвольному порядку получения элементов.
* Начиная с Python 3.6 в словарях порядок обхода стал соответствовать порядку, в котором элементы сохранялись в словаре. Однако, такое поведение являлось всего лишь спецификой реализации референсной реализации Python CPython, а не спецификой языка Python. 
* Начиная с Python 3.7 сохранение порядка вставки стало требованием языка и все реализации Python 3.7 должны реализовывать эту логику.

### Создание словаря <a class="anchor" id="создание-словаря"></a>
* [к оглавлению](#разделы)

Создание словаря с nомощью конструктора `dict()`. Допустимые форматы вызова конструктора: 
* `diсt(<Ключ1>=<Значение1>[,  ... ,  <КлючN>=<ЗначениеN>])` 
* `diсt(<Словарь>)`
* `diсt(<Список  кортежей  с  двумя  элементами  (Ключ,  Значение)>)`
* `diсt(<Список  списков  с  двумя элементами  [Ключ,  Значение]>)`

In [27]:
dict() # пустой словарь

{}

In [28]:
# при данном способе имена ключей должны быть корректными идентификаторами Python:
dict(a=1, b=2)

{'a': 1, 'b': 2}

In [29]:
# ошибка:
dict(1a=1, b=2)

SyntaxError: invalid syntax (<ipython-input-29-91c01e426dc6>, line 2)

In [32]:
# создание словаря без явного использования конструктора:
d0 = {'a': 1, 'b': 2}

In [33]:
# создание словаря на основе другого словаря (копирование словаря):
d0c = dict(d0)

In [34]:
# ... на основе списка кортежей вида: (ключ, значение):
dict([('a', 1), ('b', 1)]) 

{'a': 1, 'b': 1}

In [35]:
# ... на основе списка списков вида: (ключ, значение):
dict([['a', 1], ['b', 1]])

{'a': 1, 'b': 1}

Объединить два списка в список кортежей позволяет функция `zip()`

In [36]:
k = ['a', 'b', 'c']
v = [1, 2, 3]

In [38]:
lkv = list(zip(k, v))
lkv

[('a', 1), ('b', 2), ('c', 3)]

In [39]:
dict(lkv)

{'a': 1, 'b': 2, 'c': 3}

В действительности конструктор `dict()` работает не только со списками, но и с итерируемыми объектами:

In [40]:
# dict можно применять напрямую к zip:
dict(zip(k, v))

{'a': 1, 'b': 2, 'c': 3}

In [41]:
zip(k, v) # zip() возвращает не список, а итерируемый объект!

<zip at 0x27b5655f188>

In [42]:
list(zip('hello', [1, 2])) # zip() заканчивает работу как только кончается один из итерируемых объектов

[('h', 1), ('e', 2)]

Создание словаря при помощи указания всех элементов словаря внутри фигурных скобок.  Это наиболее часто используемый способ создания словаря. Между ключом и значением указывается двоеточие, а пары "ключ/значение" перечисляются через запятую.

In [43]:
d1 = {} # пустой словарь
d1

{}

In [44]:
d2 = {'a':1, 'b':2}
d2

{'a': 1, 'b': 2}

In [45]:
d2 = {'1a':1, 'b':2}
d2

{'1a': 1, 'b': 2}

Поэлементное заполнение словаря:

In [46]:
d3 = {} # создание пустого словаря
d3['a'] = 1 # добавление элемента в словарь
d3['b'] = 2
d3

{'a': 1, 'b': 2}

In [47]:
# напоминание: ключами словаря могут быть только неизменяемые объекты (кортежи, строки, числа и т.д.)
d3[d2] = 3

TypeError: unhashable type: 'dict'

Создание словаря с помощью метода `dict.fromkeys(<Последовательность> [,  <Значение>] )`.  Метод создает новый словарь, ключами которого будут элементы последовательности. Если второй параметр не указан, то значением элементов словаря будет значение `None`.

In [48]:
d4 = dict.fromkeys(['a', 'b'], 1)
d4

{'a': 1, 'b': 1}

In [49]:
d5 = dict.fromkeys(['a', 'b'])
d5

{'a': None, 'b': None}

Создание поверхностной копии с помощью функции `dict()`:

In [50]:
d6 = dict(d4)
d6

{'a': 1, 'b': 1}

In [51]:
d6 is d4 # словари разные

False

Создание поверхностной копии с помощью функции copy()

In [52]:
d7 = d6.copy()
d7

{'a': 1, 'b': 1}

In [21]:
d7 is d6 # словари разные

False

Создание глубокой копии словаря

In [22]:
import copy
d8 = copy.deepcopy(d6)
d8

{'a': 1, 'b': 1}

# >

---

# Операции над словарями <a class="anchor" id="операции-над-словарями"></a>
* [к оглавлению](#разделы)

In [77]:
d9 = {1: 'int', 'a': 'string', (1, 2): 'tuple'} 

Определение размера словаря:

In [78]:
len(d9)

3

Извлечение значений из словаря:

In [79]:
d9[1]

'int'

In [80]:
d9['a']

'string'

In [81]:
d9[(1, 2)]

'tuple'

In [74]:
d9['c'] # ошибка! Обращение к несуществующему элементу

KeyError: 'c'

Проверить существование ключа можно с  nомощью оператора `in`:
* если ключ найден, то возвращается значение `True`
* в противном случае - `False`.

In [82]:
'a' in d9

True

In [83]:
'c' in d9

False

In [84]:
if 'c' in d9:
    print(d9['c'])
else:
    print(None)

None


Метод `get(<Ключ> [,  <Значение  no  умолчанию>])` позволяет избежать вывода сообщения об ошибке при отсутствии указанного ключа:
* если ключ присутствует в словаре, то метод возвращает значение, соответствующее этому ключу
* если ключ отсутствует, то возвращается значение `None` или значение, указанное во втором nараметре.

In [85]:
print(d9.get('a'))

string


In [88]:
print(d9.get('c')) # обращение к несуществующему элементу

None


In [89]:
d9.get('c', 'default')

'default'

In [90]:
d9.get('a', 'default')

'string'

In [91]:
d91 = dict(zip('abcd', range(4)))
d91

{'a': 0, 'b': 1, 'c': 2, 'd': 3}

In [92]:
# способ, НЕ позволяющий работать с отсутствующими элементами:
d91['a'] = d91['a'] + 1
d91

{'a': 1, 'b': 1, 'c': 2, 'd': 3}

In [93]:
# способ, НЕ позволяющий работать с отсутствующими элементами:
d91['e'] = d91['e'] + 1
d91

KeyError: 'e'

In [94]:
# способ, позволяющий работать с отсутствующими элементами:
d91['a'] = d91.get('a', 0) + 1
d91

{'a': 2, 'b': 1, 'c': 2, 'd': 3}

In [95]:
d91['e'] = d91.get('e', 0) + 1
d91

{'a': 2, 'b': 1, 'c': 2, 'd': 3, 'e': 0}

Кроме того,  можно воспользоваться методом `setdefault(<Ключ>[,  <Значение  по  умолчанию>])`:
* если ключ присутствует в словаре, то метод возвращает значение соответствующее этому ключу
* если ключ отсутствует, то вставляет новый элемент со значением, указанным во втором  nараметре
    * если второй параметр не указан, значением нового элемента будет `None`.

In [96]:
d10 = dict(a=1, b=2)
d10

{'a': 1, 'b': 2}

In [97]:
print(d10.setdefault('a'))

1


In [5]:
d10

{'a': 1, 'b': 2}

In [98]:
print(d10.setdefault('c'))

None


In [99]:
d10

{'a': 1, 'b': 2, 'c': None}

In [100]:
d10.setdefault('d', 3)

3

In [101]:
d10

{'a': 1, 'b': 2, 'c': None, 'd': 3}

Так как словари относятся к  изменяемым типам данных, мы можем изменить элемент по ключу. Если элемент с указанным ключом отсутствует в словаре, то он будет добавлен в словарь.

In [102]:
d11 = dict(a=1, b=2)
d11

{'a': 1, 'b': 2}

In [103]:
d11['a'] = 11 # изменение значения по ключу
d11

{'a': 11, 'b': 2}

In [105]:
d11['с'] = 13 # добавление значения
d11

{'a': 11, 'b': 2, 'с': 13}

Получить количество ключей в словаре позволяет функция `len()`:

In [106]:
len(d11)

3

Удалить элемент из словаря можно с помощью оператора `del`:

In [107]:
d12 = dict(a=1, b=2)
del d12['b']
d12

{'a': 1}

In [108]:
len(d12)

1

# >

---------

 # Перебор элементов словаря  <a class="anchor" id="перебор-элементов-словаря"></a>
* [к оглавлению](#разделы)

In [114]:
d13 = dict(a=5, f=7, b=12, c=9, d=5)

In [115]:
# обход ключей словаря в цикле for:
for k in d13:
    print(f'key: {k}')

key: a
key: f
key: b
key: c
key: d


In [113]:
# НЕ эффективный обход ключей и значений словаря в цикле for:
for k in d13:
    print(f'key: {k}, value: { d13[k]}')

key: a, value: 5
key: b, value: 12
key: c, value: 9
key: d, value: 5


In [117]:
# обход ключей словаря в цикле for:
for k in d13.keys():
    print(f'key: {k}')

key: a
key: f
key: b
key: c
key: d


In [116]:
# обход упорядоченных по возрастанию ключей в цикле for:
for k in sorted(d13.keys()):
    print(f'key: {k}, value: { d13[k]}')

key: a, value: 5
key: b, value: 12
key: c, value: 9
key: d, value: 5
key: f, value: 7


In [118]:
# получение cписка ключей
list(d13) 

['a', 'f', 'b', 'c', 'd']

In [119]:
# получение cписка ключей
list(d13.keys())

['a', 'f', 'b', 'c', 'd']

In [120]:
# обход значений словаря в цикле for:
for v in d13.values():
    print(f'value: {v}')
# в словаре могут содержаться одинаковые значения!

value: 5
value: 7
value: 12
value: 9
value: 5


In [121]:
# получение cписка значений:
list(d13.values())

[5, 7, 12, 9, 5]

In [122]:
# обход пар ключ-значение в цикле for:
for k, v in d13.items():
    print(f'key: {k}, value: {v}')

key: a, value: 5
key: f, value: 7
key: b, value: 12
key: c, value: 9
key: d, value: 5


In [21]:
# получение cписка кортежей ключ-значение:
list(d13.items())

[('a', 5), ('b', 12), ('c', 9), ('d', 5)]

Методы `dict.items()`, `dict.keys()` и `dict.values()` возвращают __представления словарей__. 

__Представление словаря__ - это итерируемый объект, доступный только для чтения и хранящий элементы, ключи или значения словаря в зависимости от того, какое представление было запрошено. 

Между представлениями и обычными итерируемыми объектами есть два различия:
* если словарь, для которого было получено представление, изменяется, то представление будет отражать эти изменения. 
* представления ключей и элементов поддерживают некоторые операции, свойственные множествам. Допустим, у нас  имеются представление словаря `v` и множество или представление словаря `х`; для этой пары поддерживаются следующие операции: 
    * `v & х` # Пересечение 
    * `v | х` # Объединение 
    * `v - х` # Разность 
    * `v ^ х` # Строгая дизъюнкция 

Как обходить словарь и при необходимости удалять из него элементы?

In [123]:
d13c = dict(d13)
d13c

{'a': 5, 'f': 7, 'b': 12, 'c': 9, 'd': 5}

In [124]:
# попытка реализации тривиального способа решения задачи:
for k, v in d13c.items():
    if k > 'b':
        del d13c[k] # НЕЛЬЗЯ удалять ключ-значение из словаря во время итерации по представлению этого словаря!

RuntimeError: dictionary changed size during iteration

In [46]:
# решение проблемы удаления:
d13c = dict(d13)
# сначала итерируемся по представлению словарь.items() и создаем из него список:
for k, v in list(d13c.items()): 
    if k > 'b':
# во время удаления представление уже не используется, используется его КОПИЯ в списке        
        del d13c[k] 
d13c

{'a': 5, 'b': 12}

`рор(<Ключ> [, <Значение по умолчанию>])` - удаляет элемент с  указанным  ключом и возвращает его значение. Если ключ отсутствует, то возвращается значение из второго параметра. Если ключ отсутствует и второй параметр не указан, то возбуждается исключение KeyError.

In [126]:
d14 = dict(a=5, b=12, c=9, d=5)

In [127]:
d14.pop('a')

5

In [128]:
d14

{'b': 12, 'c': 9, 'd': 5}

In [129]:
d14.pop()

TypeError: pop expected at least 1 arguments, got 0

`popitem()` - удаляет последний добавленный в словарь элемент (до версии 3.7 метод удалял произвольный элемент) и возвращает кортеж из ключа и значения. Если словарь пустой, возбуждается исключение `KeyError`.

In [131]:
d15 = dict(a=5, b=12, c=9, d=5)

In [132]:
d15.popitem()

('d', 5)

In [133]:
d15

{'a': 5, 'b': 12, 'c': 9}

In [134]:
d15['z'] = 42

In [135]:
# извелекается последний добавленный элемент:
d15.popitem()

('z', 42)

`clear()` - удаляет все элементы словаря. Метод ничего не возвращает в качестве значения.

In [136]:
d15.clear()
d15

{}

`update()` - добавляет элементы в словарь.  Метод изменяет текущий словарь и  ничего не возвращает. Форматы метода:
* `uрdаtе(<Ключ1>=<Значение1>[,  ... ,  <КлючN>=<ЗначениеN>])`
* `uрdаtе(<Словарь>)`
* `update(<Cпиcoк кортежей с двумя элементами>)`
* `update(<Cпиcoк списков с  двумя элементами>)`

Если элемент с указанным ключом уже присутствует в словаре, то его значение будет перезаписано. 

In [137]:
d16 = dict(a=5, b=12, c=9, d=5)

In [138]:
d16.update(c=3, d=4) 
d16

{'a': 5, 'b': 12, 'c': 3, 'd': 4}

# >

----

# Множества <a class="anchor" id="множества"></a>
* [к оглавлению](#разделы)

<em class="df"></em> __Множество__ - это  неупорядоченная  коллекция уникальных элементов, с  которой можно сравнивать другие элементы, чтобы определить, принадлежат ли они этому множеству. Множество может содержать только элементы  неизменяемых типов, например числа, строки, кортежи. Объявить множество можно с помощью конструктора `set()`.

In [139]:
s1 = set()
s1

set()

In [140]:
# преобразуем список в множество:
s2 = set ([1, 2, 3, 4, 5])
s2

{1, 2, 3, 4, 5}

In [91]:
# преобразуем список, содержащий совпрадающие элементы, в множество:
s3 = set ([1, 2, 3, 1, 2, 3])
s3

{1, 2, 3}

In [95]:
# использование итерируемого объекта вместо списка:
s21 = set(range(5))
s21

{0, 1, 2, 3, 4}

В Python 3 можно также создать множество, указав элементы внутри фигурных скобок. Обратите внимание на то,  что при указании пустых фигурных скобок будет создан словарь, а не  множество.  Чтобы  создать  пустое  множество,  следует  использовать  функцию `set()`.

In [142]:
{1, 2, 3, 1, 2, 3}

{1, 2, 3}

In [143]:
# обход элементов множества в цикле for:
for v in s2:
    print(v, end=' ')

1 2 3 4 5 

In [144]:
len(s2)

5

Пример: обход уникальных значений в списке (порядок обхода не сохраняется):

In [146]:
# создаем список с повторяющимися элементами:
import random
rl = []
for _ in range(15):
    rl.append(random.randint(1, 15))
rl

[14, 5, 15, 15, 7, 11, 11, 8, 4, 5, 4, 9, 2, 4, 1]

In [147]:
# обход уникальных значений в списке, порядок обхода не сохраняется:
for e in set(rl):
    print(e)

1
2
4
5
7
8
9
11
14
15


In [148]:
s3 = {1, 2, 3, 4}
s4 = {2, 4, 5, 6}

In [149]:
# объединение множеств:
s3 | s4

{1, 2, 3, 4, 5, 6}

In [150]:
# объединение множеств:
s3.union(s4)

{1, 2, 3, 4, 5, 6}

In [151]:
# добавляют элементы множества s4 во множество s5:
s5 = {7, 8 , 9}
s5.update(s4) # эквивалентно: s5 |= s4
s5

{2, 4, 5, 6, 7, 8, 9}

In [152]:
s51 = s5.copy()
s51 |= s4
s51

{2, 4, 5, 6, 7, 8, 9}

In [153]:
# & и intersection() - пересечение множеств:
s4 & s3 #  s4.intersection(s3) 

{2, 4}

`а &= b` и `а.intersection_update(b)` - во множестве а останутся элементы, которые существуют и во множестве а, и во множестве b

In [154]:
s7 = {2, 4, 5, 6}

In [155]:
s7 &= s3 # s7.intersection_update(s7)
s7

{2, 4}

In [156]:
# разница множеств:
s4 - s3 # s4.difference(s3)

{5, 6}

In [157]:
# удаляем элементы из множества а, которые присутствуют во множестве b:
s6 = {2, 4, 5, 6} 
s6 -= s3 # s6.difference_update(s3)
s6

{5, 6}

`^` и `symmetric_difference()` - возвращают элементы обоих множеств, присутствующие только в одном из множеств-аргументов.

In [158]:
{3, 4, 5, 6} ^ {5, 6, 7, 8}

{3, 4, 7, 8}

`a ^= b` и `a.symmetric_difference_update(b)` - во множестве `а` будут все элементы обоих множеств, исключая одинаковые элементы.

#### Оnераторы сравнения множеств

`in` - проверка наличия элемента во множестве:

In [159]:
s3

{1, 2, 3, 4}

In [160]:
2 in s3

True

In [161]:
7 in s3

False

== - проверка на равенство (совпадение значений множеств):

In [162]:
set([1, 2, 3]) == set([1, 2, 3])

True

* `а <= b` и `a.issubset(b)` - проверяют, входят ли все элементы множества а во множество b
* `а < b` - проверяет, входят ли все элементы множества а во множество b.  Причем множество а не должно быть равно множеству b
* `а >= b` и `а.issuperset(b)` - проверяют, входят ли все элементы множества b во множество а
* `а > b` - проверяет, входят ли все элементы множества b во множество а.  Причем множество а не должно быть равно множеству b
* `а.isdisjoint(b)` - возвращает `True`, если результатом пересечения множеств а и b является пустое множество (это означает, что множества не имеют одинаковых элементов)

`сору()` - создает копию множества. Обратите внимание на то, что оператор `=` присваивает лишь ссылку на тот же объект, а не копирует его.

`add(<Элемент>)` - добавляет <Элемент> во множество:

In [163]:
s8 = {1, 2, 3}
s8.add(4)
s8

{1, 2, 3, 4}

`remove(<Элемент>)` - удаляет <Элемент> из множества. Если элемент не найден, то возбуждается исключение `KeyError`

In [164]:
s9 = {1, 2, 3}
s9.remove(2)
s9

{1, 3}

In [165]:
s9.remove(4)

KeyError: 4

`disсаrd(<Элемент>)`- удаляет <Элемент> из множества, если он присутствует

In [166]:
s10 = {1, 2, 3}
s10.discard(2)
s10

{1, 3}

In [167]:
s10.discard(4)

`рор()` - удаляет произвольный элемент из множества и возвращает его. Если элементов нет, то возбуждается исключение `KeyError`

In [168]:
s11 = {1, 2, 3}
s11.pop()

1

In [169]:
s11

{2, 3}

`clear()` - удаляет все элементы из множества

In [163]:
s11.clear()
s11

set()

# >

----

#  Задание к следующему разделу

По книге Н. Прохоренок:

Глава 11 Пользовательские функции
повторить из Глав 8 и 9 разделы "Генераторы списков и выражения-генераторы" и "Генераторы словарей" и "Генераторы множеств"

По книге М. Саммерфильд:

Глава 4 Управляющие структуры и функции (разедел "Собственные функции")
Глава 3 Типы коллекций (раздел "Генераторы списков", "Генераторы множеств", "Генераторы словарей")