<img src="../Img/ФинУ.jpg">

# Алгоритмы и структуры данных в языке Python

# Лекция 3. Словари, множества, выражения-генераторы

# Часть 1. Словари и множества

## Разделы: <a class="anchor" id="разделы"></a>

* [Словари](#словари)
    * [Создание словаря](#создание-словаря)
    * [Операции над словарями](#операции-над-словарями)
    * [Перебор элементов словаря](#перебор-элементов-словаря)
* [Множества](#множества)

In [2]:
# загружаем стиль для оформления презентации
from IPython.display import HTML
from urllib.request import urlopen
html = urlopen("file:../lec_v1.css")
HTML(html.read().decode('utf-8'))

# Словари <a class="anchor" id="словари"></a>
* [к оглавлению](#разделы)

<em class="df"></em> __Словарь__ – изменяемая, неинедксируемая, упорядоченная коллекция.

* В качестве __ключа__ можно указать __неизменяемый объект__, например число, строку или кортеж.
* __Значения словаря__ могут содержать объекты __произвольного типа данных__ и  иметь неограниченную степень  вложенности. 
* Доступ к значениям словаря осуществляется по ключу.

### Создание словаря <a class="anchor" id="создание-словаря"></a>
* [к оглавлению](#разделы)

Создание словаря с nомощью конструктора `dict()`. Допустимые форматы вызова конструктора:

* `diсt(<Ключ1>=<Значение1>[,  ... ,  <КлючN>=<ЗначениеN>])` 
* `diсt(<Словарь>)`
* `diсt(<Список кортежей с двумя  элементами (Ключ, Значение)>)`
* `diсt(<Список списков с двумя элементами [Ключ, Значение]>)`

In [3]:
dict() # пустой словарь

{}

In [1]:
# В этом способе имена ключей должны быть корректными именами переменных Python.
# В создаваемом словаре становятся ключами строкового типа
dict(a=1, b=2)

{'a': 1, 'b': 2}

In [2]:
# Ошибка из-за того, что 1а - некорректное имя
dict(1a=1, b=2)

SyntaxError: invalid decimal literal (1004537152.py, line 2)

In [5]:
# Создание словаря без явного использования конструктора.
d0 = {'a': 1, 'b': 2}

In [4]:
# Создание словаря на основе другого словаря (копирование словаря).
d0c = dict(d0)
d0c

{'a': 1, 'b': 2}

In [10]:
# ... на основе списка кортежей вида (ключ, значение).
dict([('a', 1), ('b', 1)]) 

{'a': 1, 'b': 1}

In [11]:
# ... на основе списка списков вида: (ключ, значение).
dict([['a', 1], ['b', 1]])

{'a': 1, 'b': 1}

Пусть ключи и значения хранятся в отдельно, например в двух списках. Тогда воспользуемся функцией *zip*.

In [2]:
keys = ['a', 'b', 'c']
vals = [1, 2, 3]

lkv = list(zip(keys, vals))
lkv

[('a', 1), ('b', 2), ('c', 3)]

Далее на основе списка кортежей создадим словарь.

In [3]:
dict(lkv)

{'a': 1, 'b': 2, 'c': 3}

В действительности конструктор *dict()* работает не только со списками, но и с итерируемыми объектами. То есть *dict* можно применять напрямую к *zip* без использования *list*.

In [4]:
dict(zip(keys, vals))

{'a': 1, 'b': 2, 'c': 3}

In [5]:
zip(keys, vals) # zip() возвращает не список, а итерируемый объект!

<zip at 0x2894e6ebf80>

In [6]:
list(zip('hello', [1, 2])) # zip() заканчивает работу как только кончается один из итерируемых объектов

[('h', 1), ('e', 2)]

Создание словаря при помощи указания всех элементов словаря внутри фигурных скобок.  Это наиболее часто используемый способ создания словаря. Между ключом и значением указывается двоеточие, а пары "ключ/значение" перечисляются через запятую.

In [7]:
d1 = {} # пустой словарь
d1

{}

In [8]:
d2 = {'a': 1, 'b': 2}
d2

{'a': 1, 'b': 2}

In [9]:
d2 = {'1a': 1, 'b': 2}
d2

{'1a': 1, 'b': 2}

Поэлементное заполнение словаря:

In [11]:
d3 = {} # создание пустого словаря
d3['a'] = 1 # добавление элемента в словарь
d3['b'] = 2
d3

{'a': 1, 'b': 2}

In [23]:
# Напоминание: ключами словаря могут быть только неизменяемые объекты (кортежи, строки, числа и т.д.)
d3[d2] = 3

TypeError: unhashable type: 'dict'

Создание словаря с помощью метода `dict.fromkeys(<Последовательность> [,  <Значение>])`.  Метод создает новый словарь, ключами которого будут элементы последовательности. Если второй параметр не указан, то значением элементов словаря будет значение *None*.

In [12]:
d4 = dict.fromkeys(['a', 'b'], 1)
d4

{'a': 1, 'b': 1}

In [13]:
d5 = dict.fromkeys(['a', 'b'])
d5

{'a': None, 'b': None}

**Копирование словаря**

Приравнивание одного словаря другому не приводит к созданию нового словаря.

In [30]:
g1 =  {1: ['a', 'b', 'c'], 2: ['d', 'e', 'f']}
g2 = g1
print(id(g1))
print(id(g2))
print(g1 is g2)

2788749925696
2788749925696
True


**Поверхностная копия словаря**

- Создание поверхностной копии словаря с помощью метода *copy*

In [52]:
g1 =  {1: ['a', 'b', 'c'], 2: ['d', 'e', 'f']}
g2 = g1.copy()
print(id(g1))
print(id(g2))
print(g1 is g2)

2788749732608
2788736178816
False


Мы видим, что объекты словарей разные, однако, для значений изменяемого типа при этом способе копирования копии не создается, поэтому, если значениями ключей являются изменяемые типы данных, то изменение такого значения в одном словаре сказывается на изменении в другом.

In [47]:
g1 =  {1: ['a', 'b', 'c'], 2: ['d', 'e', 'f']}
g2 = g1.copy()
g2[1][0] = 'XX'
print(g1)
print(g2)

{1: ['XX', 'b', 'c'], 2: ['d', 'e', 'f']}
{1: ['XX', 'b', 'c'], 2: ['d', 'e', 'f']}


- Создание поверхностной копии с помощью функции *dict*

In [48]:
g1 =  {1: ['a', 'b', 'c'], 2: ['d', 'e', 'f']}
g2 = dict(g1)

print(id(g1))
print(id(g2))
print(g1 is g2)

g1[2][2] = 'YY'
print(g1)
print(g2)

2788750097984
2788749885888
False
{1: ['a', 'b', 'c'], 2: ['d', 'e', 'YY']}
{1: ['a', 'b', 'c'], 2: ['d', 'e', 'YY']}


**Глубокая копия словаря**

- создание глубокой копии словаря с помощью функции *deepcopy* из модуля *copy*

In [55]:
import copy
g1 =  {1: ['a', 'b', 'c'], 2: ['d', 'e', 'f']}
g2 = copy.deepcopy(g1)

g1[1][0] = 'RR'
print(g1)
print(g2)

{1: ['RR', 'b', 'c'], 2: ['d', 'e', 'f']}
{1: ['a', 'b', 'c'], 2: ['d', 'e', 'f']}


# >

---

# Операции над словарями <a class="anchor" id="операции-над-словарями"></a>
* [к оглавлению](#разделы)

In [36]:
d9 = {1: 'integer', 'a': 'string', (1, 2): 'tuple'} 

Нахождение размера словаря:

In [37]:
len(d9)

3

Извлечение значений из словаря:

In [38]:
d9[1]

'integer'

In [39]:
d9['a']

'string'

In [40]:
d9[(1, 2)]

'tuple'

In [41]:
d9['c'] # ошибка! Обращение к несуществующему элементу

KeyError: 'c'

Проверить существование ключа можно с  nомощью оператора `in`:
* если ключ найден, то возвращается значение *True*
* в противном случае *False*.

In [82]:
'a' in d9

True

In [83]:
'c' in d9

False

In [84]:
if 'c' in d9:
    print(d9['c'])
else:
    print(None)

None


Метод `get(<Ключ> [,  <Значение  пo  умолчанию>])` позволяет избежать вывода сообщения об ошибке при отсутствии указанного ключа:
* если ключ присутствует в словаре, то метод возвращает значение, соответствующее этому ключу
* если ключ отсутствует, то возвращается значение `None` или значение, указанное во втором nараметре.

In [46]:
print(d9)
print(d9.get('a'))

{1: 'integer', 'a': 'string', (1, 2): 'tuple'}
string


In [43]:
print(d9.get('c')) # обращение к несуществующему элементу

None


In [44]:
d9.get('c', 'default')

'default'

In [45]:
d9.get('a', 'default')

'string'

Пример использования метода *get*. Создадим словарь и изменим одно из значений.

In [48]:
d91 = dict(zip('abcd', range(4)))
print(d91)

d91['a'] = d91['a'] + 100
d91

{'a': 0, 'b': 1, 'c': 2, 'd': 3}


{'a': 100, 'b': 1, 'c': 2, 'd': 3}

Что делать, если мы не знаем заранее, есть ли в словаре конкретный ключ ?

In [50]:
# Пробуем изменить значение несуществующего ключа.
d91['e'] = d91['e'] + 1
d91

KeyError: 'e'

Тогда на помощь приходит метод *get*.

In [49]:
d91['a'] = d91.get('a', 0) + 1
d91

{'a': 101, 'b': 1, 'c': 2, 'd': 3}

In [51]:
d91['e'] = d91.get('e', 0) + 1
d91

{'a': 101, 'b': 1, 'c': 2, 'd': 3, 'e': 1}

Кроме того,  можно воспользоваться методом `setdefault(<Ключ>[,  <Значение  по  умолчанию>])`:
* если ключ присутствует в словаре, то метод возвращает значение соответствующее этому ключу
* если ключ отсутствует, то вставляет новый элемент со значением, указанным во втором  параметре
    * если второй параметр не указан, значением нового элемента будет `None`.

In [60]:
d10 = dict(a=1, b=2)
d10

{'a': 1, 'b': 2}

In [61]:
d10.setdefault('a')

1

In [57]:
d10.setdefault('c')
d10

{'a': 1, 'b': 2, 'c': None}

In [63]:
d10.setdefault('d', 3)

3

In [64]:
d10

{'a': 1, 'b': 2, 'd': 3}

Так как словари относятся к  изменяемым типам данных, мы можем изменить элемент по ключу. Если элемент с указанным ключом отсутствует в словаре, то он будет добавлен в словарь.

In [65]:
d11 = dict(a=1, b=2)
d11

{'a': 1, 'b': 2}

In [66]:
d11['a'] = 11 # изменение значения по ключу
d11

{'a': 11, 'b': 2}

In [67]:
d11['с'] = 13 # добавление значения
d11

{'a': 11, 'b': 2, 'с': 13}

Удалить элемент из словаря можно с помощью оператора *del*.

In [69]:
d12 = dict(a=1, b=2)
del d12['b']
d12

{'a': 1}

# >

---------

 # Перебор элементов словаря  <a class="anchor" id="перебор-элементов-словаря"></a>
* [к оглавлению](#разделы)

In [63]:
d13 = dict(a=5, f=7, b=12, c=9, d=5)

# Обход ключей словаря в цикле for
for k in d13:
    print(f'key: {k}')

key: a
key: f
key: b
key: c
key: d


In [3]:
# Обход ключей словаря в цикле for, использование метода keys(), результат тот же
for k in d13.keys():
    print(f'key: {k}')

key: a
key: f
key: b
key: c
key: d


In [4]:
# Обход ключей и значений словаря в цикле for
for k in d13:
    print(f'key: {k}, value: { d13[k]}')

key: a, value: 5
key: f, value: 7
key: b, value: 12
key: c, value: 9
key: d, value: 5


In [5]:
# Обход упорядоченных по возрастанию ключей в цикле for.
for k in sorted(d13.keys()):
    print(f'key: {k}, value: { d13[k]}')

key: a, value: 5
key: b, value: 12
key: c, value: 9
key: d, value: 5
key: f, value: 7


In [6]:
# Получение ключей
list(d13) 

['a', 'f', 'b', 'c', 'd']

In [9]:
# Получение ключей
d13.keys()

dict_keys(['a', 'f', 'b', 'c', 'd'])

In [7]:
# обход значений словаря в цикле for:
for v in d13.values():
    print(f'value: {v}')
# в словаре могут содержаться одинаковые значения!

value: 5
value: 7
value: 12
value: 9
value: 5


In [8]:
# получение значений:
d13.values()

dict_values([5, 7, 12, 9, 5])

In [10]:
# обход пар ключ-значение в цикле for:
for k, v in d13.items():
    print(f'key: {k}, value: {v}')

key: a, value: 5
key: f, value: 7
key: b, value: 12
key: c, value: 9
key: d, value: 5


In [11]:
# получение перечня кортежей ключ-значение:
d13.items()

dict_items([('a', 5), ('f', 7), ('b', 12), ('c', 9), ('d', 5)])

Методы `dict.keys()`, `dict.values()`, `dict.items()` возвращают **представления словарей**. 

__Представление словаря__ – это итерируемый объект, доступный только для чтения и хранящий ключи или значения в зависимости от того, какое представление было запрошено.

Между представлениями и обычными итерируемыми объектами есть два различия:
* если словарь, для которого было получено представление, изменяется, то представление будет отражать эти изменения. 
* представления ключей и элементов поддерживают некоторые операции, свойственные множествам. Допустим, у нас  имеются представление словаря `v` и множество или представление словаря `х`; для этой пары поддерживаются следующие операции:
<br><br>

    * `v & х` # Пересечение 
    * `v | х` # Объединение 
    * `v - х` # Разность 
    * `v ^ х` # Строгая дизъюнкция (симметрическая разность)

<u>Пример</u>. Создадим словарь, создадим представление, изменим словарь. Изменится ли представление?

In [20]:
string = 'abcd'
dict_1 = dict(zip(string, range(len(string))))
view_1 = dict_1.items() # Представление
print(type(view_1))
view_1

<class 'dict_items'>


dict_items([('a', 0), ('b', 1), ('c', 2), ('d', 3)])

In [13]:
# Изменим словарь
dict_1['a'] = 100

In [14]:
view_1

dict_items([('a', 100), ('b', 1), ('c', 2), ('d', 3)])

Как видим, представление изменилось.

Пример. Создадим два словаря и объединим их в один словарь с помощью представлений.

In [61]:
string_1, string_2 = 'abcd', 'efgh'
dict_1 = dict(zip(string_1, range(len(string_1)))) # Первый словарь
dict_2 = dict(zip(string_2, range(len(string_2)))) # Второй словарь

view_1 = dict_1.items() # Представление 1-го словаря
view_2 = dict_2.items() # Представление 2-го словаря

view_3 = view_1 | view_2 # Объединение представлений
view_3 # Получили множество

{('a', 0),
 ('b', 1),
 ('c', 2),
 ('d', 3),
 ('e', 0),
 ('f', 1),
 ('g', 2),
 ('h', 3)}

Результатом объединения представлений является множество

In [59]:
type(view_3)

set

С помощью функции *dict()* создадим словарь на базе множества

In [60]:
dict_3 = dict(view_3)
dict_3

{'g': 2, 'f': 1, 'c': 2, 'a': 0, 'e': 0, 'd': 3, 'b': 1, 'h': 3}

Как обходить словарь и при необходимости удалять из него элементы?

In [65]:
d13 = dict(a=5, f=7, b=12, c=9, d=5)

d13c = dict(d13)
d13c

{'a': 5, 'f': 7, 'b': 12, 'c': 9, 'd': 5}

<u>Пример</u>. Удалим пары с ключом больше *b*.

In [66]:
# Попытка реализации тривиального способа решения задачи:
for k, v in d13c.items():
    if k > 'b':
        del d13c[k] # НЕЛЬЗЯ удалять ключ-значение из словаря во время итерации по представлению этого словаря!

RuntimeError: dictionary changed size during iteration

In [67]:
# Решение проблемы удаления:
d13c = dict(d13)
# Создаем из представления список.
for k, v in list(d13c.items()): 
    if k > 'b':
# Во время удаления представление уже не используется, используется список
        del d13c[k] 
d13c

{'a': 5, 'b': 12}

Метод `рор(<Ключ> [, <Значение по умолчанию>])` удаляет элемент с  указанным  ключом и возвращает его значение. Если ключ отсутствует, то возвращается значение из второго параметра. Если ключ отсутствует и второй параметр не указан, то возбуждается исключение *KeyError*.

In [22]:
d14 = dict(a=5, b=12, c=9, d=5)

In [23]:
d14.pop('a')

5

In [24]:
d14

{'b': 12, 'c': 9, 'd': 5}

In [25]:
d14.pop()

TypeError: pop expected at least 1 argument, got 0

Метод `popitem()` удаляет последний добавленный в словарь элемент (до версии 3.7 метод удалял произвольный элемент) и возвращает кортеж из ключа и значения. Если словарь пустой, возбуждается исключение `KeyError`.

In [1]:
d15 = dict(a=5, b=12, c=9, d=5)

In [2]:
d15.popitem()

('d', 5)

In [3]:
d15

{'a': 5, 'b': 12, 'c': 9}

In [4]:
d15['z'] = 42

In [5]:
# извелекается последний добавленный элемент:
d15.popitem()

('z', 42)

`clear()` удаляет все элементы словаря. Метод ничего не возвращает.

In [6]:
d15.clear()

In [7]:
d15

{}

Метод `update()` добавляет элементы в словарь. Метод изменяет текущий словарь и ничего не возвращает. Форматы метода:
* `uрdаtе(<Ключ1>=<Значение1>[,  ... ,  <КлючN>=<ЗначениеN>])`
* `uрdаtе(<Словарь>)`
* `update(<Cпиcoк кортежей с двумя элементами>)`
* `update(<Cпиcoк списков с  двумя элементами>)`

Если элемент с указанным ключом уже присутствует в словаре, то его значение будет перезаписано. 

In [68]:
d16 = dict(a=5, b=12, c=9, d=5)

In [69]:
d16.update(c=3, d=4, e=8) 
d16

{'a': 5, 'b': 12, 'c': 3, 'd': 4, 'e': 8}

# >

----

# Множества <a class="anchor" id="множества"></a>
* [к оглавлению](#разделы)

<em class="df"></em> __Множество__ — изменяемая, неиндексируемая, неупорядоченная  коллекция.

Множество может содержать только элементы  неизменяемых типов, например числа, строки, кортежи. Объявить множество можно с помощью конструктора `set()`.

In [34]:
s1 = set()
s1

set()

In [36]:
# Преобразуем список в множество
s2 = set([1, 2, 3, 4, 5])
s2

{1, 2, 3, 4, 5}

In [37]:
# Преобразуем список, содержащий совпрадающие элементы, в множество
s3 = set([1, 2, 3, 1, 2, 3])
s3

{1, 2, 3}

In [38]:
# Использование итерируемого объекта вместо списка
s21 = set(range(5))
s21

{0, 1, 2, 3, 4}

В Python 3 можно также создать множество, указав элементы внутри фигурных скобок. Обратите внимание на то,  что при указании пустых фигурных скобок будет создан словарь, а не  множество.  Чтобы  создать  пустое  множество,  следует  использовать  функцию `set()`.

In [49]:
{1, 2, 3, 1, 2, 3} # В множестве останутся только уникальные элементы

{1, 2, 3}

In [40]:
# обход элементов множества в цикле for:
for v in s2:
    print(v, end=' ')

1 2 3 4 5 

In [41]:
len(s2)

5

<u>Пример</u>. Обход уникальных значений в списке (порядок обхода не сохраняется).

In [43]:
# Создаем список с повторяющимися элементами.
import random
rl = []
for _ in range(15):
    rl.append(random.randint(1, 15))
rl

[2, 14, 1, 4, 7, 3, 5, 2, 11, 14, 12, 8, 7, 13, 8]

In [44]:
# Обход уникальных значений в списке, порядок обхода не сохраняется.
for e in set(rl):
    print(e)

1
2
3
4
5
7
8
11
12
13
14


In [45]:
s3 = {1, 2, 3, 4}
s4 = {2, 4, 5, 6}

In [46]:
# объединение множеств:
s3 | s4

{1, 2, 3, 4, 5, 6}

In [47]:
# объединение множеств:
s3.union(s4)

{1, 2, 3, 4, 5, 6}

In [53]:
# Элементы одного множества можно добавить в другое множество.
s3.update(s4) # эквивалентно: s3 |= s4
s3

{1, 2, 3, 4, 5, 6}

In [54]:
s3 = {1, 2, 3, 4}
s4 = {2, 4, 5, 6}
s3 |= s4
s3

{1, 2, 3, 4, 5, 6}

In [56]:
# & и intersection() - пересечение множеств:

s3 = {1, 2, 3, 4}
s4 = {2, 4, 5, 6}

s4 & s3 #  s4.intersection(s3) 

{2, 4}

`а &= b` и `а.intersection_update(b)` — во множестве *а* останутся элементы, которые существуют и во множестве *а*, и во множестве *b*.

In [57]:
s3 = {1, 2, 3, 4}
s4 = {2, 4, 5, 6}
s3.intersection_update(s4)
s3

{2, 4}

In [60]:
# разница множеств:
s3 = {1, 2, 3, 4}
s4 = {2, 4, 5, 6}
s4 - s3 # s4.difference(s3)

{5, 6}

In [61]:
# Удаляем элементы из множества s3, которые присутствуют во множестве s4.
s3 = {1, 2, 3, 4}
s4 = {2, 4, 5, 6}
s3 -= s4 # s3.difference_update(s4)
s3

{1, 3}

In [63]:
# Такой же результат
s3 = {1, 2, 3, 4}
s4 = {2, 4, 5, 6}
s3.difference_update(s4)
s3

{1, 3}

`^` и `symmetric_difference()` — возвращают элементы обоих множеств, присутствующие только в одном из множеств-аргументов.

In [64]:
{3, 4, 5, 6} ^ {5, 6, 7, 8}

{3, 4, 7, 8}

`a ^= b` и `a.symmetric_difference_update(b)` — во множестве `а` будут все элементы обоих множеств, исключая одинаковые элементы.

In [65]:
s3 = {1, 2, 3, 4}
s4 = {2, 4, 5, 6}
s3.symmetric_difference_update(s4)
s3

{1, 3, 5, 6}

### Операторы сравнения множеств

`in` — проверка наличия элемента во множестве:

In [159]:
s3

{1, 2, 3, 4}

In [160]:
2 in s3

True

In [161]:
7 in s3

False

== — проверка на равенство (совпадение значений множеств):

In [162]:
set([1, 2, 3]) == set([1, 2, 3])

True

* `а <= b` и `a.issubset(b)` проверяют, входят ли все элементы множества а во множество b
* `а < b` проверяет, входят ли все элементы множества а во множество b.  Причем множество а не должно быть равно множеству b
* `а >= b` и `а.issuperset(b)` - проверяют, входят ли все элементы множества b во множество а
* `а > b` - проверяет, входят ли все элементы множества b во множество а.  Причем множество а не должно быть равно множеству b
* `а.isdisjoint(b)` - возвращает `True`, если результатом пересечения множеств а и b является пустое множество (это означает, что множества не имеют одинаковых элементов)

`сору()` — создает копию множества. Обратите внимание на то, что оператор `=` присваивает лишь ссылку на тот же объект, а не копирует его.

`add(<Элемент>)` — добавляет <Элемент> во множество:

In [68]:
s8 = {1, 2, 3}
s8.add(4)
s8

{1, 2, 3, 4}

`remove(<Элемент>)` — удаляет <Элемент> из множества. Если элемент не найден, то возбуждается исключение `KeyError`

In [66]:
s9 = {1, 2, 3}
s9.remove(2)
s9

{1, 3}

In [67]:
s9.remove(4)

KeyError: 4

`disсаrd(<Элемент>)`— удаляет <Элемент> из множества, если он присутствует.

In [69]:
s10 = {1, 2, 3}
s10.discard(2)
s10

{1, 3}

In [70]:
s10.discard(4)

`рор()` — удаляет произвольный элемент из множества и возвращает его. Если элементов нет, то возбуждается исключение `KeyError`

In [73]:
s11 = {1, 2, 3}
deleted_element = s11.pop()
print(deleted_element)
s11

1


{2, 3}

`clear()` — удаляет все элементы из множества

In [75]:
s11 = {1, 2, 3}
s11.clear()
s11

set()

# >

----