# Множества и словари

## Множества

Это тоже типы перечисления, как и списки, кортежи, диапазоны (range) хранят набор элементов. По смыслу — это такие же множества, как в математике. **Хранят элемент не более одного раза**. В списке можно сделать `a = [42, 42, 10]`, т.е. 42 встречается дважды. В множестве так быть не может.

Для множеств доступны те же действия, что и с перечислениями, кроме того, доступны теоретико-множественные операции типа объединения, пересечения и т.п.

### Создание множества
Тип множества — `set`, (аналогично `int`, `str`, `range`) есть функция с тем же названием `set`, которая позволяет создавать множества.

In [10]:
s1 = {10, 20, 30}  # как список, но только в фигурных скобках
s2 = {"cat", "dog", "cow"}  # множество строк
s3 = {10, "cow"}  # есть и строки, и числа
s4 = {}  # ВНИМАНИЕ!!! Это не пустое множество, это пустой словарь (см. далее)
s5 = set()  # а вот это уже пустое множество
# set(любое перечисление) 
s6 = set([5, 6, 40])  # внутри set() передан список, будет создано множество из его элементов
print("s6", s6)
s7 = set( (40, 50, 11) )  # внутри set() передан кортеж, множество делается из него
print("s7", s7)
s8 = set(range(1, 10))
print("s8", s8)
s9 = set("banana")  # строка — перечисление своих символов
print("s9", s9)
# а еще бывают генераторы множеств. Это то же самое, что генераторы списков,
# только они создают множество и пишутся в фигурных скобках
s10 = {letter.lower() for letter in "Hello, World!"}  # эквивалентно set("H, W!".lower())
print("s10", s10)

s6 {40, 5, 6}
s7 {40, 50, 11}
s8 {1, 2, 3, 4, 5, 6, 7, 8, 9}
s9 {'b', 'n', 'a'}
s10 {'d', 'h', 'o', ' ', ',', 'r', 'e', 'w', 'l', '!'}


## Операции с множествами
[https://docs.python.org/3/library/stdtypes.html#set-types-set-frozenset](https://docs.python.org/3/library/stdtypes.html#set-types-set-frozenset)

Несколько операций, которые есть почти во всех типах-перечислениях:

In [28]:
s = {10, 20, 30}
print(len(s))
print(10 in s)  # принадлежность
print(12 not in s)  # не принадлежит
print(s == {20, 30, 10})  # сравнение множеств, конечно, как и в математике, без учета порядка

3
True
True
True


Для множеств операция `in` работает **очень** быстро. Мы будем пользоваться множеством для реализации орфографического словаря. Там будут все русские слова (~10 тыс), и мы будем очень быстро проверять по слову, правильное это слово или нет.

In [17]:
for x in s:  # перебор элементов множества
    print(x)

10
20
30


Порядок перечисления элементов множества не определен. Теоретически, даже в одной программе два перебора подряд могут перечислить элементы в разном порядке.

Операции, специфические именно для множеств:

In [27]:
s1 = {10, 20, 30, 40}
s2 = {30, 40, 50, 60}

print(s1 | s2)  # объединение множеств
print(s1 & s2)  # пересечение
print(s1 - s2)  # элементы s1, которых нет в s2

print(s1.union(s2))  # тоже объединение
print(s1.union("abc"))  # можно объединять с любым перечислением, не только с множеством
#print(s1 | "abc") не работает
# для & есть intersection, другие аналогичные действия см. в документации по ссылке

# можно объединять, пересекать сразу несколько множеств
s3 = {50, 60, 70, 80}

print(s1 | s2 | s3)
print(s1.union(s2, s3))  # аналогично предыдущему

{40, 10, 50, 20, 60, 30}
{40, 30}
{10, 20}
{40, 10, 50, 20, 60, 30}
{40, 10, 'c', 20, 'b', 'a', 30}
{70, 40, 10, 80, 50, 20, 60, 30}
{70, 40, 10, 80, 50, 20, 60, 30}


Сравнение множеств:

In [32]:
print({10, 20, 30} <= {30, 20, 40, 10, 50})  # первое множество — подмножество второго
print({10, 20, 30} <= {30, 20, 10})  # Да, подмножество
print({10, 20, 30} < {30, 20, 10})  # Нет, проверяется, что не совпадают

True
True
False


Есть копирование множества, это нужно для того же, для чего копируют списки. Чтобы изменения в s1 не влияли на s2.

In [33]:
s1 = {10, 20, 30}
s2 = s1.copy()
print(s1, s2)

{10, 20, 30} {10, 20, 30}


Все предыдущие операции со множествами не изменяли множеств, а создавали новые.

In [34]:
s1 = {10, 20, 30}
s2 = {30, 40, 50}
s3 = s1 & s2
print(s1, s2, s3)  # s1 s2 не изменились

{10, 20, 30} {40, 50, 30} {30}


### Изменяемые и неизменые множества
`set` и `frozenset` — два типа множеств. Вторые это неизменяемые множества. Они эффективнее работают, чем `set`. Все операции выше доступны и для set, и для frozenset. Единственное, создание frozenset только через `frozenset(перечисление)`, через фигурные скобки и через генератор множества создаются только обычные `set`.

Следующие операции работают только для `set`, потому что они изменяют множество:

In [42]:
s1 = set()  # пустое множество
s1.add("cat")
s1.add("dog")
s1.add("cow")  # добавили элементы
s1.add("cow")  # второй раз не добавляется, уже есть
print(s1)
s1.remove("dog")
# s1.remove("bird")  # будет ошибка, нельзя убрать то, чего нет
s1.discard("bird")  # тоже убирает, но не генерирует ошибку, если убирать нечего
print(s1)
animal = s1.pop()  # забрать какой-то элемент
print(animal, s1)
s1.clear() # очистка
print(s1)

{'cow', 'cat', 'dog'}
{'cow', 'cat'}
cow {'cat'}
set()


In [44]:
s1 = {10, 20, 30}
s2 = {20, 30, 40}
# s1 = s1 & s2  # создается новое множество-пересчение. Оно присваивается s1
# при этом исходное множество {10, 20, 30} не изменяется.
s1 &= s2  # множество из переменной s1 изменяется, оно становится равным s1 & s2

# intersection_update аналогичен &=, но можно пересекать не только со множеством
s1.intersection_update(s2)
print(s1)
s1.intersection_update([30, 40, 50])  # можно пересечь со списком
print(s1)

{20, 30}
{30}


## Словари

Действия со словарями: [https://docs.python.org/3/library/stdtypes.html#mapping-types-dict](https://docs.python.org/3/library/stdtypes.html#mapping-types-dict)

Другое название словарей — это ассоциативные массивы. (map по-английски)

Название типа — `dict`, это работает как функция для создания словарей.

Словарь — это массив, в котором в качестве индексов могут выступать произвольные объекты (почти произвольные). Например, вот обычный массив (список в питоне):

In [45]:
a = [10, 20, 30, 40, 50]

Элементы массива (списка) доступны по индексам:

In [48]:
print(a[0])
print(a[2])
a[2] = 31
print(a)

10
30
[10, 20, 31, 40, 50]


Здесь индексы это числа от 0 до 4. В массивах (списках) индексы это числа от 0 до какого-то значения, оно на 1 меньше длины.
В ассоциативном массиве (словаре) индексы могут быть любыми:

In [50]:
d = {}  # создаем пустой словарь
d[0] = 10
d[1] = 20
d[2] = 30
d[3] = 40
d[4] = 50
d[100] = 1010
d["один"] = "двадцать"
d["one"] = "twenty"
print(d)

{0: 10, 1: 20, 2: 30, 3: 40, 4: 50, 100: 1010, 'один': 'двадцать', 'one': 'twenty'}


При распечатке словарь выглядит как перечисление индексов и значений для этих индексов. Также словари и создаются:

In [54]:
d1 = {0: 10, 1: 20, 3: 40, 4: 50, 100: 1010, "один": "двадцать", "one": "twenty"}
d2 = dict([(0, 10), (1, 20), (3, 40), (4, 50)])  # перечисление пар
print(d1)
print(d2)

{0: 10, 1: 20, 3: 40, 4: 50, 100: 1010, 'один': 'двадцать', 'one': 'twenty'}
{0: 10, 1: 20, 3: 40, 4: 50}


# 