# Семинар 6

## Множества

**Множества** — ещё один тип данных. Они очень похожи на списки и кортежи, но кое-чем отличаются. Про множества можно думать так: это такие особенные списки, в которых
1. **все объекты уникальны** (в отличие от списков и кортежей, в которых объекты могут повторяться)
2. **объекты «не упорядочены»** (то есть у них нет индексов, в отличие от списков и кортежей)

Создаётся множество так:

```
m = {ЭЛЕМЕНТ1, ЭЛЕМЕНТ2, ЭЛЕМЕНТ3, …}
```

В питоне множества обозначаются словом `set`, а с помощью функции `set()` можно превратить другие итерируемые объекты (строки, списки, кортежи) в множества.

Попробуем создать список исторических названий Петербурга, а потом превратим в множество:

In [1]:
piter_names = ["Санкт-Петербург", "Петроград", "Ленинград", "Санкт-Петербург"]
print(piter_names)
piter_names = set(piter_names)
print(piter_names)

['Санкт-Петербург', 'Петроград', 'Ленинград', 'Санкт-Петербург']
{'Ленинград', 'Петроград', 'Санкт-Петербург'}


Этот пример иллюстрирует оба свойства множеств.
1. Так как объекты множества **уникальны**, в оригинальном списке имя «Санкт-Петербург» повторяется дважды, а во множестве — только один раз.
2. Обратите внимание на то, что при выводе функцией `print()` названия печатаются не в том порядке, в котором мы их подавали. Это при обучении питона часто называют «неупорядоченностью», но это немного некорректно:
   - На самом деле питон, разумеется, хранит элементы множества в некотором порядке — просто этот порядок он определяет сам, так, как ему удобнее, чтобы хранить и обрабатывать содержимое множества было легче для компьютера. Важно, что **пользователь не может предсказать порядок элементов** множества **и не может обращаться к этому порядку**! Я бы назвал это свойство множества **«непредсказуемостью» порядка** элементов, а не «неупорядоченностью».
   - Из-за этого свойства мы не можем обращаться к элементам множества по индексам (ведь индексы от $0$ до $…$ предполагали бы, что элементы упорядочены). Чтобы обратиться к элементу по индексу, придётся сначала сделать из множества список:

In [2]:
print(piter_names)
print(piter_names[1])

{'Ленинград', 'Петроград', 'Санкт-Петербург'}


TypeError: 'set' object is not subscriptable

In [3]:
print(list(piter_names)[1])

Петроград


Несмотря на то, что у множества нет индексов, а порядок элементов непредсказуем, с ними можно делать много вещей, которые можно делать со списками. Например, пройтись циклом или узнать, есть ли в множестве определённый элемент, командой `in`:

In [4]:
for city_name in piter_names:
    print(city_name.upper())

ЛЕНИНГРАД
ПЕТРОГРАД
САНКТ-ПЕТЕРБУРГ


In [5]:
print("Ленинград" in piter_names)
print("Питер" in piter_names)

True
False


В множество можно добавить новые элементы с помощью метода `.add()`. Обратите внимание, что так как порядок элементов *непредсказуем*, добавленный элемент можно оказаться в любом месте внутри множества:

In [6]:
piter_names.add("Болото-Сити")
print(piter_names)

{'Ленинград', 'Болото-Сити', 'Петроград', 'Санкт-Петербург'}


А удалить элемент с определённым значением можно с помощью известного вам метода `.remove()` (который мы уже видели для списков):

In [7]:
piter_names.remove("Ленинград")
print(piter_names)

{'Болото-Сити', 'Петроград', 'Санкт-Петербург'}


### Методы взаимодействия множеств

Содержимое нескольких множеств можно легко сравнивать между собой. Например, сделаем множества всех целых отрицательных чисел не меньше $-4$, всех целых положительных чисел не больше $4$ и всех чётных чисел в том же диапазоне (от $-4$ до $4$). А потом нарисуем эти множества в виде [кругов Эйлера](https://ru.wikipedia.org/wiki/%D0%94%D0%B8%D0%B0%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B0_%D0%AD%D0%B9%D0%BB%D0%B5%D1%80%D0%B0):

In [8]:
negative_numbers = {-4, -3, -2, -1}   # <--- отрицательные числа
positive_numbers = {1, 2, 3, 4}       # <--- положительные числа
even_numbers = {-4, -2, 0, 2, 4}      # <--- чётные числа

print(negative_numbers, positive_numbers, even_numbers, sep="\n")

{-4, -3, -2, -1}
{1, 2, 3, 4}
{0, 2, 4, -4, -2}


<img src="https://sun9-68.userapi.com/impg/wXBp-rbspqRbIQW178DKlZwXM5_esiHLA6tCEg/Vis4NbrnGXw.jpg?size=1233x894&quality=96&sign=ef7119023d880fa8b2251379de2d2f34&type=album" alt="диаграмма Эйлера" width="300"/>

Видно, что множество `positive_numbers` пересекается с `even_numbers` (так как числа $2$ и $4$ — одновременно и положительные, и чётные), и то же верно для пары `negative_numbers` пересекается с `even_numbers`. А вот множества `positive_numbers` и `negative_numbers` не пересекаются — ведь ни одно число не является одновременно и отрицательным, и положительным. Ещё у каждого множества есть такие элементы, которые принадлежат только ему. Например, в множестве `even_numbers` есть число $0$, которое чётно, но не принадлежит ни отрицательным, ни положительным числам.

_____

Итак, попробуем сравнить эти множества. Для этого используется несколько операторов. Оператор `|` (этот символ на клавиатуре обычно можно найти где-то справа около буквы «Э») поможет найти все элементы двух или более множеств. Логически это то же самое, что оператор «ИЛИ» (`or`), выдаются все элементы, которые есть ИЛИ в одном, ИЛИ в другом множестве:

In [9]:
print(positive_numbers | even_numbers)   # <--- положительные или чётные числа

{0, 1, 2, 3, 4, -4, -2}


In [10]:
print(positive_numbers | negative_numbers | even_numbers)

{0, 1, 2, 3, 4, -1, -4, -3, -2}


Оператор `&` поможет найти только те элементы, которые находятся на пересечении множеств. Это логический аналог оператора «И» (`and`):

In [11]:
print(positive_numbers & even_numbers)   # <--- положительные И чётные числа

{2, 4}


In [12]:
print(positive_numbers & negative_numbers)   # <--- положительные и отрицательные числа не пересекаются, поэтому множество пустое

set()


Оператор `-` (дефис) находит разницу между двумя множествами. Он выдаёт все элементы, которые есть в одном множестве, но отсутствуют в другом — то есть буквально вычитает из первого множества второе. Например, можно «вычесть» из положительных чисел чётные. Останутся только нечётные положительные числа:

In [13]:
print(positive_numbers)
print(positive_numbers - even_numbers)

{1, 2, 3, 4}
{1, 3}


Обратите внимание, что операции «И» и «ИЛИ» обладают свойством коммутативности: это значит, что выражение `a | b` равнозначно `b | a`, а выражение `a & b` равнозначно `b & a` (так же, как в арифметике $2 × 5 = 5 × 2$, а $2 + 5 = 5 + 2$). Однако операция «логического вычитания» не обладает этим свойством, как и операция арифметического вычитания: $2-5 ≠ 5-2$. Поэтому важно понимать, из какого множества вычитается какое. Первым (до оператора) мы пишем множество, *из которого* вычитаем, а вторым (после оператора) — то, *чьё содержимое вычитаем*. В общем, всё как в арифметике:

In [14]:
print(positive_numbers - even_numbers)   # <--- все положительные числа, кроме чётных
print(even_numbers - positive_numbers)   # <--- все чётные числа, кроме положительных

{1, 3}
{0, -4, -2}


Последний оператор в этом списке пишется как `^` (чтобы набрать этот символ, перейдите на английскую раскладку и зажмите Shift + «6»). Этот оператор выдаст так называемую «симметричную разницу», то есть все элементы из первого и второго множеств, кроме тех, что находятся на пересечении:

In [15]:
print(positive_numbers)
print(positive_numbers - even_numbers)   # <--- все положительные числа, кроме чётных
print(positive_numbers & even_numbers)   # <--- пересечение положительных и чётных чисел
print(positive_numbers ^ even_numbers)   # <--- все положительные и все чётные, кроме пересечения

{1, 2, 3, 4}
{1, 3}
{2, 4}
{0, 1, 3, -4, -2}


Для каждого из операторов есть также соответствующий метод множеств, который можно использовать в той же функции. Например, для `-` такой метод называется `.difference()`, потому что этот оператор буквально возвращает разницу между двумя множествами. При этом метод применяется к тому множеству, *из которого* вычитается объект, а то, *которое* вычитается, подаётся как аргумент:

In [16]:
print(positive_numbers - even_numbers)
print(positive_numbers.difference(even_numbers))

{1, 3}
{1, 3}


Вот список всех этих операторов и аналогичных им методов:
- объединение всех элементов нескольких множеств
  - оператор `|`
  - метод `.union()`
- пересечение нескольких множеств
  - оператор `&`
  - метод `.intersection()`
- разница («вычитание»)
  - оператор `-`
  - метод `.difference()`
- симметричная разница
  - оператор `^`
  - метод `.symmetric_difference()`

Все операторы и аналогичные им методы возвращают новые множества. Их можно напечатать, пройтись по ним циклам или записать в переменную — в общем, это просто обычные множества (так же, как при сложении или вычитании двух чисел получается обычное число). А ещё можно использовать скобки, чтобы указать на порядок применения операций. Например, сначала сложим вместе все положительные и отрицательные числа, а потом вычтем эту «сумму» из множества чётных чисел:

In [18]:
even_without_pos_neg = even_numbers - (positive_numbers | negative_numbers)
print(even_without_pos_neg)
print(type(even_without_pos_neg))

{0}
<class 'set'>


Остался, предсказуемо, только $0$ (все остальные чётные числа либо положительные, либо отрицательные).