# Множества (```set```)

Множества в Python полностью аналогичны одноименным математическим объектам. Множества -- это неупорядоченный набор уникальных элементов. В Python они представлены типом ```set```. Литералами множеств являются фигурные скобки, в точности как в математической нотации. Однако нельзя создать пустое множество с помощью выражения ```{}```, в этом случае будет создан пустой словарь. Пустое множество можно создать используя вызов функции ```set()```.

In [1]:
a = set()
b = {1, 2, 3}
print(f'{a = }, {type(a) = }')
print(f'{b = }, {type(b) = }')

a = set(), type(a) = <class 'set'>
b = {1, 2, 3}, type(b) = <class 'set'>


Элементы множества должны быть хешируемыми, это означает, что в множествах можно хранить только неизменяемые типы. При этом само множество является изменяемым типом, а значит нехешируемо. Обратите внимание, что кортежи являются хешируемыми, только в том случае, если все их элементы хешируемы. В примере ниже в запись множества были добавлены элементы ```1``` и ```True```, которые являются эквивалентными. Поэтому при создании множества объект ```True``` был исключен как дубликат.

In [2]:
a = {
    1, 2.0, 3 + 4j,
    'monty_python',
    True, False, None,
    (1, 2, 3),
    tuple,
}
print(f'{a = }')

a = {False, 1, 2.0, (1, 2, 3), None, (3+4j), <class 'tuple'>, 'monty_python'}


Такое поведение делает из множеств отличный инструмент для удаления дубликатов (поиск уникальных элементов) из последовательностей.

In [3]:
a = [42, 1, 2, 1, 3, 1, 2]
print(f'{set(a) = }')

set(a) = {3, 1, 42, 2}


## Операции со множествами

Можно узнать длину множества с помощью стандартной функции ```len```.

In [4]:
a = {1, 2, 3}
print(f'{len(a) = }')

len(a) = 3


Множества в Python реализованы на основе хэш-таблиц. В связи с этим множества являются неупорядоченными коллекциями. Это приводит к тому, что во множествах нельзя обращаться к элементу по индексу и нельзя брать срез. 

In [5]:
b = {3, 42, 'abc', 0, -1, '0'}
print(f'{b = }')
print(f'{b[0] = }')

b = {0, 3, 42, '0', -1, 'abc'}


TypeError: 'set' object is not subscriptable

Однако, множества являются итерируемыми коллекциями. Но не стоит итерироваться по ним из-за отсутствия порядка. 

In [6]:
b = {3, 42, 'abc', 0}

for item in b:
    print(f'{item}')

0
42
3
abc


Со множествами можно выполнять все операции, предусмотренные теорией множеств, а именно брать пересечение, объединение, разность и др. Эти операции представлены несколькими способами. Можно использовать операторы ```&```, ```|```, ```-``` и другие. В этом случае оба операнда должны иметь тип ```set```. Для всех этих операций есть представление в виде соответствующих методов. Отличие операторов от методов заключается в том, что методы могут принимать не только аргументы, которые должны иметь тип ```set```, но и любой итерируемый объект. Кроме этого методы могут принимать любое количество аргументов. Дополнительно у этих операторов есть аналоги в виде in-line операторов и соответствующие методы для изменения множеств "на месте".

In [7]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}

print(f'Пересечение: {a & b = }')  # a и b должны быть типа set
# a должна быть типа set, b любой итерируемый объект, может 
# принимать любое количество аргументов.
print(f'Пересечение: {a.intersection(b) = }')
print(f'Разность: {a - b = }')

a &= b
print(f'Пересечение (in-place): {a = }')

Пересечение: a & b = {3, 4}
Пересечение: a.intersection(b) = {3, 4}
Разность: a - b = {1, 2}
Пересечение (in-place): a = {3, 4}


В таблице приведены операторы и методы для этих операций.

| Операция                | Оператор | Метод                             |
|-------------------------|:--------:|-----------------------------------|
| Пересечение             | ```&```  | ```intersection```                |
|                         | ```&=``` | ```intersection_update```         |
| Объединение             | ```\|``` | ```union```                       |
|                         | `\|=`    | ```update```                      |
| Разность                | ```-```  | ```difference```                  |
|                         | ```-=``` | ```difference_update```           |
| Симметрическая разность | ```^```  | ```symmetric_difference```        |
|                         | ```^=``` | ```symmetric_difference_update``` |

Кроме этих математический операций существует набор операций сравнения, включая оператор ```in``` для проверки элемента на вхождение в множество.

In [8]:
a = {1, 2, 3, 4}
b = {3, 4}

print(f'Проверка наличия элемента: {1 in a = }')
print(f'b влючено в a (подмножество): {b <= a = }')
print(f'b строго влючено в a (подмножество): {b < a = }')
print(f'b включает a (надмножество): {b >= a = }')
print(f'b строго включает a (надмножество): {b > a = }')

Проверка наличия элемента: 1 in a = True
b влючено в a (подмножество): b <= a = True
b строго влючено в a (подмножество): b < a = True
b включает a (надмножество): b >= a = False
b строго включает a (надмножество): b > a = False


Так как множества -- это изменяемый тип, то для них есть набор методов для их изменения.

In [9]:
a = {1, 2, 3, 4}
a.add(5)  # добавить элемент
b = a.pop()  # удалить элемент
a.remove(2)  # удалить элемент по значению
a.discard(5)  # удалить элемент по значению, если есть

# Полезные ссылки

- [Python и теория множеств](https://habr.com/ru/post/516858/#otnosheniya-mezhdu-mnozhestvami)