Рассмотрим пример. У вас есть несколько уникальных товаров: хлеб, булка, молоко, кефир, сметана, колбаса, ветчина. У каждого товара есть категория: мучное, молочное, мясное. Также в нашем примере есть девочка Маша, которая любит молоко с булкой и сметаной, и есть мальчик Петя, который обожает булку с колбасой и ветчиной.

Можно рассмотреть несколько операций. Первой будет принадлежность. Булка входит в категорию «мучное»? Да. А что насчёт молока? Нет, этот товар (элемент) не входит в категорию (множество) «мучное».

Какие товары любят Петя И Маша вместе? Это булка. Получается, что пересечением двух подмножеств товаров будет один товар — булка.

Какие товары любит Петя ИЛИ Маша? Это булка, молоко, колбаса, сметана, ветчина. То есть объединением товаров у двух ребят будет список из пяти уникальных товаров.

Можно задать вопрос: а почему товаров пять, если у каждого их было по три?

Дело в том, что нам не нужно учитывать два раза один товар (булку), в этом нет смысла.

Так же рассуждает структура данных множество — в нём могут находиться только уникальные элементы.

Введём чуть более формальное определение для множеств.

**Множество** — это структура данных, состоящая из уникальных элементов (элементы не могут повторяться). Элементы внутри множества могут быть объектами неизменяемых типов (числа, строки и кортежи). Множества не поддерживают хранение изменяемых типов данных, таких как списки, словари и сами множества. Порядок элементов во множестве не фиксирован, то есть элементы не упорядочены.

С множествами можно делать многие операции из теории множеств: объединение, пересечение, вычитание и т. д. Можно проверять принадлежность элемента к множеству.

Любые неизменяемые типы данных могут быть элементами множества: числа, строки, кортежи.

Зачем нужны множества, если есть списки?

В отличие от списков, где элементы хранятся в виде последовательностей, в множествах порядок хранения элементов не определён. Внутри множества представлены с помощью «хитрых» алгоритмов, которые позволяют выполнять операции типа «проверить принадлежность элемента множеству» быстрее, чем просто перебором всех элементов множества.

На практике множества используются в случаях, когда надо взять только уникальные элементы из списка, а затем посмотреть только те элементы, которые есть либо в двух множествах, либо в каком-то одном из них.

Например, у нас есть статистика по продажам разных товаров.
Она хранится в словаре `d = {"apple": 145, "mango": 31, "banana": 1, "orange": 1}`.

Затем нам понадобилось посмотреть, какие значения имеют товары, однако нам не хочется смотреть на повторы. Тогда можно воспользоваться множествами. В итоге получится последовательность из трёх элементов: 145, 31, 1. Порядок элементов в множествах может не соблюдаться.

### Задание множества

Пустое множество можно задать одним способом — через конструктор типов set().
```python
set1 = set()
set1 
# set()
```
Так же можно задать множество, уже содержащее элементы:
```python
s1 = set("hello")
s1 
#  {'h', 'l', 'e', 'o'}
```

Мы видим, что в множестве содержится только одна буква 'l', так как множества содержат только уникальные элементы.

Также стоит отметить, что множества обрамляются с двух сторон фигурными скобками.

**Важно!** Вы можете создать множество с помощью фигурных скобок, но внутри множества уже должны быть элементы (хотя бы один). Пустые фигурные скобки указывают, что создаётся словарь, а не множество — про это нужно помнить.
```python
s1 = {}
type(s1) 
# <class 'dict'>

s2 = {1,2,3}
type(s2) 
# <class 'set'>
```

### Методы множеств

#### .add()

Быстро и безболезненно добавить новый элемент в множество можно с помощью метода .add():
```python
s = {1, 2, 3, 4}
s.add(5)
s 
# {1, 2, 3, 4, 5}
```

#### update()
В тех случаях, когда добавить во множество надо сразу несколько элементов, удобно воспользоваться методом update(). Ему можно передать один или сразу несколько итерируемых объектов (строк, списков, кортежей, множеств), и он автоматически добавит все их уникальные элементы в исходное множество (если, конечно, их там ещё нет).

#### .discard(), .remove()

Методы **discard()** и **.remove()** позволяют убрать элемент из множества.

Их отличие друг от друга состоит в том, что при удалении уже отсутствующего элемента из множества discard() ничего не сделает, а вот .remove() выкинет ошибку.

Суть выбора заключается в логике вашего алгоритма. Если вам важно, чтобы удаление элемента было явным, используйте метод .remove().

Например,  вы отвечаете за безопасность в банке. У сотрудников банка есть различные доступы. Вы пишите алгоритм, который будет удалять сотрудников, когда те увольняются. Вам важно, чтобы удаление происходило один раз, иначе поведение программы настораживает, и нужно явно указывать на ошибку в ней. В таком случае вы обязаны использовать метод .remove() на множестве работников банка. 

В любом другом случае используйте discard().

Рассмотрим пример с удалением элемента, которого нет во множестве.
```python
s1 = {1,2,3,4,5}
s1.remove(10)
# Ошибка KeyError: 10
s1.discard(10)
# Ничего не произошло
```

#### .union()

Это важная операция из теории множеств. Её суть заключается в том, чтобы отобрать из двух множеств все элементы, которые есть хотя бы в одном из них. Другими словами, объединить без повторов элементы обоих множеств.

Например, есть два сотрудника. У каждого на столе находится несколько предметов: у первого — ноутбук, тетрадь, карандаш, а у второго — ноутбук, жвачка. Тогда после операции объединения (.union()) в множестве будут следующие элементы: ноутбук, тетрадь, карандаш, жвачка.

Вот ещё пример. Вы анализируете товары на разных складах вашей компании. Вам очень важно знать, какие товары есть на двух складах. Причём вам не нужно брать повторяющиеся товары. Тогда вам необходимо использовать метод .union() для двух множеств товаров на складах.
```python
cluster1 = {"item1", "item2", "item3", "item4"}
cluster2 = {"item2", "item3", "item5", "item7"}
cluster1.union(cluster2) 
# {"item1", "item2", "item3", "item4", "item5", "item7"}
```
Мы видим, что .union() взял все имеющиеся элементы в двух множествах ровно один раз. Порядок следования элементов может не соблюдаться.

#### .intersection()

При **.intersection()** берутся все элементы, которые есть в обоих множествах.

Возьмём также пример с товарами и кластерами. Только на этот раз вы не хотите знать, какие есть товары у вас на двух складах — вы хотите посмотреть на товары, которые лежат и на первом, и на втором складе. Делаете вы это для того, чтобы, например, оптимизировать хранение. Возможно, вы увидите дальше, что лучше перекинуть какие-то товары на один склад и сэкономить деньги.
```python
cluster1 = {"item1", "item2", "item3", "item4"}
cluster2 = {"item2", "item3", "item5", "item7"}
cluster1.intersection(cluster2) 
# {"item2", "item3"}
```
Видим, что изначально в двух множествах одинаковыми элементами являлись лишь второй и третий товары.

#### .difference()

**.difference()** выбирает все элементы из первого множества, которых нет во втором множестве.

Теперь мы хотим посмотреть на те товары, которые есть только на первом складе. Возможно, будет удобно распределить часть товаров на два склада. Нужно понять, что это за товары.
```python
cluster1 = {"item1", "item2", "item3", "item4", "item5"}
cluster2 = {"item3", "item4", "item5", "item6"}
cluster1.difference(cluster2) 
# {"item1", "item2"}
```
В первом множестве только товары 1 и 2 являются уникальными для первого кластера при наличии остальных на втором кластере.

#### .issubset()

Метод **.issubset()** используется для того, чтобы узнать, все ли элементы из первого множества есть во втором множестве.

Все ли товары с первого склада есть и на втором складе?
```python
cluster1 = {"item1", "item2", "item3"}
cluster2 = {"item2", "item3", "item4", "item5", "item6"}
cluster1.issubset(cluster2) 
# False
```

Видно, что ответ — нет. И действительно: на первом складе есть "item1", которого нет на втором складе.

***Дополнительно***

Статья о множествах в [Python](https://python-scripts.com/sets)