Множества в Python set()

![image.png](attachment:64f03c7c-5942-4acf-92a4-6f3fe9d5ce0f.png)

Множества в Python – это структура данных, которые содержат неупорядоченные элементы. Элементы также не является индексированным. Как и список, множество позволяет внесение и удаление элементов. Однако, есть ряд особенных характеристик, которые определяют и отделяют множество от других структур данных:

- Множество не содержит дубликаты элементов;
- Элементы множества являются неизменными (их нельзя менять), однако само по себе множество является изменяемым, и его можно менять;
- Так как элементы не индексируются, множества не поддерживают никаких операций среза и индексирования.

Создание множеств

Существует два пути, следуя которым, мы можем создавать множества в Python.

Мы можем создать множество путем передачи всех элементов множества внутри фигурных скобок {} и разделить элементы при помощи запятых (,).

Основные методы set:
![image.png](attachment:9d568c47-a214-4b1f-9012-1fbfc8ae6a87.png)

In [17]:
set_1 = {1, 2, 3, 4, 5}
print(type(set_1))

<class 'set'>


так же можно создать множество из строк

In [19]:
string_set = {'Nicholas', 'Michelle', 'John', 'Mercy'}
print(string_set)
# расположение элементов множества выдает в случайном порядке

{'Mercy', 'Michelle', 'John', 'Nicholas'}


Мы также можем создать множество с элементами разных типов.

In [21]:
mixed_set = {2.0, "Nicholas", (1, 2, 3)}
print(mixed_set)

{2.0, (1, 2, 3), 'Nicholas'}


Мы также можем создать множество из списков. Это можно сделать, вызвав встроенную функцию Python под названием set().

In [22]:
num_set = set([1, 2, 3, 4, 5, 6])
print(num_set)

{1, 2, 3, 4, 5, 6}


Как упоминалось ранее, множества не содержат дубликаты элементов. Предположим, наш список содержит дубликаты элементов, как показано ниже

In [25]:
num_set = set([1, 2, 3, 1, 2])
print(num_set)
# И снова, множество удалило дубликаты и вернуло только один из дублируемых объектов.

{1, 2, 3}


Создание пустого множества подразумевает определенную хитрость. Если вы используете пустые фигурные скобки {} в Python, вы скорее создадите пустой словарь, а не множество.

In [26]:
x = {}
print(type(x))

<class 'dict'>


Чтобы создать пустое множество в Python, мы должны использовать функцию set() без передачи какого-либо значения в параметрах

In [28]:
x = set()
print(type(x))

<class 'set'>


Доступ к элементам множеств

Python не предоставляет прямой способ получения значения к отдельным элементам множества. Однако, мы можем использовать цикл для итерации через все элементы множества.

In [43]:
months = set(
    ["Jan", "Feb", "March", "Apr",
     "May", "June", "July", "Aug",
     "Sep", "Oct", "Nov", "Dec"]
)

for m in months:
    print(m)

Aug
Sep
Nov
Dec
June
Apr
May
Feb
Jan
Oct
March
July


Мы также можем проверить наличие элемента во множестве при помощи in

In [45]:
months = set(
    ["Jan", "Feb", "March",
     "Apr", "May", "June", "July",
     "Aug", "Sep", "Oct", "Nov", "Dec"]
)
print("May" in months)

True


Код возвращает «True«, а это означает, что элемент был найден во множестве. Аналогичным образом, при поиске элемента, который отсутствует во множестве, мы получим «False«

In [48]:
months = set(
    ["Jan", "Feb", "March",
     "Apr", "May", "June",
     "July", "Aug", "Sep",
     "Oct", "Nov", "Dec"]
)
print("nicholas" in months)
# Как и ожидалось, код вернул «False«

False


Добавление элементов во множество

Python позволяет нам вносить новые элементы во множество при помощи функции add()

In [50]:
months = set(
    ["Jan", "March", "Apr",
     "May", "June", "July",
     "Aug", "Sep", "Oct",
     "Nov", "Dec"]
)
months.add("feb")
print(months)

{'Aug', 'Sep', 'Nov', 'Dec', 'feb', 'Apr', 'May', 'Jan', 'June', 'Oct', 'March', 'July'}


In [52]:
num_set = {1, 2, 3} 
num_set.add(4)
print(num_set)

{1, 2, 3, 4}


Удаление элемента из множеств

Python позволяет нам удалять элемент из множества, но не используя индекс, так как множество элементов не индексированы. Элементы могут быть удалены при помощи обоих методов discard() и remove().

Помните, что метод discard() не будет выдавать ошибку, если элемент не был найден во множестве. Однако, если метод remove() используется и элемент не был найден, возникнет ошибка.

In [55]:
num_set = {1, 2, 3, 4, 5, 6}
num_set.discard(3)
print(num_set)

{1, 2, 4, 5, 6}


Аналогично, метод remove() может использоваться следующим образом:

In [56]:
num_set = {1, 2, 3, 4, 5, 6}
num_set.remove(3)
print(num_set)

{1, 2, 4, 5, 6}


Теперь попробуем удалить элемент, которого нет во множестве. Сначала используем метод discard():

In [57]:
num_set = {1, 2, 3, 4, 5, 6}
num_set.discard(8)
print(num_set)

{1, 2, 3, 4, 5, 6}


![image.png](attachment:72265259-dd8f-4c05-9a2a-ad94904a2f39.png)

С методом pop(), мы можем удалить и вернуть элемент. Так как элементы находятся в произвольном порядке, мы не можем утверждать или предсказать, какой элемент будет удален.

In [60]:
num_set = {1, 2, 3, 4, 5, 6}
num_set.pop()
print(num_set)

{2, 3, 4, 5, 6}


Метод Python под названием clear() поможет удалить все элементы во множестве.

num_set = {1, 2, 3, 4, 5, 6}
num_set.clear()
print(num_set)

Объединение множеств

Предположим, у нас есть два множества, А и В. Объединение этих двух множеств — это множество со всеми элементами обеих множеств. Такая операция выполняется при помощи функции Python под названием union().

In [65]:
months_a = set(["Jan", "Feb", "March", "Apr", "May", "June"])
months_b = set(["July", "Aug", "Sep", "Oct", "Nov", "Dec"])
all_months = months_a.union(months_b)
print(*all_months, sep = '\n')
# Объединение может состоять из более чем двух множеств, и все их элементы сложатся в одно большое множество.

Aug
Sep
Nov
Dec
June
Apr
May
Feb
Jan
Oct
March
July


In [67]:
x = {1, 2, 3}
y = {4, 5, 6}
z = {7, 8, 9}
xyz = x.union(y, z)
print(*xyz, sep = '\n')

1
2
3
4
5
6
7
8
9


При выполнении операции объединения, дубликаты игнорируются, так что только один из двух элементов дубликатов будет отображаться.

In [68]:
x = {1, 2, 3}  
y = {4, 3, 6}  
z = {7, 4, 9}
xyz = x.union(y, z)
print(xyz)

{1, 2, 3, 4, 6, 7, 9}


Оператор | может также использоваться при поиске объединения двух или более множеств.

In [72]:
months_a = set(["Jan","Feb", "March", "Apr", "May", "June"])
months_b = set(["July", "Aug", "Sep", "Oct", "Nov", "Dec"])
print(*months_a | months_b, sep = '\n')

Aug
Sep
Nov
Dec
June
Apr
May
Feb
Jan
Oct
March
July


In [71]:
x = {1, 2, 3}
y = {4, 3, 6}
z = {7, 4, 9}
print(*x | y | z, sep = '\n')

1
2
3
4
6
7
9


Пересечение множеств

Предположим, у вас есть два множества: А и В. Их пересечение представляет собой множество элементов, которые являются общими для А и для В.

Операция пересечения во множествах может быть достигнута как при помощи оператора &, так и метода intersection(). 

In [73]:
x = {1, 2, 3}
y = {4, 3, 6}
z = x.intersection(y)
print(z)

{3}


In [74]:
x = {1, 2, 3}
y = {4, 3, 6}
print(x & y)

{3}


Разница между множествами

Предположим, у вас есть два множества: А и В. Разница между А и В (А — В) — это множество со всеми элементами, которые содержатся в А, но не в В. Соответственно, (В — А) — это множество со всеми элементами в В, но не в А.

Для определения разницы между множествами в Python, мы можем использовать как функцию difference(), так и оператор — .

In [77]:
set_a = {1, 2, 3, 4, 5}
set_b = {4, 5, 6, 7, 8}
diff_set = set_a.difference(set_b)
print(diff_set)
diff_set_1 = set_b.difference(set_a)
print(diff_set_1)

{1, 2, 3}
{8, 6, 7}


ператор минус - можно также применить для нахождения разницы между двумя множествами

In [79]:
set_a = {1, 2, 3, 4, 5}
set_b = {4, 5, 6, 7, 8}
print(set_a - set_b)
print(set_b - set_a)

{1, 2, 3}
{8, 6, 7}


Симметричная разница между множествами А и В — это множество с элементами, которые находятся в А и В, за исключением тех элементов, которые являются общими для обеих множеств. Это определяется использованием метода Python под названием symmetric_difference(), или оператора ^

In [80]:
set_a = {1, 2, 3, 4, 5}
set_b = {4, 5, 6, 7, 8}
symm_set = set_a.symmetric_difference(set_b)
print(symm_set)

{1, 2, 3, 6, 7, 8}


In [81]:
print(set_a ^ set_b)

{1, 2, 3, 6, 7, 8}


Сравнение множеств


Мы можем сравнить множества в зависимости от того, какие элементы в них содержатся. Таким образом, мы можем сказать, является ли множество родительским, или дочерним от другого множества. Результат такого сравнения будет либо True, либо False.

Чтобы проверить, является ли множество А дочерним от В, мы можем выполнить следующую операцию:

A <= B 

Чтобы узнать является ли множество В дочерним от А, мы можем выполнить следующую операцию, соответственно:

B >= A

In [83]:
months_a = set(
    ["Jan", "Feb", "March",
     "Apr", "May", "June"]
)  
months_b = set(
    ["Jan", "Feb", "March",
     "Apr", "May", "June",
     "July", "Aug", "Sep",
     "Oct", "Nov", "Dec"]
)
subset_check = months_a <= months_b
superset_check = months_b >= months_a

print(subset_check, superset_check)

True True


Дочернее и родительское множество может также быть проверено при помощи методов issubset() и issuperset()

In [85]:
months_a = set(
    ["Jan", "Feb", "March",
     "Apr", "May", "June"]
)  
months_b = set(
    ["Jan", "Feb", "March",
     "Apr", "May", "June",
     "July", "Aug", "Sep",
     "Oct", "Nov", "Dec"]
)
subset_check = months_b.issubset(months_a)
superset_check = months_b.issuperset(months_a)
print(subset_check, superset_check)

False True


Методы множеств

Метод copy()


Этот метод возвращает копию множества.

In [87]:
string_set = {"Nicholas", "Michelle", "John", "Mercy"}
x = string_set.copy()

print(x)

{'Mercy', 'Michelle', 'John', 'Nicholas'}


Метод isdisjoint()

Этот метод проверяет, является ли множество пересечением или нет. Если множества не содержат общих элементов, метод возвращает True, в противном случае — False.

In [89]:
names_a = {"Nicholas", "Michelle", "John", "Mercy"}  
names_b = {"Jeff", "Bosco", "Teddy", "Milly"}

x = names_a.isdisjoint(names_b)

print(x)

# Оба множества не имеют общих элементов, что делает выдачу True.

True


Метод len()

Этот метод возвращает длину множества, которая является общим количеством элементов во множестве.

In [92]:
names_a = {"Nicholas", "Michelle", "John", "Mercy"}

print(len(names_a))

4


Frozenset в Python

Frozenset (замороженное множество) – это класс с характеристиками множества, однако, как только элементы становятся назначенными, их нельзя менять. Кортежи могут рассматриваться как неизменяемые списки, в то время как frozenset-ы — как неизменные множества.

Множества являются изменяемыми и нехешируемыми, это значит, что мы не можем использовать их как словарные ключи. Замороженные множества (frozenset) являются хешированными и могут использоваться в качестве ключей словаря.

Для создания замороженного множества, мы используем метод frozenset(). Давайте создадим два замороженных множества, Х и Y:

In [93]:
x = frozenset([1, 2, 3, 4, 5, 6])
y = frozenset([4, 5, 6, 7, 8, 9])

print(x)
print(y)

frozenset({1, 2, 3, 4, 5, 6})
frozenset({4, 5, 6, 7, 8, 9})


Замороженные множества поддерживают использование множественных методов Python, таких как copy(), difference(), symmetric_difference(), isdisjoint(), issubset(), intersection(), issuperset() и union().

Вывод

Множество — это набор элементов в произвольном порядке. Само по себе, множество является изменяемым, однако его элементы являются неизменяемыми.

Однако, мы можем добавлять и убирать элементы из множества без каких-либо проблем. В большей структур данных элементы являются индексированными. Однако, элементы множеств не являются индексированными. Это делает невозможным для нас выполнять операции, которые направлены на определенные элементы множества.