## 2. Множества. Операции над множествами

#### Операции над множествами в Python

Для тренировки создадим два множества:

- Во множестве A будут храниться уникальные ID клиентов компании, которые пользуются мобильной связью.
- Во множестве B — уникальные ID клиентов компании, которые используют домашний интернет.

In [76]:
A = {'ID453', 'ID312', 'ID41', 'ID3', 'ID500', 'ID920', 'ID36', 'ID27'}
B = {'ID41', 'ID36', 'ID27', 'ID124', 'ID7', 'ID501', 'ID91' }

ОБЪЕДИНЕНИЕ МНОЖЕСТВ

Для того чтобы найти объединение множеств, можно использовать метод union(). В качестве результата мы получим тех клиентов, которые используют хотя бы одну из двух услуг компании:

In [77]:
union_AB = A.union(B)
print(union_AB)
#{'ID500', 'ID27', 'ID41', 'ID3', 'ID501', 'ID453', 'ID312', 'ID124', 'ID920', 'ID91', 'ID7', 'ID36'}

{'ID41', 'ID920', 'ID312', 'ID36', 'ID7', 'ID27', 'ID91', 'ID453', 'ID501', 'ID500', 'ID124', 'ID3'}


Обратите внимание, что по результатам применения данного методы мы получили новое множество.

Метод union() можно заменить простой вертикальной чертой:

In [78]:
union_AB = A | B
print(union_AB)
#{'ID500', 'ID27', 'ID41', 'ID3', 'ID501', 'ID453', 'ID312', 'ID124', 'ID920', 'ID91', 'ID7', 'ID36'}

{'ID41', 'ID920', 'ID312', 'ID36', 'ID7', 'ID27', 'ID91', 'ID453', 'ID501', 'ID500', 'ID124', 'ID3'}


ПЕРЕСЕЧЕНИЕ МНОЖЕСТВ

Для нахождения пересечения множеств используется метод intersection(). В контексте нашего примера мы получим клиентов, которые пользуются обеими услугами:

In [79]:
inter_AB = A.intersection(B)
print(inter_AB)
#{'ID27', 'ID41', 'ID36'}

{'ID27', 'ID36', 'ID41'}


Также мы можем заменить метод intersection() на амперсанд (&) — результат будет идентичным:

In [80]:
inter_AB = A & B
print(inter_AB)
#{'ID27', 'ID41', 'ID36'}

{'ID27', 'ID36', 'ID41'}


РАЗНОСТЬ МНОЖЕСТВ

Для того чтобы получить разность между двумя множествами, применим метод difference(). В данном случае мы получим перечень тех клиентов, которые используют мобильную связь, однако не используют домашний интернет.

In [81]:
diff_AB = A.difference(B)
print(diff_AB)
#{'ID500', 'ID3', 'ID453', 'ID312', 'ID920'}

{'ID920', 'ID312', 'ID453', 'ID500', 'ID3'}


Здесь также есть вариант замены метода символом — в данном случае это знак «минус»:

In [82]:
diff_AB = A - B
print(diff_AB)
#{'ID500', 'ID3', 'ID453', 'ID312', 'ID920'}

{'ID920', 'ID312', 'ID453', 'ID500', 'ID3'}


Важно отметить, что если поменять два множества местами при выполнении операции разности, результат изменится. В нашем примере результатом будут клиенты, которые пользуются только домашним интернетом:

In [83]:
diff_BA = B - A
print(diff_BA)
#{'ID124', 'ID7', 'ID501', 'ID91'}

{'ID91', 'ID7', 'ID124', 'ID501'}


Разность можно также использовать для нахождения дополнения ко множеству, если заранее задать универсальное множество для задачи.

СИММЕТРИЧЕСКАЯ РАЗНОСТЬ

Для вывода симметрической разности можно использовать метод symmetric_difference() или оператор ^. В качестве результата получим клиентов, которые пользуются только какой-то одной из услуг:

In [84]:
symmAB = A.symmetric_difference(B)
print(symmAB)
#{ID124', 'ID91', 'ID7', 'ID312', 'ID500', 'ID453', 'ID3', 'ID501', 'ID920'}


symmAB = A ^ B
print(symmAB)
#{ID124', 'ID91', 'ID7', 'ID312', 'ID500', 'ID453', 'ID3', 'ID501', 'ID920'}

{'ID920', 'ID312', 'ID7', 'ID91', 'ID453', 'ID501', 'ID500', 'ID124', 'ID3'}
{'ID920', 'ID312', 'ID7', 'ID91', 'ID453', 'ID501', 'ID500', 'ID124', 'ID3'}


#### Библиотека Sympy, символьные вычисления и множества

SymPy — это библиотека Python для выполнения символьных вычислений. Это система компьютерной алгебры, которая может выступать как отдельное приложение, так и в качестве библиотеки для других приложений (как это реализовано, например, в Python).

С её помощью можно работать и со множествами. Для этого нам необходимо импортировать из неё функцию FiniteSet, а объединение обозначается уже знакомой нам функцией Union:

In [85]:
from sympy import FiniteSet, Union
l1 = [1, 3, 7, 10] 
l2 = [9, 7, 1] 
a = FiniteSet(*l1) 
b = FiniteSet(*l2) 
Union(a, b)

{1, 3, 7, 9, 10}

Также с помощью этой библиотеки можно задать множество не прямым перечислением элементов, а с помощью условий и математических выражений (это то, о чём мы говорили ранее). Интересно то, что мы получим не прямое перечисление элементов, а именно математическую запись.

In [86]:
from sympy import ConditionSet, Eq, Symbol, Interval
x=Symbol('x')
s=ConditionSet(x, Eq(x**2-5*x,0), Interval(2,9))
s

ConditionSet(x, Eq(x**2 - 5*x, 0), Interval(2, 9))

→ Для простых операций со множествами эта библиотека может показаться слишком сложной, но совсем скоро вы оцените её пользу при работе с производными — там она является поистине незаменимой даже в простых операциях. Через несколько уроков мы познакомимся с ней более подробно.

In [90]:
A={2,4,6,8,10,12}
B={3,6,9,12}
print(A-B)
print(A|B)

{8, 2, 10, 4}
{2, 3, 4, 6, 8, 9, 10, 12}


In [94]:
N={22,23,24,25}
K={24,25,26}
len(N|K)

5

Представьте, что вы являетесь куратором образовательной программы, на которой будет два вебинара: по программированию и по машинному обучению.

На вебинар по программированию записались потенциальные слушатели со следующими электронными адресами: P

На вебинар по машинному обучению записались потенциальные слушатели со следующими электронными адресами: ML

Оформите множества в Python для обоих списков слушателей.

In [102]:
P = {'bennet@xyz.com', 'darcy@abc.com', 'margaret@xyz.com', 'pa@hhh.com', 'marimari@xyz.com', 'mallika@yahoo.com', 'abc@xyz.com', '0071235@gmail.ru'}
ML = {'marimari@xyz.com', 'darcy@abc.com', '0071235@gmail.ru', 'darcy@abc.com', 'petr44@xyz.com', 'katrin@ya.com'}
# Пересечение мноеств
print(len(P&ML))
# Объединение множеств
print(len(P|ML))
# Симметрическая разность множеств
print(len(P^ML))

3
10
7
