# Множества

Для тренировки создадим два множества:

- Во множестве A будут храниться уникальные ID клиентов компании, которые пользуются мобильной связью.
- Во множестве B — уникальные ID клиентов компании, которые используют домашний интернет.

In [1]:
A = {'ID453', 'ID312', 'ID41', 'ID3', 'ID500', 'ID920', 'ID36', 'ID27'} # Мобильная связь
B = {'ID41', 'ID36', 'ID27', 'ID124', 'ID7', 'ID501', 'ID91' } # Домашний интернет

### Объединение множеств

В качестве результата мы получим тех клиентов, которые используют хотя бы одну из двух услуг компании:

In [3]:
union_AB = A.union(B)
print(union_AB)

# Или так

union_AB = A | B
print(union_AB)

{'ID453', 'ID7', 'ID41', 'ID27', 'ID3', 'ID124', 'ID501', 'ID91', 'ID920', 'ID312', 'ID500', 'ID36'}
{'ID453', 'ID7', 'ID41', 'ID27', 'ID3', 'ID124', 'ID501', 'ID91', 'ID920', 'ID312', 'ID500', 'ID36'}


### Пересечение множеств

В контексте нашего примера мы получим клиентов, которые пользуются обеими услугами:

In [5]:
inter_AB = A.intersection(B)
print(inter_AB)

# Или так

inter_AB = A & B
print(inter_AB)

{'ID36', 'ID41', 'ID27'}
{'ID36', 'ID41', 'ID27'}


### Разность множеств

В данном случае мы получим перечень тех клиентов, которые используют мобильную связь, однако не используют домашний интернет.

In [6]:
diff_AB = A.difference(B)
print(diff_AB)

# Или так

diff_AB = A - B
print(diff_AB)

{'ID453', 'ID3', 'ID920', 'ID312', 'ID500'}
{'ID453', 'ID3', 'ID920', 'ID312', 'ID500'}


Если поменять два множества местами при выполнении операции разности, результат изменится. В нашем примере результатом будут клиенты, которые пользуются только домашним интернетом:

In [7]:
diff_BA = B - A
print(diff_BA)

{'ID91', 'ID124', 'ID501', 'ID7'}


Примечание: Разность можно также использовать для нахождения дополнения ко множеству, если заранее задать универсальное множество для задачи.

### Симметрическая разность

В качестве результата получим клиентов, которые пользуются только какой-то одной из услуг:

In [8]:
symm_AB = A.symmetric_difference(B)
print(symm_AB)

# Или так

symm_AB = A ^ B
print(symm_AB)

{'ID7', 'ID453', 'ID124', 'ID91', 'ID500', 'ID3', 'ID501', 'ID920', 'ID312'}
{'ID7', 'ID453', 'ID124', 'ID91', 'ID500', 'ID3', 'ID501', 'ID920', 'ID312'}


# SymPy

Это библиотека Python для выполнения символьных вычислений. Это система компьютерной алгебры, которая может выступать как отдельное приложение, так и в качестве библиотеки для других приложений (как это реализовано, например, в Python).

Такие системы, как SymPy, помогают выполнять вычисления разного рода (производные, интегралы, пределы, решение уравнений, работа с матрицами) в символьном виде. Это значит, что получаемые результаты будут понятны и хорошо читаемы, так как будут выводиться в привычном для нас виде.

In [15]:
from sympy import FiniteSet, Union # Для работы со множествами
l1 = [1,3,7,10]
l2 = [9,7,1]

a = FiniteSet(*l1) # То же самое, что FiniteSet(1,3,7,10)
b = FiniteSet(*l2) # * используется для распаковки списка

display(Union(a, b))

{1, 3, 7, 9, 10}

Также с помощью этой библиотеки можно задать множество не прямым перечислением элементов, а с помощью условий и математических выражений:

In [14]:
from sympy import ConditionSet, Eq, Symbol, Interval

x = Symbol('x')
s = ConditionSet(x, Eq(x**2 - 5*x, 0), Interval(2,9))
display(s)

ConditionSet(x, Eq(x**2 - 5*x, 0), Interval(2, 9))

В данном примере мы задали множество, в котором находятся все числа из отрезка от 2 до 9, для которых верно, что они являются корнями уравнения $x^2 - 5_x = 0$.

# Практика

Представьте, что вы являетесь куратором образовательной программы, на которой будет два вебинара: по программированию и по машинному обучению.

На вебинар по программированию записались потенциальные слушатели со следующими электронными адресами:

- bennet@xyz.com
- darcy@abc.com
- margaret@xyz.com
- pa@hhh.com
- marimari@xyz.com
- mallika@yahoo.com
- abc@xyz.com
- 0071235@gmail.ru

На вебинар по машинному обучению записались потенциальные слушатели со следующими электронными адресами:

- marimari@xyz.com
- darcy@abc.com
- 0071235@gmail.ru
- darcy@abc.com
- petr44@xyz.com
- katrin@ya.com

Оформите множества в Python для обоих списков слушателей.

In [19]:
prog = {'bennet@xyz.com',
'darcy@abc.com',
'margaret@xyz.com',
'pa@hhh.com',
'marimari@xyz.com',
'mallika@yahoo.com',
'abc@xyz.com',
'0071235@gmail.ru'}

ml = {'marimari@xyz.com',
'darcy@abc.com',
'0071235@gmail.ru',
'darcy@abc.com',
'petr44@xyz.com',
'katrin@ya.com'}

С помощью операций множеств в Python определите, сколько слушателей записалось на оба вебинара.

In [22]:
print(len(prog.intersection(ml)))

3


Сколько человек заинтересованы в посещении хотя бы одного вебинара?

In [23]:
print(len(prog.union(ml)))

10


Сколько человек заинтересованы в посещении только одного вебинара из двух?

In [26]:
print(len(prog.symmetric_difference(ml)))

7
