# Множина

## Set (множина)
Множина - це **невпорядковані** колекції унікальних та **незмінюваних** об'єктів у випадковому порядку (невпорядкований список).
Множина примітна тим, що операція перевірки "чи належить об'єкт множині" відбувається значно швидше за аналогічні операції в інших структурах даних.

In [None]:
my_set = {1, 2, 3, 4, 5, 6, 2, 4}
print(type(my_set))
print(my_set) #  колекції унікальних об'єктів

In [None]:
# Для створення порожньої множини існує тільки один спосіб
my_set = set()
print(type(my_set))

In [None]:
my_set = {}  # is not a set!
print(type(my_set))

In [None]:
#Функція set приймає на вхід об'єкт, що ітерується, і повертає невпорядковану колекцію унікальних елементів
my_set = set('Hello world! Hi there!')
print(my_set)
print(type(my_set))

In [None]:
print(my_set)

In [None]:
# Функція list теж приймає на вхід об'єкт, що ітерується, але послідовність елементів у вихідному списку відповідає оригіналу
my_list = list('Hello world! Hi there!')
print(my_list)

In [None]:
my_set = set([2, 1, 1, 2, 3, 2, 1])
print(my_set)

In [None]:
my_set = {1, 2, [3, 4]} # Буде помилка, оскільки потрібні незмінні об'єкти

In [None]:
# Кортеж, на відміну від списку, відноситься до незмінного типу даних
lst = [(1, 2), (2, 2), (1, 2), (1, 2), (2, 1), (1, 2)] 
my_set = set(lst)
print(my_set)

In [None]:
hash((1, 2))

In [None]:
# При цьому в кортежі можуть бути елементи змінного типу даних
tpl = (1, 2, [3, 4])
print(tpl)

In [None]:
hash(tpl) # Буде помилка

In [None]:
lst = [(1, 2, [3, 4]), (2, 2), (1, 2), (1, 2), (2, 1), (1, 2)]


In [None]:
my_set = set(lst) # Буде помилка

**Python не надає прямий спосіб отримання значення до окремих елементів множини.**

In [None]:
my_set = set('Hello world! Hi there!')
print(my_set)
my_set[0] # Буде помилка

In [None]:
months = set(["Jan", "Feb", "March", "Apr", "May", "June", "July", "Aug", "Sep", "Oct", "Nov", "Dec"])
# Порядок елементів у множині недоступний для опису
for m in months:
    print(m, hash(m), )

In [None]:
print("May" in months) # Перевірка наявності елемента

### *Доступні методи*

#### *add(x)* додає x до множини

In [None]:
num_set = {1, 2, 3}
num_set.add(4)

print(num_set)

In [None]:
num_set.add(4)
num_set.add(4)
num_set.add(4)
print(num_set) # 4 так і залишиться в одному екземплярі

#### *set.update(x)* додає в set всі елементи з множини x

In [None]:
set_a = {1, 2, 3, 4, 5}
set_b = {4, 5, 6, 7, 8}
set_a.update(set_b)

print(set_a)

In [None]:
print(set_b) # Залишиться незмінним


#### *set.difference(Х)* повертає множину елементів, які не входять у множину *Х*
Результат залежить від того, у якої множини викликати цей метод

In [None]:
set_a = {1, 2, 3, 4, 5}
set_b = {4, 5, 6, 7, 8}
# Або інакше - з множини set_a беруться лише ті елементи, яких немає в множині set_b
diff_set = set_a.difference(set_b)
print(diff_set)

In [None]:
# результат буде іншим
diff_set = set_b.difference(set_a)
print(diff_set)

In [None]:
diff_set = set_a.difference(set_a)
print(diff_set)

In [None]:
print(set_a, set_b)


#### *set_a.symmetric_difference(set_b)* повертає всі елементи з set_a і set_b за винятком тих елементів, які є спільними для обох множин.

In [None]:
set_a = {1, 2, 3, 4, 5}
set_b = {4, 5, 6, 7, 8}

diff_set = set_a.symmetric_difference(set_b)
print(diff_set)

In [None]:
# Не залежить від того, у якої множини викликати цей метод
diff_set = set_b.symmetric_difference(set_a)
print(diff_set)

In [None]:
print(set_a ^ set_b) # короткий запис методу symmetric_difference

#### *set_a.difference_update(set_b)* видаляє з множини set_a всі елементи, які є спільними з множиною set_b

In [None]:
set_a = {1, 2, 3, 4, 5}
set_b = {4, 5, 6, 7, 8}

set_a.difference_update(set_b)
print(set_a)

In [None]:
set_a = {1, 2, 3, 4, 5}
set_b = {4, 5, 6, 7, 8}
# залежить від того, у якої множини викликати цей метод
set_b.difference_update(set_a)
print(set_b)

#### *set.discard(x)* видаляє елемент x із set

In [None]:
set_a = {1, 2, 3, 4, 5}
set_a.discard(2)

print(set_a)

In [None]:
set_a.discard(55) # видалення відсутнього елемента не викликає помилки!

#### *set.remove(x)* видаляє x з множини

In [None]:
set_a = {1, 2, 3, 4, 5}
set_a.remove(2)

print(set_a)

In [None]:
set_a.remove(2) # видалення відсутнього елемента викликає помилку!

#### *set.clear()* Очищення вмісту

In [None]:
num_set = {1, 2, 3, 4, 5, 6}
num_set.clear()
print(num_set)

#### *set.pop()* повертає та видаляє перший (на даний момент) елемент множини

In [None]:
set_a = set('Hello')
print(set_a)
x = set_a.pop()
print(set_a)
print(x)

In [None]:
set_a.clear()
x = set_a.pop() #помилка для порожньої множини

**Як можна у циклі видаляти елементи та не отримати помилку**

In [None]:
set_a = set('Hello')
while set_a:
    x = set_a.pop()
    print(x)

#### *set.union(x, y, z)* повертає **нову** множину, що складається з усіх елементів set, x, y та z

In [None]:
months_a = set(["Jan", "Feb", "March", "Apr", "May", "July", "June"])
months_b = set(["July", "Aug", "Sep", "Oct", "Nov", "Dec"])

all_months = months_a.union(months_b)
print(all_months)

In [None]:
#множини, що беруть участь у цій операції, не змінюються
print(months_a)
print(months_b)

In [None]:
x = {1, 2, 3}
y = {4, 3, 6}
z = {7, 4, 9}

output = x.union(y, z)

print(output)

In [None]:
# короткий запис методу
all_months = months_a | months_b
print(all_months)


output = x | y | z

print(output)

#### *set.intersection(x)* повертає елементи загальні для множин set і x

In [30]:
x = {1, 2, 3}
y = {4, 3, 6}

z = x.intersection(y)
print(z)
print(x & y) # короткий запис методу

{3}
{3}


#### *set.intersection_update(x)* залишає в set ті елементи, які є спільними і для множини set і для множини x

In [29]:
x = {1, 2, 3}
y = {4, 3, 6}

x.intersection_update(y)
print(x)
print(y)

{3}
{3, 4, 6}


In [None]:
x = {1, 2, 3}
y = {4, 3, 6}
# залежить від того, для якої множини викликати цей метод
y.intersection_update(x)
print(x)
print(y)

In [None]:
x = {1, 2, 3}

x.intersection_update(x)
print(x)

#### *set.copy()* повертає копію множини

In [None]:
set_a = {1, 2, 3, 4, 5}
set_b = set_a.copy()
print(set_b)

In [None]:
print(id(set_b))
print(id(set_a))

In [None]:
#Оскільки елементи множини, це незмінні типи даних, то проблем, як у списків або словників, тут немає
set_b.update({4, 5, 6, 7, 8})
print(set_a)
print(set_b)

In [None]:
#В даному випадку, обидві змінні вказують на одну і ту ж множину
set_c = set_a
set_c.update({4, 5, 6, 7, 8})
print(set_a)

## Порівняння множин

Ми можемо порівняти множини в залежності від того, які елементи в них утримуються. Таким чином, ми можемо сказати, чи є множина
батьківською, або дочірньою від іншої множини. Результат такого порівняння буде або *True*, або *False*.

#### *set.issubset(x)* повертає True якщо множина set є частиною множини х

In [1]:
months_a = set(["Jan","Feb", "March", "Apr", "May", "June"])
months_b = set(["Jan","Feb", "March", "Apr", "May", "June", "July", "Aug", "Sep", "Oct", "Nov", "Dec"])

subset_check = months_a.issubset(months_b)

print(subset_check)

True


In [2]:
months_a = set(["Jan","Feb", "March", "Apr", "May", "June", "hi"])
months_b = set(["Jan","Feb", "March", "Apr", "May", "June", "July", "Aug", "Sep", "Oct", "Nov", "Dec"])

subset_check = months_a.issubset(months_b)
#У months_a є елемент, якого немає в months_b
print(subset_check)

False


In [3]:
months_a = set(["Jan","Feb", "March", "Apr", "May", "June"])
months_b = set(["Jan","Feb", "March", "Apr", "May", "June", "July", "Aug", "Sep", "Oct", "Nov", "Dec"])

subset_check = months_b.issubset(months_a)
# У months_b більше елементів, ніж у months_а
print(subset_check)

False


#### *set.issuperset(x)* повертає Тrue якщо всі елементи x входять до множини set

In [4]:
months_a = set(["Jan","Feb", "March", "Apr", "May", "June"])
months_b = set(["Jan","Feb", "March", "Apr", "May", "June", "July", "Aug", "Sep", "Oct", "Nov", "Dec"])
# Цей метод робить зворотну дію методом issubset
superset_check = months_b.issuperset(months_a)

print(superset_check)

True


In [5]:
superset_check = months_a.issuperset(months_b)

print(superset_check)

False


#### *set.isdisjoint(x)* повертає True якщо set і x не містять однакових значень

In [6]:
names_a = {"Nicholas", "Michelle", "John", "Mercy"}
names_b = {"Jeff", "Bosco", "Teddy", "Milly"}

print(names_a.isdisjoint(names_b))

True


In [7]:
names_a = {"Nicholas", "Michelle", "John", "Mercy"}
names_b = {"Jeff", "Bosco", "Teddy", "Milly", "Mercy"}

print(names_a.isdisjoint(names_b))

False


In [8]:
names_a = {"Nicholas", "Michelle", "John", "Mercy"}
names_b = {"Jeff", "Bosco", "Teddy", "Milly"}
names_a.intersection(names_b)

set()

In [9]:
#Варіант, як можна уявити цей метод, використовуючи інші методи
names_a = {"Nicholas", "Michelle", "John", "Mercy"}
names_b = {"Jeff", "Bosco", "Teddy", "Milly"}
z = not bool(names_a.intersection(names_b))
print(z)


True


## Вбудовані (built-in) функції, які працюють з множинами та кортежами

### *len()*

In [10]:
names_a = {"Jeff", "Bosco", "Teddy", "Milly", "Mercy"}
print(len(names_a))

names_b = ("Jeff", "Bosco", "Teddy", "Milly", "Mercy")
print(len(names_b))

5
5


### *all()*

In [11]:
set_a = {1, 2, 3, 4, 5}
set_b = {0, 2, 3, 4, 5}

print(all(set_a))
print(all(set_b))

True
False


In [12]:
a = (1, 2, 3, 4, 5)
b = (0, 2, 3, 4, 5)

print(all(a))
print(all(b))

True
False


### *any()*

In [13]:
set_b = {0, 2, 3, 4, 5}

print(any(set_b))

True


In [14]:
b = (0, 2, 3, 4, 5)


print(any(b))

True


In [15]:
b = (0, 0.0, '', [], {}, (), set())


print(any(b))

False


### *max(), min(), sum()*

In [16]:
set_a = {1, 2, 3, 4, 5}
a = (1, 2, 3, 4, 5)

print(min(set_a), min(a))
print(max(set_a), max(a))
print(sum(set_a), sum(a))

1 1
5 5
15 15


### *sorted()*

In [17]:
set_a = {3, 4, 1, 2, 5}
a = (1, 5, 2, 3, 4)

print(sorted(set_a))
print(sorted(a))

[1, 2, 3, 4, 5]
[1, 2, 3, 4, 5]


### *enumerate()*

In [18]:
months_set = set(["Jan","Feb", "March", "Apr", "May", "June", "July", "Aug", "Sep", "Oct", "Nov", "Dec"])
# i = 0
for i, m in enumerate(months_set):
    print(f'{i} -> {m}')
    # i += 1


0 -> Aug
1 -> Dec
2 -> July
3 -> May
4 -> Feb
5 -> Nov
6 -> Sep
7 -> Oct
8 -> Jan
9 -> March
10 -> Apr
11 -> June


In [19]:
for i, m in enumerate(months_set, 61):
    print(f'{i} -> {m}')

61 -> Aug
62 -> Dec
63 -> July
64 -> May
65 -> Feb
66 -> Nov
67 -> Sep
68 -> Oct
69 -> Jan
70 -> March
71 -> Apr
72 -> June


In [20]:
months = tuple(["Jan","Feb", "March", "Apr", "May", "June", "July", "Aug", "Sep", "Oct", "Nov", "Dec"])
for i, m in enumerate(months, 1):
    print(f'{i} -> {m}')

1 -> Jan
2 -> Feb
3 -> March
4 -> Apr
5 -> May
6 -> June
7 -> July
8 -> Aug
9 -> Sep
10 -> Oct
11 -> Nov
12 -> Dec


## Frozenset 


Frozenset (заморожена множина) – це клас з характеристиками множини, проте їх не можна змінювати. Кортежі можуть розглядатися як незмінні списки, тоді як frozenset-и - як незмінні множини.

Множина це змінюваний тип даних, це означає, що ми не можемо використовувати ії як словникові ключі. Заморожені множини (frozenset) є хешованими і можуть використовуватися як ключі словника.

In [21]:
x = frozenset([1, 2, 3, 4, 5, 6, 1, 2, 3, 4, 5, 6, 1, 2, 3, 4, 5, 6])
y = frozenset([4, 5, 6, 7, 8, 9])

print(x)
print(y)

frozenset({1, 2, 3, 4, 5, 6})
frozenset({4, 5, 6, 7, 8, 9})


In [22]:
print(hash(x))
print(hash(y))


1667793003797511190
7240274577185785831


In [23]:
names_b = {"Jeff", "Bosco", "Teddy", "Milly", "Mercy"}
hash(names_b) # error

TypeError: unhashable type: 'set'

In [24]:
dct = {x: 'Frozenset', y: 'Python'}
print(dct)

{frozenset({1, 2, 3, 4, 5, 6}): 'Frozenset', frozenset({4, 5, 6, 7, 8, 9}): 'Python'}


In [25]:
x.add(2)

AttributeError: 'frozenset' object has no attribute 'add'

Заморожені множини підтримують використання методів, які не впливають на неї.
  `copy()`, `difference()`, `symmetric_difference()`, `isdisjoint()`,
`issubset()`, `intersection()`, `issuperset()` та `union()`.

In [26]:
# Перетворення "замороженої множини" у звичайну
xx = set(x)
print(type(xx))

<class 'set'>


In [27]:
b = x.copy()


In [28]:
b


frozenset({1, 2, 3, 4, 5, 6})