#  Множества

## Set (множество)
Множества - это **неупорядоченные** коллекции уникальных и **неизменяемых** объектов в случайном порядке (неупорядоченный список).
Множества примечательны тем, что операция проверки "принадлежит ли объект множеству" происходит значительно быстрее аналогичных операций в других структурах данных.

In [1]:
my_set = {1, 2, 3, 4, 5, 6, 2, 4}
print(type(my_set))
print(my_set)

<class 'set'>
{1, 2, 3, 4, 5, 6}


In [2]:
my_set = set()
print(type(my_set))

<class 'set'>


In [3]:
my_set = {}  # is not a set!
print(type(my_set))

<class 'dict'>


In [4]:
my_set = set('Hello world! Hi there!')
print(my_set)
print(type(my_set))

{'o', 'i', 'e', 'w', 'd', ' ', 't', '!', 'r', 'h', 'l', 'H'}
<class 'set'>


In [5]:
my_list = list('Hello world! Hi there!')
print(my_list)
print(type(my_list))

['H', 'e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd', '!', ' ', 'H', 'i', ' ', 't', 'h', 'e', 'r', 'e', '!']
<class 'list'>


In [6]:
my_set = set([2, 1, 1, 2, 3, 2, 1])
print(my_set)

{1, 2, 3}


In [7]:
my_set = {1, 2, [3, 4]} # коллекции уникальных и неизменяемых! объектов

TypeError: unhashable type: 'list'

In [8]:
lst = [(1, 2), (2, 2), (1, 2), (1, 2), (2, 1), (1, 2)]
my_set = set(lst)
print(my_set)

{(1, 2), (2, 1), (2, 2)}


In [9]:
hash((1, 2))

-3550055125485641917

In [10]:
hash((1, 2, [3, 4]))

TypeError: unhashable type: 'list'

In [12]:
lst = [(1, 2, [3, 4]), (2, 2), (1, 2), (1, 2), (2, 1), (1, 2)]


In [13]:
my_set = set(lst)

TypeError: unhashable type: 'list'

In [14]:
my_set = set('Hello world! Hi there!')
print(my_set)
my_set[0] # Python не предоставляет прямой способ получения значения к отдельным элементам множества.

{'o', 'i', 'e', 'w', 'd', ' ', 't', '!', 'r', 'h', 'l', 'H'}


TypeError: 'set' object is not subscriptable

In [15]:
months = set(["Jan", "Feb", "March", "Apr", "May", "June", "July", "Aug", "Sep", "Oct", "Nov", "Dec"])

for m in months:
    print(m, hash(m), )

Jan -494744805756238815
Sep -6512483311223696636
June -1223231993258344795
Dec -6186947698086772411
Nov 5320454819962846631
Oct -7471683724088871637
Apr 2311278825119436173
Feb -5810717482979580274
March -7283013714421545326
Aug -6353229677580510341
May -5238406091604129604
July 6684749619074561405


In [16]:
print("May" in months)

True


### *Доступные методы*

### *add(x)* добавляет x во множество

In [17]:
num_set = {1, 2, 3}
num_set.add(4)

print(num_set)

{1, 2, 3, 4}


In [18]:
num_set.add(4)

print(num_set)

{1, 2, 3, 4}


### *set.update(x)* добавляет в set все элементы из множества x

In [19]:
set_a = {1, 2, 3, 4, 5}
set_b = {4, 5, 6, 7, 8}
set_a.update(set_b)

print(set_a)

{1, 2, 3, 4, 5, 6, 7, 8}


In [20]:
set_b


{4, 5, 6, 7, 8}

###  *set.difference(x)* возвращает множество элементов, которые не входят во множество x

In [21]:
set_a = {1, 2, 3, 4, 5}
set_b = {4, 5, 6, 7, 8}

diff_set = set_a.difference(set_b)
print(diff_set)

{1, 2, 3}


In [22]:
diff_set = set_b.difference(set_a)
print(diff_set)

{8, 6, 7}


In [23]:
diff_set = set_a.difference(set_a)
print(diff_set)

set()


In [24]:
print(set_a, set_b)


{1, 2, 3, 4, 5} {4, 5, 6, 7, 8}


### *set.symmetric_difference(x)* возвращает все элементы из x и set за исключением тех элементов, которые являются общими для обеих множеств.

In [25]:
set_a = {1, 2, 3, 4, 5}
set_b = {4, 5, 6, 7, 8}

diff_set = set_a.symmetric_difference(set_b)
print(diff_set)

{1, 2, 3, 6, 7, 8}


In [26]:
diff_set = set_b.symmetric_difference(set_a)
print(diff_set)

{1, 2, 3, 6, 7, 8}


In [27]:
print(set_a ^ set_b) # symmetric_difference

{1, 2, 3, 6, 7, 8}


### *set.difference_update(x)* удаляет из множества set все элементы, которые являются общими со множеством x

In [28]:
set_a = {1, 2, 3, 4, 5}
set_b = {4, 5, 6, 7, 8}

set_a.difference_update(set_b)
print(set_a)

{1, 2, 3}


In [29]:
set_a = {1, 2, 3, 4, 5}
set_b = {4, 5, 6, 7, 8}

set_b.difference_update(set_a)
print(set_b)

{6, 7, 8}


### *set.discard(x)* удаляет элемент x из set

In [30]:
set_a = {1, 2, 3, 4, 5}
set_a.discard(2)

print(set_a)

{1, 3, 4, 5}


In [31]:
set_a.discard(55) # удаление отсутствующего элемента не вызывает ошибки!

### *set.remove(x)* удаляет x из множества

In [32]:
set_a = {1, 2, 3, 4, 5}
set_a.remove(2)

print(set_a)

{1, 3, 4, 5}


In [33]:
set_a.remove(2) # удаление отсутствующего элемента вызывает ошибку

KeyError: 2

### *set.clear()* Очистка множества от содержимого

In [34]:
num_set = {1, 2, 3, 4, 5, 6}
num_set.clear()
print(num_set)

set()


### *set.pop()* возвращает и удаляет первый (на данный момент) элемент множества

In [35]:
set_a = set('Hello')
print(set_a)
x = set_a.pop()
print(set_a)
print(x)

{'o', 'l', 'e', 'H'}
{'l', 'e', 'H'}
o


In [36]:
set_a.clear()
x = set_a.pop() # error for empty set

KeyError: 'pop from an empty set'

In [37]:
set_a = set('Hello')
while set_a:
    x = set_a.pop()
    print(x)

o
l
e
H


### *set.union(x, y, z)* возвращает **новое** множество, состоящее из всех элементов set, x, y и z

In [38]:
months_a = set(["Jan", "Feb", "March", "Apr", "May", "July", "June"])
months_b = set(["July", "Aug", "Sep", "Oct", "Nov", "Dec"])

all_months = months_a.union(months_b)
print(all_months)

{'Jan', 'Sep', 'June', 'Dec', 'Nov', 'Oct', 'Apr', 'Feb', 'March', 'Aug', 'May', 'July'}


In [39]:
print(months_a)

{'Jan', 'June', 'Apr', 'Feb', 'March', 'May', 'July'}


In [40]:
x = {1, 2, 3}
y = {4, 3, 6}
z = {7, 4, 9}

output = x.union(y, z)

print(output)

{1, 2, 3, 4, 6, 7, 9}


In [41]:
all_months = months_a | months_b
print(all_months)


output = x | y | z

print(output)

{'Jan', 'Sep', 'June', 'Dec', 'Nov', 'Oct', 'Apr', 'Feb', 'March', 'Aug', 'May', 'July'}
{1, 2, 3, 4, 6, 7, 9}


### *set.intersection(x)* возвращает элементы общие для множеств set и x

In [42]:
x = {1, 2, 3}
y = {4, 3, 6}

z = x.intersection(y)
print(z)
print(x & y)

{3}
{3}


### *set.intersection_update(x)* удаляет из множества set элементы, которых нет во множестве x. Или иначе, оставляет в set те элементы, которые являются общие и для множеств set и для множества x

In [43]:
x = {1, 2, 3}
y = {4, 3, 6}

x.intersection_update(y)
print(x)
print(y)

{3}
{3, 4, 6}


In [44]:
x = {1, 2, 3}
y = {4, 3, 6}

y.intersection_update(x)
print(x)
print(y)

{1, 2, 3}
{3}


In [45]:
x = {1, 2, 3}

x.intersection_update(x)
print(x)

{1, 2, 3}


### *set.copy()* возвращает копию множества

In [46]:
set_a = {1, 2, 3, 4, 5}
set_b = set_a.copy()
print(set_b)

{1, 2, 3, 4, 5}


In [47]:
print(id(set_b))
print(id(set_a))

139661201336576
139661201337024


In [48]:
set_b.update({4, 5, 6, 7, 8})
print(set_a)
print(set_b)

{1, 2, 3, 4, 5}
{1, 2, 3, 4, 5, 6, 7, 8}


In [49]:
set_c = set_a
set_c.update({4, 5, 6, 7, 8})
print(set_a)

{1, 2, 3, 4, 5, 6, 7, 8}


## Сравнение множеств

Мы можем сравнить множества в зависимости от того, какие элементы в них
содержатся. Таким образом, мы можем сказать, является ли множество
родительским, или дочерним от другого множества. Результат такого сравнения
будет либо *True*, либо *False*.

### *set.issubset(x)* возвращает True если все элементы set входят во множество x. Т.е. является ли множество set частью множества х

In [50]:
months_a = set(["Jan","Feb", "March", "Apr", "May", "June"])
months_b = set(["Jan","Feb", "March", "Apr", "May", "June", "July", "Aug", "Sep", "Oct", "Nov", "Dec"])

subset_check = months_a.issubset(months_b)

print(subset_check)

True


In [51]:
months_a = set(["Jan","Feb", "March", "Apr", "May", "June", "hi"])
months_b = set(["Jan","Feb", "March", "Apr", "May", "June", "July", "Aug", "Sep", "Oct", "Nov", "Dec"])

subset_check = months_a.issubset(months_b)

print(subset_check)

False


In [52]:
subset_check = months_b.issubset(months_a)

print(subset_check)

False


### *set.issuperset(x)* возвращает true если все элементы x входят во множество set

In [53]:
months_a = set(["Jan","Feb", "March", "Apr", "May", "June"])
months_b = set(["Jan","Feb", "March", "Apr", "May", "June", "July", "Aug", "Sep", "Oct", "Nov", "Dec"])

superset_check = months_b.issuperset(months_a)

print(superset_check)

True


In [54]:
superset_check = months_a.issuperset(months_b)

print(superset_check)

False


### *set.isdisjoint(x)* возвращает True если set и x не содержат одинаковых значений

In [55]:
names_a = {"Nicholas", "Michelle", "John", "Mercy"}
names_b = {"Jeff", "Bosco", "Teddy", "Milly"}

print(names_a.isdisjoint(names_b))

True


In [56]:
names_a = {"Nicholas", "Michelle", "John", "Mercy"}
names_b = {"Jeff", "Bosco", "Teddy", "Milly", "Mercy"}

print(names_a.isdisjoint(names_b))

False


In [57]:
names_a = {"Nicholas", "Michelle", "John", "Mercy"}
names_b = {"Jeff", "Bosco", "Teddy", "Milly"}
z = not bool(names_a.intersection(names_b))
print(z)


True


## Встроенные (built-in) функции, которые работают с множествами и кортежами

### *len()*

In [58]:
names_a = {"Jeff", "Bosco", "Teddy", "Milly", "Mercy"}
print(len(names_a))

names_b = ("Jeff", "Bosco", "Teddy", "Milly", "Mercy")
print(len(names_b))

5
5


### *all()*

In [59]:
set_a = {1, 2, 3, 4, 5}
set_b = {0, 2, 3, 4, 5}

print(all(set_a))
print(all(set_b))

True
False


In [60]:
a = (1, 2, 3, 4, 5)
b = (0, 2, 3, 4, 5)

print(all(a))
print(all(b))

True
False


### *any()*

In [61]:
set_b = {0, 2, 3, 4, 5}

print(any(set_b))

True


In [62]:
b = (0, 2, 3, 4, 5)


print(any(b))

True


In [63]:
b = (0, 0.0, '', [], {}, (), set())


print(any(b))

False


### *max(), min(), sum()*

In [64]:
set_a = {1, 2, 3, 4, 5}
a = (1, 2, 3, 4, 5)

print(min(set_a), min(a))
print(max(set_a), max(a))
print(sum(set_a), sum(a))

1 1
5 5
15 15


### *sorted()*

In [65]:
set_a = {3, 4, 1, 2, 5}
a = (1, 5, 2, 3, 4)

print(sorted(set_a))
print(sorted(a))

[1, 2, 3, 4, 5]
[1, 2, 3, 4, 5]


### *enumerate()*

In [66]:
months_set = set(["Jan","Feb", "March", "Apr", "May", "June", "July", "Aug", "Sep", "Oct", "Nov", "Dec"])
# i = 0
for i, m in enumerate(months_set):
    print(f'{i} -> {m}')
    # i += 1


0 -> Jan
1 -> Sep
2 -> June
3 -> Dec
4 -> Nov
5 -> Oct
6 -> Apr
7 -> Feb
8 -> March
9 -> Aug
10 -> May
11 -> July


In [67]:
for i, m in enumerate(months_set, 61):
    print(f'{i} -> {m}')

61 -> Jan
62 -> Sep
63 -> June
64 -> Dec
65 -> Nov
66 -> Oct
67 -> Apr
68 -> Feb
69 -> March
70 -> Aug
71 -> May
72 -> July


In [68]:
months = tuple(["Jan","Feb", "March", "Apr", "May", "June", "July", "Aug", "Sep", "Oct", "Nov", "Dec"])
for i, m in enumerate(months, 1):
    print(f'{i} -> {m}')

1 -> Jan
2 -> Feb
3 -> March
4 -> Apr
5 -> May
6 -> June
7 -> July
8 -> Aug
9 -> Sep
10 -> Oct
11 -> Nov
12 -> Dec


## Frozenset в Python


Frozenset (замороженное множество) – это класс с характеристиками множества, однако, как только элементы становятся назначенными, их нельзя менять. Кортежи могут рассматриваться как неизменяемые списки, в то время как frozenset-ы — как неизменные множества.

Множества являются изменяемыми и нехешируемыми, это значит, что мы не можем использовать их как словарные ключи. Замороженные множества (frozenset) являются хешированными и могут использоваться в качестве ключей словаря.

In [69]:
x = frozenset([1, 2, 3, 4, 5, 6, 1, 2, 3, 4, 5, 6, 1, 2, 3, 4, 5, 6])
y = frozenset([4, 5, 6, 7, 8, 9])

print(x)
print(y)

frozenset({1, 2, 3, 4, 5, 6})
frozenset({4, 5, 6, 7, 8, 9})


In [70]:
print(hash(x))
print(hash(y))


1667793003797511190
7240274577185785831


In [71]:
names_b = {"Jeff", "Bosco", "Teddy", "Milly", "Mercy"}
hash(names_b) # error

TypeError: unhashable type: 'set'

In [72]:
dct = {x: 'Frozenset', y: 'Python'}
print(dct)

{frozenset({1, 2, 3, 4, 5, 6}): 'Frozenset', frozenset({4, 5, 6, 7, 8, 9}): 'Python'}


Замороженные множества поддерживают использование методов, которые не влияют на него -
 `copy()`, `difference()`, `symmetric_difference()`, `isdisjoint()`,
`issubset()`, `intersection()`, `issuperset()` и `union()`.

In [73]:
# Преобразование "замороженного множества" в обычное
xx = set(x)
print(type(xx))

<class 'set'>


In [75]:
b = x.copy()


In [76]:
b


frozenset({1, 2, 3, 4, 5, 6})