## Множества

Множество - неупорядоченная коллекция уникальных элементов. Является изменяемым типом данных. Множество задается в фигурных скобках, в которых прописываются значения:

In [1]:
a = {1, 2, 3, "hello world"}

In [2]:
print(a, type(a))

{'hello world', 2, 3, 1} <class 'set'>


Ключевая особенность множества - отсутствие дублирующих значений. Если попробовать задать одинаковые значения, ошибки не будет, но дублирующие значение будут проигнорированы:

In [3]:
a = {1, 2, 3, "hello world", 2, 1, "hello world"}

In [4]:
print(a)

{'hello world', 2, 3, 1}


Элементами множества могут быть только неизменяемые типы данных: числа, булевые значения, строки, кортежи. Неизменяемые типы данных, такие как списки, словари и т.д. - использовать в множествах нельзя. Внутри множеств использовать другие множества также нельзя. Также если внутри множества есть кортеж, элементами этого списка также могут быть только неизменяемые типы данных.

Для создания пустого множество необходимо воспользоваться функцией set:

In [5]:
c = set()
print(c, type(c))

set() <class 'set'>


Так как если воспользоваться следующей конструкцией, на выходе будет словарь:

In [6]:
d = {}
print(d, type(d))

{} <class 'dict'>


Если в функцию set в качестве аргумента передать итерируемый объект, например список, то будет создано не пустое множество, а множество со значениями:

In [7]:
li = [5, 1, 3, 4, "python", "python"]
e = set(li)

Если в этом объекте будут дублирующие элементы, то они будут проигнорированы, а в множестве окажутся только уникальные элементы:

In [8]:
print(e, type(e))

{1, 3, 4, 5, 'python'} <class 'set'>


In [9]:
d = set(range(10))
print(d, type(d))

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9} <class 'set'>


In [10]:
set("developer")

{'d', 'e', 'l', 'o', 'p', 'r', 'v'}

Так как множество - неупорядоченная коллекция, обратиться к ее элементу по индексу невозможно:

In [11]:
# d[0]

С помощью множеств можно легко убирать дубли из данных. Допустим, есть список городов:

In [12]:
cities = ["Москва", "Екатеринбург","Нижний Новгород","Екатеринбург","Таллинн","Санкт-Петербург", "Москва"]

из которого нужно убрать дублирующие значения. Для этого из этого списка можно создать множество, в котором будут только уникальные значения:

In [13]:
set(cities)

{'Екатеринбург', 'Москва', 'Нижний Новгород', 'Санкт-Петербург', 'Таллинн'}

Полученный результат можно сразу преобразовать обратно в список:

In [14]:
list(set(cities))

['Нижний Новгород', 'Таллинн', 'Екатеринбург', 'Москва', 'Санкт-Петербург']

Множество - итерируемый объект, и поэтому его можно перебрать через цикл:

In [15]:
f = set(cities)
f

{'Екатеринбург', 'Москва', 'Нижний Новгород', 'Санкт-Петербург', 'Таллинн'}

In [16]:
for c in f:
    print(c)

Нижний Новгород
Таллинн
Екатеринбург
Москва
Санкт-Петербург


Для того, чтобы узнать число элементов в множестве, используется фунция len:

In [17]:
len(f)

5

Для проверки вхождения - оператор in:

In [18]:
"Москва" in f

True

In [19]:
"Ульяновск" in f

False

### Методы множеств

### add

Метод add позволяет добавить элемент в множество:

In [20]:
g = set()
g

set()

In [21]:
g.add("el1")
g.add(1)
g

{1, 'el1'}

### update

Метод update позволяет добавить сразу несколько элементов. В качестве аргумента в него передается любой итерируемый объект:

In [22]:
g.update([1, 2, 3, ("str1", "str2", 9, 2)])
g

{('str1', 'str2', 9, 2), 1, 2, 3, 'el1'}

In [23]:
g.update("sdfsd")
g

{('str1', 'str2', 9, 2), 1, 2, 3, 'd', 'el1', 'f', 's'}

### discard

Метод discard позволяет удалить элемент по его значению:

In [24]:
g.discard("el1")
g

{('str1', 'str2', 9, 2), 1, 2, 3, 'd', 'f', 's'}

Если передать ему несуществующее значение, ошибки не будет, но и множество никак не изменится:

In [25]:
g.discard(324)
g

{('str1', 'str2', 9, 2), 1, 2, 3, 'd', 'f', 's'}

### remove

Метод remove аналогичен методу discard:

In [26]:
g.remove(3)
g

{('str1', 'str2', 9, 2), 1, 2, 'd', 'f', 's'}

Но в отличие от метода discard, если ему передать несуществующее значение, возникнет ошибка:

In [27]:
# g.remove(456)

### pop

Метод pop удаляет произвольное значение из множества и возвращает его. Произвольное потому, что множество - неупорядоченная коллекция:

In [28]:
g.pop()

1

In [29]:
g.pop()

2

In [30]:
g.pop()

'd'

In [31]:
g.pop()

'f'

Если вызвать метод pop для пустого множества, то возникнет ошибка

### clear

Метод clear удаляет все элементы из множества:

In [32]:
g

{('str1', 'str2', 9, 2), 's'}

In [33]:
g.clear()
g

set()