#Set

Множество (Set) — это структура данных, которая хранит неупорядоченные уникальные хешируемые элементы. 

In [1]:
s = set() # создание пустого множества
s

set()

In [4]:
s = set((1, 2, 3, 4, 5))  # cоздание множества из кортежа
s = set([1, 2, 3, 4, 5])  # создание множества из списка
s = {1, 2, 3, 4, 5} # еще вариант создания множества
s

{1, 2, 3, 4, 5}

In [5]:
s = {1, 2, 3, 4, 5, "test", ()}
s

{(), 1, 2, 3, 4, 5, 'test'}

In [7]:
s.add("new test") # добавление нового элемента
s

{(), 1, 2, 3, 4, 5, 'new test', 'test'}

In [8]:
s.discard(3)
s

{(), 1, 2, 4, 5, 'new test', 'test'}

In [10]:
first = set((1, 2, 3, 4, 5))
second = set((6, 7, 8, 9, 10))
first.union(second)

{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

In [11]:
first.intersection(second)

set()

####Set Comprehensions

In [12]:
{s for s in [1, 2, 1, 0]}

{0, 1, 2}

In [13]:
{s**2 for s in [1, 2, 1, 0]}

{0, 1, 4}

In [14]:
{s**2 for s in range(10)}

{0, 1, 4, 9, 16, 25, 36, 49, 64, 81}

In [15]:
{s for s in [1, 2, 3] if s%2}

{1, 3}

In [16]:
{(m, n) for n in range(2) for m in range(3, 5)}

{(3, 0), (3, 1), (4, 0), (4, 1)}

Сложность основных операций в нотации big (O)

Таблица времени выполнения операций над множествами в нотации Big O выглядит следующим образом:

Операция	Средняя сложность
<br>len — O(1)
<br>add	— O(1)
<br>Проверка на входимость —	O(1)
<br>.remove	— O(1)
<br>.discard	— O(1)
<br>.pop	— O(1)
<br>.clear	— O(1)
<br>Создание	— O(len(t))
<br>Проверки ==, !=	— O(len(s))
<br>s.issubset(t)	— O(len(s))
<br>t.issuperset(s)	— O(len(t))
<br>.union	— O(len(s)+len(t))
<br>.intersection	— O(min(len(s), len(t)))
<br>.difference	— O(len(s))
<br>.symmetric_difference —	O(len(s))
<br>Проход	— O(n)
<br>.copy —	O(n)

Как множества устроены внутри Python

Внутри множества представляют таблицу, в ячейки которой добавляют новые элементы. В СPython множества представляют следующую структуру:

In [None]:
typedef struct{
    PyObject_HEAD
    Py_ssize_t fill;
    Py_ssize_t used;
    Py_ssize_t mask;
    setentry *table;
    Py_hash_t hash;
    Py_ssize_t finger;
    setentry smalltable[PySet_MINSIZE];
    PyObject *weakreflist;
} PySetObject;

где:

PyObject_HEAD — С-макрос, используется при объявлении новых типов, представляющих объекты без переменной длины;

Py_ssize_t fill — количество активных и фиктивных записей;

Py_ssize_t used — количество активных записей;

setentry *table — указатель на таблицу, где хранятся данные;

Py_hash_t hash — хеш, заполняется только в случае frozen set;

Py_ssize_t finger — специальная переменная для определения элемента, который нужно выкинуть из коллекции при операции pop();

PyObject *weakreflist — список ссылок для сборщика мусора.

#Frozen Set

Неизменяемая версия множеств — уникальный и хешируемый набор элементов в структуре, так же, как и в обычном множестве. Отличается отсутствием возможности добавить или удалить новый элемент.

In [20]:
fs = frozenset((1, 2, 3))
fs

frozenset({1, 2, 3})

In [19]:
frozenset({1, 2, 3})

frozenset({1, 2, 3})

In [21]:
fs.add(2)

AttributeError: ignored