# Система непересекающихся множеств

$\def\Union{\operatorname{Union}}$
$\def\Find{\operatorname{Find}}$
$\def\MakeSet{\operatorname{MakeSet}}$

![Иллюстрация к проекту](https://habrastorage.org/storage/6cf7f9c4/e6848578/0bf0505b/5d3ded44.png)

Система непересекающихся множеств - иерархическая структура данных, позволяющая эффективно работать с множествами.

В самом начале есть лишь разбросанные элементы, которые по сути являются множествами из одного элемента. Будут введены две операции: $\Union(x, y), \Find(x), \MakeSet(x)$

$\Union(x, y)$ - будет объединять два множества в одно, а $\Find(x)$ - говорить в каком множестве лежит $х$. Точнее, мы будем выбирать какого-то представителя множества и на $\Find$ выдавать именно его. Представителем множества может являться любой элемент множества.
$\MakeSet(x)$ - создаёт множество из одного элемента $x$.
    
Рассмотрим несколько вариантов реализации данной структуры данных.


Первый вариант. Создадим массив $\mathcal{P}$, где $\mathcal{P}_i$ - представитель множества, в котором содержится элемент $i$. Нумерация с 1.

In [1]:
class DisjointSetForest_Naive1:
    
    def __init__(self): 
        self.p = list()
        
    def MakeSet(self, x): 
        self.p.append(x) -> <= >= == != 
        
    def Find(self, x):
        if x < len(self.p):
            return self.p[x-1]
    
    def Print(self):
        print(self.p)
    
    def Union(self, x, y):
        x, y = self.Find(x), self.Find(y)
        if x == y:
            pass
        for i in range(len(self.p)):
            if self.p[i] == x:
                self.p[i] = y

In [2]:
dsf = DisjointSetForest_Naive1()

In [3]:
dsf.MakeSet(1)

In [4]:
dsf.Print()

[1]


In [5]:
dsf.MakeSet(2)

In [6]:
dsf.MakeSet(3)
dsf.MakeSet(4)
dsf.MakeSet(5)
dsf.MakeSet(6)
dsf.MakeSet(7)

In [7]:
dsf.Print()

[1, 2, 3, 4, 5, 6, 7]


In [8]:
dsf.Find(3)

3

In [9]:
dsf.Union(1, 3)

In [10]:
dsf.Print()

[3, 2, 3, 4, 5, 6, 7]


In [11]:
dsf.Union(4, 5)

In [13]:
dsf.Union(6, 5)

In [14]:
dsf.Print()

[3, 2, 3, 5, 5, 5, 7]


Также можно хранить "списки подчиненных" для каждой вершины. И использовать хак с подвязкой по размеру. Выгоднее будет подвязывать маленькие множества к большим. Так как пробегаться в итоге нужно будет по меньшему количеству.