## Union-Find (Disjoint-Set)

서로소 부분 집합으로 나누어진 원소에 대한 정보를 저장하는 자료구조이다.  
union과 find 연산을 제공한다.  

union과 find 연산은 linked list와 tree 로 구현될 수 있다.  
tree 로 구현시 최적화를 적용하면 시간을 줄일 수 있다.  

In [1]:
class UnionFindTree():
    def __init__(self, n):
        """
        n : 노드의 개수
        노드 번호가 1 ~ n 일 때
        """
        self.par = [i for i in range(n+1)]
        self.rank = [0 for _ in range(n+1)]
        self._cost = [1 for _ in range(n+1)]  # i번 노드가 속한 집합의 노드의 개수
    
    def __repr__(self):
        sets = {}
        for idx, x in enumerate(self.par):
            parent = self.find(x)
            if parent not in sets:
                sets[parent] = [idx]
            else:
                sets[parent].append(idx)
        return "Disjoint-set: " + str(sets)
    
    def find(self, x):
        if self.par[x] == x:
            return x
        self.par[x] = self.find(self.par[x])
        return self.par[x]
    
    def union(self, x, y):
        px = self.find(x)
        py = self.find(y)
        
        if px == py:
            return px
        
        if self.rank[px] < self.rank[py]:
            # px를 py 아래로 union
            self.par[px] = py
            
            # px에 속한 집합의 노드 개수를 py 집합에 더함
            self._cost[py] += self._cost[px]
        else:
            # py를 px 아래로 union
            self.par[py] = px
            
            # py에 속한 집합의 노드 개수를 px 집합에 더함
            self._cost[px] += self._cost[py]
            
            if self.rank[px] == self.rank[py]:
                self.rank[px] += 1
                
    def cost(self, x):
        # _cost 배열에서 노드 x가 속한 집합의 노드의 개수를 알려면
        # 반드시 find로 부모노드를 찾아서 cost 배열에서 조회해야 함
        px = self.find(x)
        return self._cost[px]

In [2]:
ds = UnionFindTree(7)

In [3]:
ds.union(0, 1)

In [4]:
ds.union(3, 4)

In [5]:
ds.union(5, 6)

In [6]:
ds.find(0)

0

In [7]:
ds.find(1)

0

In [8]:
ds

Disjoint-set: {0: [0, 1], 2: [2], 3: [3, 4], 5: [5, 6], 7: [7]}

In [None]:
"""
0  2  3  5
1     4  6
"""

In [9]:
ds.rank

[1, 0, 0, 1, 0, 1, 0, 0]

In [10]:
ds.union(1, 2)

In [11]:
ds.union(3, 6)

In [12]:
ds

Disjoint-set: {0: [0, 1, 2], 3: [3, 4, 5, 6], 7: [7]}

In [13]:
ds.cost(2)

3

In [14]:
ds.cost(4)

4

In [15]:
ds.cost(7)

1

In [None]:
"""
  0       3
1   2   4   5
            6
"""

In [16]:
ds.rank

[1, 0, 0, 2, 0, 1, 0, 0]

In [17]:
ds.union(0, 6)

In [18]:
ds

Disjoint-set: {3: [0, 1, 2, 3, 4, 5, 6], 7: [7]}

In [None]:
"""
       3
  0    4    5
1   2       6
"""

In [19]:
ds.rank

[1, 0, 0, 2, 0, 1, 0, 0]

In [20]:
ds.find(0), ds.find(3), ds.find(5)

(3, 3, 3)

In [21]:
ds.par

[3, 0, 0, 3, 3, 3, 3, 7]

In [22]:
ds.find(1), ds.find(2)

(3, 3)

In [23]:
ds.cost(2)

7

In [24]:
ds.cost(7)

1

<hr>  

In [25]:
uf = UnionFindTree(6)

In [26]:
uf.union(1, 2)

In [27]:
uf.union(1, 3)

In [28]:
uf.union(4, 5)

In [29]:
uf.union(4, 6)

In [30]:
uf

Disjoint-set: {0: [0], 1: [1, 2, 3], 4: [4, 5, 6]}

In [31]:
uf.par

[0, 1, 1, 1, 4, 4, 4]

In [32]:
uf.rank

[0, 1, 0, 0, 1, 0, 0]

In [33]:
uf.find(2)

1

In [34]:
uf.cost(3)

3

In [35]:
uf.cost(2)

3

In [36]:
uf.cost(1)

3

In [37]:
uf.cost(5)

3

In [38]:
uf.union(3, 4)

In [39]:
uf

Disjoint-set: {0: [0], 1: [1, 2, 3, 4, 5, 6]}

In [40]:
uf.cost(3)

6

In [41]:
uf.cost(4)

6

In [42]:
uf.par

[0, 1, 1, 1, 1, 4, 4]

In [43]:
uf.cost(5)

6

In [44]:
uf.rank

[0, 2, 0, 0, 1, 0, 0]