# `Union Find`

[Union Find | mols Blog](https://mols3131d.notion.site/Union-Find-0d050f11e45c4b92b20e4b7c5a9297ae?pvs=4)


## find

In [1]:
def find(parent, x):
    if parent[x] != x:
        parent[x] = find(parent, parent[x])
    return parent[x]

In [2]:
parent = [0, 1, 0, 1]

for p in parent:
    print(find(parent, p))

0
1
0
1


## union

In [3]:
def union(parent, i, j):
    i = find(parent, i)
    j = find(parent, j)
    if i < j:
        parent[j] = i
    else:
        parent[i] = j

In [4]:
# # node와 edge가 둘다 주어진 경우
node = [0, 1, 2, 3, 4]
edge = [(0, 1), (1, 2), (3, 4)]
n = len(node)

print(node)

[0, 1, 2, 3, 4]


In [5]:
# node가 주어지지 않고, edge만 주어진 경우
edge = [(0, 1), (1, 2), (3, 4)]
n = float("-inf")
for ed in edge:
    ed = list(ed)
    n = max(n, *ed)

node = [i for i in range(n + 1)]
print(node)

[0, 1, 2, 3, 4]


In [6]:
# 병합 이전의 초기 parent 배열을 생성한다.
parent = node.copy()
print(parent)
print()

for ed in edge:
    union(parent, ed[0], ed[1])
    print(parent)

[0, 1, 2, 3, 4]

[0, 0, 2, 3, 4]
[0, 0, 0, 3, 4]
[0, 0, 0, 3, 3]


위의 경우 주어진 간선의 병합을 다 진행하고, 모든 노드들의 루트를 담는 배열 `parent`가 만들어졌다.

이 경우, 함수 `find`를 활용하지 않고, 리스트 인덱싱을 활용해도 노드의 루트를 찾을 수 있지만,

간선이 어떻게 주어지는지(정렬 여부 등)에 따라 결과를 보장할 수 없다.

아래는 이에 대한 예시이다.


In [7]:
edge = [(0, 1), (1, 2), (3, 4), (0, 3), (5, 5)]
n = float("-inf")
for ed in edge:
    ed = list(ed)
    n = max(n, *ed)

n += 1
node = [i for i in range(n)]
parent = node.copy()
print(parent)

for ed in edge:
    union(parent, ed[0], ed[1])
    print(parent)

[0, 1, 2, 3, 4, 5]
[0, 0, 2, 3, 4, 5]
[0, 0, 0, 3, 4, 5]
[0, 0, 0, 3, 3, 5]
[0, 0, 0, 0, 3, 5]
[0, 0, 0, 0, 3, 5]


`parent[4]`는 `3`인데, 간선을 보면 노드 4의 루트는 0이다. 

이는 `Union Find`가 경로 압축을 활용하여 최적화하기 때문이다.

아래처럼 `find` 연산을 실행시키면 노드 4의 루트가 0으로 잘 나온다.

In [8]:
print(parent[4])

print(find(parent, 4))

print(parent)

3
0
[0, 0, 0, 0, 0, 5]


## Union by Rank

Union by Rank를 활용하여 합집합 연산을 개선시킬 수 있다.

In [21]:
class UnionFind:
    def __init__(self, n):
        self.parent = [i for i in range(n)]
        self.rank = [0] * n

    def find(self, x):
        if self.parent[x] != x:
            self.parent[x] = self.find(self.parent[x])
        return self.parent[x]

    def union(self, x, y):
        root_x = self.find(x)
        root_y = self.find(y)
        
        if root_x == root_y:
            return
        
        if self.rank[root_x] < self.rank[root_y]:
            self.parent[root_x] = root_y
        elif self.rank[root_x] > self.rank[root_y]:
            self.parent[root_y] = root_x
        else:
            self.parent[root_y] = root_x
            self.rank[root_x] += 1

    def is_connected(self, x, y): #is_cycled
        return self.find(x) == self.find(y)

In [22]:
edge = [(0, 1), (1, 2), (3, 4), (0, 3), (5, 5)]
n = float("-inf")
for ed in edge:
    ed = list(ed)
    n = max(n, *ed)
n += 1


uf = UnionFind(n)

print(uf.parent)
print(uf.rank)
print()
print()



for ed in edge:
    uf.union(ed[0], ed[1])
    print(uf.parent)
    print(uf.rank)
    print()

[0, 1, 2, 3, 4, 5]
[0, 0, 0, 0, 0, 0]


[0, 0, 2, 3, 4, 5]
[1, 0, 0, 0, 0, 0]

[0, 0, 0, 3, 4, 5]
[1, 0, 0, 0, 0, 0]

[0, 0, 0, 3, 3, 5]
[1, 0, 0, 1, 0, 0]

[0, 0, 0, 0, 3, 5]
[2, 0, 0, 1, 0, 0]

[0, 0, 0, 0, 3, 5]
[2, 0, 0, 1, 0, 0]



: 

In [17]:
print(uf.parent)
print(uf.rank)

[0, 0, 0, 0, 3, 5]
[2, 0, 0, 1, 0, 0]


In [18]:
uf.union(0,2)
print(uf.parent)
print(uf.rank)

[0, 0, 0, 0, 3, 5]
[2, 0, 0, 1, 0, 0]


In [20]:
uf.find(5)
print(uf.parent)
print(uf.rank)

[0, 0, 0, 0, 0, 5]
[2, 0, 0, 1, 0, 0]
