# 합집합 찾기(Union-Find)

    * 대표적인 그래프 알고리즘
    * 서로소 집합(Disjoint-Set) 알고리즘이라고도 부름
    * 여러 개의 노드가 존재할 때, 두 개의 노드를 선택해서, 현재 이 두 노드가 서로 같은 그래프에 속하는지 판별하는 알고리즘
    * 합집합 찾기에 사용되는 원리는, Strongly Connected Component 등과 같은 고급 알고리즘에서도 적용이 되는 원리임(알아두는것이 좋음)

# 노드 표현 방식

    * 노드 하나로 이루어진 그래프의 경우 자기 자신을 부모 노드로 칭함
    * 2개의 노드가 연결되었을 경우, 더 작은 값을 부모 노드로 칭함(ex) 1-2 그래프는, 1의 부모=1, 2의 부모=1
        * 이렇게 서로 다른 노드(or 그래프)가 하나로 합쳐지면서, 노드의 부모를 작은 값으로 변경하는 것을 "합침(Union)"이라 부름
    * 1-2 그래프 중, 2 노드에 3이 추가 연결되어서 1-2-3이 될 경우,
        * 먼저 3에 연결된 2가 3의 부모 노드로 설정되고, 
        * 그다음 "재귀함수"에 의해서 2의 부모노드인 1로 3의 부모 노드가 최종적으로 설정된다.
        => 결론적으로 1, 2, 3의 부모 노드는 모두 1로 동일하므로, 1, 2, 3은 같은 그래프에 속한다고 할 수 있다.
        => 이 것이 Union-Find의 전부임!

In [8]:

# 특정 노드 x의 부모 노드를 찾아주는 함수, parent는 각 노드의 부모가 담긴 배열
def getParent(parent, x):    
    
    if parent[x] == x:    # 노드와 부모가 같으면 종료
        return x    # 재귀 함수의 종료 부분
    
    else:
        parent[x] = getParent(parent, parent[x])    # 부모 노드에 대한 부모 노드를 다시 찾는 재귀적인 과정
        return parent[x]
    
# 두 부모 노드를 합치는 함수
def unionParent(parent, a, b):
    
    a = getParent(parent, a)   # 두 노드 각각의 부모노드를 찾은 후, 
    b = getParent(parent, b)
    
    if a < b:    # 부모노드 끼리 비교해서 작은 값을 서로의 부모로 설정
        parent[b] = a
    else:
        parent[a] = b
        
# 두 노드가 같은 부모를 가지는지(=같은 그래프에 속해 있는지) 확인하는 함수
def findParent(parent, a, b):
    a = getParent(parent, a)
    b = getParent(parent, b)
    if a==b:
        return 1
    else:
        return 0
    

# 서로 각각 개별적으로 분리된 노드 10개(1~10) 설정
# 각 노드는 자기 자신을 부모로 가짐
parent = [i for i in range(11)]

# 노드를 그래프로 합치기(1-2-3-4, 5-6-7-8, 9, 10)
unionParent(parent, 1, 2)
unionParent(parent, 2, 3)
unionParent(parent, 3, 4)
unionParent(parent, 5, 6)
unionParent(parent, 6, 7)
unionParent(parent, 7, 8)

print("1과 5는 연결되어 있나요? %d" % findParent(parent, 1, 5))


1과 5는 연결되어 있나요? 0


* 1과 6를 연결한 이후에 재확인 (5와 6은 서로 연결되어 있으므로, 1과 5도 연결됨)

In [9]:
unionParent(parent, 1, 6)
print("1과 5는 연결되어 있나요? %d" % findParent(parent, 1, 5))

1과 5는 연결되어 있나요? 1
