### 서로소 집합 알고리즘

1. union 연산
- 각각의 원소에 대해 루트 노드를 찾은 뒤, 더 큰 루트 노드가 더 작은 루트 노드를 가리키도록 한다.  
- union 연산을 효과적으로 수행하기 위해서는 각 원소의 "부모 테이블"을 가지고 있어야 한다.    

- 해당 부모 테이블로부터 계속 거슬러 올라가면서 루트 노드를 찾는다.  

1) Find 함수가 비효율적으로 동작하는 경우 (recursive하게 계속 부모 테이블을 탐색해야 하므로)

In [1]:
### 기본적인 서로소 집합 알고리즘 소스코드
# 특정 원소의 루트 노드 찾기(= 특정 원소가 속한 집합 찾기)
def find_parents(parent, x):
    # 루트 노드가 자기 자신이 아니면 재귀적으로 거슬러 올라가며 탐색
    if parent[x] != x:
        return find_parents(parent, parent[x])
    return x
# 두 원소가 속한 집합을 합치기
def union(parent, a, b):
    a = find_parents(parent, a)
    b = find_parents(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

# 데이터 입력
v, e = map(int, input().split())
parent = [0]*(v+1)
# 부모 노드를 자기 자신으로 초기화
for i in range(1, v+1):
    parent[i] = i
# union 연산을 수행
for i in range(e):
    a, b = map(int, input().rstrip().split())
    union(parent, a, b)

# 각 원소가 속한 집합 출력
print('각 원소가 속한 집합: ', end = '')
for i in range(1, v+1):
    print(find_parents(parent, i), end = ' ')
print()
# 부모 테이블 출력
print('부모 테이블 :', end = '')
for i in range(1, v+1):
    print(parent[i], end =' ')

6 4
1 3
2 4
2 3
5 6
각 원소가 속한 집합: 1 1 1 1 5 5 
부모 테이블 :1 1 1 2 5 5 

2) 경로 압축을 통해 부모 테이블을 계속해서 업데이트

In [15]:
### 기본적인 서로소 집합 알고리즘 소스코드
# 특정 원소의 루트 노드 찾기(= 특정 원소가 속한 집합 찾기)
def find_parents(parent, x):
    # 루트 노드가 자기 자신이 아니면 재귀적으로 거슬러 올라가며 탐색
    if parent[x] != x:
        ### 경로 압축 ###
        parent[x] = find_parents(parent, parent[x])
    return parent[x]
# 두 원소가 속한 집합을 합치기
def union(parent, a, b):
    a = find_parents(parent, a)
    b = find_parents(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

# 데이터 입력
v, e = map(int, input().split())
parent = [0]*(v+1)
# 부모 노드를 자기 자신으로 초기화
for i in range(1, v+1):
    parent[i] = i
# union 연산을 수행
for i in range(e):
    a, b = map(int, input().rstrip().split())
    union(parent, a, b)

# 각 원소가 속한 집합 출력
print('각 원소가 속한 집합: ', end = '')
for i in range(1, v+1):
    print(find_parents(parent, i), end = ' ')
print()
# 부모 테이블 출력
print('부모 테이블 :', end = '')
for i in range(1, v+1):
    print(parent[i], end =' ')

6 4
1 4
2 3
2 4
5 6
각 원소가 속한 집합: 1 1 1 1 5 5 
부모 테이블 :1 1 1 1 5 5 

3) 서로소 집합을 활용한 사이클 판별 : union 연산 과정에서 만약 두 노드의 루트노드가 같다면 싸이클이 발생한 것이라는 사실을 활용. 각 edge의 두 노드에 대하여 루트노드 확인 >> 같으면 사이클 발생, 다르면 union연산 실행.

In [20]:
### 서로소 집합을 활용한 사이클 판별 소스코드
# 특정 원소의 루트 노드 찾기(= 특정 원소가 속한 집합 찾기)
def find_parents(parent, x):
    # 루트 노드가 자기 자신이 아니면 재귀적으로 거슬러 올라가며 탐색
    if parent[x] != x:
        ### 경로 압축 ###
        parent[x] = find_parents(parent, parent[x])
    return parent[x]
# 두 원소가 속한 집합을 합치기
def union(parent, a, b):
    a = find_parents(parent, a)
    b = find_parents(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

# 데이터 입력
v, e = map(int, input().split())
parent = [0]*(v+1)
# 부모 노드를 자기 자신으로 초기화
for i in range(1, v+1):
    parent[i] = i
# 각 edge에 대하여 사이클 판별
cycle = False
for i in range(e):
    a, b = map(int, input().rstrip().split())
    if find_parents(parent, a) == find_parents(parent, b):
        cycle = True
        break
    else:
        union(parent, a, b)
if cycle:
    print('사이클이 발생했습니다.')
else:
    print('사이클이 발생하지 않았습니다.')

3 3
1 2
1 3
2 3
사이클이 발생했습니다.


In [2]:
### 실전문제 2 : 팀 결성
# 루트 노드 확인
def find_parents(parent, x):
    if parent[x] != x:
        parent[x] = find_parents(parent, parent[x])
    return parent[x]
# union 연산
def union(parent, a, b):
    a = find_parents(parent, a)
    b = find_parents(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b
# 데이터 입력
n, m = map(int, input().split())
parent = [0]*(n+1)
for i in range(1, n+1):
    parent[i] = i
for _ in range(m):
    x, a, b = map(int, input().rstrip().split())
    if x == 0:
        union(parent, a, b)
    else:
        if find_parents(parent, a) == find_parents(parent, b):
            print('YES')
        else:
            print('NO')

7 8
0 1 3
1 1 7
NO
0 7 6
1 7 1
NO
0 3 7
0 4 2
0 1 1
1 1 1
YES


### 크루스칼 알고리즘

- Minimum spanning tree를 찾는 알고리즘.  
- 과정
1. edge를 비용에 따라 오름차순으로 정렬.
2. 최소 비용인 edge부터 순차적으로 선택하여 사이클을 발생 시키는지 확인. 사이클이 발생하지 않는 경우만 포함.
3. 모든 edge에 대하여 반복 수행.

In [17]:
### 크루스칼 알고리즘 소스코드
# 루트노드 찾기
def find_parents(parent, x):
    if parent[x] != x:
        parent[x] = find_parents(parent, parent[x])
    return parent[x]
# 합치기
def union(parent, a, b):
    a = find_parents(parent, a)
    b = find_parents(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b
# 입력
n, m = map(int, input().rstrip().split())
parent = [0]*(n+1)
edges = []
result = 0
for i in range(1, n+1):
    parent[i] = i
# edge 입력
for i in range(m):
    a, b, cost = map(int, input().rstrip().split())
    edges.append((cost, a, b))
edges.sort()
# 사이클 판별하며 edge 선택
for i in range(m):
    cost, a, b = edges[i]
    # 사이클이 안 생기면 edge 선택
    if find_parents(parent, a) != find_parents(parent, b):
        union(parent, a, b)
        result += cost
print(result)

7 9
1 2 29
1 5 75
2 3 35
2 6 34
3 4 7
4 6 23
4 7 13
5 6 53
6 7 25
159


In [2]:
### 실전문제3 : 도시 분할 계획
import heapq
def find_parent(parent, x):
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]
def union(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b
# 입력
n, m = map(int, input().split())
parent = [0]*(n+1)
for i in range(1, n+1):
    parent[i] = i
edge = []
result = 0
for i in range(m):
    a, b, cost = map(int, input().rstrip().split())
    edge.append((cost, a, b))
heapq.heapify(edge)
# minimum spanning tree 만들기
while edge:
    cost, a, b = heapq.heappop(edge)
    if find_parent(parent, a) != find_parent(parent, b):
        union(parent, a, b)
        result += cost
        max_cost = cost
# 최대 비용을 가진 edge하나 제거
print(result-max_cost)

7 12
1 2 3
1 3 2
3 2 1
2 5 2
3 4 4
7 3 6
5 1 5
1 6 2
6 4 1
6 5 3
4 5 3
6 7 4
8
