# 다양한 그래프 알고리즘

## 서로소 집합 (union-find)
* 공통 원소가 없는 두 집합
    * `{1, 2}, {3, 4}`는 서로소
* 서로소 집합 자료구조: 서로소 부분집합으로 나누어진 원소들의 데이터를 처리하기 위한 자료구조
* `union(합집합)`: 2개의 원소가 포함된 집합을 하나의 집합으로 합치기
* `find(찾기)`: 특정한 원소가 속한 집합이 어떤 집합인지 알려주기

### 서로소 집합 자료구조
**합집합 연산**
1. 합집합 연산을 확인하여, 서로 연결된 루트 A, B를 확인한다.
    * A와 B의 루트 노드 A', B'를 각각 찾는다.
    * A'를 B'의 부모 노드로 설정한다 (B'가 A'를 가리키도록 한다).
    * 실제로는 더 번호가 작은 원소가 부모 노드가 되도록 구현한다.
2. 모든 합집합 연산을 처리할 때까지 (1)을 반복한다.


In [2]:
# 노드의 개수, 간선(union 연산)의 개수
v, e = map(int, input().split())

# 부모 테이블: 부모는 자기 자신
parent = [0] * (v + 1)
for i in range(1, v + 1):
    parent[i] = i

# 특정 원소가 속한 집합을 찾
def find_parent(parent, x):
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

# 특정 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

# union 연산을 각각 수행
for i in range(e):
    a, b = map(int, input().split())
    union_parent(parent, a, b)

# 각 원소가 속한 집합
print('각 원소가 속한 집합: ', end="")
for i in range(1, v + 1):
    print(find_parent(parent, i), end=" ")

print()

# 부모 테이블 내용 출력
print('부모 테이블: ', end="")
for i in range(1, v + 1):
    print(parent[i], end=" ")

6 4
1 4
2 3
2 4
5 6
각 원소가 속한 집합: 1 1 1 1 5 5 
부모 테이블: 1 1 1 1 5 5 

### 서로소 집합을 활용한 사이클 판별
* 무방향 그래프 내에서의 사이클 판별에 사용 가능
* 그래프의 모든 간선에 대하여, 두 노드의 루트 노드를 확인
* 루트 노드가 다르다면 union 연산 수행, 루트 노드가 같다면 사이클 발생

In [4]:
# 노드의 개수, 간선(union 연산)의 개수
v, e = map(int, input().split())

# 부모 테이블: 부모는 자기 자신
parent = [0] * (v + 1)
for i in range(1, v + 1):
    parent[i] = i

# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

# 특정 원소가 속한 집합을 합치기.

def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

cycle = False

# 모든 간선을 확인
for i in range(e):
    a, b = map(int, input().split())
    if find_parent(parent, a) == find_parent(parent, b):
        cycle = True
        break
    else:
        union_parent(parent, a, b)

if cycle:
    print("사이클이 발생했습니다.")
else:
    print("사이클이 발생하지 않았습니다.")

3 3
1 2
1 3
2 3
사이클이 발생했습니다.


## 신장 트리 (spanning tree)

* 하나의 그래프가 있을 때 모든 노드를 포함하면서 사이클이 존재하지 않는 부분 그래프
* 트리의 기본 조건: (모든 노드가 포함되어 서로 연결) + (사이클 X) 이므로 트리라 부름


### 크루스칼 알고리즘
* 최소 신장 트리 알고리즘
* 최소한의 비용으로 신장 트리 찾기
    * e.g., N개의 도시가 존재할 때, 도시 사이 도로를 놓아 전체 도시가 서로 연결되게 도로를 설치

1. 간선 데이터를 비용에 따라 오름차순으로 정렬한다.
2. 간선을 하나씩 확인하며 현재의 간선이 사이클을 발생시키는지 확인한다.
    * 사이클이 발생하지 않는 경우 최소 신장 트리에 포함시킨다.
    * 사이클이 발생하는 경우 최소 신장 트리에 포함시키지 않는다.
3. 모든 간선에 대하여 (2)를 반복한다.

In [6]:
# 노드의 개수, 간선(union 연산)의 개수
v, e = map(int, input().split())

# 부모 테이블: 부모는 자기 자신
parent = [0] * (v + 1)
for i in range(1, v + 1):
    parent[i] = i

# 모든 간선을 담을 리스트, 최종 비용을 담을 변수
edges = []
answer = 0

# 모든 간선을 확인 후 정렬
for i in range(e):
    a, b, cost = map(int, input().split())
    edges.append((cost, a, b))
edges.sort()

# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

# 특정 원소가 속한 집합을 합치기.
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    # 여기서 a, b값은 원래 입력한 a, b 값과 달라짐에 유의.
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

# 간선을 하나씩 확인
for cost, a, b in edges:
    # 사이클이 발생하지 않는 경우만 집합에 포함
    if find_parent(parent, a) != find_parent(parent, b):
        union_parent(parent, a, b)
        answer += cost
        print(a, b, parent[1:])

print(answer)

7 9
1 2 29
1 5 75
2 3 35
2 6 34
3 4 7
4 6 23
4 7 13
5 6 53
6 7 25
3 4 [1, 2, 3, 3, 5, 6, 7]
4 7 [1, 2, 3, 3, 5, 6, 3]
4 6 [1, 2, 3, 3, 5, 3, 3]
1 2 [1, 1, 3, 3, 5, 3, 3]
2 6 [1, 1, 1, 3, 5, 3, 3]
5 6 [1, 1, 1, 3, 1, 1, 3]
159


**시간 복잡도**
* 간선의 개수가 $E$개일 때, $O(E log E)$
* 가장 오래 걸리는 부분은, $E$개의 간선을 정렬하는 작업이기 때문

## 위상 정렬(topology sort)

* 방향 그래프의 모든 노드를 방향성에 거스르지 않도록 순서대로 나열하는 것
    * e.g., 선수 과목을 고려한 학습 순서 결정
* 진입차수(indegree): 특정한 노드로 들어오는 간선의 개수
    * e.g., 2개의 선수과목이 있는 경우, 진입차수는 2


1. 진입차수가 0인 노드를 큐에 넣는다.
2. 큐가 빌 때까지 다음의 과정을 반복한다.
    * 큐에서 원소를 꺼내 해당 노드에서 출발하는 간선을 그래프에서 제거한다.
    * 새롭게 진입차수가 0이 된 노드를 큐에 넣는다.
* 큐에서 원소가 $V$번 추출되기 전에 큐가 비어버리면 사이클이 발생한 것 -> 어떠한 원소도 큐에 못 들어가기 때문

In [10]:
from collections import deque

# 노드의 개수, 간선 개수
v, e = map(int, input().split())
# 진입차수 리스트
indegree = [0] * (v + 1)
# 간선 정보를 담기 위한 연결 리스트
graph = [[] for _ in range(v + 1)]

# 간선 정보 입력
for _ in range(e):
    a, b = map(int, input().split())
    graph[a].append(b)
    indegree[b] += 1

# 위상정렬 함수
def topology_sort():
    result = [] # 알고리즘 수행 결과
    queue = deque()

    # 처음엔 진입차수가 0인 노드를 큐에 삽입
    for i in range(1, v + 1):
        if indegree[i] == 0:
            queue.append(i)

    while queue:
        now = queue.popleft()
        result.append(now)

        for i in graph[now]:
            indegree[i] -= 1
            if indegree[i] == 0:
                queue.append(i)

    for i in result:
        print(i, end=' ')
topology_sort()

7 8
1 2
1 5
2 3
2 6
3 4
4 7
5 6
6 4
1 2 5 3 6 4 7 

**시간 복잡도**

* $O(V+E)$. 차례대로 모든 노드 확인 ($V$) + 간선을 차례대로 제거 ($E$)

# [실전] 팀 결성

In [11]:
n, m = map(int, input().split())

# 부모노드
parent = [i for i in range(n + 1)]

def find(parent, x):
    if x != parent[x]:
        parent[x] = find(parent, parent[x])
    return parent[x]

def union(parent, a, b):
    a = find(parent, a)
    b = find(parent, b)

    if a < b:
        parent[b] = a
    else:
        parent[a] = b


for _ in range(m):
    act, a, b = map(int, input().split())
    if act == 0:
        # 합치기
        union(parent, a,b)
    else:
        # 확인하기
        if find(parent, a) == find(parent, b):
            print("YES")
        else:
            print("NO")

7 8
0 1 3
1 1 7
NO
0 7 6
1 7 1
NO
0 3 7
0 4 2
0 1 1
1 1 1
YES


* 서로소 집합 자료구조를 이용하면 된다.

# [실전] 도시 분할 계획

In [22]:
# import sys
# input = lambda: sys.stdin.readline().rstrip()

n, m = map(int, input().split())
edges = []
parent = [i for i in range(n + 1)]
max_route = 0

def find(parent, x):
    if x != parent[x]:
        parent[x] = find(parent, parent[x])
    return parent[x]

def union(parent, a, b):
    a = find(parent, a)
    b = find(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

for _ in range(m):
    a, b, cost = map(int, input().split())
    edges.append((cost, a, b))

edges.sort()

answer = 0

for cost, a, b in edges:
    if find(parent, a) == find(parent, b):
        continue
    else:
        union(parent, a, b)
        answer += cost
        max_route = max(cost, max_route)

print(answer - max_route)

7 12
1 2 3
1 3 2
3 2 1
2 5 2
3 4 4
7 3 6
5 1 5
1 6 2
6 4 1
6 5 3
4 5 3
6 7 4
8


* 크루스칼 알고리즘으로 최소 신장 트리를 찾는다.
* 가장 비용이 큰 간선을 제거한다.

In [None]:
# 맨 마지막이 비용 제일 큰거 알고 있잖슴

# import sys
# input = lambda: sys.stdin.readline().rstrip()

n, m = map(int, input().split())
edges = []
parent = [i for i in range(n + 1)]

def find(parent, x):
    if x != parent[x]:
        parent[x] = find(parent, parent[x])
    return parent[x]

def union(parent, a, b):
    a = find(parent, a)
    b = find(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

for _ in range(m):
    a, b, cost = map(int, input().split())
    edges.append((cost, a, b))

edges.sort()

answer = 0

for cost, a, b in edges:
    if find(parent, a) == find(parent, b):
        continue
    else:
        union(parent, a, b)
        answer += cost
        max_route = cost

print(answer - max_route)

# [실전] 커리큘럼

In [35]:
from collections import deque

n = int(input())

graph = [[] for _ in range(n + 1)]
time = [0] * (n + 1)
num_pre = [0] * (n + 1)


for i in range(1, n + 1):
    input_list = list(map(int, input().split()))
    time[i] = input_list[0]

    for pre in input_list[1:-1]:
        graph[pre].append(i)
        num_pre[i] += 1

# 전 노드 없는 애들 먼저
queue = deque([])

for i in range(1, n + 1):
    if num_pre[i] == 0:
        queue.append((time[i], i))

while queue:
    curr_time, curr = queue.popleft()
    for next in graph[curr]:
        num_pre[next] -= 1
        if num_pre[next] == 0:
            time[next] += curr_time
            queue.append((time[next], next))

for t in time[1:]:
    print(t)

5
10 -1
10 1 -1
4 1 -1
4 3 1 -1
3 3 -1
10
20
14
18
17


* 각 노드(강의)에 대하여 인접한 노드를 확인할 때, 현재보다 강의시간이 더 긴 경우를 찾고, 더 오랜 시간이 걸리는 경우의 시간 값을 저장하기

In [36]:
from collections import deque
import copy

n = int(input())

graph = [[] for _ in range(n + 1)]
time = [0] * (n + 1)
num_pre = [0] * (n + 1)


for i in range(1, n + 1):
    input_list = list(map(int, input().split()))
    time[i] = input_list[0]

    for pre in input_list[1:-1]:
        graph[pre].append(i)
        num_pre[i] += 1

# 전 노드 없는 애들 먼저
queue = deque([])
result = copy.deepcopy(time) # 알고리즘 수행결과를 담을 리스트

for i in range(1, n + 1):
    if num_pre[i] == 0:
        queue.append(i)

while queue:
    curr = queue.popleft()
    for next in graph[curr]:
        time[next] = max(time[next], result[curr] + time[next])
        num_pre[next] -= 1
        if num_pre[next] == 0:
            queue.append(next)

for t in time[1:]:
    print(t)

5
10 -1
10 1 -1
4 1 -1
4 3 1 -1
3 3 -1
10
20
14
18
7
