# Chap10. 그래프 이론

### 다양한 그래프 알고리즘
### 1. 서로소 집합 
- 수학에서 서로소 집합이란 공통원소가 없는 두 집합을 의미
- [서로소 집합 자료구조]란 서로소 부분 집합들로 나누어진 원소들의 데이터를 처리하기 위한 자료구조
- 서로소 집합 자료구조는 union(합집합)과 find(찾기) 연산으로 조작할 수 있다.
    - union연산: 2개의 집합을 하나의 집합으로 합치는 연산이다
    - find연산: 특정한 원소가 속한 집합이 어떤 집합인지 알려주는 연산이다
- 트리자료구조를 이용해 서로소 집합 자료를 표현할 수 있다
    - 합집합 연산을 확인하여 서로 연결된 두 노드 A, B를 확인한다
        - A와 B의 루트노드 A', B'을 각각 찾는다.
        - A'을 B'의 부모 노드로 설정한다
    - 모든 union연산을 처리할 때까지 위의 과정을 반복한다.
- union-find 자료구조라고 불리기도 한다

### 서로소 연산 진행과정

- 처리할 연산들: union(1,4), union(2,3), union(2,4), union(5,6)
##### 1) 노드의 개수 크기의 부모 테이블을 초기화한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FrfwwB%2FbtqSEKX71Ow%2FjjU0PKeYUxvjFthjwO6rmk%2Fimg.png">

##### 2) union (1,4)
- 노드 1과 노드 4의 루트 노드를 각각 찾는다. 현재 루트 노드는 각각 1과 4이므로 더 큰 번호에 해당하는 루트 노드 4의 부모를 1로 설정한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FdLVMzI%2FbtqSDt3nsPH%2Fi9g6LCsi6WRsk1RYT6RkfK%2Fimg.png">

##### 3) union (2,3)
- 노드 2과 노드 3의 루트 노드를 각각 찾는다. 현재 루트 노드는 각각 2와 3이므로 더 큰 번호에 해당하는 루트 노드 3의 부모를 2로 설정한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FcjcwCV%2FbtqSjAiOtSs%2FK9hgSvvAhbD4xRPE5kK900%2Fimg.png">

##### 4) union (2, 4)
- 노드 2과 노드 4의 루트 노드를 각각 찾는다. 현재 루트 노드는 각각 2와 1이므로 더 큰 번호에 해당하는 루트 노드 2의 부모를 1로 설정한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fbv9JC2%2FbtqSsRYj57e%2Foy7PJHeTqaGseLfMXTOK8K%2Fimg.png">

##### 5) union (5,6)
- 노드 5과 노드 6의 루트 노드를 각각 찾는다. 현재 루트 노드는 각각 5와 6이므로 더 큰 번호에 해당하는 루트 노드 6의 부모를 5로 설정한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2F8r8WP%2FbtqSGimJEsA%2FAr1sbr44oKVZlPsEHq3DVk%2Fimg.png">

##### 6) 결과
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FETHfB%2FbtqSmACW6VF%2FYRdzjpIHSma3WQb2AFk6a0%2Fimg.png">

#### {1,2,3,4} / {5,6} 서로소

In [1]:
###기본적인 서로소 집합 알고리즘 소스코드###

# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        return find_parent(parent, parent[x])
    return x

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

# 노드의 개수와 간선(Union 연산)의 개수 입력 받기
v, e = map(int, input().split())
parent = [0] * (v + 1) # 부모 테이블 초기화하기

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
    parent[i] = i

# Union 연산을 각각 수행
for i in range(e):
    a, b = map(int, input().split())
    union_parent(parent, a, b)

# 각 원소가 속한 집합 출력하기
print('각 원소가 속한 집합: ', end='')
for i in range(1, v + 1):
    print(find_parent(parent, i), end=' ')

print()

# 부모 테이블 내용 출력하기
print('부모 테이블: ', end='')
for i in range(1, v + 1):
    print(parent[i], end=' ')

6 4
1 4
2 3
2 4
5 6
각 원소가 속한 집합: 1 1 1 1 5 5 
부모 테이블: 1 1 2 1 5 5 

### 1-1. 기본적인 서로소 구현의 한계 및 경로 압축을 이용한 개선
- find함수를 개선해 시간복잡도를 줄일 수 있다.
- 최악의 경우 모든 노드를 다 확인하기 때문에 시간복잡도가 O(V)이다. 
- 예) 수행된 연산들: 𝑈𝑛𝑖𝑜𝑛(4,5), 𝑈𝑛𝑖𝑜𝑛(3,4), 𝑈𝑛𝑖𝑜𝑛(2,3), 𝑈𝑛𝑖𝑜𝑛(1,2)
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2F6akvl%2FbtqSxCNkHyw%2FkeiKWqXgCno3HDl8I23LLk%2Fimg.png">

- 이 경우 1부터 5까지의 모든 원소들이 루트노드를 1로 가진다
- 그러나, 테이블 상에 나와있는 부모도느는 1, 1, 2, 3, 4이므로 노드5의 루트를 찾기 위해서는 5->4->3->2->1순서대로 거슬러 올라가야하기 때문에 번거롭다.
- 이때 노드의 개수가 V개고 find혹은 union연산의 개수가 M일때 전체 시간복잡도는 O(VM)이 되어 비효율적이다
- 이러한 문제는 FIND함수의 최적화를 통해 해결할 수 있다.

#### 경로 압축 기법을 이용한 개선된 서로소 집합 알고리즘
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FEm1VP%2FbtqSmzRxksP%2FQzY6slICjbKQymzl15M0gK%2Fimg.png">

In [6]:
#개선된 서로소 집합 알고리즘 (경로 압축)
# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x] #기본 알고리즘에서는 return x

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

# 노드의 개수와 간선(Union 연산)의 개수 입력 받기
v, e = map(int, input().split())
parent = [0] * (v + 1) # 부모 테이블 초기화하기

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
    parent[i] = i

# Union 연산을 각각 수행
for i in range(e):
    a, b = map(int, input().split())
    union_parent(parent, a, b)

# 각 원소가 속한 집합 출력하기
print('각 원소가 속한 집합: ', end='')
for i in range(1, v + 1):
    print(find_parent(parent, i), end=' ')

print()

# 부모 테이블 내용 출력하기
print('부모 테이블: ', end='')
for i in range(1, v + 1):
    print(parent[i], end=' ')

6 4
1 4
2 3
2 4
5 6
각 원소가 속한 집합: 1 1 1 1 5 5 
부모 테이블: 1 1 1 1 5 5 

### 1-2 서로소 집합을 활용한 사이클 판별
- 서로소 집합은 무방향 그래프 내에서 사이클을 판별할 때 사용할 수 있다.
- 1) 각 간선을 확인하며 두 노드의 루트노드를 확인한다.
    - 루트 노드가 서로 다르다면 두 노드에 대해 union연산을 수행한다
    - 루트노드가 서로 같다면 사이클이 발생한 것이다.
- 2) 그래프에 포함되어있는 모든 간선에 대하여 1)의 과정을 반복한다.

#### 사이클 동작과정
- 모든 노드에 대하여 자기 자신을 부모로 설정하는 형태로 부모 테이블을 초기화한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fd0Rgym%2FbtqSpGv7ZQq%2FfOsQRbaTV4pNIEXjkCq7JK%2Fimg.png">

- 간선 (1,2)를 확인한다. 노드 1과 노드 2의 루트 노드는 각각 1과 2이다. 따라서 더 큰 번호에 해당하는 노드 2의 부모 노드를 1로 변경한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FkF2gM%2FbtqSmApoXwN%2FQjHRC5LBNINLdxqmyjvtI1%2Fimg.png">

- 간선 (1,3)을 확인한다. 노드 1과 노드 3의 루트 노드는 각각 1과 3이다. 따라서 더 큰 번호에 해당하는 노드 3의 부모 노드를 1로 변경한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FcbygOL%2FbtqSsRD1p3S%2FDqClkwtXwcdy0y8FUCm1U1%2Fimg.png">

- 간선 (2,3)을 확인한다. 이미 노드 2과 노드 3의 루트 노드는 모두 1이다. 다시 말해 사이클이 발생한다는 것을 알 수 있다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbxjObf%2FbtqSmAQnkRM%2FiAU7g2cEeEgu8w7V8bXum0%2Fimg.png">

In [8]:
#서로소 집합을 활용한 사이클 판별
# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

# 노드의 개수와 간선(Union 연산)의 개수 입력 받기
v, e = map(int, input().split())
parent = [0] * (v + 1) # 부모 테이블 초기화하기

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
    parent[i] = i

cycle = False # 사이클 발생 여부

for i in range(e):
    a, b = map(int, input().split())
    # 사이클이 발생한 경우 종료
    if find_parent(parent, a) == find_parent(parent, b):
        cycle = True
        break
    # 사이클이 발생하지 않았다면 합집합(Union) 연산 수행
    else:
        union_parent(parent, a, b)

if cycle:
    print("사이클이 발생했습니다.")
else:
    print("사이클이 발생하지 않았습니다.")

3 3
1 2
1 3
2 3
사이클이 발생했습니다.


### 신장트리
- 하나의 그래프가 있을 때 모든 노드를 포함하면서 사이클이 존재하지 않는 부분 그래프
- 간선의 개수: 노드의 총 개수-1

### 2. 크루스칼 알고리즘
- 신장 트리 중에서 최소 비용으로 만들 수 있는 신장트리를 찾는 최소 신장 트리 알고리즘
- 가장 적은 비용으로 모든 노드를 연결할 수 있다-> 그리디 알고리즘으로 분류
- 이때, 사이클을 발생시킬 수 있는 간선에 대해서는 집합에 포함시키지 않는다
- 1) 간선 데이터를 비용에 따라 오름차순으로 정렬한다
- 2) 간선을 하나씩 확인하며 현재의 간선이 사이클을 발생시키는지 확인한다
    - 사이클이 발생하지 않는 경우 최소 신장 트리에 포함시킨다
    - 사이클이 발생하는 경우 최소 신장 트리에 포함시키지 않는다
- 3) 모든 간선에 대하여 2번의 과정을 반복한다

##### 크루스칼 알고리즘 동작과정
- 그래프의 모든 간선 정보에 대하여 오름차순 정렬을 수행한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FqDr3V%2FbtqSgNCIJxK%2FIxzn6oYTH6nMChodLZtjP1%2Fimg.png">
- 아직 처리하지 않은 간선 중에서 가장 짧은 간선인 (3,4)를 선택하여 처리한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fnj3q4%2FbtqSASbl3oi%2FsJ55jjdgj0EEAaKiV4Sx81%2Fimg.png">
- 아직 처리하지 않은 간선 중에서 가장 짧은 간선인 (4,7)을 선택하여 처리한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FqLS42%2FbtqSmzKHLU6%2FpF0bTmL264Xa6G6XK38cRK%2Fimg.png">
- 아직 처리하지 않은 간선 중에서 가장 짧은 간선인 (4,6)을 선택하여 처리한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbnIT6E%2FbtqSmAv8aSj%2FHKZdnKdErROK1M7Fv3MHo1%2Fimg.png">
- 아직 처리하지 않은 간선 중에서 가장 짧은 간선인 (6,7)을 선택하여 처리한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fbse6he%2FbtqSpGQkvbp%2FvgDPPUfirhmD9oLVqCFhPk%2Fimg.png">
- 아직 처리하지 않은 간선 중에서 가장 짧은 간선인 (1,2)를 선택하여 처리한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FcNClIe%2FbtqSxBHIZi4%2FPJjagUrZsRJ0HRikbIF7gK%2Fimg.png">
- 아직 처리하지 않은 간선 중에서 가장 짧은 간선인 (2,6)을 선택하여 처리한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FcUfFKO%2FbtqSjAXpQ2s%2FCnoOcgkCTdls3ompzNxQhK%2Fimg.png">
- 아직 처리하지 않은 간선 중에서 가장 짧은 간선인 (2,3)을 선택하여 처리한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FL7ttH%2FbtqSsSpraJx%2F3x4TbGYotthyvHtDkoHeck%2Fimg.png">
- 아직 처리하지 않은 간선 중에서 가장 짧은 간선인 (5,6)을 선택하여 처리한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbcNAlx%2FbtqSATBiF3K%2FN2Icdl9K3UhorF7Dfh6KVk%2Fimg.png">
- 아직 처리하지 않은 간선 중에서 가장 짧은 간선인 (1,5)를 선택하여 처리한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fcu1nzm%2FbtqSELirlyF%2FBwfXsbENBsln6FGLX6LxB1%2Fimg.png">
- 최소 신장 트리에 포함되어 있는 간선의 비용만 모두 더하면, 그 값이 최종 비용에 해당한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FAY3Su%2FbtqSgNbIdXd%2FplDEha4JlBktdq7mMZscC0%2Fimg.png">

In [10]:
# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출(경로 압축방법 사용)
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

# 노드의 개수와 간선(Union 연산)의 개수 입력 받기
v, e = map(int, input().split())
parent = [0] * (v + 1) # 부모 테이블 초기화하기

# 모든 간선을 담을 리스트와, 최종 비용을 담을 변수
edges = []
result = 0

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
    parent[i] = i

# 모든 간선에 대한 정보를 입력 받기
for _ in range(e):
    a, b, cost = map(int, input().split())
    # 비용순으로 정렬하기 위해서 튜플의 첫 번째 원소를 비용으로 설정
    edges.append((cost, a, b)) #튜플에서는 첫번째 원소를 기준으로 정렬됨

# 간선을 비용순으로 정렬
edges.sort()

# 간선을 하나씩 확인하며
for edge in edges:
    cost, a, b = edge
    # 사이클이 발생하지 않는 경우에만 집합에 포함
    if find_parent(parent, a) != find_parent(parent, b): #루트노드가 같지 않은 경우에만 union수행
        union_parent(parent, a, b)
        result += cost

print(result)

7 9
1 2 29
1 5 75
2 3 35
2 6 34
3 4 7
4 6 23
4 7 13
5 6 53
6 7 25
159


- 간선의 개수가 E일 때 O(ElogE)의 시간복잡도를 가진다.

### 3.위상정렬
- 정렬 알고리즘의 일종
- 순서가 정해져 있는 일련의 작업을 차례대로 수행해야할 때 사용할 수 있는 알고리즘
- 방향 그래프의 모든 노드를 방향성에 거스르지 않도록 순서대로 나열하는 것
- 예) 선수과목을 고려한 학습 순서 설정
- 전입차수(Indegree): 특정한 노드로 들어오는 간선의 개수
- 진출차수(Outdegree): 특정한 노드에서 나가는 간선의 개수
- 그래프는 <b>사이클이 없는 방향그래프</b> 여야한다.

##### 큐를 이용한 위상 정렬 알고리즘 동작과정
- 1) 진입차수가 0인 모든 노드를 큐에 넣는다
- 2) 큐가 빌 때까지 다음의 과정을 반복한다
    - 큐에서 원소를 꺼내 해당 노드에서 나가는 간선을 그래프에서 제거한다
    - 새롭게 진입차수가 0이 된 노드를 큐에 넣는다
   
##### 위상정렬 알고리즘 동작 예시
- 진입차수가 0인 모든 노드를 큐에 넣는다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FLHVAD%2FbtqSsQLVF60%2F8PAzC3pjDaGPBsMYj92Q3K%2Fimg.png">
- 큐에서 노드 1을 꺼낸 뒤에 노드 1에서 나가는 간선을 제거한다. 2, 5 중에 수가 작은 2부터 큐에 넣는다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FG86vR%2FbtqSATVz85h%2FWAktuqlhu8jBdxd7qoGSj1%2Fimg.png">
- 큐에서 노드 2를 꺼낸 뒤에 노드 2에서 나가는 간선을 제거한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FtMwTO%2FbtqSGjspJxc%2FmtoY6ENiUJ1Bvfq4d8Juuk%2Fimg.png">
- 큐에서 노드 5를 꺼낸 뒤에 노드 5에서 나가는 간선을 제거한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fb0WaJy%2FbtqSELbEwko%2F37cbUpQdmzuAcJtVWrFfPk%2Fimg.png">
-  큐에서 노드 3를 꺼낸 뒤에 노드 3에서 나가는 간선을 제거한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FAOoQb%2FbtqSpFRte1e%2FdkkUujX7KkduGekbALSIUK%2Fimg.png">
- 큐에서 노드 6을 꺼낸 뒤에 노드 6에서 나가는 간선을 제거한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fb5B0zO%2FbtqSxCfr7Xu%2Fq0qD1K2NJZXKIE4g81Cytk%2Fimg.png">
- 큐에서 노드 4를 꺼낸 뒤에 노드 4에서 나가는 간선을 제거한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2F48K82%2FbtqSDugXPv7%2FtfbKBYUHzeIv7QvVXKoeLK%2Fimg.png">
- 큐에서 노드 7을 꺼낸 뒤에 노드 7에서 나가는 간선을 제거한다
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbZiXVr%2FbtqSjBotIER%2FtQJgYuMrwkFmcPtA3OVOyk%2Fimg.png">
- 큐에 삽입된 전체 노드 순서: 1 → 2 → 5 → 3 → 6 → 4 → 7
<img src="https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fbl7JC9%2FbtqSmAW9cdY%2FJC4IpfyADlrK0AtdoP0Qkk%2Fimg.png">

##### 위상정렬의 특징
- 순환하지 않는 방향그래프(=DAG(Direct Acyclic Graph))에 대해서만 수행할 수 있다
- 여러가지 답이 존재할 수 있다
- 모든 원소를 방문하기 전에 큐가 빈다면 사이클이 존재한다고 판단할 수 있다
- 스택을 활용한 DFS를 이용해 위상 정렬을 수행할 수도 있다
- 시간복잡도가 O(V+E)이다

In [11]:
from collections import deque

# 노드의 개수와 간선의 개수를 입력 받기
v, e = map(int, input().split())
# 모든 노드에 대한 진입차수는 0으로 초기화
indegree = [0] * (v + 1)
# 각 노드에 연결된 간선 정보를 담기 위한 연결 리스트 초기화
graph = [[] for i in range(v + 1)]

# 방향 그래프의 모든 간선 정보를 입력 받기
for _ in range(e):
    a, b = map(int, input().split())
    graph[a].append(b) # 정점 A에서 B로 이동 가능
    # 진입 차수를 1 증가
    indegree[b] += 1

# 위상 정렬 함수
def topology_sort():
    result = [] # 알고리즘 수행 결과를 담을 리스트
    q = deque() # 큐 기능을 위한 deque 라이브러리 사용

    # 처음 시작할 때는 진입차수가 0인 노드를 큐에 삽입
    for i in range(1, v + 1):
        if indegree[i] == 0:
            q.append(i)

    # 큐가 빌 때까지 반복
    while q:
        # 큐에서 원소 꺼내기
        now = q.popleft()
        result.append(now)
        # 해당 원소와 연결된 노드들의 진입차수에서 1 빼기
        for i in graph[now]:
            indegree[i] -= 1
            # 새롭게 진입차수가 0이 되는 노드를 큐에 삽입
            if indegree[i] == 0:
                q.append(i)

    # 위상 정렬을 수행한 결과 출력
    for i in result:
        print(i, end=' ')

topology_sort()

7 8
1 2
1 5
2 3
2 6
3 4
4 7
5 6
6 4
1 2 5 3 6 4 7 

### 실전문제

### 2. 팀결성
- 학생들에게 0번부터 N번까지 번호를 부여한 뒤 서로 다른 팀으로 구분한다(총 N+1개 팀)
- 선생님이 M개의 연산을 수행할 수 있을 때 '같은 팀 여부 확인'연산에 대한 연산결과를 출력하는 프로그램을 작성하시오(같은 팀 여부 확인 연산에 대해 한 줄에 하나씩 YES 혹은 NO로 결과를 출력한다)

- 팀 합치기 연산: 두 팀을 합치는 연산(0 a b형태로 주어진다)
- 같은 팀 여부 확인 연산: 특정한 두 학생이 같은 팀에 속하는 지 확인하는 연산이다(1 a b 형태로 주어진다)

##### 풀이 전략
- 팀 합치기 연산=union연산
- 같은 팀 여부 확인 연산= find연산
- 기존의 서로소 집합 알고리즘 형태를 그대로 이용하되 출력 결과 YES, NO 나오게 조정해야함

In [12]:
# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

n, m = map(int, input().split())
parent = [0] * (n + 1) # 부모 테이블 초기화

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(0, n + 1):
    parent[i] = i

# 각 연산을 하나씩 확인
for i in range(m):
    oper, a, b = map(int, input().split())
    # 합치합(Union) 연산인 경우
    if oper == 0:
        union_parent(parent, a, b)
    # 찾기(Find) 연산인 경우
    elif oper == 1:
        if find_parent(parent, a) == find_parent(parent, b):
            print('YES')
        else:
            print('NO')

7 8
0 1 3
1 1 7
NO
0 7 6
1 7 1
NO
0 3 7
0 4 2
0 1 1
1 1 1
YES


In [19]:
# 지은

# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b
check=[]
n, m = map(int, input().split())
parent = [0] * (n + 1) # 부모 테이블 초기화

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(0, n + 1):
    parent[i] = i
#union연산을 각각 수행
for i in range(m):
    code, a, b = map(int, input().split())
    if code == 0:
        union_parent(parent, a, b)
    else:
        check.append((a, b))
        
for i in check:
    if parent[i[0]] == parent[i[1]]: #i=(a,b)
        print("YES")
    else:
        print("NO")

7 8
0 1 3
1 1 7
0 7 6
1 7 1
0 3 7
0 4 2
0 1 1
1 1 1
NO
NO
YES


### 3. 도시 분할 계획
- 마을은 N개의 집과 그 집을 연결하는 M개의 길로 이루어져있다
- 길마다 길을 유지하는데 드는 유지비가 있다
- 이장은 마을을 2개의 분리된 마을로 분할할 계획을 세우고 있다.
- 조건1: 분리된 두 마을 사이의 길들은 필요가 없으므로 없앤다
- 조건2: 각 분리된 마을 안에 임의의 두 집 사이의 경로가 항상 존재해야한다.
- 조건3: 조건 1,2을 만족하되 길의 유지비의 합을 최소로 하고싶다.
- 위 조건을 만족하는 프로그램을 작성하라

##### 문제풀이전략
- 제목부터 크루스칼 알고리즘을 사용할 것 같다는 생각이 든다!
- N개의 집=노드, M개의 길=간선, 유지비=비용
- 예제에 나오는 코드를 활용하되 각 변수를 문제에 맞게 바꿔주어야한다
- 어떻게 2개의 신장트리를 만들 수 있을까?
- 책: <b>크루스칼 알고리즘으로 최소 신장 트리를 찾은 뒤에 최소신장트리를 구성하는 간선 중에서 가장 비용이 큰 간선을 제거한다</b> 

In [15]:
# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

# 노드의 개수와 간선(Union 연산)의 개수 입력받기
v, e = map(int, input().split())
parent = [0] * (v + 1) # 부모 테이블 초기화

# 모든 간선을 담을 리스트와, 최종 비용을 담을 변수
edges = []
result = 0

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
    parent[i] = i

# 모든 간선에 대한 정보를 입력받기
for _ in range(e):
    a, b, cost = map(int, input().split())
    # 비용순으로 정렬하기 위해서 튜플의 첫 번째 원소를 비용으로 설정
    edges.append((cost, a, b))

# 간선을 비용순으로 정렬
edges.sort()
last = 0 ### 최소 신장 트리에 포함되는 간선 중에서 가장 비용이 큰 간선###

# 간선을 하나씩 확인하며
for edge in edges:
    cost, a, b = edge
    # 사이클이 발생하지 않는 경우에만 집합에 포함
    if find_parent(parent, a) != find_parent(parent, b):
        union_parent(parent, a, b)
        result += cost
        last = cost

print(result - last)

7 12
1 2 3
1 3 2
3 2 1
2 5 2
3 4 4
7 3 6
5 1 5
1 6 2
6 4 1
6 5 3
4 5 3
6 7 4
8


### 4. 커리큘럼
- 동빈이가 총 N개의 강의를 듣고자 할 때 N개의 강의에 대하여 수강하기까지 걸리는 최소시간을 출력하는 프로그램을 작성하시오
- 첫째 줄에 동빈이가 듣고자 하는 강의의 수 N개가 주어진다.
- 다음 N개의 줄에는 각 강의의 강의시간, 해당 강의를 듣기 위해 먼저 들어야하는 강의들의 번호가 주어지며 각 자연수는 공백으로 구분한다.
- 각 줄은 -1로 끝난다.

##### 풀이 전략
- 위상정렬을 사용해서 푸는 문제인것 같다. 

In [21]:
from collections import deque
import copy

# 노드의 개수 입력받기
v = int(input())
# 모든 노드에 대한 진입차수는 0으로 초기화
indegree = [0] * (v + 1)
# 각 노드에 연결된 간선 정보를 담기 위한 연결 리스트(그래프) 초기화
graph = [[] for i in range(v + 1)]
# 각 강의 시간을 0으로 초기화
time = [0] * (v + 1)

# 방향 그래프의 모든 간선 정보를 입력받기
for i in range(1, v + 1):
    data = list(map(int, input().split()))
    time[i] = data[0] # 첫 번째 수는 시간 정보를 담고 있음
    for x in data[1:-1]: #첫번째 원소부터 마지막 바로 전의 원소까지(-1이 그래서 필요한 듯)
        indegree[i] += 1
        graph[x].append(i)

# 위상 정렬 함수
def topology_sort():
    result = copy.deepcopy(time) # 알고리즘 수행 결과를 담을 리스트 
    #깊은 복사(deepcopy)는 내부에 객체들까지 모두 새롭게 copy 되는 것 
    q = deque() # 큐 기능을 위한 deque 라이브러리 사용

    # 처음 시작할 때는 진입차수가 0인 노드를 큐에 삽입
    for i in range(1, v + 1):
        if indegree[i] == 0:
            q.append(i)

    # 큐가 빌 때까지 반복
    while q:
        # 큐에서 원소 꺼내기
        now = q.popleft()
        # 해당 원소와 연결된 노드들의 진입차수에서 1 빼기
        for i in graph[now]:
            result[i] = max(result[i], result[now] + time[i]) 
            #해당과목의 수업시간하나와 선수과목+해당과목의 학습시간을 비교해 max값 출력
            #선수과목을 고려해 학습시간을 정하기 위해 필요하다
            indegree[i] -= 1
            # 새롭게 진입차수가 0이 되는 노드를 큐에 삽입
            if indegree[i] == 0:
                q.append(i)

    # 위상 정렬을 수행한 결과 출력
    for i in range(1, v + 1):
        print(result[i])

topology_sort()

5
10 -1
10 1 -1
4 1 -1
4 3 1 -1
3 3 -1
10
20
14
18
17


### 기출문제

### 41. 여행계획
- 한울이가 사는 나라에는 N개의 여행지가 있으며 각 여행지는 1~N번으로 구분된다
- 임의의 두 여행지 사이에는 두 여행지를 연결하는 도로가 존재할 수 있다.
- 이때 여행지가 연결되어있다면 양방향 이동이 가능하다
- 한울이는 하나의 여행계획을 세운 뒤 이 여행계획이 가능한지 여부를 판단하고자 한다. 
- 한울이의 여행계획이 가능한지 판별하는 프로그램을 작성하라
- 첫째 줄에 여행지 수N, 여행 계획에 속한 도시의 수 M 주어짐
- 다음 N개의 줄에 걸쳐 N*N행렬 통해 두 여행지가 연결되어있는지 주어짐. 1이면 연결O, 0이면 연결되지않음
- 마지막 줄에 한울이의 여행 계획에 포함된 여행지의 번호들 주어짐
- 한울이의 여행계획이 가능하다면 YES, 불가능하다면 NO출력

In [16]:
# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

# 여행지의 개수와 여행 계획에 속한 여행지의 개수 입력받기
n, m = map(int, input().split())
parent = [0] * (n + 1) # 부모 테이블 초기화

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, n + 1):
    parent[i] = i

# Union 연산을 각각 수행
for i in range(n):
    data = list(map(int, input().split()))
    for j in range(n):
        if data[j] == 1: # 연결된 경우 합집합(Union) 연산 수행
            union_parent(parent, i + 1, j + 1)

# 여행 계획 입력받기
plan = list(map(int, input().split()))

result = True
# 여행 계획에 속하는 모든 노드의 루트가 동일한지 확인
for i in range(m - 1):
    if find_parent(parent, plan[i]) != find_parent(parent, plan[i + 1]):
        result = False

# 여행 계획에 속하는 모든 노드가 서로 연결되어 있는지(루트가 동일한지) 확인
if result:
    print("YES")
else:
    print("NO")

5 4
0 1 0 1 1
1 0 1 1 0
0 1 0 0 0
1 1 0 0 0
1 0 0 0 0
2 3 4 3
YES
