# 기타 그래프 이론
DFS/BFS와 최단 경로는 그래프 알고리즘의 한 유형으로 볼 수 있다.
- 크루스칼 알고리즘 (Kruskal Algorithms) : 그리디 알고리즘
- 위상 정렬 알고리즘 (Topology Algorithms) : 큐, 스택 자료구조 활용해서 구현

| |그래프|트리|
|--|--|--|
|방향성|방향 그래프 혹은 무방향 그래프|방향 그래프|
|순환성|순환 및 비순환|비순환|
|루트 노드 존재 여부|루트 노드가 없음|루트 노드가 존재|
|노드간 관계성|부모와 자식 관계 없음|부모와 자식 관계|
|모델의 종류|네트워크 모델|계층 모델|

### 그래프 구현 방법
(V : 노드 개수, E : 간선 개수)
- 인접 행렬(Adjacency Matrix) : 2차원 배열을 사용하는 방식 (플로이드 워셜 알고리즘 : 노드 개수 적을 때 사용)
    - 메모리 공간 : O(V^2)
    - 간선 비용 : O(1)
- 인접 리스트(Adjacency List) : 리스트를 사용하는 방식 (우선순위 큐를 이용한 다익스트라 최단 경로 알고리즘 : 노드와 간선의 개수가 많을 때 사용)
    - 메모리 공간 : O(E)
    - 간선 비용 : O(V)

## 서로소 집합 (Disjoint Sets)
공통 원소가 없는 두 집합

### 서로소 집합 자료구조 (union-find 자료구조)
서로소 부분 집합들로 나누어진 원소들의 데이터를 처리하기 위한 자료구조
- union (합집합) : 2개의 원소가 포함된 집합을 하나의 집합으로 합치는 연산
- find (찾기) : 특정한 원소가 속한 집합이 어떤 집합인지 알려주는 연산
- 트리 자료구조 이용

### 서로소 집합 계산 알고리즘
1. union(합집한) 연산을 확인하여, 서로 연결된 두 노드 A, B를 확인한다.
    1. A와 B의 루트 노드 A', B'를 각각 찾는다.
    2. A'를 B'의 부모 노드로 설정한다(B'가 A'를 가리키도록 한다). or A'와 B' 중에서 더 번호가 작은 원소가 부모 노드
2. 모든 union(합집합) 연산을 처리할 때까지 1번 과정을 반복한다.

기본적인 서로소 집합 알고리즘 소스코드
- 루트 노드가 같은 원소끼리는 동일한 집합 ({1, 2, 3, 4}, {5, 6})
- find 함수가 비효율적으로 동작 (최악의 경우 시간 복잡도 : O(V))
- 노드의 개수가 V개이고 find 혹은 union 연산의 개수가 M개일 때, 전체 시간 복잡도 : O(VM)

In [1]:
# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        return find_parent(parent, parent[x])
    return x

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b
        
# 노드의 개수와 간선(union 연산)의 개수 입력받기
v, e = map(int, input().split())
parent = [0] * (v + 1)

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
    parent[i] = i
    
# union 연산을 각각 수행
for i in range(e):
    a, b = map(int, input().split())
    union_parent(parent, a, b)
    
# 각 원소가 속한 집합 출력
print('각 원소가 속한 집합: ', end="")
for i in range(1, v + 1):
    print(find_parent(parent, i), end=' ')
    
print()

# 부모 테이블 내용 출력
print('부모 테이블: ', end="")
for i in range(1, v + 1):
    print(parent[i], end=' ')

각 원소가 속한 집합: 1 1 1 1 5 5 
부모 테이블: 1 1 2 1 5 5 

경로 압축 (Path Compression) 기법 소스코드
- find 함수 최적화 : find 함수를 재귀적으로 호출한 뒤에 부모 테이블값을 갱신하는 기법 (각 노드의 루트 노드가 바로 부모 노드가 됨)

In [None]:
def find_parent(parent, x):
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

개선된 서로소 집합 알고리즘 소스코드
- 노드의 개수 V개, 최대 V - 1개의 union 연산과 M개의 find 연산이 가능할 때, 시간복잡도 : O(V + M(1 + log<sub>2-M/V</sub>V))

In [1]:
def find_parent(parent, x):
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b
        
# 노드의 개수와 간선(union 연산)의 개수 입력받기
v, e = map(int, input().split())
parent = [0] * (v + 1)

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
    parent[i] = i
    
# union 연산을 각각 수행
for i in range(e):
    a, b = map(int, input().split())
    union_parent(parent, a, b)
    
# 각 원소가 속한 집합 출력
print('각 원소가 속한 집합: ', end="")
for i in range(1, v + 1):
    print(find_parent(parent, i), end=' ')
    
print()

# 부모 테이블 내용 출력
print('부모 테이블: ', end="")
for i in range(1, v + 1):
    print(parent[i], end=' ')

각 원소가 속한 집합: 1 1 1 1 5 5 
부모 테이블: 1 1 1 1 5 5 

### 서로소 집합을 활용한 사이클 판별
- 서로소 집합은 무방향 그래프 내에서의 사이클을 판별할 때 사용할 수 있다.
    - 참고로 방향 그래프에서의 사이클 여부는 DFS를 이용하여 판별할 수 있다.
- 사이클 판별 알고리즘
    1. 각 간선을 하나씩 확인하며 두 노드의 루트 노드를 확인한다.
        1) 루트 노드가 서로 다르다면 두 노드에 대하여 합집합(Union) 연산을 수행한다.
        2) 루트 노드가 서로 같다면 사이클(Cycle)이 발생한 것이다.
    2. 그래프에 포함되어 있는 모든 간선에 대하여 1번 과정을 반복한다.

서로소 집합을 활용한 사이클 판별 소스코드

In [None]:
# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b
        
# 노드의 개수와 간선(union 연산)의 개수 입력받기
v, e = map(int, input().split())
parent = [0] * (v + 1)      # 부모 테이블 초기화하기

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
    parent[i] = i
    
cycle = False   # 사이클 발생 여부

for i in range(e):
    a, b = map(int, input().split())
    # 사이클이 발생한 경우 종료
    if find_parent(parent, a) == find_parent(parent, b):
        cycle = True
        break
    # 사이클이 발생하지 않았다면 합집합(Union) 연산 수행
    else:
        union_parent(parent, a, b)
        
if cycle:
    print("사이클이 발생했습니다.")
else:
    print("사이클이 발생하지 않았습니다.")

## 신장 트리 (Spanning Tree)
- 그래프에서 모든 노드를 포함하면서 사이클이 존재하지 않는 부분 그래프 (트리의 조건이기도 함)

### 최소 신장 트리
- 최소한의 비용으로 구성되는 신장 트리를 찾아야 할 때

### 크루스칼 알고리즘 (Kruskal Algorithm)
- 대표적인 최소 신장 트리 알고리즘
- 그리디 알고리즘
- 동작 과정
    1. 간선 데이터를 비용에 따라 오름차순으로 정렬
    2. 간선을 하나씩 확인하며 현재의 간선이 사이클을 발생시키는지 확인
        1) 사이클이 발생하지 않는 경우 최소 신장 트리에 포함
        2) 사이클이 발생하는 경우 최소 신장 트리에 포함시키지 않음
    3. 모든 간선에 대하여 2번의 과정을 반복

크루스칼 알고리즘 소스코드
- 시간 복잡도 : O(ElogE)  (E : 간선의 개수) (간선 정렬하는 작업)

In [None]:
# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b
        
# 노드의 개수와 간선(union 연산)의 개수 입력받기
v, e = map(int, input().split())
parent = [0] * (v + 1)      # 부모 테이블 초기화하기

# 모든 간선을 담을 리스트와 최종 비용을 담을 변수
edges = []
result = 0

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
    parent[i] = i
    
# 모든 간선에 대한 정보를 입력받기
for _ in range(e):
    a, b, cost = map(int, input().split())
    # 비용순으로 정렬하기 위해서 튜플의 첫 번째 원소를 비용으로 설정
    edges.append((cost, a, b))
    
# 간선을 비용순으로 정렬
edges.sort()

# 간선을 하나씩 확인하며
for edge in edges:
    cost, a, b = edge
    # 사이클이 발생하지 않는 경우에만 집합에 포함
    if find_parent(parent, a) != find_parent(parent, b):
        union_parent(parent, a, b)
        result += cost
        
print(result)

## 위상 정렬 (Topology Sort)
- 사이클이 없는 방향 그래프(DAG)의 모든 노드를 방향성에 거스르지 않도록 순서대로 나열하는 것
- 진입차수 (Indegree) : 특정한 노드로 들어오는 간선의 개수
- 진출차수 (Outdegree) : 특정한 노드에서 나가는 간선의 개수
- **큐**를 이용하는 위상 정렬 알고리즘의 동작 과정
    1. 진입차수가 0인 모든 노드를 큐에 넣는다.
    2. 큐가 빌 때까지 다음의 과정을 반복한다.
        1) 큐에서 원소를 꺼내 해당 노드에서 나가는 간선을 그래프에서 제거한다.
        2) 새롭게 진입차수가 0인 된 노드를 큐에 넣는다.
    - 결과적으로 각 노드가 큐에 들어온 순서가 위상 정렬을 수행한 결과와 같다

### 위상 정렬의 특징
- 위상 정렬은 DAG에 대해서만 수행할 수 있다.
    - DAG (Direct Acyclic Graph) : 순환하지 않는 방향 그래프
- 위상 정렬에서는 여러 가지 답입 존재할 수 있다.
    - 한 단계에서 큐에 새롭게 들어가는 원소가 2개 이상인 경우가 있다면 여러 가지 답입 존재
- 모든 원소를 방문하기 전에 큐가 빈다면 사이클이 존재한다고 판단할 수 있다.
    - 사이클에 포함된 원소 중에서 어떠한 원소도 큐에 들어가지 못한다.
- 스택을 활용한 DFS를 이용해 위상 정렬을 수행할 수도 있다.

위상 정렬 소스코드
- 시간 복잡도 : O(V + E)

In [1]:
from collections import deque

# 노드의 개수와 간선(union 연산)의 개수 입력받기
v, e = map(int, input().split())
# 모든 노드에 대한 진입차수는 0으로 초기화
indegree = [0] * (v + 1)
# 각 노드에 연결된 간선 정보를 담기 위한 연결 리스트(그래프) 초기화
graph = [[] for i in range(v + 1)]

# 방향 그래프의 모든 간선 정보를 입력받기
for _ in range(e):
    a, b = map(int, input().split())
    graph[a].append(b)  # 정점 A에서 B로 이동 가능
    # 진입차수를 1 증가
    indegree[b] += 1
    
# 위상 정렬 함수
def topology_sort():
    result = []     # 알고리즘 수행 결과를 담을 리스트
    q = deque()     # 큐 기능을 위한 deque 라이브러리 사용
    
    # 처음 시작할 때는 진입차수가 0인 노드를 큐에 삽입
    for i in range(1, v + 1):
        if indegree[i] == 0:
            q.append(i)
            
    # 큐가 빌 때까지 반복
    while q:
        # 큐에서 원소 꺼내기
        now = q.popleft()
        result.append(now)
        # 해당 원소와 연결된 노드들의 진입차수에서 1 빼기
        for i in graph[now]:
            indegree[i] -= 1
            # 새롭게 진입차수가 0이 되는 노드를 큐에 삽입
            if indegree[i] == 0:
                q.append(i)
                
    # 위상 정렬을 수행한 결과 출력
    for i in result:
        print(i, end=' ')
        
topology_sort()

1 2 5 3 6 4 7 

---

## 2. 팀 결성
- 학생들에게 0번부터 N번까지의 번호를 부여
- 처음에는 모든 학생이 서로 다른 팀으로 구분되어, 총 N + 1개의 팀이 존재
- '팀 합치기' 연산 : 두 팀을 합치는 연산
- '같은 팀 여부 확인' 연산 : 특정한 두 학생이 같은 팀에 속하는지를 확인하는 연산

입력 조건 :
- 첫째 줄에 N, M이 주어진다. M은 입력으로 주어지는 연산의 개수이다. (1 <= N, M <= 100,000)\
(예시) 7 8
- 다음 M개의 줄에는 각각의 연산이 주어진다.
    - '팀 합치기' 연산은 0 a b 형태로 주어진다. 이는 a번 학생이 속한 팀과 b번 학생이 속한 팀을 합친다는 의미이다.
    - '같은 팀 여부 확인' 연산은 1 a b 형태로 주어진다. 이는 a번 학생과 b번 학생이 같은 팀에 속해 있는지를 확인하는 연산이다.
    - a와 b는 N 이하의 양의 정수이다.\
(예시)\
0 1 3\
1 1 7\
0 7 6\
1 7 1\
0 3 7\
0 4 2\
0 1 1\
1 1 1

출력 조건 :
- '같은 팀 여부 확인' 연산에 대하여 한 줄에 하나씩 YES 혹은 NO로 결과를 출력한다.\
(예시)\
NO\
NO\
YES

In [6]:
n, m = map(int, input().split())

parent = [i for i in range(n + 1)]

def find_parent(parent, x):
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

for _ in range(m):
    cal, n1, n2 = map(int, input().split())
    
    # 팀 합치기 연산
    if cal == 0:
        union_parent(parent, n1, n2)
        
    # 같은 팀 여부 확인
    elif find_parent(parent, n1) == find_parent(parent, n2):
        print("YES")
    else:
        print("NO")

NO
NO
YES


## 3. 도시 분할 계획
- 마을은 N개의 집과 그 집들을 연결하는 M개의 길로 이루어져 있다.
- 길은 무방향 간선
- 마을을 2개의 분리된 마을로 분할할 계획
    - 각 분리된 마을 안에 집들이 서로 연결되도록 분할
    - 마을에는 집이 하나 이상
    - 분리된 두 마을 사이에 있는 길들은 필요가 없으므로 없앨 수 있음
    - 각 분리된 마을 안에서도 임의의 두 집 사이에 경로가 항상 존재하게 하면서 길을 더 없앨 수 있음
- 위 조건을 만족하도록 길들을 모두 없애고 나머지 길의 유지비의 합을 최소로 한다.

입력 조건 :
- 첫째 줄에 집의 개수 N, 길의 개수 M이 주어진다. (2 <= N <= 100,000, 1 <= M <= 1,000,000)\
(예시) 7 12
- 그다음 줄부터 M줄에 걸쳐 길의 정보가 A, B, C 3개의 정수로 공백으로 구분되어 주어지는데 A번 집과 B번 집을 연결하는 길의 유지비가 C(1 <= C <= 1,000)라는 뜻이다.\
(예시)\
1 2 3\
1 3 2\
3 2 1\
2 5 2\
3 4 4\
7 3 6\
5 1 5\
1 6 2\
6 4 1\
6 5 3\
4 5 3\
6 7 4

출력 조건 :
- 첫째 줄에 길을 없애고 남은 유지비 합의 최솟값을 출력한다.\
(예시) 8

In [12]:
def find_parent(parent, x):
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    
    if a < b:
        parent[b] = a
    else:
        parent[a] = b
        
n, m = map(int, input().split())
parent = [i for i in range(n + 1)]

edges = [list(map(int, input().split())) for _ in range(m)]
edges.sort(key=lambda x : x[2])

# 처음엔 무조건 union 연산
union_parent(parent, edges[0][0], edges[0][1])
total_cost = edges[0][2]

for a, b, c in edges[1:]:
    if find_parent(parent, a) != find_parent(parent, b):
        union_parent(parent, a, b)
        final_cost = c
        total_cost += final_cost
        
# 마지막에 연결된 길을 없애 두 마을로 분리
total_cost -= final_cost
print(total_cost)


8


## 4. 커리큘럼
- 모든 강의는 1번부터 N번까지의 번호를 가진다.
- 동시에 여러 개의 강의를 들을 수 있다.
- 예를들어, N = 3일 때, 3번 강의의 선수 강의로 1번과 2번 강의가 있고, 1번과 2번 강의는 선수 강의가 없다고 가정
    - 1번 강의 : 30시간
    - 2번 강의 : 20시간
    - 3번 강의 : 40시간
    - 이 경우 1번 강의를 수강하기까지의 최소 시간은 30시간, 2번 강의를 수강하기까지의 최소 시간은 20시간, 3번 강의를 수강하기까지의 최소 시간은 **70시간**이다.
- N개의 강의 정보가 주어졌을 때, N개의 강의에 대하여 수강하기까지 걸리는 최소 시간을 각각 출력하는 프로그램을 작성하시오.

입력 조건 :
- 첫째 줄에 듣고자 하는 강의의 수 N이 주어진다. (1 <= N <= 500)\
(예시) 5
- 다음 N개의 줄에는 각 강의의 강의 시간과 그 강의를 듣기 위해 먼저 들어야 하는 강의들의 번호가 자연수로 주어지며, 각 자연수는 공백으로 구분한다. 이때 강의 시간은 100,000이하의 자연수이다. 각 강의 번호는 1부터 N까지로 구성되며, 각 줄은 -1로 끝난다. (선수 강의가 0개~여러 개)\
(예시)\
10 -1\
10 1 -1\
4 1 -1\
4 3 1 -1\
3 3 -1

출력 조건 :
- N개의 강의에 대하여 수강하기까지 걸리는 최소 시간을 한 줄에 하나씩 출력한다.\
(예시)\
10\
20\
14\
18\
17

### 혼자 푼 거

In [83]:
from collections import deque
        
n = int(input())
lecture_list = [0] * n
indegree = [0] * n

for i in range(n):
    infor = list(map(int, input().split()))
    lecture_list[i] = { "lecture_id": i + 1, "time" : infor[0], "pre_lecture" : infor[1:-1] }
    indegree[i] = len(infor[1:-1])
        
lecture_min_time = [0] * n
visit = [False] * n

q = deque()
for i in range(len(indegree)):
    if indegree[i] == 0:
        q.append(lecture_list[i])
        
while q:
    lec = q.popleft()
    visit[lec["lecture_id"] - 1] = True

    for pre_lec in lec["pre_lecture"]:
        lecture_min_time[lec["lecture_id"] - 1] = max(lecture_min_time[pre_lec - 1], lecture_min_time[lec["lecture_id"] - 1])
    
    lecture_min_time[lec['lecture_id'] - 1] += lec["time"]
    
    for all_lect in lecture_list:
        if lec["lecture_id"] in all_lect["pre_lecture"]:
            indegree[all_lect["lecture_id"] - 1] -= 1
            if indegree[all_lect["lecture_id"] - 1] == 0 and not visit[all_lect["lecture_id"] - 1]:
                q.append(all_lect)
                
for min_time in lecture_min_time:
    print(min_time)
    

10
20
14
18
17


### 정답지 보고 푼 거

In [85]:
from collections import deque
import copy

n = int(input())
indegree = [0] * (n + 1)
graph = [[] for _ in range(n + 1)]
time = [0] * (n + 1)

for i in range(1, n + 1):
    infor = list(map(int, input().split()))
    time[i] = infor[0]
    for x in infor[1:-1]:
        indegree[i] += 1
        graph[x].append(i)
        
def topology_sort():
    result = copy.deepcopy(time)
    q = deque()
    
    for i in range(1, n + 1):
        if indegree[i] == 0:
            q.append(i)
            
    while q:
        now = q.popleft()
        for i in graph[now]:
            result[i] = max(result[i], result[now] + time[i])
            indegree[i] -= 1
            if indegree[i] == 0:
                q.append(i)
                
    for i in range(1, n + 1):
        print(result[i])
        
topology_sort()

10
20
14
18
17
