- 알고리즘 문제를 접했을 때 '서로 다른 개체(혹은 객체)가 연결되어 있다'는 이야기를 들으면 가장 먼저 그래프 알고리즘을 떠올려야함
- 더불어 그래프 자료구조 중에서 **트리 자료구조**

### 서로소 집합 자료 구조
- 서로소 부분 집합들로 나누어진 원소들의 데이터를 처리하기 위한 자료구조
- union, find 이 2개의 연산으로 조작 가능
- 서로소 집합 자료구조는 합집합과 찾기 연산으로 구성


#### 트리 자료구조를 이용해서 집합을 표현하는 서로소 집합 계산 알고리즘
1. union(합집합) 연산을 확인하여, 서로 연결된 두 노드 A,B를 확인한다.\
 1-1 . A와 B의 루트 노드 A', B'를 각각 찾는다. \
 1-2 . A'를 B'의 부모노드로 설정한다. (B'가 A'를 가리키도록 한다.)
2. 모든 union(합집합) 연산을 처리할때 1번 과정을 반복
\
\
**서로소 집합 알고리즘으로 루트를 찾기 위해서는 재귀적으로 부모를 거슬러 올라가야함**


- 이렇게 구현하면 답을 구할 수 는 있지만, find 함수가 비효율적으로 동작함
- 최악의 경우, find 함수가 모든 노드를 다 확인하는 터라 시간 복잡도가 O(V)

In [8]:
# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    #루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x]!=x:
        return find_parent(parent, parent[x])
    return x

#두 원소가 속한 집합을 합치기
def union_parent(parent,a,b):
    a = find_parent(parent,a)
    b = find_parent(parent,b)
    if a<b:
        parent[b]=a
    else: parent[a] = b
         
#노드의 개수와 간선의 개수 입력받기
v,e = map(int , input().split())
parent =[0]*(v+1)

#부모 테이블 상에서 , 부모를 자기 자신으로 초기화
for i in range(1,v+1):
    parent[i]=i

#union 연산을 각각 수행
for i in range(e):
    a,b = map(int, input().split())
    union_parent(parent,a,b)

#각 원소가 속한 집합 출력
print('각 원소가 속한 집합: ', end='')
for i in range(1,v+1):
    print(find_parent(parent,i), end=' ')

print()

#부모 테이블 내용 출력
print('부모 테이블: ', end='')
for i in range(1,v+1):
    print(parent[i], end=' ')

6 4
1 4
2 3
2 4
5 6
각 원소가 속한 집합: 1 1 1 1 5 5 
부모 테이블: 1 1 2 1 5 5 

#### 이러한 find 함수는 아주 간단한 과정으로 최적화 가능
#### 경로 압축 기법 적용
- 경로 압축은 find 함수를 재귀적으로 호출한 뒤에 부모 테이블 값을 갱신하는 기법

In [12]:
#경로 압축 기법 소스 코드(이 부분만 바뀜)
def find_parent(parent,x):
    if parent[x]!=x:
        parent[x] = find_parent(parent,parent[x])
    return parent[x]

#두 원소가 속한 집합을 합치기
def union_parent(parent,a,b):
    a = find_parent(parent,a)
    b = find_parent(parent,b)
    if a<b:
        parent[b]=a
    else: parent[a] = b
         
#노드의 개수와 간선의 개수 입력받기
v,e = map(int , input().split())
parent =[0]*(v+1)

#부모 테이블 상에서 , 부모를 자기 자신으로 초기화
for i in range(1,v+1):
    parent[i]=i

#union 연산을 각각 수행
for i in range(e):
    a,b = map(int, input().split())
    union_parent(parent,a,b)

#각 원소가 속한 집합 출력
print('각 원소가 속한 집합: ', end='')
for i in range(1,v+1):
    print(find_parent(parent,i), end=' ')

print()

#부모 테이블 내용 출력
print('부모 테이블: ', end='')
for i in range(1,v+1):
    print(parent[i], end=' ')

6 4
1 4
2 3
2 4
5 6
각 원소가 속한 집합: 1 1 1 1 5 5 
부모 테이블: 1 1 1 1 5 5 

### 서로소 집합을 활용한 사이클 판별
- 서로소 집합은 **무방향 그래프**내에서 사이클을 판별할 때 사용할 수 있다는 특징
- 간선을 하나씩 확인하면서 두 노드가 포함되어 있는 집합을 합치는 과정을 반복하는 것만으로도 사이클을 판별할 수 있다

1. 각 간선을 확인하며 두 노드의 루트 노드를 확인한다. \
1-1. 루트 노드가 서로 다르다면 두 노드에 대하여 union 연산을 수행한다.\
1-2. 루트 노드가 서로 같다면 사이클이 발생한 것이다. 

2. 그래프에 포함되어 있는 모든 간선에 대하여 1번 과정을 반복한다.

#### 사이클 판별 알고리즘은 그래프에 포함되어 있는 간선의 개수가 E개 일때, 모든 간선을 하나씩 확인하며, 매 간선에 대하여 union 및 find 함수를 호출하는 방식으로 동작

In [14]:
###서로소 집합을 활용한 사이클 판별 소스코드

#특정 원소가 속한 집합을 찾기
def find_parent(parent,x):
    if parent[x]!=x:
        #루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

#두 언소가 속한 집합을 합치기
def union_parent(parent,a,b):
    a = find_parent(parent,a)
    b = find_parent(parent,b)
    if a<b:
        parent[b]=a
    else: parent[a]=b
        
        
#노드의 개수와 간선의 개수 입력받기
v,e = map(int, input().split())
parent = [0]*(v+1) #부모 테이블 초기화

#부모 테이블 상에서, 부모를 자기 자신으로 초기화
for i in range(1,v+1):
    parent[i]=i
    
cycle=False

for i in range(e):
    a,b =map(int, input().split())
    #사이클이 발생한 경우 종료
    if find_parent(parent,a) == find_parent(parent,b):
        cycle=True
        break
    else:union_parent(parent,a,b)
        
        
        
if cycle: print("사이클이 발생했습니다.")
else: print('사이클이 발생하지 않았습니다. ')




3 3
1 2
1 3
2 3
사이클이 발생했습니다.


#### 신장트리
- 그래프 알고리즘 문제로 자주 출제되는 문제 유형
- 신장 트리란 하나의 그래프가 있을 때 모든 노드를 포함하면서 사이클이 존재하지 않는 부분 그래프를 의미
- 이때 모든 노드가 포함되어 서로 연결되면서 사이클이 존재하지 않는다는 조건이 트리의 성립 조건임!

### 크루스칼 알고리즘
- 최소한의 비용으로 신장트리를 찾아야함! -> 최소 신장 트리 알고리즘이라고도 함
- 가장 적은 비용으로 모든 노드를 연결할 수 있는 데 크루스칼 알고리즘은 그리디 알고리즘으로 분류

1. 간선 데이터를 비용에 따라 오름차순으로 정렬
2. 간선을 하나식 확인하며 현재의 간선이 사이클을 발생시키는지 확인
2-1. 사이클이 발생하지 않는 경우, 최소 신장 트리에 포함
2-2. 사이클이 발생하는 경우, 최소 신장 트리에 포함시키지 않는다.!
3. 모든 간선에 대하여 2번 과정 반복



In [18]:
#크루스칼 알고리즘 소스 코드
def find_parent(parent,x):
    #루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x]!=x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]


#두 원소가 속한 집합을 합치기
def union_parent(parent, a,b):
    a = find_parent(parent,a)
    b = find_parent(parent,b)
    
    if a<b:
        parent[b]=a
    else: parent[a]=b
        
    
#노드의 개수와 간선(union 연산)의 개수 입력받기
v,e = map(int, input().split())
parent = [0]*(v+1) #부모 테이블 초기화

#모든 간선을 담을 리스트와 최종 비용을 담을 변수
edges =[]
result =0

#부모 테이블 상에서, 부모를 자기 자신으로 초기화
for i in range(1,v+1):
    parent[i] = i

#모든 간선에 대한 정보를 입력받기
for _ in range(e):
    a,b,cost = map(int, input().split())
    #비용 순으로 정렬하기 위해서 튜플의 첫 번재 원소를 비용으로 설정
    edges.append((cost,a,b))
    
#간선을 비용순으로 정렬
edges.sort()

#간선을 하나씩 확인하며
for edge in edges:
    cost,a,b = edge
    #사이클이 발생하지 않는 경우에만 집합에 포함
    if find_parent(parent,a)!=find_parent(parent,b):
        union_parent(parent,a,b)
        result+=cost
print(result)

7 9
1 2 29
1 5 75
2 3 35
2 6 34
3 4 7
4 6 23
4 7 13
5 6 53
6 7 25
159


### 실전 문제 2: 팀 결성

In [39]:
N,M = map(int, input().rstrip().split())

def find_parent(parent, x):
    if parent[x]!=x:
        parent[x]=find_parent(parent,parent[x])
    return parent[x]

def union(parent,a,b):
    root_a = find_parent(parent,a)
    root_b = find_parent(parent,b)
    if root_a > root_b:
        parent[root_a] = root_b     
    else: parent[root_b] = root_a
        
        
        
parent = [0]*(N+1)
for i in range(1,N+1):
    parent[i]=i


result = []
for i in range(M):
    a,b,c = map(int, input().rstrip().split())
    if a == 0: union(parent,b,c)
    elif a==1: 
        if find_parent(parent,b) == find_parent(parent,c): result.append("YES")
        else: result.append("NO")

for var in result:
    print(var)

7 8
0 1 3
1 1 7
0 7 6
1 7 1
0 3 7
0 4 2
0 1 1
1 1 1
NO
NO
YES


### 실전문제 3: 도시 분할 계획

In [9]:
import sys
input = sys.stdin.readline
N,M = map(int, input().split())
edges = []
result = 0


for i in range(M):
    a,b,cost = map(int, input().split())
    edges.append((cost,a,b))

edges.sort()

parent = [0] * (N+1)
for i in range(1,N+1):
    parent[i]=i
    
def find_parent(parent,x):
    if parent[x]!=x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

def union(parent,a,b):
    root_a = find_parent(parent,a)
    root_b = find_parent(parent,b)
    if root_a < root_b:
        parent[root_b] = root_a
    else: parent[root_a] = root_b
max_cost = 0
for edge in edges:
    cost,a,b = edge
    #사이클 존재하지 않을 때만
    if find_parent(parent,a) !=find_parent(parent,b):
        union(parent,a,b)
        result += cost
        max_cost = cost
print(result - max_cost)

7 12
1 2 3
1 3 2
3 2 1
2 5 2
3 4 4
7 3 6
5 1 5
1 6 2
6 4 1
6 5 3
4 5 3
6 7 4
8


#### 노드보다 edge수가 많으면 prim 알고리즘을 씀

### 위상 정렬
- 순서가 정해져 있는 일련의 작업을 차례대로 수행해야 할 때 사용할 수 있는 알고리즘
- 방향 그래프의 모든 노드를 '방향성에 거스르지 않도록 순서대로 나열하는 것 \
ex) 선수 과목을 고려한 학습 순서 설정

#### 진입 차수(indegree)
- 진입 차수란 특정한 노드로 들어오는 간선의 개수

#### 위상 정렬을 수행하는 구체적인 알고리즘 : 시간 복잡도 O(V+E)
1. 진입차수가 0인 노드를 큐에 넣는다.
2. 큐가 빌 대 까지 다음의 과정을 반복한다.\
2-1. 큐에서 원소를 꺼내 해당 노드에서 출발하는 간선을 그래프에서 제거한다 \
2-2. 새롭게 진입차수가 0이 된 노드를 큐에 넣는다.

- 모든 원소를 방문하기 전에 큐가 빈다면 사이클이 존재한다고 판단할 수 있음
- 다시 말해 큐에서 원소가 v번 추출되기 전에 큐가 비어버리면 사이클이 발생한 것 \
(사이틀이 존재하는 경웨 사이클에 포함되는 원소 중에서 어떠한 원소도 큐에 들어가지 못하기 때문)
- 위상 정렬 문제에서는 사이클이 발생하지 않는다고 명시하는 경우가 더 많음

In [3]:
#위상 정렬 소스 코드
from collections import deque

#노드의 개수와 간선의 개수를 입력받기
v,e = map(int, input().split())
#모든 노드에 대한 진입 차수는 0으로 초기화
indegree =[0]*(v+1)
#각 노드에 연결된 간선 정보를 담기 위한 연결 리스트(그래프) 초기화
graph =[[] for i in range(v+1)]

#방향 그래프의 모든 간선 정보를 입력받기
for _ in range(e):
    a,b=map(int, input().split())
    graph[a].append(b) #정점 A에서 B로 이동 가능
    
    #진입차수를 1증가
    indegree[b]+=1

#위상 정렬 함수
def topology_sort():
    result = [] #알고리즘 수행 결과를 담을 리스트
    q = deque() #큐 기능을 위한 deque 라이브러리 사용
    
    #처음 시작할 대는 진입 차수가 0인 노드를 큐에 삽입
    for i in range(1,v+1):
        if indegree[i]==0:
            q.append(i)
            
    #큐가 빌 때까지 반복
    while q:
        #큐에서 원소 꺼내기
        now = q.popleft()
        result.append(now)
        #해당 원소와 연결된 노드들의 진입 차수에서 1빼기
        for i in graph[now]:
            indegree[i]-=1
            #새롭게 진입차수가 0이 되는 노드를 큐에 삽입
            if indegree[i] ==0:
                q.append(i)
                
    #위상 정렬을 수행한 결과 출력
    for i in result:
        print(i, end=' ')

topology_sort()

7 8
1 2
1 5
2 3
2 6
3 4
4 7
5 6
6 4
1 2 5 3 6 4 7 

In [4]:
graph

[[], [2, 5], [3, 6], [4], [7], [6], [4], []]

### 실전문제 4

In [31]:
from collections import deque
N=int(input())
graph =[[] for _ in range(N+1)] 
cost =[0]*(N+1)
indegree =[0]*(N+1)
for i in range(1,N+1):
    a=list(map(int,input().split()))[:-1]
    cost[i] = a[0]
    indegree[i]=len(a[1:])
    for j in a[1:]:
        graph[j].append(i)
        
def topology_sort(cost, indegree):
    result =copy.deepcopy(cost)
    q=deque()
    
    for i in range(1,N+1):
        if indegree[i]==0:
            q.append(i)
    while q:
        now = q.popleft()
        for i in graph[now]:
            result[i] = max(result[i], result[now]+cost[i])
            indegree[i]-=1
            if indegree[i]==0: q.append(i)
    for i in result[1:]:
        print(i)
        
topology_sort(cost, indegree)

5
10 -1
10 1 -1
4 1 -1
4 3 1 -1
3 3 -1
10
20
14
18
17


### 교재 해설

In [29]:
from collections import deque
import copy

#노드의 개수 입력받기
v = int(input())
#모든 노드에 대한 진입차수는 0으로 초기화
indegree = [0]*(v+1)
#각 노드에 연결된 간선 정보를 담기 위한 연결 리스트(그래프) 초기화
graph =[[] for i in range(v+1)]
#각 강의 시간을 0으로 초기화
time = [0]*(v+1)

#방향 그래프의 모든 간선 정보를 입력받기
for i in range(1,v+1):
    data = list(map(int, input().split()))
    time[i]=data[0]
    for x in data[1:-1]:
        indegree[i]+=1
        graph[x].append(i)

#위상 정렬 함수
def topology_sort():
    result = copy.deepcopy(time)
    q = deque() #큐 기능을 위한 deque 라이브러리 사용
    
    #처음 시작할 때는 진입차수가 0인 노드를 큐에 삽입
    for i in range(1,v+1):
        if indegree[i]==0:
            q.append(i)
            
    #큐가 빌 때 까지 반복
    while q:
        now = q.popleft()
        #해당 원소와 연결된 노드들의 진입 차수에서 1빼기
        for i in graph[now]:
            result[i] = max(result[i], result[now]+time[i])
            indegree[i]-=1
            #새롭게 진입차수가 0이 되는 노드를 큐에 삽입
            if indegree[i]==0:
                q.append(i)
    for i in range(1,v+1):
        print(result[i])
topology_sort()

5
10 -1
10 1 -1
4 1 -1
4 3 1 -1
3 3 -1
10
20
14
18
17
