### 1. 서로소 집합
서로소 집합은 공통 원소가 없는 두 집합을 의미한다. 그래프 알고리즘에서 매우 중요하게 사용된다.

서로소 부분 집합 들로 나누어진 원소들의 데이터를 처리하기 위한 자료구조라고 할 수 있다. 서로소 집합 자료구조는 union과 find이 2개의 연산으로 조작할 수 있다. union연산은 2개의 원소가 포함된 집합을 하나의 집합으로 합치는 연산이다.

find연산은 특정한 원소가 속한 집합이 어떤 집합인지 알려주는 연산이다.

스택과 큐가 각각 push와 pop연산으로 이루어졌던 것처럼, 서로소 집합 자료구조는 합집합과 찾기 연산으로 구성된다.

서로소 집합 자료구조는 union-find자료구조라고 불리기도 한다. 연산의 이름 자체가 합치기와 찾기이기도 하고, 두 집합이 서로소 관계인지를 확인할 수 있다는 말은 각 집합이 어떤 원소를 공통으로 가지고 있는지를 확인할 수 있다는 말과 같다.

In [None]:
#특정 원소가 속한 집합을 찾기
def find_parent(parent,x):
    #루트 노드가 아니라면, 로트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        return find_parent(parent, parent[x])
    return x

#두 원소가 속한 집합을 합치기
def union_parent(parent,a,b):
    a = find_parent(parent,a)
    b = find_parent(parent,b)
    if a<b:
        parent[b] = a
    else:
        parent[a] = b

#노드의 개수와 간선(union 연산)의 개수 입력받기
v, e = map(int, input().split())
parent = [0]*(v+1) #부모 테이블 초기화

#부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v+1):
    parent[i] = i

#union 연산을 각각 수행
for i in range(e):
    a, b = map(int, input().split())
    union_parent(parent, a, b)
    
#각 원소가 속한 집합 출력
print("각 원소가 속한 집합 : ", end='')
for i in range(1, v+1):
    print(find_parent(parent,i), end=' ')

print()

#부모 테이블 내용 출력
print('부모 테이블 : ', end='')
for i in range(1, v+1):
    print(parent[i], end=' ')

각 집합의 루트는 어떻게 되는가? 루트를 효율적으로 구할 수는 없을까?

경로 압축 기법을 적용하면 시간 복잡도를 개선시킬 수 있다. 경로 압축은 find 함수를 재귀적으로 호출한 뒤에 부모 테이블 값을 갱신하는 기법이다. 기존의 find 함수를 다음과 같이 변경하면 경로 압축 기법의 구현이 완료된다.

In [6]:
#특정한 원소가 속한 집합을 찾기
def find_parent(parent,x):
    #루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        parent[x] = find_parent(parent,parent[x])
    return parent[x]

#두 원소가 속한 집합을 찾기
def union_parent(parent,a,b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a<b:
        parent[b] = a
    else:
        parent[a] = b
        
#노드의 개수와 간선(union 연산)의 개수 입력받기
v, e = map(int, input().split())
parent = [0] * (v+1) #부모 테이블 초기화

#부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v+1):
    parent[i] = i
    
#union 연산을 각각 수행
for i in range(e):
    a,b = map(int, input().split())
    union_parent(parent,a,b)

#각 원소가 속한 집합 출력
print('각 원소가 속한 집합: ', end='')
for i in range(1,v+1):
    print(find_parent(parent,i), end=' ')

print()

#부모 테이블 내용 출력
print('부모 테이블: ', end='')
for i in range(1,v+1):
    print(parent[i], end=' ')

6 4
1 4
2 3
2 4
5 6
각 원소가 속한 집합: 1 1 1 1 5 5 
부모 테이블: 1 1 1 1 5 5 

### 신장트리(spanning tree)

그래프에서 모든 정점에 대한 최소한의 연결만을 남긴 그래프다. 한 곳으로 도달하는 경우가 두 개 이상 존재하는 경우, 즉 사이클이 존재하는 경우에는 최소한의 연결이라 말할 수 없기 때문에, 모든 위치 하나에서 다른 곳으로 이동하는 경우는 단 한 가지로 결정되도록 항상 트리의 형태를 나타낸다. 최소 비용 신장 트리는 이러한 신장 트리들 중 간선의 가중치 합이 가장 작은 트리이다.

다시 말해 하나의 그래프가 있을때 모든 노드를 포함하면서 사이클이 존재하지 않는 부분 그래프

이때 모든 노드가 포함되어 서로 연결되면서 사이클이 존재하지 않는다는 조건은 트리의 성립 조건이기도 하고 이러한 형태를 신장트리라고 한다.

최소 비용 신장 트리는 그리디 기법을 이용하여 최적의 해를 구할 수 있으며, 크루스칼 알고리즘과 프림 알고리즘, 솔린 알고리즘이 있다.

여기서는 크루스칼 알고리즘을 소개한다.

그래프의 모든 간선의 집합 E를 만든다.  
E가 비어있지 않을 때까지  
E의 간선들 중 가중치가 최대인 간선을 지운다.  
삭제된 간선이 가리키는 정점 x,y를 연결하여도 사이클이 발생하지 않는다면 연결한다.  

탐욕적으로 간선을 선택하기 때문에 그리디 알고리즘이 된다.

또는 모든 간선에 대해서 정렬을 수행한 다음에 가장 거리가 짧은 간선부터 집합에 포함시키면된다. 그러다가 사이클이 발생하면 넘어간다.

1. 간선데이터를 비용에 따라 오름 차순으로 정리
2. 간선을 확인하며 사이클이 발생하는지 확인한다.  
2_1 사이클이 발생하지 않는다면 최소 신장 트리에 포함  
2_2 사이클이 발생한다면 넘어감
3. 모든 간선에 대해서 반복한다

In [3]:
#크루스칼 알고리즘 소스코드

#특정한 원소가 속한 집합을 찾기
def find_parent(parent,x):
    #루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    #(초기화에서 부모가 자기자신 이면 루트노드로 설정함)
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

#두 원소가 속한 집합을 찾기
def union_parent(parent,a,b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a<b:
        parent[b] = a
    else:
        parent[a] = b
    
#노드의 개수와 간선(union 연산)의 개수 입력받기
v, e = map(int, input().split())
parent = [0]*(v+1) #부모 테이블 초기화

#모든 간선을 담을 리스트와 최소 비용을 담을 변수
edges = []
result = 0

#부모 테이블 상에서 부모를 자기 자신으로 초기화
for i in range(1, v+1):
    parent[i] = i

#모든 간선에 대한 정보를 입력받기
for _ in range(e):
    a,b,cost = map(int, input().split())
    #비용순으로 정렬하기 위해서 튜플의 첫 번째 원소를 비용으로 설정
    edges.append((cost,a,b))
    
#간선을 비용순으로 정렬
edges.sort()

#간선을 하나씩 확인하여
for edge in edges:
    cost,a,b = edge
    #사이클이 발생하지 않는 경우에만 집합에 포함
    if find_parent(parent,a) != find_parent(parent,b):
        union_parent(parent,a,b)
        result+=cost

print(result)

7 9
1 2 29
1 5 75
2 3 35
2 6 34
3 4 7
4 6 23
7 4 13
5 6 53
6 7 25
159


### 위상정렬(Topology Sort)
위상정렬은 정렬 알고리즘의 일종이다. 순서가 정해져 있는 일련의 작업을 차례때로 수행해야 할때 사용할 수 있는 알고리즘이다. 위상정렬의 정의는 방향 그래프의 모든 노드를 '방향성에 거스르지 않도록 순서대로 나열 하는 것'이다.

In [14]:
#위상 정렬
from collections import deque

#노드의 개수와 간선의 개수를 입력받기
v, e = map(int,input().split())
#모든 노드에 대한 진입차수는 0으로 초기화
indegree = [0]*(v+1)
#각 노드에 연결된 간선 정보를 담기 위한 연결리스트(그래프) 초기화
graph = [[] for i in range(v+1)]

#방향 그래프의 모든 간선 정보를 입력받기
for _ in range(e):
    a,b = map(int, input().split())
    graph[a].append(b) #정점 A에서 B로 이동 가능
    #전입차수를 1증가
    indegree[b] += 1
print(graph)
print(indegree)
    
#위상 정렬 함수
def topology_sort():
    result=[] #알고리즘 수행 결과를 담을 리스트
    q = deque() #큐 기능을 위한 deque 라이브러리 사용
    
    #처음 시작할 때는 전입차수가 0인 노드를 큐에 삽입
    for i in range(1, v+1):
        if indegree[i] == 0:
            q.append(i)
    print(q)
            
    #큐가 빌 때까지 반복
    while q:
        #큐에서 원소 꺼내기
        now = q.popleft()
        result.append(now)
        #해당 원소와 연결된 노드들의 전입차수에서 1빼기
        for i in graph[now]:
            indegree[i] -= 1
            #새롭게 진입차수가 0이 되는 노드를 큐에 삽입
            if indegree[i] == 0:
                q.append(i)
                
    #위상 정렬을 수행한 결과 출력
    for i in result:
        print(i, end=' ')

topology_sort()

7 8
1 2
1 5
2 3
2 6
3 4
4 7
5 6
6 4
[[], [2, 5], [3, 6], [4], [7], [6], [4], []]
[0, 0, 1, 1, 2, 1, 2, 1]
deque([1])
1 2 5 3 6 4 7 

In [12]:
graph

[[], [2, 5], [3, 6], [4], [7], [6], [4], []]

### 팀 결성
학생에게 0번부터 N번까지 번호를 부여 했다. 모든 학생이 서로 다른 팀으로 구분되어 총 N+1개의 팀이 존재한다. 이때 선생님은 팀 합치기 연산과 같은 같은 팀 여부 확인 연산을 사용할 수 있다.

1. 팀 합치기 연산은 두 팀을 합치는 연산이다.
2. 같은 팀 여부 확인 연산은 특정한 두 학생이 같은 팀에 속하는지 확인하는 연산이다.

입력 조건
* 첫줄에 N,M이 주어진다. N은 학생 M은 입력으로 주어지는 연산의 개수이다.
* 다음 M개의 줄에는 각각의 연산이 주어진다.
* 팀 합치기 연산은 0 a b 형태로 주어진다. 이는 a번 학생이 속한 팀과 b번 학생이 속한 팀을 합친다는 의미다.
* 같은 팀 여부 확인은 1 a b 형태로 주어진다. 이는 a번 학생이 속한 팀과 b번 학생이 속한 팀을 합친다는 의미

In [15]:
#특정 원소가 속한 집합을 찾기
def find_parent(parent,x):
    #루트 노드가 아니라면, 로트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        return find_parent(parent, parent[x])
    return x

#두 원소가 속한 집합을 합치기
def union_parent(parent,a,b):
    a = find_parent(parent,a)
    b = find_parent(parent,b)
    if a<b:
        parent[b] = a
    else:
        parent[a] = b

#노드의 개수와 간선(union 연산)의 개수 입력받기
n, m = map(int, input().split())
parent = [0]*(n+1) #부모 테이블 초기화

#부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v+1):
    parent[i] = i

#각 연산을 수행
for i in range(m):
    oper, a, b = map(int,input().split())
    if oper == 0:
        union_parent(parent,a,b)
    elif oper == 1:
        if find_parent(parent,a) == find_parent(parent,b):
            print("Yes")
        else:
            print("No")

7 8
0 1 3
1 1 7
No
0 7 6
1 7 1
No
0 3 7
0 4 2
0 1 1
1 1 1
Yes


In [16]:
print(parent)

[0, 1, 2, 1, 2, 5, 1, 6]


### 도시 분할 계획
마을은 N개의 집과 그 집들을 연결하는 M개의 길로 이루어져 있다. 길은 어느 방향으로든지 다닐 수 있고 길의 유지비가 있다. 마을의 이장은 2개의 분리된 마을로 분할할 계획을 세우고 있다.

두개의 최소화된 길을 가진 마을을 가지고 싶다. (최소 신장 트리를 두개 만들어야 한다.)

문제 해설 최소 신장 트리를 만들고 가장 큰 유지비가 든 길을 없애면 된다.

In [17]:
#크루스칼 알고리즘 소스코드

#특정한 원소가 속한 집합을 찾기
def find_parent(parent,x):
    #루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    #(초기화에서 부모가 자기자신 이면 루트노드로 설정함)
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

#두 원소가 속한 집합을 찾기
def union_parent(parent,a,b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a<b:
        parent[b] = a
    else:
        parent[a] = b
    
#노드의 개수와 간선(union 연산)의 개수 입력받기
v, e = map(int, input().split())
parent = [0]*(v+1) #부모 테이블 초기화

#모든 간선을 담을 리스트와 최소 비용을 담을 변수
edges = []
result = 0

#부모 테이블 상에서 부모를 자기 자신으로 초기화
for i in range(1, v+1):
    parent[i] = i

#모든 간선에 대한 정보를 입력받기
for _ in range(e):
    a,b,cost = map(int, input().split())
    #비용순으로 정렬하기 위해서 튜플의 첫 번째 원소를 비용으로 설정
    edges.append((cost,a,b))
    
#간선을 비용순으로 정렬
edges.sort()
last = 0 #최소 신장 트리에 포함되는 간선 중에서 가장 비용이 큰 간선

#간선을 하나씩 확인하여
for edge in edges:
    cost,a,b = edge
    #사이클이 발생하지 않는 경우에만 집합에 포함
    if find_parent(parent,a) != find_parent(parent,b):
        union_parent(parent,a,b)
        result+=cost
        last=cost
        #edge는 정렬되기 때문에 마지막에 남은게 결국 가장큰 비용을 가진 도로임

print(result-last)

7 12
1 2 3
1 3 2
3 2 1
2 5 2
3 4 4
7 3 6
5 1 5
1 6 2
6 4 1
6 5 3
4 5 3
6 7 4
8


### 커리큘럼
온라인 강의에는 선수강의가 존재한다. 당연히 선수강의를 들어야만 해당 강의를 들을 수 있다.

각 강의에 대하여 강의 시간이 다음과 같다.

1번 강의 30시간
2번 강의 20시간
3번 강의 40시간

그리고 1번 강의와 2번 강의를 들어야만 3번 강의를 들을 수 있으며 3번 강의를 듣기까지 걸리는 시간은 최소 70시간이다.

듣고자 하는 N개의 강의 정보가 주어졌을때, N개의 강의에 대하여 수강하기 까지 걸리는 최소 시간을 각각 출력하는 프로그램을 작성하시오

입력 형식
첫줄 듣고자 하는 강의의 개수
두번째 줄 부터
강의 시간, 먼저 들어야 하는 강의 번호(1개 이상), 마지막 줄을 알리는 -1
* 선수 과목이 없을 경우 : 10, -1
* 선수 과목이 2,3일경우 : 20, 2,3, -1

위상 정렬 알고리즘의 응용으로 각 노드에 대하여 인접한 노드를 확인할 때, 인접한 노드에 대하여 현재보다 강의 시간이 더 긴 경우를 찾는다면, 더 오랜 시간이 걸리는 경우의 시간 값을 저장하는 방식으로 결과 테이블을 갱신하여 답을 구할 수 있다. 따라서 위상 정렬을 수행하면서, 매번 간선 정보를 확인하여 결과 테이블을 갱신한다.

In [21]:
#위상 정렬
from collections import deque
import copy

#노드 개수 입력받기
v = int(input())
#모든 노드에 대한 진입차수는 0으로 초기화
indegree = [0]*(v+1)
#각 노드에 연결된 간선 정보를 담기 위한 연결리스트(그래프) 초기화
graph = [[] for i in range(v+1)]

#각 필요한 강의 시간을 0으로 초기화
time = [0]*(1+v)

#방향 그래프의 모든 간선 정보를 입력받기
for i in range(1,1+v):
    data = list(map(int, input().split()))
    #첫번째 입력받는 수는 시간 정보를 담고 있음
    time[i] = data[0]
    for x in data[1:-1]:
        indegree[i] += 1
        graph[x].append(i)
    
#위상 정렬 함수
def topology_sort():
    result= copy.deepcopy(time) #알고리즘 수행 결과를 담을 리스트
    q = deque() #큐 기능을 위한 deque 라이브러리 사용
    
    #처음 시작할 때는 전입차수가 0인 노드를 큐에 삽입
    for i in range(1, v+1):
        if indegree[i] == 0:
            q.append(i)
            
    #큐가 빌 때까지 반복
    while q:
        #큐에서 원소 꺼내기
        now = q.popleft()
        result.append(now)
        #해당 원소와 연결된 노드들의 전입차수에서 1빼기
        for i in graph[now]:
            result[i] = max(result[i], result[now]+time[i])
            indegree[i] -= 1
            #새롭게 진입차수가 0이 되는 노드를 큐에 삽입
            if indegree[i] == 0:
                q.append(i)
                
    #위상 정렬을 수행한 결과 출력
    for i in range(1,v+1):
        print(result[i])
        
topology_sort()

5
10 -1
10 1 -1
4 1 -1
4 3 1 -1
3 3 -1
deque([1])
10
20
14
18
17
