## 서로소 집합

### 합집합: 두개의 원소가 포함된 집합을 하나의 집합으로 합치는 연산
### 찾기: 특정한 원소가 속한 집합이 어떤 집합인지 알려주는 연산
    1. 합집합 연산을 확인하여 서로 연결된 두 노드를 확인
        1) a,b노드의 루트노드 a', b'노드를 찾음
        2) a'를 b'의 부모노드로 설정
    2. 모든 합집합 연산을 처리할 때까지 1을 반복

In [5]:
#특정 원소가 속한 집합 찾기(부모 노드 반환)
def find_parent(parent, x):
    if parent[x] != x:
        return find_parent(parent, parent[x])
    return x

#두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent,a)
    b = find_parent(parent,b)
    # 루트노드가 더 작은 쪽으로 맞춤
    if a < b:
        parent[b] = a
    else:
        parent[a] = b
        
#노드의 개수와 간선(union 연산)의 개수 입력
v, e = map(int,input().split())
parent = [0] * (v+1) #부모테이블 초기화

#부모 테이블 상에서 부모를 자기 자신으로 초기화
for i in range(1, v+1):
    parent[i] = i
    
#union 연산을 각각 수행
for i in range(e):
    a, b= map(int,input().split())
    union_parent(parent,a,b)
    
#각 원소가 속한 집합 출력
print('각 원소가 속한 집합: ', end='')
for i in range(1,v+1):
    print(find_parent(parent,i), end=' ')
print()

#부모 테이블 내용 출력
print('부모 테이블 출력: ', end='')
for i in range(1,v+1):
    print(parent[i], end=' ')

6 4
1 4
2 3
2 4
5 6
각 원소가 속한 집합: 1 1 1 1 5 5 
부모 테이블 출력: 1 1 2 1 5 5 

    위의 알고리즘은 찾기 함수가 최악의 경우 모든 노드를 다 확인해야하므로 시간 복잡도가 O(V)임
    -> 부모노드를 찾을 때 위처럼 단순히 부모의 값을 반환하는 것뿐만 아니라 부모테이블을 수정하면 시간복잡도 개선

In [6]:
#위의 코드에서 find 함수만 바꿈
#특정 원소가 속한 집합 찾기(루트 노드 반환)
def find_parent(parent, x):
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

#두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent,a)
    b = find_parent(parent,b)
    # 루트노드가 더 작은 쪽으로 맞춤
    if a < b:
        parent[b] = a
    else:
        parent[a] = b
        
#노드의 개수와 간선(union 연산)의 개수 입력
v, e = map(int,input().split())
parent = [0] * (v+1) #부모테이블 초기화

#부모 테이블 상에서 부모를 자기 자신으로 초기화
for i in range(1, v+1):
    parent[i] = i
    
#union 연산을 각각 수행
for i in range(e):
    a, b= map(int,input().split())
    union_parent(parent,a,b)
    
#각 원소가 속한 집합 출력
print('각 원소가 속한 집합: ', end='')
for i in range(1,v+1):
    print(find_parent(parent,i), end=' ')
print()

#부모 테이블 내용 출력
print('부모 테이블 출력: ', end='')
for i in range(1,v+1):
    print(parent[i], end=' ')

6 4
1 4
2 3
2 4
5 6
각 원소가 속한 집합: 1 1 1 1 5 5 
부모 테이블 출력: 1 1 1 1 5 5 

## 서로소 집합을 이용한 사이클 판단(노드들이 뺑뺑이로 연결되어 있는지)
    무방향 그래프를 가정
    1. 각 간선을 하나씩 확인하며 두 노드의 루트 노드 확인
        1) 루트 노드가 서로 다르면 두 노드에 대해 합집합 연산 수행
        2) 루트 노드가 서로 같다면 사이클 발생(이어져 있으므로)
    2. 그래프에 포함되어 있는 모든 간선에 대해 1 반복

In [9]:
#찾기, 합집합 함수는 위와 같음
def find_parent(parent,x):
    if parent[x] != x:
        parent[x] = find_parent(parent,parent[x])
    return parent[x]

def union_parent(parent,a,b):
    a = find_parent(parent,a)
    b = find_parent(parent,b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

v, e = map(int,input().split())
parent = [0] * (v+1)

for i in range(1, v+1):
    parent[i] = i

cycle = False #사이클 발생 여부

for i in range(e):
    a, b = map(int,input().split())
    #사이클이 발생할 경우 종료
    if find_parent(parent,a) == find_parent(parent,b):
        cycle = True
        break
    #사이클 발생 안했다면 합집합 연산 수행
    else:
        union_parent(parent,a,b)

if cycle:
    print('사이클 발생')
else:
    print('사이클 발생x')

5 5
1 2 
1 3
1 4
1 5
2 3
사이클 발생


## 신장트리
    그래프에서 모든 노드를 포함하면서 사이클이 발생하지 않는 부분 그래프 -> 트리의 조건이기도 함
## 최소신장트리
    최소한의 간선으로 구성되는 신장트리

# 크루스칼 알고리즘
    최소 신장 트리를 찾는 알고리즘(그리디)
    시간복잡도 O(ElogE) -> E는 간선의 개수 : 간선 정렬하는데 쓰이는 sort함수가 nlogn임
    1.간선 데이터를 오름차순 정렬
    2. 간선을 하나씩 확인하며 사이클 발생하는지 확인
        1) 사이클 발생하면 제외
        2) 사이클 발생하지 않으면 포함(합집합 함수)
    3. 모든 간선에 대하여 2 반복

In [7]:
def find_parent(parent,x):
    if x != parent[x]:
        parent[x] = find_parent(parent,parent[x])
    return parent[x]

def union_parent(parent,a,b):
    a = find_parent(parent,a)
    b = find_parent(parent,b)
    if a<b:
        parent[b] = a
    else:
        parent[a] = b
#모든 간선을 담을 리스트와 최종비용을 담을 변수
edges=[]
result = 0

print('노드와 간선 개수 입력: ')
v, e = map(int,input().split())

parent = [0] * (v+1)

for i in range(1,v+1):
    parent[i] = i
#비용순으로 오름차순 정렬을 위해 튜플의 첫 번쨰 원소를 비용으로 설정
print('간선의 비용과 연결된 두 노드 입력: ')
for i in range(e):
    cost, a, b = map(int,input().split())
    edges.append((cost,a,b))
#비용순으로 정렬
edges.sort()

#간선을 하나씩 확인하며
for edge in edges:
    cost, a, b = edge
    #사이클이 발생하지 않는 경우에만 집합에 포함
    if find_parent(parent,a) != find_parent(parent,b):
        union_parent(parent,a,b)
        result += cost
        
print(result)

노드와 간선 개수 입력: 
7 9
간선의 비용과 연결된 두 노드 입력: 
29 1 2
75 1 5
35 2 3
34 2 6
7 3 4
23 4 6
13 4 7
54 5 6
25 6 7
160


# 위상 정렬
    시간복잡도: O(V+E) -> 노드개수+ 간선개수
    사이클이 없는 방향 그래프에서 모든 노드를 방향성에 거스르지 않도록 순서대로 나열
    위상 정렬은 순환하지 않는 방향 그래프에서만 작동
### indegree
    특정 노드에서 들어오는 간선의 개수
### outdegree
    특정 노드에서 나가는 간선의 개수

위상 정렬 알고리즘:
    indegree가 0인 모든 노드를 큐에 넣는다.  
    큐가 빌때까지 반복: 큐에서 원소를 꺼내 해당 노드에서 나가는 간선을 그래프에서 제거한다.
    새롭게 indegree가 0이 된 노드를 큐에 넣는다. -> 각 노드가 큐에 들어온 순서가 위상 정렬을 수행한 결과  
    큐에 들어가는 원소가 2개 이상이라면 여러가지 답이 존재 가능  
    모든 원소를 방문하기 전에 큐가 빈다면 사이클이 존재

In [5]:
from collections import deque
#노드의 개수와 간선 개수 입력
print('노드와 간선 개수 입력: ')
v, e = map(int,input().split())
#모든 노드에 대해 indegree 0으로 초기화
indegree = [0] * (v+1)
#각 노드에 연결된 간선의 정보를 입력할 수 있는 2차원 리스트 초기화
graph = [[] for _ in range(e)]

#방향 그래프의 모든 간선 정보 입력
print('간선 정보 입력')
for _ in range(e):
    a,b = map(int,input().split())
    graph[a].append(b)
    # b로 들어오는 간선 개수 추가
    indegree[b] += 1

#위상 정렬 알고리즘
def topology_sort():
    q = deque()
    result = [] # 위상 정렬 결과 담을 리스트
    for i in range(1,v+1):
        if indegree[i] == 0:
            q.append(i)
    while q:
        now = q.popleft()
        #큐에서 pop된 노드는 result에 추가
        result.append(now)
        for i in graph[now]: #now가 가리키는 노드들에 대해
            indegree[i] -= 1
            if indegree[i] == 0:
                #받는 간선이 하나도 없으면 큐에 추가
                q.append(i)
    for i in result:
        print(i, end=' ')
topology_sort()
            

노드와 간선 개수 입력: 
7 8
간선 정보 입력
1 2
1 5
2 3
2 6
3 4
4 7
5 6
6 4
1 2 5 3 6 4 7 