# 그래프 자료구조

크루스칼 알고리즘 -> 그리디 알고리즘
위상정렬 알고리즘 -> 큐, 스택 자료구조

그래프, 노드 , 간선,
다이스트라 최단경로 알고리즘 -> 우선순위큐(최소힙,최대힙) -> 트리자료구조

- 인접 행렬 : 2차원 배열  O(V^2), O(1)
- 인접 리스트 : 리스트    O(E), O(V)

다이스트라 -> 인접리스트 -> 노드와 간선개수가 많으면 이용
플로이드 워셜 알고리즘 -> 인접행렬 -> 적으면 이용

## 서로로 집합

공통 원소가 없는 두 집합
{1,2} {3,4}

서로소 집합 자료구조 union(합집합), find(찾기)

## union 알고리즘
번호가 큰노드가 번호가 작은 노드를 가르키도록 그래프 생성후 연결된것끼리 union

In [5]:
# 서로소 집합 알고리즘 소스코드
# 특정 원소가 속한 집합을 찾기

def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 떄까지 재귀적으로 호출
    if parent[x] != x:
        return find_parent(parent, parent[x])
    return x

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b
    
# 노드의 개수와 간선(union 연산)의 개수 입력받기
v, e = map(int, input().split())
parent = [0] * (v + 1) # 부모 테이블 초기화

# 부모 테이블 상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
    parent[i] = i

# union 연산을 각각 수행
for i in range(e):
    a, b = map(int, input().split())
    union_parent(parent, a, b)

# 각 원소가 속한 집합 출력
print('각 원소가 속한 집합 출력', end=' ')
for i in range(1, v + 1):
    print(find_parent(parent, i), end= ' ')

print()

# 부모 테이블 출력
print('부모 테이블', end='')
for i in range(1, v + 1):
    print(parent[i], end=' ')

6 4
1 4
2 3
2 4
5 6
각 원소가 속한 집합 출력 1 1 1 1 5 5 
부모 테이블1 1 2 1 5 5 

## 경로압축기법

In [None]:
def find(parent, x):
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

In [20]:
# 서로소 집합을 활용한 사이클 판별 소스코드

# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        parent[x]  = find_parent(parent, parent[x])
    return parent[x]

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b
    
# 노드의 개수와 간선(union 연산)의 개수 입력받기
v, e = map(int, input().split())
parent = [0] * (v + 1)

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
    parent[i] = i

cycle = False # 싸이클 발생여부

for i in range(e):
    a, b = map(int, input().split())
    # 사이클이 발생한 경우 종료
    if find_parent(parent, a) == find_parent(parent, b):
        print(parent)
        cycle = True
        break
    else:
        union_parent(parent, a, b)

if cycle:
    print("사이클이 발생했습니다.")
else:
    print("사이클이 발생하지 않았습니다.")       

3 3 
1 2 
1 3
2 3
[0, 1, 1, 1]
사이클이 발생했습니다.


## 신장트리
하나의 그래프가 있을 때 모든 노드를 포함하면서 사이클이 존재하지 않는 부분 그래프를 의미
최소신장트리 알고리즘 -> 크루스칼 알고리즘 이용

1. 간선 데이터를 비용에 따라 오름차순으로 정렬한다.
2. 간선 하나씩 확인하며 현재의 간선이 사이클을 발생시키는지 확인한다.  
    2-1. 사이클이 발생하지 않는 경우 최소 신장트리에 포함시킨다.  
    2-2. 사이클이 발생하는 경우 최소 신장트리에 포함시키지 않는다.  
3. 모든 간선에 대하여 2의 과정을 거친다.

## 크루스칼 알고리즘 
    모든 간선에 대하여 정렬을 수행한 뒤에 가장 거리가 짧은 간선부터 집합에 포함시키면 된다

In [29]:
# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        parent[x]  = find_parent(parent, parent[x])
    return parent[x]

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b
        
# 노드의 개수와 간선(union 연산)의 개수 입력받기
v, e = map(int, input().split())
parent = [0] * (v + 1)

# 모든 간선을 담을 리스트와 최종 비율을 담을 변수
edges = []
result = 0

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
    parent[i] = i
    
# 모든 간선에 대한 정보를 입력받기
for _ in range(e):
    a, b, cost = map(int, input().split())
    # 비용순으로 정렬하기 위해서 튜플의 첫 번째 원소를 비용으로 설정
    edges.append((cost, a, b))
    
# 간선을 비용순으로 정렬
edges.sort()

# 간선을 하나씩 확인하며
for edge in edges:
    cost, a, b = edge
    
    # 사이클이 발생하지 않는 경우에만 집합에 포함
    if find_parent(parent, a) != find_parent(parent, b):
        union_parent(parent, a, b)
        result += cost
print(result)

7 9 
1 2 29
1 5 76
2 5 35
2 6 34
3 4 7
4 6 23
4 7 13
5 6 53
6 7 25
141


## 위상정렬
방향 그래프의 모든 노드를 "방향성에 거스르지 않도록 순서대로 나열하는 것
그래프상에서 선후 관계가 있다면, 위상 정렬을 수행하여 모든 선후 관계가 있다면, 위상 정렬을 수행하여 모든 선후 관계를 지키는 전체 순서를 계산할 수 있다.

1. 진입차수가 0인 노드를 큐에 넣는다.
2. 큐가 빌때 까지 다음의 과정을 반복한다.
    2-1. 큐에서 원소를 꺼내 해당노드에서 출발하는 간선을 그래프에서 제거한다.
    2-2. 새롭게 진입차수가 0이 된 노드를 큐에 넣는다.

In [33]:
from collections import deque

v,e = map(int, input().split())
# 모든 노드에 대한 진입차수는 0으로 초기화
indegree = [0] * (v + 1)
# 각 노드에 ㄷ연결된 간선 정보를 담기 위한 연결 리스트(그래프) 초기화
graph = [[] for i in range(v +1)]

# 방향 그래프의 모든 간선 정보를 입력받기
for _ in range(e):
    a, b = map(int, input().split())
    graph[a].append(b) # 정점 A에서 B로 이동
    # 진입 차수를 1 증가
    indegree[b] += 1

# 위상 정렬 함수
def topology_sort():
    result = [] # 알고리즘 수행 결과를 담을 리스트
    q = deque()
    
    # 처음 시작할때 진입 차수가 0인 노드를 큐에 삽입
    for i in range(1, v + 1):
        if indegree[i] == 0:
            q.append(i)
    
    # 큐가 빌 때까지 반복
    while q:
        # 큐에서 원소 꺼내기
        now = q.popleft()
        result.append(now)
        #해당원소와 연결된 노드들의 진입차수에서 1빼기
        for i in graph[now]:
            indegree[i] -= 1
            # 새롭게 진입차수가 0이 되는 노드를 큐에 삽입
            if indegree[i] == 0:
                q.append(i)
            
    for i in result:
        print(i, end=' ')

topology_sort()

7 8
1 2
1 5
2 3
2 6
3 4
4 7
5 6
6 4
1 2 5 3 6 4 7 

위상정렬의 시간복잡도는 O(V+E) 
차례대로 모든 노드를 확인하면서, 해당 노드에서 출발하는 간선을 차례대로 제거해야함.