## Graph

### 1. 다양한 그래프 알고리즘

#### 1) 이미 배운 내용을 훑어보자

- 그래프 알고리즘의 유형 : DFA/BFS, 최단 경로, 그외(서로소 집합, 신장트리, 위상정렬)
- 그래프 : 노드와 노드 사이에 연결된 간선의 정보를 가지고 있는 자료구조 (서로 다른 개체가 연결되어 있다 => 그래프 알고리즘!)
- 트리 : 그래프 자료구조 중 하나

- 그래프 vs 트리
  - 그래프 : 방향/무방향 그래프, 순환/비순환, 루트노드 없음, 부모 자식 관계 없음, 네트워크 모델
  - 트리 : 방향 그래프, 비순환, 루트노드 존재, 부모 자식 관계, 계층모델  

- 그래프의 구현 방법
  - 인접 행렬 : 2차원 배열을 사용하는 방식 (플로이드 워셜 알고리즘)
  - 인접 리스트 : 리스트를 사용하는 방식 (다익스트라 최단 경로 알고리즘)

#### 2) 서로소 집합

- 서로소 집합 : 공통 원소가 없는 두 집합
- 서로소 집합 자료구조(union-find 자료구조) : 서로소 부분 집합들로 나누어진 원소들의 데이터를 처리하기 위한 자료구조 (union, find로 연산 조작)
  - union : 2개의 원소가 포함된 집합을 하나의 집합으로 합치는 연산
  - find : 특정 원소가 속한 집합이 어떤 집합인지 알려주는 연산 => 두 집합이 서로소 관계인지 확인할 수 있다
- 서로소 집합 구현(트리구조 이용)
  - STEP1. union(합집합) 연산을 확인하여, 서로 연결된 두 노드 A, B를 확인
    - I. A와 B의 루트 노드 A', B'를 각각 찾는다 (루트노드: 부모가 없는 최상단의 노드)
    - II. A'를 B'의 부모노드로 설정한다. (실제로는 더 번호가 작은 원소가 부모노드가 되도록)
  - STEP2. 모든 union 연산을 처리할 때까지 1번 과정을 반복
  - 각 원소는 노드, 같은 집합에 속한다는 정보는 간선으로 표현하여 연결성 확인 가능
  - 루트 노드를 알기 위해서는 부모테이블을 통해 거슬러 올라가야 한다

In [3]:
# 특정 원소가 속한 집합을 찾기 (루트노드 찾기)
def find_parent(parent, x):
    # 루트노드가 아닌 경우, 재귀적으로 호출
    if parent[x] != x:
        return find_parent(parent, parent[x])
    # 루트노드가 맞다면, 해당 노드 x 반환
    return x

# 두 원소가 속한 집합을 합치기
def union_parent(parent,a,b):
    a = find_parent(parent,a) #a가 속한 집합(루트노드)
    b = find_parent(parent,b) #b가 속한 집합(루트노드)
    if a<b:
        parent[b]=a
    else:
        parent[a]=b


# 노드개수, 간선개수(union 연산개수)
v, e = map(int, input().split())

# 부모테이블 초기화 및 자기자신을 부모노드로 설정
parent = [0]*(v+1) 
for i in range(1,v+1):
    parent[i] = i

# union 연산
for i in range(e):
    a,b = map(int, input().split())
    union_parent(parent,a,b)


# 각 원소가 속한 집합 => 루트노드가 같은 원소끼리 동일 집합 
for i in range(1,v+1):
    print(find_parent(parent,i), end=" ")
# 부모테이블 출력
for i in range(1,v+1):
    print(parent[i], end=" ")

1 1 1 1 5 5 1 1 2 1 5 5 

- 경로 압축기법 : find함수의 비효율성을 최적화
  - 루트노드를 찾기 위해 계속해서 부모 노드를 거슬러 올라가야 함
  - find함수를 재귀적으로 호출해 부모 테이블값을 갱신

In [None]:
def find_parent(parent, x):
    if parent[x]!= x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

In [None]:
# 경로 압축기법을 활용한 특정 원소가 속한 집합을 찾기 (루트노드 찾기)
def find_parent(parent, x):
    if parent[x]!= x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

def union_parent(parent,a,b):
    a = find_parent(parent,a) 
    b = find_parent(parent,b) 
    if a<b:
        parent[b]=a
    else:
        parent[a]=b


v, e = map(int, input().split())
parent = [0]*(v+1) 
for i in range(1,v+1):
    parent[i] = i

# union 연산
for i in range(e):
    a,b = map(int, input().split())
    union_parent(parent,a,b)

for i in range(1,v+1):
    print(find_parent(parent,i), end=" ")
for i in range(1,v+1):
    print(parent[i], end=" ")

- 서로소 집합의 사용
  - 무방향 그래프 내에서 사이클 판별할 때 사용 (방향 그래프에서는 DFS 이용)
  - STEP1. 각 간선을 확인하며 두 노드의 루트 노드를 확인
    - I. 루트 노드가 다르다면, 두 노드에 대해 union 연산
    - II. 루트 노드가 같다면, 사이클 발생
  - STEP2. 그래프에 포함된 모든 간선에 대해 1번 과정 반복

In [12]:
def find_parent(parent,x):
    if parent[x]!=x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

def union_parent(parent, a, b):
    a= find_parent(parent,a)
    b= find_parent(parent,b)
    if a<b:
        parent[b]=a
    else:
        parent[a]=b

v,e = map(int,input().split())
parent = [0]*(v+1)
for i in range(1,v+1):
    parent[i]=i
cycle = False #사이클 발생 여부

for i in range(e):
    a,b = map(int, input().split())
    
    #사이클 발생 시 종료
    if find_parent(parent,a)==find_parent(parent,b):
        cycle=True
        break
    #루트노드가 다르다면 union연산
    else:
        union_parent(parent,a,b)

print(cycle)

True


#### 3) 신장 트리

- 신장 트리 : 하나의 그래프가 있을 때, 모든 노드를 포함하면서(트리성립조건) 사이클이 존재하지 않는 부분 그래프
- 최소 신장 트리 알고리즘 : 신장 트리 중 최소 비용으로 만들 수 있는 신장트리를 찾는 알고리즘
  - 최소 비용으로 모든 노드를 연결할 수 있도록 찾는다. (Ex. 도시A와 B가 이동가능하도록 연결)
- 크루스칼 알고리즘 : 최소 신장트리 알고리즘 중 대표적인 알고리즘 (그리디 알고리즘으로 분류)
  - STEP1. 간선데이터를 비용에 따라 오름차순 정렬
  - STEP2. 간선을 하나씩 확인하며 현재의 간선이 사이클을 발생시키는지 확인
    - I. 사이클이 발생하지 않는 경우, 최소 신장 트리에 포함
    - II. 사이클이 발생하는 경우, 최소 신장 트리에 포함시키지 않는다
  - STEP3. 모든 간선에 대해 2번의 과정을 반복
  - 최종적으로, 신장트리에 포함되는 간선의 개수는 '노드개수-1'이다.

In [14]:
def find_parent(parent,x):
    if parent[x]!=x:
        parent[x] = find_parent(parent,parent[x])
    return parent[x]

def union_parent(parent,a,b):
    a= find_parent(parent,a)
    b= find_parent(parent,b)
    if a<b:
        parent[b]=a
    else:
        parent[a]=b

v,e= map(int, input().split())
parent= [0]*(v+1)
for i in range(1,v+1):
    parent[i]= i


# 간선리스트와 최종비용 담을 변수
edges = []
result = 0

# 간선에 대한 정보를 입력
for _ in range(e):
    a,b,cost = map(int,input().split())
    # 비용으로 정렬하기 위해 첫번째 원소를 비용으로 설정
    edges.append((cost,a,b))

# 비용순으로 간선 정렬
edges.sort()

# 간선을 하나씩 확인하며 사이클 발생시키지 않는 집합 생성
for edge in edges:
    cost,a,b = edge
    if find_parent(parent,a)!=find_parent(parent,b):
        union_parent(parent,a,b)
        result += cost

print(result)

159


#### 4) 위상 정렬

- 위상 정렬: 정렬 알고리즘의 일종으로 방향그래프의 모든 노드를 "방향성에 거스르지 않도록 순서대로 나열하는 것"
  - 즉, 모든 선후 관계를 지키는 전체 순서 계산 ex) 선수과목을 고려한 학습 순서 설정
  - 진입차수: 특정 노드로 들어오는 간선의 개수 ex) 선수과목이 2개인 과목의 진입차수는 2

- 위상 정렬 알고리즘
  - STEP1. 진입차수가 0인 노드를 큐에 넣는다
  - STEP2. 큐가 빌때까지 과정 반복
    - I. 큐에서 원소를 꺼내 해당 노드에서 출발하는 간선을 그래프에서 제거
    - II. 새롭게 진입차수가 0이 된 노드를 큐에 넣기 
  - 큐에서 빠져나간 노드를 순서대로 출력하면, 위상 정렬!
  - 이때, 모든 원소를 방문하기 전 큐가 비면 사이클이 존재

In [1]:
from collections import deque

v,e= map(int,input().split())
# 모든 노드에 대한 진입차수 초기화
indegree = [0]*(v+1)
# 각 노드에 연결된 간선 정보를 담는 리스트 초기화
graph = [[] for i in range(v+1)]

# 간선 정보와 진입차수 입력
for _ in range(e):
    a,b = map(int, input().split())
    graph[a].append(b) #a->b로 이동
    indegree[b] +=1 #b에 대한 진입차수 +1

# 위상 정렬 함수
def topology_sort():
    result =[] #알고리즘 수행 결과
    q = deque() #큐 실행

    # 진입차수가 0인 노드를 큐에 입력 (초기)
    for i in range(1,v+1):
        if indegree[i]==0:
            q.append(i)
    
    # 큐가 빌 때까지 반복
    while q:
        # 선입선출, 큐에서 원소 꺼내기
        now = q.popleft()
        result.append(now) 

        # 해당 노드와 연결된 노드의 진입차수 1씩 제거
        for i in graph[now]:
            indegree[i] -= 1
            # 새롭게 진입차수가 0이 된 노드 큐에 입력
            if indegree[i]==0:
                q.append(i)

    # 위장 정렬 함수 출력
    for i in result:
        print(i, end=" ")

topology_sort()

1 2 5 3 6 4 7 

### 2. 팀 결성
- Try

In [2]:
def find_parent(parent,x):
    if parent[x]!=x:
        parent[x]=find_parent(parent,parent[x]) #parent[x]에 대해 find_parent
    return parent[x]

def union_parent(parent,a,b):
    a= find_parent(parent,a)
    b= find_parent(parent,b)
    if a<b:
        parent[b]=a
    else:
        parent[a]=b

n,m = map(int, input().split())
parent = [0]*(n+1)
for i in range(1,n+1):
    parent[i]=i

for _ in range(m):
    k, a, b = map(int,input().split())
    if k==0:
        union_parent(parent,a,b)
    else:
        if find_parent(parent,a)==find_parent(parent,b):
            print("YES")
        else:
            print("NO")

NO
NO
YES


### 3. 도시 분할 계획
- Try

** HINT : 최소 신장 트리를 찾은 뒤, 최소 신장 트리를 구성하는 간선 중 가장 비용이 큰 간선을 제거

In [7]:
def find_parent(parent,x):
    if parent[x]!=x:
        parent[x]=find_parent(parent,parent[x])
    return parent[x]

def union_parent(parent,a,b):
    a= find_parent(parent,a)
    b= find_parent(parent,b)
    if a<b:
        parent[b]=a
    else:
        parent[a]=b


n,m = map(int, input().split())
# ---- 부모테이블에 대한 정보가 필요 ----
parent = [0]*(n+1)
for i in range(1,n+1):
    parent[i]=i

edges = [] # 간선 정보
for _ in range(m):
    a,b,c = map(int, input().split())
    edges.append((c,a,b))
edges.sort()

result = 0 # 비용 총합
result_big = [] # 가장 큰 비용 기록

for edge in edges:
    c,a,b = edge
    if find_parent(parent,a)!=find_parent(parent,b):
        union_parent(parent,a,b)
        result += c
        result_big.append(c) #edges를 비용에 따라 오름차순정렬했으므로 result_big=c 라고 표현해도 된다.

print(result-max(result_big))   


8


### 4. 커리큘럼
- Answer

In [12]:
from collections import deque
import copy # 리스트 변수의 값을 복사하는 연산


# 강의 개수 / 진입차수 / 간선정보 담을 리스트
n = int(input())
indegree = [0]*(n+1) 
graph = [[] for i in range(n+1)]
# 각 강의 시간을 0으로 초기화 -> 동시에 들을 수 있는 강의 중 max값을 찾을 예정
time = [0]*(n+1)


# input: 해당 강의 시간 - 강의 들어야하는 번호들 - (-1)
for i in range(1,n+1):
    data = list(map(int,input().split()))
    time[i] = data[0]
    for x in data[1:-1]:
        indegree[i] +=1 #진입차수 +1
        graph[x].append(i) # i강의는 x강의를 선수해야 한다(x->i)


def topology_sort():
    result = copy.deepcopy(time) #알고리즘 수행 결과를 담을 리스트(초기: time리스트 변수의 값을 복사)
    q = deque()

    # 진입차수가 0인 노드를 큐에 삽입
    for i in range(1,n+1):
        if indegree[i]==0:
            q.append(i)
    
    # 큐가 빌 때까지 반복
    while q:
        now = q.popleft() # 큐에서 원소 꺼내기
        for i in graph[now]:
            indegree[i] -= 1 # 현재 노드와 연결된 노드들의 진입차수를 -1 (graph[x].append(i)로 보관하는 이유)
            result[i] = max(result[i], result[now]+time[i]) # 기존 해당노드 수강시간 vs 큐에서 꺼낸 노드 수강시간+해당노드 수강시간
            # 진입차수가 0이 되는 노드를 큐에 삽입
            if indegree[i]==0:
                q.append(i)

    for i in range(1,n+1):
        print(result[i])

topology_sort()


10
20
14
18
17
