# 배운 내용 훑어보기
- DFS/BFS와 최단 경로에서 다룬 내용은 모두 그래프 알고리즘의 한 유형
- 코딩 테스트에서 출제 비중이 낮은 편이지만 꼭 제대로 알아야 하는 알고리즘
- 여기서 다루는 개념들을 바르게 이해할 수있다면 코딩 테스트에서 만나게 될 다양한 응용문제들도 해결할 수 있을것!
- 앞으로 배울 알고리즘들은 앞서 배운 내용에 기반
    - 크루스칼 알고리즘 : 그리디 알고리즘
    - 위상 정렬 알고리즘 : 큐 자료구조, 스택 자료구조를 활용해야 구현 가능
- 그래프
    - 그래프란 노드와 노드사이에 연결된 간선의 정보를 가지고 있는 자료구조
    - 알고리즘 문제를 접했을 때 서로 다른 개체가 연결돼있다. 와 같은 내용이 등장하면 그래프 알고리즘을 의심!
    - 그래프 자료구조 중 트리 자료구조는 다양한 알고리즘에서 사용되므로 꼭 기억하자!
    - 그래프의 구현 방법
        - 인접 행렬 : 2차원 배열을 사용하는 방식
        - 인접 리스트 : 리스트를 사용하는 방식

# 서로소 집합
- 공통 원소가 없는 두 집합
    - {1, 2}와 {3, 4}는 서로소 관계이다
    - {1, 2}와 {2, 3}은 서로소관계가 아니다

### 서로소 집합 자료구조
- 서로소 부분 집합들로 나누어진 원소들의 데이터를 처리하기 위한 자료구조
- 서로소 집합 자료구조는 두 종류의 연산을 지원
    1. 합집합(Union) : 두 개의 원소가 포함된 집합을 하나의 집합으로 합치는 연산
    2. 찾기(Find): 특정한 원소가 속한 집합이 어떤 집합인지 알려주는 연산
- 서로소 집합 자료구조는 합치기 찾기(Union Find) 자료구조라고 불리기도 한다.
- 여러 개의 합치기 연산이 주어졌을 때 서로소 집합 자료구조의 동작과정
    1. 합집합(Union) 연산을 확인하여, 서로 연결된 두 노드 A, B를 확인한다
        1. A와 B의 루트 노드 A', B'을 각각 찾는다
        2. A'를 B'의 부모 노드로 설정한다.
    2. 모든 합집합(Union) 연산을 처리할 때까지 1번의 과정을 반복한다.
- 기본적인 형태의 서로소 집합 자료구조에서는 루트 노드에 즉시 접근할 수 없다.
    - 루트 노드를 찾기 위해 부모 테이블을 계속해서 확인하며 거슬러 올라가야 한다.

In [2]:
# 서로소 집합 자료구조: 기본적인 구현 방법
# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    # 루트 노드를 찾을 때까지 재귀 호출
    if parent[x] != x:
        return find_parent(parent, parent[x])
    return x

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

# 노드의 개수와 간선(Union 연산)의 개수 입력 받기
v, e = map(int, input().split())
parent = [0] * (v + 1) # 부모 테이블 초기화하기

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
    parent[i] = i

# Union 연산을 각각 수행
for i in range(e):
    a, b = map(int, input().split())
    union_parent(parent, a, b)

# 각 원소가 속한 집합 출력하기
print('각 원소가 속한 집합: ', end='')
for i in range(1, v + 1):
    print(find_parent(parent, i), end=' ')

print()

# 부모 테이블 내용 출력하기
print('부모 테이블: ', end='')
for i in range(1, v + 1):
    print(parent[i], end=' ')

각 원소가 속한 집합: 1 1 1 1 5 5 
부모 테이블: 1 1 2 1 5 5 

- 합집합 연산이 편향되게 이뤄지는 경우 찾기(Find) 함수가 비효율적으로 동작
- 최악의 경우 찾기(Find) 함수가 모든 노드를 다 확인하게 되어 시간 복잡도가 O(V)
- 따라서 찾기 함수를 최적화하기 위한 방법으로 경로 압축(Path Compression)을 이용할 수 있다.
    - 찾기 함수를 재귀적으로 호출한 뒤 부모 테이블 값을 바로 갱신한다.
- 경로 압축 기법을 적용하면 각 노드에 대해 찾기 함수를 호출한 이후 해당 노드의 루트 노드가 바로 부모 노드가 된다.
- 기본적인 방법에 비해 시간 복잡도가 개선!

In [None]:
# 서로소 집합 자료구조: 경로 압축 기법 사용
# find_parent함수 부분만 루트노드를 부모노드로 적용시키도록 바뀌었다.
# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    # 루트 노드를 찾을 때까지 재귀 호출
    if parent[x] != x:
        parent[x] =  find_parent(parent, parent[x])
    return parent[x]

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

# 노드의 개수와 간선(Union 연산)의 개수 입력 받기
v, e = map(int, input().split())
parent = [0] * (v + 1) # 부모 테이블 초기화하기

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
    parent[i] = i

# Union 연산을 각각 수행
for i in range(e):
    a, b = map(int, input().split())
    union_parent(parent, a, b)

# 각 원소가 속한 집합 출력하기
print('각 원소가 속한 집합: ', end='')
for i in range(1, v + 1):
    print(find_parent(parent, i), end=' ')

print()

# 부모 테이블 내용 출력하기
print('부모 테이블: ', end='')
for i in range(1, v + 1):
    print(parent[i], end=' ')

### 서로소 집합을 활용한 사이클 판별
- 서로소 집합은 무방향 그래프 내에서의 사이클을 판별할 때 사용할 수 있다.
    - 참고로 방향 그래프에서의 사이클 여부는 DFS를 이용해 판별가능하다.
- 사이클 판별 알고리즘은 다음과 같다
    1. 각 간선을 하나씩 확인하며 두 노드의 루트 노드를 확인한다.
        1. 루트 노드가 서로 다르다면 두 노드에 대해 합집합(Union) 연산을 수행한다.
        2. 루트 노드가 서로 같다면 사이클(Cycle)이 발생한 것입니다.
    2. 그래프에 포함되어 있는 모든 간선에 대해 1번 과정을 반복한다.

In [3]:
# 서로소 집합을 활용한 사이클 판별 소스코드

# 특정 원소가 속한 집합 찾기
def find_parent(parent, x):
    # 루트 노드를 찾을 때까지 재귀 호출
    if parent[x] != x:
        parent[x] =  find_parent(parent, parent[x])
    return parent[x]

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

# 노드의 개수와 간선(Union 연산)의 개수 입력 받기
v, e = map(int, input().split())
parent = [0] * (v + 1) # 부모 테이블 초기화하기

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
    parent[i] = i

cycle = False # 사이클 발생 여부

for i in range(e):
    a, b = map(int, input().split())
    # 사이클이 발생한 경우 종료
    if find_parent(parent, a) == find_parent(parent, b):
        cycle = True
        break
    # 사이클이 발생하지 않았다면 합집합(union) 수행
    else:
        union_parent(parent, a, b)

if cycle:
    print('사이클 발생')
else:
    print('사이클 미발생')

사이클 발생


# 신장 트리
