# 1774 : 우주신과의 교감

https://www.acmicpc.net/problem/1774

>## <B>신장 트리란?</B>
>
>
>그래프에서 모든 노드가 연결되어 있으면서 트리의 속성(사이클 x)을 만족하는 그래프
>1. 모든 노드가 서로 연결
>2. 사이클 존재 X

>## <B>최소 신장 트리(MST)란?</B>
>
>신장 트리 중 간선의 가중치 합이 최소인 경우
>
>1. 모든 노드가 서로 연결
>2. 사이클 존재 X
>3. <U>간선의 가중치 합 최소</U>
>
> 알고리즘 종류 : 1. <b>크루스칼 알고리즘</b> 2. <b>프림 알고리즘</b>

>## <b>크루스칼 알고리즘</b>
>
> 1. 모든 정점을 독립적인 집합으로 만든다.
> 2. 모든 간선을 비용 기준으로 정렬하고, 비용이 작은 간선부터 양 끝의 두 정점을 비교한다.
> 3. 두 정점의 최상위 정점을 확인하고, 서로 다를 경우 두 정점을 연결한다. → Union-Find 알고리즘

> ## <B>Union-Find 알고리즘</B>
>
> 두 노드가 같은 집합에 속해있는지 판단하고, 아닐 경우 하나의 집합으로 합치는 알고리즘
>
> <b>Union</b> : 두 개별 집합을 하나의 집합으로 합침(두 트리를 하나의 트리로)  
> <b>Find</b> : 여러 노드 중, 두 노드 선택 시 서로 같은 그래프(부분 집합)에 속해있는지 판별 (각 그룹의 루트 노드 비교)
>
>
>1. 초기화
>   - n 개의 원소가 개별 집합으로 이뤄지도록 초기화
><img src="https://www.fun-coding.org/00_Images/initial_findunion.png" width=400>
>2. Union
>   - 두 개별 집합을 하나의 집합으로 합침, 두 트리를 하나의 트리로 만듬
><img src="https://www.fun-coding.org/00_Images/union_findunion.png" width=600>
>
>3. Find
>   - 여러 노드가 존재할 때, 두 개의 노드를 선택해서, 현재 두 노드가 서로 같은 그래프에 속하는지 판별하기 위해, 각 그룹의 최상단 원>소 (즉, 루트 노드)를 확인
><img src="https://www.fun-coding.org/00_Images/find_findunion.png" width=500>
>
>
> ### Union-Find 알고리즘의 고려할 점
>- Union 순서에 따라서, 최악의 경우 링크드 리스트와 같은 형태가 될 수 있음.
>- 이 때는 Find/Union 시 계산량이 O(N) 이 될 수 있으므로, 해당 문제를 해결하기 위해, <b>union-by-rank, path compression</b> 기법을 사용함 
>
><img src="https://www.fun-coding.org/00_Images/worst_findunion.png" width=200>
>
>
>
>### union-by-rank 기법
>- 각 트리에 대해 높이(rank)를 기억해 두고,
>- Union시 두 트리의 높이(rank)가 다르면, 높이가 작은 트리를 높이가 큰 트리에 붙임 (즉, 높이가 큰 트리의 루트 노드가 합친 집합의 루>트 노드가 되게 함)
><img src="https://www.fun-coding.org/00_Images/unionbyrank_findunion.png" width=700>
>
>
>- 높이가 h - 1 인 두 개의 트리를 합칠 때는 한 쪽의 트리 높이를 1 증가시켜주고, 다른 쪽의 트리를 해당 트리에 붙여줌
><img src="https://www.fun-coding.org/00_Images/unionbyranksame_findunion.png" width=700>
>
>- 초기화시, 모든 원소는 높이(rank) 가 0 인 개별 집합인 상태에서, 하나씩 원소를 합칠 때, union-by-rank 기법을 사용한다면,
>  - 높이가 h 인 트리가 만들어지려면, 높이가 h - 1 인 두 개의 트리가 합쳐져야 함
>  - 높이가 h - 1 인 트리를 만들기 위해 최소 n개의 원소가 필요하다면, 높이가 h 인 트리가 만들어지기 위해서는 최소 2n개의 원소가 필요함
>  - 따라서 union-by-rank 기법을 사용하면, union/find 연산의 시간복잡도는 O(N) 이 아닌, $ O(log{N}) $ 로 낮출 수 있음
>
> ### path compression 기법
>- Find를 실행한 노드에서 거쳐간 노드를 루트에 다이렉트로 연결하는 기법
>- Find를 실행한 노드는 이후부터는 루트 노드를 한번에 알 수 있음
>
><center><img src="https://www.fun-coding.org/00_Images/pathcompression_findunion.png" width=400></center>
>
>- union-by-rank 와 path compression 기법 사용시 시간 복잡도는 다음 계산식을 만족함이 증명되었음
>  - $ O(M log^*{N}) $
>  - $ log^*{N} $ 은 다음 값을 가짐이 증명되었음
>    - N이 $ 2^{65536} $ 값을 가지더라도, $ log^*{N} $ 의 값이 5의 값을 가지므로, 거의 <b>O(1)</b>, 즉 상수값에 가깝다고 볼 수 있음

### 크루스칼 알고리즘

In [4]:
mygraph = {
    'vertices': ['A', 'B', 'C', 'D', 'E', 'F', 'G'],
    'edges': [
        (7, 'A', 'B'),
        (5, 'A', 'D'),
        (7, 'B', 'A'),
        (8, 'B', 'C'),
        (9, 'B', 'D'),
        (7, 'B', 'E'),
        (8, 'C', 'B'),
        (5, 'C', 'E'),
        (5, 'D', 'A'),
        (9, 'D', 'B'),
        (7, 'D', 'E'),
        (6, 'D', 'F'),
        (7, 'E', 'B'),
        (5, 'E', 'C'),
        (7, 'E', 'D'),
        (8, 'E', 'F'),
        (9, 'E', 'G'),
        (6, 'F', 'D'),
        (8, 'F', 'E'),
        (11, 'F', 'G'),
        (9, 'G', 'E'),
        (11, 'G', 'F')
    ]
}

In [5]:
parent = dict()
rank = dict()

def find(node):
    # path compression 기법
    if parent[node] != node:             # 루트 노드 찾기
        parent[node] = find(parent[node])
    return parent[node]                 # 루트 노드 반환

def union(node_v, node_u):
    root1 = find(node_v)       # node_v의 루트노드
    root2 = find(node_u)       # node_u의 루트노드
    
    # union-by-rank 기법
    if rank[root1] > rank[root2]: # root1의 높이가 더 크면, root1에 붙이기
        parent[root2] = root1
    else:
        parent[root1] = root2      # root2의 높이가 더 크거나 같으면, root2에 붙이고
        if rank[root1] == rank[root2]:  # root2와 높이가 같으면, root2의 높이 1 증가
            rank[root2] += 1
    
def make_set(node):  # 초기화 : 모든 정점을 독립적인 집합으로 만듦
    parent[node] = node
    rank[node] = 0

def kruskal(graph):
    mst = list()
    
    # 1. 초기화
    for node in graph['vertices']: # 초기화 : 모든 정점을 독립적인 집합으로 만듦
        make_set(node)
    
    # 2. 간선 weight 기반 sorting
    edges = graph['edges']          # 간선의 가중치 오름차순 정렬
    edges.sort()
    
    # 3. 간선 연결 (사이클 없는) 
    for edge in edges:               
        weight, node_v, node_u = edge
        if find(node_v) != find(node_u): # 두 그룹이 다른 그룹일경우
            union(node_v, node_u)        # 하나로 합치기
            mst.append(edge)             # 최소 신장 리스트 append
    
    return mst

In [6]:
kruskal(mygraph)

[(5, 'A', 'D'),
 (5, 'C', 'E'),
 (6, 'D', 'F'),
 (7, 'A', 'B'),
 (7, 'B', 'E'),
 (9, 'E', 'G')]

![title](1774_2.png)

In [13]:
import math

def find(node):
    if parent[node]!=node:
        parent[node]=find(parent[node])
    return parent[node]

def union(node1, node2):
    root1=find(node1)
    root2=find(node2)
    
    if rank[root1]>rank[root2]:
        parent[root2]=root1
    else:
        parent[root1]=root2
        if rank[root1]==rank[root2]:
            rank[root2]+=1
            
def make_set(node): # 초기화
    parent[node]=node
    rank[node]=0
        
def get_distance(a, b):  # 두 노드(좌표)의 거리계산
    return math.sqrt(pow(a[0]-b[0], 2) + pow(a[1]-b[1], 2)) 

def kruskal():
    n, m = map(int, input().split())
    parent = dict()                  # 각 노드의 루트 노드
    rank = dict()                    # 각 노드의 높이
    locations=[()]                   # 노드들의 좌표 저장 / index가 노드를 가리키기 위해 index : () 추가
    edges=[]                         # 간선 저장
    mst=[]                           # 최소신장 간선(edge) 반환

    for i in range(1, n+1): # 노드들 좌표값 입력받고 저장 & 초기화
        x, y =map(int, input().split())
        locations.append((x, y))   # 각 노드의 좌표 입력
        make_set(i)                #### 1. 모든 정점을 독립적인 집합으로 만든다.

    for _ in range(m):  # 이미 연결되어 있는 노드들 연결
        a, b = map(int, input().split())
        union(a, b)

    for i in range(1, n+1): # 노드들간의 모든 간선 계산 & 저장
        for j in range(i+1, n+1):        
            edges.append((get_distance(locations[i], locations[j]), i, j)) # edges.append( (거리, 노드1, 노드2) )

    edges.sort()               #### 2. 모든 간선을 비용(길이) 기준으로 정렬한다.

    for edge in edges:  # 비용(길이)가 작은 간선부터 연결(사이클 X)
        distance, node1, node2 = edge   #### 3. 비용이 작은 간선부터 양 끝의 두 정점을 비교한다.
        if find(node1)!=find(node2): #### 3. 두 정점의 최상위 정점을 확인하고, 서로 다를 경우 두 정점을 연결한다.→ Union-Find 알고리즘
            union(node1, node2)
            mst.append(edge)        ## mst : 최소 신장 트리의 간선 정보            

            
kruskal() # kruskal 알고리즘에 의해 mst의 간선 정보 확인 가능

sum=0 
for i in mst:     # 이미 연결된 간선 제외 최소 신장 트리의 간선의 길이 합 계산
    sum+=i[0]
    
print("%0.2f" %sum)

4 1
1 1
3 1
2 3
4 3
1 4
4.00


![title](1774_3.jpg)

> ### 핵심! 
>
> 모든 간선들을 탐색해서 간선의 길이가 작은것의 노드들 부터 Union하여 최소 신장 트리 완성  
>
>
> → 크루스칼 알고리즘은 모든 간선의 정보 필요!