# MST 최소 스패닝 트리

- 최소스패닝 트리는 그래프에서 그래프의 모든 정점을 연결하되, **사이클이 존재하지 않도록** 모든 정점을 간선으로 연결하는 것을 의미
- **간선의 가중치 합을 최소**로 하며 연결
> 무조건 하나의 그래프에서 하나만 생성된다고는 보장하지 못함

### 크루스칼 알고리즘(Kruskal's Algorithm)

- **모든 간선에 대해 가장 가중치가 작은 간선부터 연결**해주면서 스패닝트리를 만듬
- 가장 작은 간선부터 연결하되, **연결하는 도중 사이클에 생기게 되면 가중치가 작은 간선이어도 무시**

#### 유니온 파인드 알고리즘(Union-Find (disjoint-set) Algorithm)
- **서로 중복되지 않는 부분 집합**들로 나눠진 원소들에 대한 정보를 저장하고 조작하는 자료구조 (공통 원소가 없음)
- 다수의 노드들 중에 연결된 노드를 찾거나 노드들을 합칠 때 사용하는 알고리즘
- 트리 구조를 이용하여 구현
> - 초기화  
>  - N개의 원소가 각각의 집합에 포함되어 있도록 초기화
> - union 연산
>  - 두 원소 a,b가 주어질 때, 이들이 속한 두 집합을 하나로 합침
> - find 연산
>  - 어떤 원소 a가 주어질 때, 이 원소가 속한 집합을 반환

- 배열로 사용할 시 시간 복잡도는 O(N), 따라서 트리구조로 많이 사용
- 일반적으로 부모를 합칠 때는 더 작은 값 쪽을 합침

배열 방식

In [5]:
#배열방식
class DisjointSet:
    def __init__(self,n):
        self.data = list(range(n))
        self.size = n
    
    def find(self,index):
        return self.data[index]
    
    def union(self,x,y):
        x,y = self.find(x), self.find(y)
        
        if x == y:
            return
        
        for i in range(self.size):
            if self.find(i) == y:
                self.data[i] = x
    @property
    def length(self):
        return len(set(self.data))

disjoint = DisjointSet(10)

disjoint.union(0,1)
disjoint.union(1,2)
disjoint.union(2,3)
disjoint.union(4,5)
disjoint.union(5,6)
disjoint.union(6,7)
disjoint.union(8,9)

print(disjoint.data)
print(disjoint.length)

[0, 0, 0, 0, 4, 4, 4, 4, 8, 8]
3


트리 방식 - Union-by-size
- 주어진 원소의 개수 만큼 사용하지 않을 값 생성
- 루트 노드의 인덱스를 찾음
- 루트 노드의 인덱스가 다르다면 리스트이 값이 더 낮은(size가 더 큰) 것을 찾아 큰 것에 더해줌
- 작은건 큰 것의 인덱스를 바꿔줌

> 시간복잡도는 O(logn)

In [10]:
class DisjointSet_tree:
    def __init__(self,n):
        self.data = [-1 for _ in range(n)]
        self.size = n
    
    def find(self,index):
        value = self.data[index]
        if value < 0:
            return index
        return self.find(value)
    
    def union(self, x,y):
        x=self.find(x)
        y=self.find(y)
        
        if x == y:
            return
        
        if self.data[x] < self.data[y]:
            self.data[x] += self.data[y]
            self.data[y] = x
        else:
            self.data[y] += self.data[x]
            self.data[x] = y
        
        self.size -=1
        
disjoint = DisjointSet_tree(10)

disjoint.union(0,1)
disjoint.union(1,2)
disjoint.union(2,3)
disjoint.union(4,5)
disjoint.union(5,6)
disjoint.union(6,7)
disjoint.union(8,9)

print(disjoint.data)
print(disjoint.size)

[1, -4, 1, 1, 5, -4, 5, 5, 9, -2]
3


트리 방식 - Union-by-height

In [16]:
class DisjointSet_tree:
    def __init__(self,n):
        self.data = [-1 for _ in range(n)]
        self.size = n
    
    def find(self,index):
        value = self.data[index]
        if value < 0:
            return index
        return self.find(value)
    
    def union(self, x,y):
        x=self.find(x)
        y=self.find(y)
        
        if x == y:
            return
        
        #작은 원소의 값이 즉 루트노드가 되기 때문
        if self.data[x] < self.data[y]:
            self.data[y] = x
        elif self.data[x] > self.data[y]:
            self.data[x] = y
        elif self.data[x] == self.data[y]:
            self.data[x] -=1
            self.data[y] = x
        
        self.size -=1
        
disjoint = DisjointSet_tree(10)

disjoint.union(0,1)
print(disjoint.data)
disjoint.union(1,2)
print(disjoint.data)
disjoint.union(2,3)
print(disjoint.data)
disjoint.union(4,5)
print(disjoint.data)
disjoint.union(5,6)
print(disjoint.data)
disjoint.union(6,7)
print(disjoint.data)
disjoint.union(8,9)
print(disjoint.data)

print(disjoint.data)
print(disjoint.size)

[-2, 0, -1, -1, -1, -1, -1, -1, -1, -1]
[-2, 0, 0, -1, -1, -1, -1, -1, -1, -1]
[-2, 0, 0, 0, -1, -1, -1, -1, -1, -1]
[-2, 0, 0, 0, -2, 4, -1, -1, -1, -1]
[-2, 0, 0, 0, -2, 4, 4, -1, -1, -1]
[-2, 0, 0, 0, -2, 4, 4, 4, -1, -1]
[-2, 0, 0, 0, -2, 4, 4, 4, -2, 8]
[-2, 0, 0, 0, -2, 4, 4, 4, -2, 8]
3


Path Comprehension

- 위에 나온 union-by-size,height 방식에서 find() 연산을 수행할 때 트리의 높이 만큼 올라가 루트를 찾는 것이라 비효율적 (find() 연산 비용 감소하는 방법)

In [2]:
class DisjointSet_path:
    def __init__(self,n):
        self.data = [-1 for _ in range(n)]
        self.size = n
    def upward(self, change_list, index):
        value = self.data[index]
        if value<0:
            return index
        
        change_list.append(index)
        return self.upward(change_list,value)
    
    def find(self,index):
        change_list = []
        result = self.upward(change_list,index)
        
        for i in change_list:
            self.data[i] = result
        return result
    
    def union(self,x,y):
        x = self.find(x)
        y = self.find(y)
        
        if x == y:
            return
        
        if self.data[x] < self.data[y]:
            self.data[y] = x
        elif self.data[x] > self.data[y] :
            self.data[x] = y
        else:
            self.data[x] -= 1
            self.data[y] = x
        self.size -=1
disjoint = DisjointSet_path(10)

disjoint.union(0,1)
print(disjoint.data)
disjoint.union(1,2)
print(disjoint.data) 
disjoint.union(2,3)
print(disjoint.data)
disjoint.union(4,5)
print(disjoint.data)
disjoint.union(5,6)
print(disjoint.data)
disjoint.union(6,7)
print(disjoint.data)
disjoint.union(8,3)
print(disjoint.data)

print(disjoint.data)
print(disjoint.size)

[-2, 0, -1, -1, -1, -1, -1, -1, -1, -1]
[-2, 0, 0, -1, -1, -1, -1, -1, -1, -1]
[-2, 0, 0, 0, -1, -1, -1, -1, -1, -1]
[-2, 0, 0, 0, -2, 4, -1, -1, -1, -1]
[-2, 0, 0, 0, -2, 4, 4, -1, -1, -1]
[-2, 0, 0, 0, -2, 4, 4, 4, -1, -1]
[-2, 0, 0, 0, -2, 4, 4, 4, -2, 8]
[-2, 0, 0, 0, -2, 4, 4, 4, -2, 8]
3
