# 최소 신장 트리 
### 1. 신장트리와 최소 신장트리의 이해
<b>신장트리(Spanning Tree)의 조건</b>
- 본래의 그래프의 모든 노드를 포함해야 함
- 모든 노드가 서로 연결
- 트리의 속성을 만족시킴 (사이클이 존재하지 않음)
<img src="https://www.fun-coding.org/00_Images/spanningtree.png">

**최소 신장트리(Minimum Spanning Tree, MST)의 조건**
- 가능한 Spanning Tree 중에서, 간선의 가중치 합이 최소인 Spanning Tree를 지칭함
<img src="https://www.fun-coding.org/00_Images/mst.png" width=500>
  

### 2. 최소 신장 트리 알고리즘 (MST를 찾는 알고리즘)
### 2-1. 크루스칼 알고리즘 (Kruskal's Algorithm)
1. 모든 정점을 독립적인 집합으로 만든다.
2. 모든 간선을 비용을 기준으로 정렬하고, 비용이 작은 간선부터 양 끝의 두 정점을 비교한다. -> 이 비교 알고리즘의 예시가 union-find
3. 두 정점의 최상위 정점을 확인하고, 서로 다를 경우 두 정점을 연결한다. (최소 신장 트리는 사이클이 없으므로, 사이클이 생기지 않도록 하는 것임)

 `탐욕 알고리즘을 기초로 하고 있음 (당장 눈 앞의 최소 비용을 선택해서, 결과적으로 최적의 솔루션을 찾음)`
<img src="https://www.fun-coding.org/00_Images/kruscal_internal1.png" width=650>
<img src="https://www.fun-coding.org/00_Images/kruscal_internal2.png" width=800>

### 2-2 Union-Find 알고리즘
- 두 노드를 연결했을 때, cycle이 생기는지 안생기는지 검사하는 알고리즘
- 같은 집합에 있다 = 이미 연결된 노드이다.
- 같은 집합 내에 있는 두 노드를 연결하면 사이클이 생긴다.
- 서로 다른 집합 (Disjoint Set)에 있는 두 노드를 연결하면 사이클이 생기지 않는다.
- find : 두 노드가 동일 부분 집합에 있는지 없는 지 확인
- 이 알고리즘 에서 각 집합의 root노드를 저장하고 있기 때문에 두 노드의 집합의 root 노드를 비교해서 체크한다.
- union : find완료 후 합치기  

1. 초기화
   - n 개의 원소가 개별 집합으로 이뤄지도록 초기화
<img src="https://www.fun-coding.org/00_Images/initial_findunion.png" width=400>
2. Union
   - 두 개별 집합을 하나의 집합으로 합침, 두 트리를 하나의 트리로 만듬
<img src="https://www.fun-coding.org/00_Images/union_findunion.png" width=600>

3. Find
   - 여러 노드가 존재할 때, 두 개의 노드를 선택해서, 현재 두 노드가 서로 같은 그래프에 속하는지 판별하기 위해, 각 그룹의 최상단 원소 (즉, 루트 노드)를 확인
<img src="https://www.fun-coding.org/00_Images/find_findunion.png" width=500>

### union-by-rank 기법
- 각 트리에 대해 높이(rank)를 기억해 두고,
- Union시 두 트리의 높이(rank)가 다르면, 높이가 작은 트리를 높이가 큰 트리에 붙임 (즉, 높이가 큰 트리의 루트 노드가 합친 집합의 루트 노드가 되게 함)
<img src="https://www.fun-coding.org/00_Images/unionbyrank_findunion.png" width=700>

- 높이가 h - 1 인 두 개의 트리를 합칠 때는 한 쪽의 트리 높이를 1 증가시켜주고, 다른 쪽의 트리를 해당 트리에 붙여줌
<img src="https://www.fun-coding.org/00_Images/unionbyranksame_findunion.png" width=700>

- 초기화시, 모든 원소는 높이(rank) 가 0 인 개별 집합인 상태에서, 하나씩 원소를 합칠 때, union-by-rank 기법을 사용한다면,
  - 높이가 h 인 트리가 만들어지려면, 높이가 h - 1 인 두 개의 트리가 합쳐져야 함
  - 높이가 h - 1 인 트리를 만들기 위해 최소 n개의 원소가 필요하다면, 높이가 h 인 트리가 만들어지기 위해서는 최소 2n개의 원소가 필요함
  - 따라서 union-by-rank 기법을 사용하면, union/find 연산의 시간복잡도는 O(N) 이 아닌, $ O(log{N}) $ 로 낮출 수 있음
  
### path compression
- Find를 실행한 노드는 싹다 루트 노드 자식으로 붙여버림

<center><img src="https://www.fun-coding.org/00_Images/pathcompression_findunion.png" width=400></center>

- union-by-rank 와 path compression 기법 사용시 시간 복잡도는 다음 계산식을 만족함이 증명되었음
  - $ O(M log^*{N}) $
  - $ log^*{N} $ 은 다음 값을 가짐이 증명되었음
    - N이 $ 2^{65536} $ 값을 가지더라도, $ log^*{N} $ 의 값이 5의 값을 가지므로, 거의 O(1), 즉 상수값에 가깝다고 볼 수 있음

<div style="text-align:left">
<table>
  <tr>
    <th style="text-align:center">N</th>
    <th style="text-align:center">$ log^*{N} $</th>
  </tr>
  <tr>
    <td style="text-align:left">1</td>
    <td style="text-align:left">0</td>
  </tr>
  <tr>
    <td style="text-align:left">2</td>
    <td style="text-align:left">1</td>
  </tr>
  <tr>
    <td style="text-align:left">4</td>
    <td style="text-align:left">2</td>
  </tr>
  <tr>
    <td style="text-align:left">16</td>
    <td style="text-align:left">3</td>
  </tr>
  <tr>
    <td style="text-align:left">65536</td>
    <td style="text-align:left">4</td>
  </tr>
  <tr>
    <td style="text-align:left">$ 2^{65536} $</td>
    <td style="text-align:left">5</td>
  </tr>
</table>
</div>

In [4]:
mygraph = {
    'vertices': ['A', 'B', 'C', 'D', 'E', 'F', 'G'],
    'edges': [ # 중복 포함 (정렬하려고 맨앞에 weight로 저렇게 표현함 )
        (7, '', 'B'),
        (5, 'A','D'),
        (7, 'B', 'A'),
        (8, 'B', 'C'),
        (9, 'B', 'D'),
        (7, 'B', 'E'),
        (8, 'C', 'B'),
        (5, 'C', 'E'),
        (5, 'D', 'A'),
        (9, 'D', 'B'),
        (7, 'D', 'E'),
        (6, 'D', 'F'),
        (7, 'E', 'B'),
        (5, 'E', 'C'),
        (7, 'E', 'D'),
        (8, 'E', 'F'),
        (9, 'E', 'G'),
        (6, 'F', 'D'),
        (8, 'F', 'E'),
        (11, 'F', 'G'),
        (9, 'G', 'E'),
        (11, 'G', 'F')
    ]
}

In [1]:
# union-by-rank 기법을 사용하기 위해 msk의 결과와는 상관없는 두 딕셔너리 parent, rank를 생성해야 한다.
# 여러 함수에서 사용할거기 때문에 전역변수로 선언한다.

parent = dict()
rank = dict()

# 초기화를 위한 메소드 : 모든 노드가 자기자신이 루트인 간선은 없고 vertex만 있는 트리/그래프가 된다.
def make_set(node):
    parent[node] = node # 부모 노드가 자기 자신이라는 것은 루트라는 의미
    rank[node] = 0 

# 노드의 root 노드 찾기 + path compression
def find(node):
    if node != parent[node]:
        parent[node] = find(parent[node]) # 재귀용법으로 계속 부모를 find하면 결국 root가 리턴될것 : node를 무조건 root의 자식으로 붙임
    return parent[node] # node == parent[node]일 때 리턴되는 parent[node]는 root

# 두 노드 합치기
def union(v, u):
    root1 = find(v)
    root2 = find(u)
    
    if rank[root1] > rank[root2]:
        parent[root2] = root1
    else:
        parent[root1] = root2
        if rank[root1] == rank[root2]:
            rank[root2] += 1
        
    
# 나중에 거쳐간 간선들을 리스트로 담아 리턴할 변수
def kruskal(graph):      
    mst = [] 
    
    # 1. 초기화 : 모든 노드들 parent, rank에 초기화 값으로 채우기 
    for node in graph['vertices']:
        make_set(node)
            
    # 2. weight순 edge 정렬 : edge의 weight가 가장 작은 것 부터 처리하기 위해 
    edges = graph['edges']
    edges.sort()
    
    # 3. 간선 연결 (union-find)
    for edge in edges:
        weight, v, u = edge
        if find(v) != find(u):
            union(v, u)
            mst.append(edge)
        
    return mst

In [5]:
kruskal(mygraph)

KeyError: ''

### 2-3. 프림 알고리즘 
- 임의의 정점을 선택해 연결된 노드 집합에 삽입
- 선택된 정점에 연결된 간선들을 간선 리스트에 삽입
- 간선 리스트 중 최소 가중치를 갖는 간선부터 추출
- cycle이 되거나, 연결된 접점이 이미 연결된 노드 집합 내에 있으면 패스
- 아니면 해당 간선 선택

<img src="https://www.fun-coding.org/00_Images/prim1.png" width=600>
<img src="https://www.fun-coding.org/00_Images/prim2.png" width=600>
<img src="https://www.fun-coding.org/00_Images/prim3.png" width=600>

> 프림 알고리즘을 구현하기 위해 필요한 문법 (heapq, heapify, deaultdict)

In [17]:
import heapq

queue = []
graph_data = [[2,'A'],[5,'B'],[3,'C']]

for edge in graph_data:
    heapq.heappush(queue, edge)
    
for i in range(len(queue)):
    print(heapq.heappop(queue))

[2, 'A']
[3, 'C']
[5, 'B']


In [24]:
import heapq

graph_data = [[2,'A'],[5,'B'],[3,'C']]

heapq.heapify(graph_data) # 위에 처럼 for문 써서 하나하나 push하지 않아도 전체가 우선순위큐의 규칙을 맞춰서 잘 들어감
    
for i in range(len(graph_data)):
    print(heapq.heappop(graph_data))


[2, 'A']
[3, 'C']
[5, 'B']


In [28]:
from collections import defaultdict
# 어떤 키값으로 호출해도, 에러 안나고 null값 리턴
list_dict = defaultdict(list) # 안에 타입을 적으면 그 타입에 맞는 null값을 리턴해준다
                             # int = 0, list = []
print(list_dict['key1'])

list_dict2 = dict()  # 라이브러리 쓰지 않으면 없는 키 호출해보면 에러
print(list_dict2['key2'])

[]


KeyError: 'key2'

### 프림 알고리즘 정리
1. 필요한 변수
    - mst : 최종 최소신장트리
    - edgeList : pop해가면서 테스트할 간선 리스트 (매번 weight가 가장작은 간선 먼저 pop해야하는데, 항상 정렬할 수 없으니까 힙 사용)
    - connectedNode : 이미 연결 완료된 노드 리스트
    
    
2. 처음 초기화 
    - start 노드를 connectedNode에 추가
    - edgeList에 start 노드와 인접해있는 모든 간선 추가


3.  edgeList pop()해가면서 처리 
    - pop한 간선의 말단 노드가 connectedNode에 없으면 추가
    - pop한 간선의 말단 노드의 인접한 간선 중 말단이 connectedNode에 없는 간선 edgeList에 추가 

In [31]:
# 앞 크루스칼 알고리즘과 다르게 중복을 제외하고 간선 리스트 저장 
edges = [
    (7, 'A', 'B'), (5, 'A', 'D'),
    (8, 'B', 'C'), (9, 'B', 'D'), (7, 'B', 'E'),
    (5, 'C', 'E'),
    (7, 'D', 'E'), (6, 'D', 'F'),
    (8, 'E', 'F'), (9, 'E', 'G'),
    (11, 'F', 'G')
]

In [52]:
from collections import defaultdict
import heapq

def prim(start, edges):
    graph = defaultdict(list)
    
    # 1. 노드 별 인접한 간선 리스트 모두 저장
    for w, n1, n2 in edges:
        graph[n1].append((w, n1, n2))
        graph[n2].append((w, n2, n1))
        #  graph = {'A': [(7, 'A', 'B'), (5, 'A', 'D')], 'B': [(7, 'B', 'A'), (8, 'B', 'C'), (9, 'B', 'D'), (7, 'B', 'E')]
        # 중복된거 하나하나 두번씩 써주지 않아도 이렇게 append((weight, n1, n2))로 전체 노드에 모든 간선을 담은 딕셔너리를 만들 수 있다.
    
        
    # 2. 필요한 변수 선언
    mst = [] # 최종 최소신장트리
    edgeList = [] # pop해가면서 테스트할 엣지 리스트
    
    # 3. 시작 노드 (start)에 대한 데이터 삽입
    connectedNode = [start] # 이미 연결된 노드의 리스트
    edgeList.extend(graph[start]) # append로 하면 graph[start]가 이중 리스트인데 이게 그대로 들어감, pop할 때 같이나옴
    heapq.heapify(edgeList) # 우선순위 큐 형태로 바꿔주기 
    
    # 4. 간선 리스트 pop해가면서 하나씩 처리 (w 가장 작은 애 pop)
    while edgeList:
        edge = heapq.heappop(edgeList)
        w, n1, n2 = edge # n1은 무조건 connetedNode에 이미 담겨있는 애
        
        if n2 not in connectedNode:
            connectedNode.append(n2)
            mst.append(edge)
            
            for edge in graph[n2]:
                if edge[2] not in connectedNode: # 이미 connectedNode에 담겨 있지 않은 노드의 간선만 추가 
                    heapq.heappush(edgeList, edge)
    
    return mst

In [53]:
prim('A', edges)

[(5, 'A', 'D'),
 (6, 'D', 'F'),
 (7, 'A', 'B'),
 (7, 'B', 'E'),
 (5, 'E', 'C'),
 (9, 'E', 'G')]

<br><br>

# 백트래킹 (backtracking)
- 제약 조건 만족 문제에서 해를 찾기 위한 전략
- 해를 찾기 위해 후보군 들을 탐색하다, 특정 후보군이 조건이 만족되지 않는다 생각하면 아예 제외시켜서 계산양을 줄이는 방법
- 후보군 = 고려할 수 있는 경우의 수 = "상태 공간 트리" = State Space Tree
- Promising: 해당 루트가 조건에 맞는지 검사
- Pruning(가지치기): 조건에 맞지 않으면 포기/제외시키고 다른 루트 검사 
- 각 후보군을 DFS 방식으로 탐색한다. 

- 결과값은 `[[첫행에서 열번호, 두번째 행에서 열번호, 세번째 행에서 열번호, 네번째 행에서 열번호], [가능한 다른 경우]]`