# 트리

## 비선형구조와 트리

- 선형 구조 : 자료가 순서를 가지고 연속되어 있음
- 비선형 구조 : 선형 구조에 해당하지 않는 자료구조

### 대표적인 자료구조의 예시

비선형 구조의 대표적 예시는 트리와 그래프이다.

### 그래프

트리는 그래프의 특수한 형태 중 하나이다.

트리를 이해하기 위해 우선 그래프의 정의부터 알아보자.

- 정점(vertex)과 간선(edge)으로 이루어져 있는 자료구조
  - 정점 : 자료, 상태 등 뭔가를 담고 있음
    - 정점은 '노드'라고도 표현한다.
  - 간선 : 정점 간의 관계를 나타냄

어떤 정점에서 간선을 통해 다른 정점으로 이동할 수 있다.

어떤 정점에서 다른 정점으로 이동하기 위해 거치는 모든 정점을 경로하고 한다.

예를 들어 정점 4에서 정점 6으로 이동하는 경로들 중 하나는 4 -> 5 -> 3 -> 6 이 될 수 있다.

![](image/020_001.png)

그래프의 간선은 방향이 있을 수도, 없을 수도 있다.

방향이 있는 간선을 포함한 그래프를 유향 그래프라고 한다.

- 사이클
  - 어떤 정점에서 출발하여 자기 자신으로 돌아오는 경로가 있을 수 있다. 이와같이 청므 시작한 정점으로 다시 돌아오는 경로를 사이클이라고 한다.

### 트리

그래프 중 아래의 특별한 성질을 갖는 그래프를 트리라고 한다.

![](image/020_002.png)

- 트리의 간선들은 모두 방향성을 갖는다
- 어떤 정점을 가리키는 정점의 개수는 최대 1개이다
- 어떤 정점에서 다른 정점으로 이동할 수 있는 경로는 1개다
- 트리는 사이클을 갖지 않는다. 

트리에서 다른 어떠한 정점도 가리키지 않는 정점을 루트 노드(Root Node)라고 한다.

정점 1이 루트노드에 해당한다.

또, 루트 노드로쿠터의 거리를 깊이라고 한다.

![](image/020_003.png)

- 임의의 정점 A가 다른 정점 B를 가리킬 때 
  - A를 B의 부모 노드(Parent Node) 라고 하고,
  - B를 A의 자식 노드(Child Node) 라고 한다.

가리키는 정점이 없는 정점들을 리프 노드(Leaf Node) 라고 한다.

트리는 계층적인 구조로 되어 있는 자료구조이다.
운영체제에서 파일을 분류하기 위해 사용하는 디렉터리(폴더)는 트리구조의 대표적인 예시이다.

#### 이진 트리

- 각 정점들이 자식노드를 최대 2개까지만 갖는 트리를 이진 트리라고 한다
  - 이진 탐색 트리 등 유용하게 활용되는 트리 중에는 대부분 이진트리를 응용한 것이 많다.

#### 포화 이진 트리

- 리프 노드를 제외한 모든 정점이 항상 자식을 2개씩 갖고 있으면서 모든 리프 노드의 깊이가 동일한 트리를 포화 이진 트리라고 한다.

- 포화 이진 트리의 높이를 h라고 할 때, 정점의 개수는 항상 $2^h - 1$개 이다.

#### 완전 이진 트리

- 마지막 깊이를 데외하고 모든 정점이 완전히 채워져 있으며, 마지막 깊이의 정점들은 다능한 한 왼쪽에 있는 트리를 완전 이진 트리라고 한다.

- 또는 포화 이진 트리에서 마지막 깊이의 정점이 오른쪽에서부터 일부 제거된 트리라고 볼 수 있다.

- 완전 이진트리의 높이가 h일 때 정점의 개수는 
  - $2^{h-1} \leq x \leq 2^h - 1$ 개 이다.

#### 정 이진 트리

- 정 이진 트리는 리프 노드를 제외한 모든 노드들이 두개의 자식 노드를 갖고 있는 이진 트리이다.
- 즉, 모든 정점은 0개 또는 2개의 자식 노드를 갖는다.

## 트리의 표현 방법

- 클래스 사용

```python
    class TreeNode:
        def __init__(self):
            self.left = None
            self.right = None
```

완전 이진 트리의 경우, 배열을 이용하여 간단하게 구현이 가능하다.

- 아래와 같은 완전 이진트리가 존재할 때 각 정점에 순서대로 번호를 붙일 수 있다.

![](image/020_004.png)

어쩐 정점의 번호가 n이면 왼쪽 자식은 2n, 오륹쪽 자식은 2n + 1이다.

따라서 배열로 완전 이진 트리를 표현할 수 있게 된다.

![](image/020_005.png)

또, 트리는 그래프의 일종이므로 그래프를 표현할 때 사용하는 인접 행렬, 인접 리스트, 간선 리스트를 사용할 수도 있다.

## 트리 순회하기

- 트리 순회란 트리의 모든 노드를 방문하는 순서이다.
- 트리에 들어있는 자료에 접근하기 위해 순회를 해야 한다.
- 배열, 연결 리스트 증 선형 구조는 각 자료가 순서를 가지지만 비선형 구조에 해당하는 트리는 정해진 순서가 존재하지 않는다.
- 트리의 모든 노드를 방문하는 순서는 크게 두 가지 종류가 있다.
- DFS(깊이 우선 탐색)과 BFS(너비 우선 탐색) 이다.

### 깊이 우선 탐색 DFS

1. 전위 순회\
![](image/020_006.png)
2. 중위 순회\
![](image/020_007.png)
3. 후위 순회\
![](image/020_008.png)

### 너비 우선 탐색 BFS

![](image/020_009.png)
|
### DFS

- DFS는 재귀 호출을 사용하는 알고리즘으로, DFS를 이해하기 위해서는 트리의 재귀적 특성을 알아야 한다.
- 재귀 호출은 스택의 특성을 이용하므로 스택을 이용한다고 볼 수 있다.

트리에서 루트노드를 제외하면 두개의 작은 트리가 만들어 진다. 이와 같이 기존 트리에서 하위의 트리 구조를 서브트리라고 한다.

DFS의 세 가지 방법은 정점을 언제 방문하는지에 따라 순서가 달라지며 재귀 호출을 이용한다는 기본적인 개념 자체는 동일하다.

- 전위 순회 :
  - 루트 방문 -> 왼쪽 서브 트리 순회 -> 오른쪽 서브 트리 순회
- 중위 순회 :
  - 왼쪽 서브 트리 순회 -> 루트 방문 -> 오른쪽 서브 트리 순회
- 후위 순회 :
  - 왼쪽 서브 트리 순회 -> 오른쪽 서브 트리 순회 -> 루트 방문

전체 트리를 순회하기 위해 서브 트리를 순회한다.

순회를 위해 순회한다. 재귀 호출

### BFS

트리의 BFS는 큐 자료구조를 이용하여 구현한다.

현재 정점과 기웃한 정점일수록 먼저 방문해야 하므로 FIFO 자료구조인 큐를 이용해야 한다.

quque = [1]\
방문한 노드 : 1 (pop(1 제거))

quque = [2, 3]\
방문한 노드 : 1, 2 (pop(2 제거))

quque = [3, 4, 5]\
방문한 노드 : 1, 2, 3 (pop(3 제거))

quque = [4, 5, 6, 7]\
...


## 트리의 활용

### 이진 탐색 트리

임의의 자료들을 담고 있는 자료구조 A가 있다고 가정할 때,
A는 항상 정렬된 상태를 유지해야 한다고 생각해 보자.

만약 A가 배열이라면 자료의 추가, 삭제, 탐색은 다음과 같다.

정렬된 상태를 유지하는 배열의 추가와 삭제 연산은 1장에서 배운 배열의 특성대로 O(n)의 시간 복잡도를 가진다.

- 이진 탐색

정렬된 자료구조에서 사용할 수 있는 탐색 알고리즘인 이진탐색을 이용하면 정렬된 배열 내에서의 자료 탐색을 O($\log n$)만에 수행할 수 있다.

정렬된 배열의 중간값과 찾는 값의 크기를 비교하고, 중간값보다 작은 경우에는 중간값을 기준으로 좌측, 중간값보다 큰 경우에는 중간값을 기준으로 우측을 대상으로 다시 탐색한다.

1부터 n가지의 자연수 중 상대방이 생각하고 있는 숫자를 맞히는 '업 다운 게임'에서 최적의 전략으로 사용할 수 있다.

- 이진 탐색 트리

정렬된 상태를 유지해야 하는 자료구조 A가 트리로 구현되어 있다면 더 효율적으로 연산이 가능해 진다.

이진 탐색 트리는 항상 정렬된 상태를 유지하는 자료구조이며 어떤 장점의 왼쪽 서브 트리는 그 정점보다 같거나 작은 정점들로만, 오른쪽 서브 트리는 그 정점의 값보다 큰 정점들로만 이루어져 있다.

![](image/020_010.png)

# 우선순위 큐와 힙

## 우선순위 큐의 구현 방법과 힙

### 우선순의 큐

- 우선순위가 높은 원소가 먼저 출력되는 추상적 자료형
- 출력 연산 시 가장 우선순위가 높은 원소를 출력한다.

우선순의 큐를 단순한 접근 방법으로 구현한 경우
- 입력 : O(1)
- 출력 : O(n)

우선순위가 가장 높은 원소를 탖는 과정과, 그 원소를 제거하는 것이 비효율 적이다.

### 힙

- 최솟값 또는 최댓값을 빠르게 찾기 위해 고안된 완전 이진 트리

- 최대 힙(Max Heap)
  - 부모 노드는 항상 자식 노드보다 큰 값을 갖고 있다.
- 최소 힙(Min Heap)
  - 부모 노드는 항상 자식 노드보다 작은 값을 갖고 있다.

```python
    import heapq
```
파이썬의 heapq 모듈로 최소 힙을 사용할 수 있다.

최대 힙이 필요한 경우에는 값을 저장할 때 -1을 곱한 값을 저장하면 된다.

-1을 곱함으로서 최댓값과 최솟값이 반전 된다는 점을 이용한다.

단, 이 방법은 힙이 저장하는 값이 수(number) 일 때만 유효하다.

### 자료 입력하기

힙은 완전 이진 트리의 특성을 유지해야 한다.
따라서 입력된 자료는 
