# 7. 트리 (Tree)

## 7.1 트리 (Tree) 구조

- Node와 Branch를 이용해서 사이클을 이루지 않도록 구성한 데이터 구조

<br>

### 7.1.1 트리가 많이 사용되는 경우

- 트리 중 이진 트리(Binary Tree) 형태의 구조로, 탐색(검색) 알고리즘 구현을 위해 많이 사용됨

<br>

## 7.2 트리 관련 용어

### 7.2.1 Node

- 트리에서 데이터를 저장하는 기본 요소
- 데이터와 다른 연결된 노드에 대한 Branch 정보 포함

<br>

### 7.2.2 Root Node

- 트리 맨 위에 있는 노드

<br>

### 7.2.3 Level

- 최상위 노드를 Level 0 으로 하였을 때, 하위 Branch로 연결된 노드의 깊이를 나타냄

<br>

### 7.2.4 Parent Node

- 어떤 노드의 다음 레벨에 연결된 노드

<br>

### 7.2.5 Child Node

- 어떤 노드의 상위 레벨에 연결된 노드

<br>

### 7.2.6 Leaf Node (Terminal Node)

- Child Node가 하나도 없는 노드

<br>

### 7.2.7 Sibling (Brother Node)

- 동일한 Parent Node를 가진 노드

<br>

### 7.2.8 Depth

- 트리에서 Node가 가질 수 있는 최대 Level

<img src="img/tree.png" width="600px" />

<br>

## 7.3 이진 트리와 이진 탐색 트리 (Binary Search Tree)

### 7.3.1 이진 트리

- 노드의 최대 Branch가 2인 트리

<br>

### 7.3.2 이진 탐색 트리 (Binary Search Tree, BST)

- 이진 트리에 다음과 같은 추가적인 조건이 있는 트리
- 조건 : 왼쪽 노드는 해당 노드보다 작은 값, 오른쪽 노드는 해당 노드보다 큰 값을 가지고 있음

<img src="https://www.mathwarehouse.com/programming/images/binary-search-tree/binary-search-tree-insertion-animation.gif" />

<br>

## 7.4 자료 구조 이진 탐색 트리의 장점과 주요 용도

### 7.4.1 장점

- 탐색 속도를 개선할 수 있음

<br>

### 7.4.2 주요 용도

- 데이터 검색(탐색)

<br>

## 7.5 이진 트리와 정렬된 배열간의 탐색 비교

<img src="https://www.mathwarehouse.com/programming/images/binary-search-tree/binary-search-tree-sorted-array-animation.gif" />

<br>

## 7.6 이진 탐색 트리 구현

### 7.6.1 노드 클래스 만들기

In [1]:
class Node:
    def __init__(self, value):
        self.value = value
        self.left = None
        self.right = None

<br>

### 7.6.2 이진 탐색 트리에 데이터 넣기

- 이진 탐색 트리 조건에 부합하게 데이터를 넣어야 함

In [2]:
class NodeMgmt:
    def __init__(self, head):
        self.head = head
        
    def insert(self, value):
        self.current_node = self.head
        
        while True:
            if value < self.current_node.value:
                if self.current_node.left != None:
                    self.current_node = self.current_node.left
                else:
                    self.current_node.left = Node(value)
                    break
            else:
                if self.current_node.right != None:
                    self.current_node = self.current_node.right
                else:
                    self.current_node.right = Node(value)
                    break

In [3]:
head = Node(1)
BST = NodeMgmt(head)
BST.insert(2)

<br>

### 7.6.3 이진 탐색 트리 탐색

In [4]:
class NodeMgmt:
    def __init__(self, head):
        self.head = head
        
    def insert(self, value):
        self.current_node = self.head
        
        while True:
            if value < self.current_node.value:
                if self.current_node.left != None:
                    self.current_node = self.current_node.left
                else:
                    self.current_node.left = Node(value)
                    break
            else:
                if self.current_node.right != None:
                    self.current_node = self.current_node.right
                else:
                    self.current_node.right = Node(value)
                    break
                    
    def search(self, value):
        self.current_node = self.head
        
        while self.current_node:
            if self.current_node.value == value:
                return True
            elif value < self.current_node.value:
                self.current_node = self.current_node.left
            else:
                self.current_node = self.current_node.right
        return False

In [5]:
head = Node(1)
BST = NodeMgmt(head)
BST.insert(2)
BST.insert(3)
BST.insert(0)
BST.insert(4)
BST.insert(8)

In [6]:
BST.search(-1)

False

<br>

### 7.6.4 이진 탐색 트리 삭제

- 매우 복잡하다.
- 경우를 나누어서 이해하는 것이 좋음

<br>

#### 7.6.4.1 Leaf Node 삭제

- Leaf Node : Child Node가 없는 Node
- 삭제할 Node의 Parent Node가 삭제할 Node를 가리키지 않도록 한다.

<img src="img/remove_leaf_node.png" width="500px" />

<br>

#### 7.6.4.2 Child Node가 하나인 Node 삭제

- 삭제할 Node의 Parent Node가 삭제할 Node의 Child Node를 가리키도록 한다.

<img src="img/remove_have_one_child_node.png" width="500px" />

<br>

#### 7.6.4.3 Child Node가 두 개인 Node 삭제

1. 삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 삭제할 Node의 Parent Node가 가리키도록 한다.
  - 삭제할 Node의 오른쪽 자식 선택
  - 오른쪽 자식의 가장 왼쪽에 있는 Node를 선택
  - 해당 Node를 삭제할 Node의 Parent Node의 왼쪽 Branch가 가리키게 함
  - 해당 Node의 왼쪽 Branch가 삭제할 Node의 왼쪽 Child Node를 기리키게 함
  - 해당 Node의 오른쪽 Branch가 삭제할 Node의 오른쪽 Child Node를 가리키게 함
  - 만약 해당 Node가 오른쪽 Child Node를 가지고 있었을 경우에는 해당 Node의 본래 Parent Node의 왼쪽 Branch가 해당 오른쪽 Child Node를 가리키게 함
2. 삭제할 Node의 왼쪽 자식 중, 가장 큰 값을 삭제할 Node의 Parent Node가 가리키도록 한다.

<img src="img/remove_have_two_child_node.png" width="500px" />

<br>

### 7.6.5 이진 탐색 트리 삭제 코드 구현과 분석

#### 7.6.5.1 삭제할 Node 탐색

- 삭제할 Node가 없는 경우도 처리해야 함
- 이를 위해 삭제할 Node가 없는 경우는 False를 리턴하고 함수를 종료 시킴

```python
def delete(self, value):
    searched = False
    self.current_node = self.head
    self.parent = self.head
    
    while self.current_node:
        if self.current_node.value == value:
            searched = True
            break
        elif value < self.current_node.value:
            self.parent = self.current_node
            self.current_node = self.current_node.left
        else:
            self.parent = self.current_node
            self.current_node = self.current_node.right
            
    if searched == False:
        return False
    
    ### 이후부터 Case들을 분리해서 코드 작성
```    

<br>

#### 7.6.5.2 CASE1 : 삭제할 Node가 Leaf Node인 경우

<img src="img/case1.png" width="400px" />

```python
# self.current_node가 삭제할 Node
# self.parent는 삭제할 Node의 Parent Node인 상태
    if self.current_node.left == None and self.current_node.right == None:
        if value < self.parent.value:
            self.parent.left = None
        else:
            self.parent.right = None
        del self.current_node
```

<br>

#### 7.6.5.3 CASE2 : 삭제할 Node가 Child Node를 한 개 가지고 있을 경우

<img src="img/case2.png" width="300px" />

```python
    if self.current_node.left != None and self.current_node.right == None:
        if value < self.parent.value:
            self.parent.left = self.current_node.left
        else:
            self.parent.right = self.current_node.left
        
    elif self.current_node.left == None and self.current_node.right != None:
        if value < self.parent.value:
            self.parent.left = self.current_node.right
        else:
            self.parent.right = self.current_node.right
```

<br>

#### 7.6.5.4 CASE3-1 : 삭제할 Node가 Child Node를 두 개 가지고 있을 경우 (삭제할 Node가 Parent Node *왼쪽*에 있을 때)

- 기본 사용 가능 전략
  1. **삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 삭제할 Node의 Parent Node가 가리키도록 한다.**
  2. 삭제할 Node의 왼쪽 자식 중, 가장 큰 값을 삭제할 Node의 Parent Node가 가리키도록 한다.

- 기본 사용 가능 전략 중, **1번 전략을 사용**하여 코드를 구현하도록 함

- 경우의 수가 또 다시 두 가지가 있음
  - **CASE3-1-1**  
    - 삭제할 Node가 Parent Node의 왼쪽에 있음
    - 그리고 삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 가진 Node의 Child Node가 없을 때
  - **CASE3-1-2**
    - 삭제할 Node가 Parent Node의 왼쪽에 있음
    - 그리고 삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 가진 Node의 오른쪽에 Child Node가 있을 때
    - 가장 작은 값을 가진 Node의 Child Node가 왼쪽에 있을 경우는 없음
    - 왜냐하면 왼쪽 Node가 있다는 것은 해당 Node보다 더 작은 값을 가진 Node가 있다는 뜻이기 때문이다.

<img src="img/case3-1.png" width="400px" />

```python
    if self.current_node.left != None and self.current_node.right != None: # case3
        if value < self.parent.value: # case3-1
            self.change_node = self.current_node.right
            self.change_node_parent = self.current_node.right
            
            while self.change_node.left != None:
                self.change_node_parent = self.change_node
                self.change_node = self.change_node.left
            
            if self.change_node.right != None:
                self.change_node_parent.left = self.change_node.right
            else:
                self.change_node_parent.left = None
            
            self.parent.left = self.change_node
            self.change_node.right = self.current_node.right
            self.change_node.left = self.change_node.left
```

<br>

#### 7.6.5.5 CASE3-2 : 삭제할 Node가 Child Node를 두 개 가지고 있을 경우 (삭제할 Node가 Parent Node *오른쪽*에 있을 때)

- 기본 사용 가능 전략
  1. **삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 삭제할 Node의 Parent Node가 가리키도록 한다.**
  2. 삭제할 Node의 왼쪽 자식 중, 가장 큰 값을 삭제할 Node의 Parent Node가 가리키도록 한다.

- 기본 사용 가능 전략 중, **1번 전략을 사용**하여 코드를 구현하기로 함

- 경우의 수가 또 다시 두 가지가 있음
  - **CASE3-2-1**
    - 삭제할 Node가 Parent Node의 오른쪽에 있음
    - 그리고 삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 가진 Node의 Child Node가 없을 때
  - **CASE3-2-2**
    - 삭제할 Node가 Parent Node의 오른쪽에 있음
    - 그리고 삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 가진 Node의 오른쪽에 Child Node가 있을 때
    - 가장 작은 값을 가진 Node의 Child Node가 왼쪽에 있을 경우는 없음
    - 왜냐하면 왼쪽 Node가 있다는 것은 해당 Node보다 더 작은 값을 가진 Node가 있다는 뜻이기 때문

<img src="img/case3-2.png" width="400px" />

```python
    else:
        self.change_node = self.current_node.right
        self.change_node_parent = self.current_node.right
        
        while self.change_node.left != None:
            self.change_node_parent = self.change_node
            self.change_node = self.change_node.left
            
        if self.change_node.right != None:
            self.change_node_parent.left = self.change_node.right
        else:
            self.change_node_parent.left = None
            
        self.parent.right = self.change_node
        self.change_node.left = self.current_node.left
        self.change_node.right = self.current_node.right
```

<br>

#### 7.6.5.6 파이썬 전체 코드 구현

In [13]:
class Node:
    def __init__(self, value):
        self.value = value
        self.left = None
        self.right = None
        
class NodeMgmt:
    def __init__(self, head):
        self.head = head
        
    def insert(self, value):
        
        self.current_node = self.head
        
        while True:
            if value < self.current_node.value:
                if self.current_node.left != None:
                    self.current_node = self.current_node.left
                else:
                    self.current_node.left = Node(value)
                    break
            else:
                if self.current_node.right != None:
                    self.current_node = self.current_node.right
                else:
                    self.current_node.right = Node(value)
                    break
                    
    def search(self, value):
        
        self.current_node = self.head
        
        while self.current_node:
            if self.current_node.value == value:
                return True
            elif value < self.current_node.value:
                self.current_node = self.current_node.left
            else:
                self.current_node = self.current_node.right
                
        return False
    
    def delete(self, value):
        
        # 삭제할 노드 탐색
        searched = False
        self.current_node = self.head
        self.parent = self.head
        
        while self.current_node:
            if self.current_node.value == value:
                searched = True
                break
            elif value < self.current_node.value:
                self.parent = self.current_node
                self.current_node = self.current_node.left
            else:
                self.parent = self.current_node
                self.current_node = self.current_node.right
        
        if searched == False:
            return False
        
        # case1 : current_node가 leaf Node인 경우
        if self.current_node.left == None and self.current_node.right == None:
            if value < self.parent.value:
                self.parent.left = None
            else:
                self.parent.right = None
                
        # case2 : current_node의 Child Node가 1개만 존재할 경우
        # case2-1 : current_node의 왼쪽 Node만 존재할 경우
        elif self.current_node.left != None and self.current_node.right == None:
            if value < self.parent.value:
                self.parent.left = self.current_node.left
            else:
                self.parent.right = self.current_node.left
        
        # case2-2 : current_node의 오른쪽 Node만 존재할 경우
        elif self.current_node.left == None and self.current_node.right != None:
            if value < self.parent.value:
                self.parent.left = self.current_node.right
            else:
                self.parent.right = self.current_node.right
        
        # case3 : current_node의 Child Node가 2개 존재할 경우
        elif self.current_node.left != None and self.current_node.right != None:
            # case3-1
            if value < self.parent.value:
                self.change_node = self.current_node.right
                self.change_node_parent = self.current_node.right
                
                while self.change_node.left != None:
                    self.change_node_parent = self.change_node
                    self.change_node = self.change_node.left
                
                if self.change_node.right != None:
                    self.change_node_parent.left = self.change_node.right
                else:
                    self.change_node_parent.left = None
                
                self.parent.left = self.change_node
                self.change_node.right = self.current_node.right
                self.change_node.left = self.change_node.left
                
            # case3-2
            else:
                self.change_node = self.current_node.right
                self.change_node_parent = self.current_node.right
                
                while self.change_node.left != None:
                    self.change_node_parent = self.change_node
                    self.change_node = self.change_node.left
                    
                if self.change_node.right != None:
                    self.change_node_parent.left = self.change_node.right
                else:
                    self.change_node_parent.left = None
                    
                self.parent.right = self.change_node
                self.change_node.right = self.current_node.right
                self.change_node.left = self.current_node.left
                
        return True

참고: [http://ejklike.github.io/2018/01/09/traversing-a-binary-tree-1.html](http://ejklike.github.io/2018/01/09/traversing-a-binary-tree-1.html)

<br>

#### 7.6.5.7 파이썬 전체 코드 테스트

- `random` 라이브러리 활용
- `random.randint(첫번째 숫자, 마지막 숫자)`
  - 첫 번째 숫자부터 마지막 숫자 사이에 있는 숫자를 랜덤하게 선택해서 리턴
  - ex) `random.randint(0, 99)`  
  : 0에서 99까지 숫자 중 특정 숫자를 랜덤하게 선택해서 리턴해줌

In [11]:
# 0 ~ 999 숫자 중에서 임의로 100개를 추출해서
# 이진 탐색 트리에 입력, 검색, 삭제
import random

# 0 ~ 999 중, 100개의 숫자 랜덤 선택
bst_nums = set()

while len(bst_nums) != 100:
    bst_nums.add(random.randint(0, 999))
    
print(bst_nums)

{521, 522, 524, 13, 532, 33, 40, 48, 51, 567, 60, 64, 576, 70, 72, 585, 77, 80, 88, 601, 92, 610, 113, 631, 647, 136, 650, 139, 657, 662, 164, 167, 174, 695, 696, 187, 701, 190, 704, 705, 710, 203, 717, 719, 208, 722, 729, 217, 734, 757, 758, 761, 763, 256, 769, 779, 786, 275, 790, 279, 283, 796, 284, 795, 800, 810, 309, 310, 823, 319, 833, 834, 321, 840, 845, 335, 348, 354, 871, 879, 882, 374, 379, 389, 907, 910, 398, 417, 421, 941, 949, 437, 956, 465, 478, 483, 493, 495, 496, 509}


In [14]:
# 선택된 100개의 숫자를 이진 탐색 트리에 입력
# 임의로 루트노드는 500을 넣기로 함
head = Node(500)
binary_tree = NodeMgmt(head)

for num in bst_nums:
    binary_tree.insert(num)

In [16]:
# 입력한 100개의 숫자 중 10개의 숫자를 랜덤 선택
delete_nums = set()
bst_nums = list(bst_nums)
while len(delete_nums) != 10:
        delete_nums.add(bst_nums[random.randint(0, 99)])
        
delete_nums

{217, 335, 483, 576, 585, 657, 710, 719, 734, 907}

In [17]:
# 선택한 10개의 숫자를 삭제 (삭제 기능 확인)
for del_num in delete_nums:
    if binary_tree.delete(del_num) == False:
        print('delete failed', del_num)

<br>

## 7.7 이진 탐색 트리의 시간 복잡도와 단점

### 7.7.1 시간 복잡도 (탐색 시)

- depth(트리의 높이)를 $h$라고 표기한다면,  
$\Rightarrow$ 시간복잡도 : $O(h)$

- $n$개의 노드를 가진다면 $h = log_2{n}$에 가까우므로,  
$\Rightarrow$ 시간복잡도 : $O(log{n})$

- (참고) 빅오 표기법에서 $log n$에서의 $log$의 밑은 10이 아니라 2이다.
  - 한 번 실행시마다, 50%의 실행할 수도 있는 명령을 제거한다는 의미
  - 즉, 50%의 실행시간을 단축시킬 수 있다는 것을 의미함

<img src="https://www.mathwarehouse.com/programming/images/binary-search-tree/binary-search-tree-sorted-array-animation.gif" />

<br>

### 7.7.2 이진 탐색 트리 단점

- 평균 시간 복잡도는 $O(log n)$이다.
- 하지만 이는 트리가 균형잡혀 있을 때의 평균 시간 복잡도이다.
- 다음 예와 같이 구성되어 있을 경우, 최악의 경우는 링크드 리스트 등과 동일한 성능을 보여준다. (즉, 최악의 시간 복잡도는 $O(n)$이다.)

<img src="img/worst_tree.png" width="300px" />