## 자료구조 : 트리

### 1. 트리(Tree) 란
- 트리: Node와 Branch를 이용해서, 사이클을 이루지 않도록 구성한 데이터 구조

### 2. 트리 관련 용어
- Node: 트리에서 데이터를 저장하는 기본 요소 (데이터와 다른 연결된 노드에 대한 Branch 정보 포함)
- Root Node: 트리 맨 위에 있는 노드
- Level: 최상위 노드를 Level 0으로 하였을 때, 하위 Branch로 연결된 노드의 깊이를 나타냄
- Parent Node: 어떤 노드의 다음 레벨에 연결된 노드
- Child Node: 어떤 노드의 상위 레벨에 연결된 노드
- Leaf Node (Terminal Node): Child Node가 하나도 없는 노드
- Sibling (Brother Node): 동일한 Parent Node를 가진 노드
- Depth: 트리에서 Node가 가질 수 있는 최대 Level
<img src="https://www.fun-coding.org/00_Images/tree.png" width=500 />

### 3. 이진 트리와 이진 탐색 트리(Binary Search Tree)
- 이진 트리: 노드의 최대 Branch가 2인 트리
- 이진 탐색 트리 (Binary Search Tree, BST): 이진 트리에 다음과 같은 추가적인 조건이 있는 트리
  - 왼쪽 노드는 해당 노드보다 작은 값, 오른쪽 노드는 해당 노드보다 큰 값을 가지고 있음!
  
<img src="https://www.mathwarehouse.com/programming/images/binary-search-tree/binary-search-tree-insertion-animation.gif" />  

### 4. 이진 탐색 트리의 장점과 사용성
- 사용성: 데이터 검색(탐색) 
- 장점: 탐색 속도를 개선할 수 있음
<br><br>
- 이진트리의 탐색 vs 정렬된 배열에서의 탐색
<img src="https://www.mathwarehouse.com/programming/images/binary-search-tree/binary-search-tree-sorted-array-animation.gif" width=400/>

### 5. BST 구현하기 전략

### 5.1. 노드 클래스 만들기

In [46]:
class Node:
    def __init__(self, data):
        self.data = data
        self.left = None
        self.right = None

### 5.2. 데이터 삽입
* 목적: 이진 탐색 트리 조건에 부합하게 데이터 넣기
<br><br>
* 루트 노드부터 값 비교하며 적절한 위치 찾기
* 조건에 부합하고, 노드도 없다면 삽입하기

### 5.3. 데이터 탐색
* Pre-order Traversal (선위 순회) : 부모 노드를 먼저 방문

* 찾고자 하는 값과 비교하며 트리 타기
* 찾고자 하는 값과 같다면 True, 트리에 없다면 False

### 5.4. 데이터 삭제

* 매우 복잡함. **경우를 나눌 것!**

#### 5.4.1. 삭제할 Node 탐색
- 삭제할 Node가 없는 경우 처리하기
  - 리턴하여 함수를 종료 시키기

#### 5.4.2. Case1: 삭제할 노드의 Child Node 가 없는 경우 ( = 삭제할 노드가 Leaf Node일 경우)
* 바로 해당 Node 삭제
<img src="https://www.fun-coding.org/00_Images/tree_remove_leaf_code.png" width="400" />

#### 5.4.3. Case2: 삭제할 노드의 Child Node 가 1개일 경우
* 삭제할 노드의 Parent Node가 삭제할 Node의 Child Node를 가리키도록 한다.

<img src="https://www.fun-coding.org/00_Images/tree_remove_1child_code.png" width=300 />

#### 5.4.4. Case3: 삭제할 Node의 Child Node가 2개일 경우

방법1. **삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 삭제할 Node의 Parent Node가 가리키도록 한다.** (선택)<br>
방법2. 삭제할 Node의 왼쪽 자식 중, 가장 큰 값을 삭제할 Node의 Parent Node가 가리키도록 한다.

- 삭제할 Node의 오른쪽 자식 선택
- 오른쪽 자식의 가장 왼쪽에 있는 Node를 선택
<br><br>
- Parent Node의 위치 변화가 있을 경우
    - 만약 선택된 Node가 오른쪽 Child Node를 가지고 있을 경우
        - 선택된 Node의 Parent Node의 왼쪽 Branch가 이 오른쪽 Child Node를 가리키게 함
    - 선택된 Node의 오른쪽 Branch가 삭제할 Node의 오른쪽 Child Node를 가리키게 함
<br><br>
- 선택된 Node의 왼쪽 Branch가 삭제할 Node의 왼쪽 Child Node를 가리키게 함
- 선택된 Node를 삭제 노드 자리에 두기 (= 삭제할 Node의 Parent Node의 왼쪽 Branch가 선택된 Node를 가리키게 함)

<img src="https://www.fun-coding.org/00_Images/tree_remove_2child_code_left.png" width="400" />
<img src="https://www.fun-coding.org/00_Images/tree_remove_2child_code_right.png" width="400" />

### 6. BST 전체 코드 구현하기
- 참고: http://ejklike.github.io/2018/01/09/traversing-a-binary-tree-1.html

In [131]:
class Node:
    def __init__(self, data):
        self.data = data
        self.left = None
        self.right = None

class BinarySearchTree:
    def __init__(self, root):
        self.root = root
    
    def insert(self, data):
        self.current_node = self.root
        
        while True:
            if data < self.current_node.data:
                if self.current_node.left != None:
                    self.current_node = self.current_node.left
                else: # data가 들어갈 자리 찾음
                    self.current_node.left = Node(data)
                    break
            else:
                if self.current_node.right != None:
                    self.current_node = self.current_node.right
                else: # data가 들어갈 자리 찾음
                    self.current_node.right = Node(data)
                    break
    
    def search(self, data):
        self.current_node = self.root
        
        while self.current_node:
            if self.current_node.data == data:
                return True
            elif data < self.current_node.data:
                self.current_node = self.current_node.left
            else:
                self.current_node = self.current_node.right
        return False
    

    def delete(self, node, key):
        
        deleted = False
        
        # 삭제할 노드가 존재하지 않을 때
        if node == None:
            return node

        # 삭제할 노드 값이 key(삭제 하고자 하는 값)와 같을 때
        if node.data == key:
            deleted = True
            
            # 삭제할 노드가 child node를 2개 가지고 있을 경우 
            if node.left and node.right:
                
                # 삭제할 노드의 오른쪽 자식 중, 가장 왼쪽에 있는 node 찾기 (삭제 노드 자리를 대체할 가장 작은 값의 노드 찾기)
                parent = node
                child = node.right
                
                while child.left != None:
                    parent = child
                    child = child.left
                    
                # parent의 변화가 있을 경우
                if parent != node:
                    # 선택된 노드가 오른쪽 노드를 가질 경우, parent의 왼쪽으로 연결
                    if child.right != None:
                        parent.left = child.right
                    
                    # 선택된 노드를 삭제할 노드의 오른쪽 노드와 연결
                    child.right = node.right
                
                # 선택된 노드를 삭제할 노드의 왼쪽 노드와 연결
                child.left = node.left
                
                # 선택된 노드를 삭제 노드 자리에 두기
                node = child
                
            # 삭제할 노드가 child node를 1개 가지고 있을 경우
            elif node.left or node.right:
                node = node.left or node.right
            # 삭제할 노드가 leaf 노드일 경우 
            else:
                node = None
        # key(삭제하고자 하는 값)가 노드의 값보다 작을 때 
        elif key < node.data:
            node.left = self.delete(node.left, key)
        # key(삭제하고자 하는 값)가 노드의 값보다 클 때 
        else:
            node.right = self.delete(node.right, key)
        
        return node

### 6. BST 전체 코드 TEST

In [128]:
# parent 변화 없는 경우
root = Node(10)
bst = BinarySearchTree(root)

bst.insert(5)
bst.insert(15)
bst.insert(3)
bst.insert(7)
bst.insert(8)

bst.delete(root, 5)

<__main__.Node at 0x10b0a0590>

In [130]:
bst.search(3)

True

In [132]:
# parent 변화 있고, 선택된 노드의 오른쪽 자식도 있는 경우
root2 = Node(31)
bst2 = BinarySearchTree(root2)

bst2.insert(15)
bst2.insert(41)
bst2.insert(13)
bst2.insert(18)
bst2.insert(16)
bst2.insert(19)
bst2.insert(17)

bst2.delete(root, 15)

<__main__.Node at 0x10b088690>

In [133]:
bst.search(15)

False

In [19]:
# 0 ~ 999 숫자 중에서 임의로 100개를 추출해서, 이진 탐색 트리에 입력, 검색, 삭제
import random

# 0 ~ 999 중, 100 개의 숫자 랜덤 선택
bst_nums = set()
while len(bst_nums) != 100:
    bst_nums.add(random.randint(0, 999))
# print (bst_nums)

# 선택된 100개의 숫자를 이진 탐색 트리에 입력, 임의로 루트노드는 500을 넣기로 함
head = Node(500)
binary_tree = NodeMgmt(head)
for num in bst_nums:
    binary_tree.insert(num)
    
# 입력한 100개의 숫자 검색 (검색 기능 확인)
for num in bst_nums:
    if binary_tree.search(num) == False:
        print ('search failed', num)

# 입력한 100개의 숫자 중 10개의 숫자를 랜덤 선택
delete_nums = set()
bst_nums = list(bst_nums)
while len(delete_nums) != 10:
    delete_nums.add(bst_nums[random.randint(0, 99)])

# 선택한 10개의 숫자를 삭제 (삭제 기능 확인)
for del_num in delete_nums:
    if binary_tree.delete(del_num) == False:
        print('delete failed', del_num)

### 7. 이진 탐색 트리(BST) 분석 

#### 7.1. 시간 복잡도
  - 탐색 시간 복잡도: $ O(log{n}) $
       - 한번 실행될 때마다, 실행할 명령 50% 제거. 즉, 50%의 실행시간을 단축시킬 수 있음 
<img src="https://www.mathwarehouse.com/programming/images/binary-search-tree/binary-search-tree-sorted-array-animation.gif" width=400/>

#### 7.2. 이진 탐색 트리 단점
  - **트리가 균형 잡혀 있을 때**, 평균 시간 복잡도: $ O(log{n}) $ 
  - 최악의 경우 링크드 리스트와 동일한 성능: $O(n)$ 
<img src="https://www.fun-coding.org/00_Images/worstcase_bst.png" width="200" />