### 1. Tree 구조

- 트리: Node와 Branch를 이용해서, 사이클을 이루지 않도록 구성한 데이터 구조
- 실제로 어디에 많이 사용하는가?
    - Binary Tree의 구조로, 탐색(검색) 알고리즘 구현을 위해 많이 사용됨
    
### 2. 알아둘 용어

- Node: 데이터를 저장하는 기본 요소(데이터와 다른 연결된 node에 대한 Branch 정보 필요)
- Root Node: 맨 위에 있는 Node
- Level: Root node(맨 위)의 Level은 0으로, 하위 Branch로 연결된 Node의 길이르 나타냄
- Parent, Child Node: 해당 노드의 상위 혹은 하위 노드
- Leaf Node: Child Node가 없는 Node
- Sibling: Nodes with Same parent node
- Depth: Node의 최대 Levle

### 3. 이진 트리와 이진 탐색 트리(BST)

- 이진 트리: 노드의 최대 branch가 최대 2인 트리
- 이진 탐색 트리: 다음 조건이 추가된 이진 트리
    - 왼쪽 노드는 해당 노드보다 작은 값, 오른쪽 노드는 해당 노드보다 큰 값을 가지고 있음!
    
### 4. 자료 구조 이진 탐색 트리의 장점과 주요 용도

- 주요 용도: 데이터 검색(탐색)
- 장점: 탐색 속도를 개선할 수 있음

### 5. 링크드 리스트로 이진 탐색 트리 구현하기
##### 5.1. 노드 클래스 만들기

In [35]:
class Node:
    def __init__(self, value):
        self.value = value
        self.left = None
        self.right = None

##### 5.2. 데이터 넣기

In [36]:
class NodeMgmt:
    def __init__(self, head):
        self.head = head
        
    def insert(self, value):
        self.current_node = self.head
        while True:
            if value < self.current_node.value:
                if self.current_node.left == None:
                    self.current_node.left = Node(value)
                    break
                else:
                    self.current_node = self.current_node.left
            else:
                if self.current_node.right == None:
                    self.current_node.right = Node(value)
                    break
                else:
                    self.current_node = self.current_node.right                    

In [37]:
head = Node(1)
bst = NodeMgmt(head)
bst.insert(2)

##### 5.3 이진 탐색 트리 탐색

In [38]:
class NodeMgmt:
    def __init__(self, head):
        self.head = head
        
    def insert(self, value):
        self.current_node = self.head
        while True:
            if value < self.current_node.value:
                if self.current_node.left == None:
                    self.current_node.left = Node(value)
                    break
                else:
                    self.current_node = self.current_node.left
            else:
                if self.current_node.right == None:
                    self.current_node.right = Node(value)
                    break
                else:
                    self.current_node = self.current_node.right
                    
    def search(self, value):
        self.current_node = self.head
        while self.current_node:
            if self.current_node.value == value:
                return True
            elif self.current_node.value > value:
                self.current_node = self.current_node.left
            else:
                self.current_node = self.current_node.right
        return False

In [39]:
head = Node(1)
bst = NodeMgmt(head)
bst.insert(2)
bst.insert(10)
bst.insert(-10)

In [40]:
bst.search(10), bst.search(2), bst.search(-10), bst.search(1)

(True, True, True, True)

In [41]:
bst.search(-100), bst.search(3), bst.search(4)

(False, False, False)

##### 5.4. 이진 탐색 트리 삭제

- 5.4.1. delete leaf node
- 5.4.2. delete node with one child node
- 5.4.3. delete node with two child nodes
    - **삭제할 노드의 오른쪽 자식 중, 가장 작은 값을 삭제할 노드의 parent node가 가리키도록 한다.**
    - 삭제할 노드의 왼쪽 자식 중, 가장 큰 값 값을 삭제할 노드의 parent node가 가리키도록 한다.

In [42]:
class NodeMgmt:
    def __init__(self, head):
        self.head = head
        
    def insert(self, value):
        self.current_node = self.head
        while True:
            if value < self.current_node.value:
                if self.current_node.left == None:
                    self.current_node.left = Node(value)
                    break
                else:
                    self.current_node = self.current_node.left
            else:
                if self.current_node.right == None:
                    self.current_node.right = Node(value)
                    break
                else:
                    self.current_node = self.current_node.right
                    
    def search(self, value):
        self.current_node = self.head
        while self.current_node:
            if self.current_node.value == value:
                return True
            elif self.current_node.value > value:
                self.current_node = self.current_node.left
            else:
                self.current_node = self.current_node.right
        return False

    def delete(self, value):
        # search deleting node
        searched = False
        self.current_node = self.head
        self.parent = self.head
        while self.current_node:
            if self.current_node.value == value:
                searched = True
                break
            elif self.current_node.value > value:
                self.parent = self.current_node
                self.current_node = self.current_node.left
            else:
                self.parent = self.current_node
                self.current_node = self.current_node.right

        if searched == False:
            return False

        # Start deleting
        ## 5.4.1. current node: leaf node
        if self.current_node.left == None and self.current_node.right == None:
            if value < self.current_node.value:
                self.parent.left = None
            else: 
                self.parent.right = None
            del self.current_node

        ## 5.4.2 current node: one child node at left
        elif self.current_node.left != None and self.current_node.right == None:
            if value < self.parent.value: # left 
                self.parent.left = self.current_node.left
            else:
                self.parent.right = self.current_node.left

        ## 5.4.2 current node: one child node at right
        elif self.current_node.left == None and self.current_node.right != None:
            if value < self.parent.value:
                self.parent.left = self.current_node.right
            else:
                self.parent.right = self.current_node.right

        ## 5.4.3 current node: two child node 
        elif self.current_node.left != None and self.current_node.right != None:

            # current node is on the left side from parent node
            if value < self.parent.value:
                self.change_node = self.current_node.right
                self.change_node_parent = self.current_node.right
                while self.change_node.left != None: # get the smallest value
                    self.change_node_parent = self.change_node
                    self.change_node = self.change_node.left

                if self.change_node.right != None:
                    self.change_node_parent.left = self.change_node.right
                else:
                    self.change_node_parent.left = None

                self.parent.left = self.change_node
                self.change_node.right = self.current_node.right
                self.change_node.left = self.change_node.left

            # current node is on the right side from parent node
            else:
                self.change_node = self.current_node.right
                self.change_node_parent = self.current_node.right
                while self.change_node.left != None: # get the smallest value
                    self.change_node_parent = self.change_node
                    self.change_node = self.change_node.left

                if self.change_node.right != None:
                    self.change_node_parent.left = self.change_node.right
                else:
                    self.change_node_parent.left = None

                self.parent.right = self.change_node
                self.change_node.left = self.current_node.left
                self.change_node.right = self.current_node.right

In [43]:
# Testing
import random

# select 100 random int from 0 to 999
bst_nums = set()
while len(bst_nums) != 100:
    bst_nums.add(random.randint(0, 999))

root = Node(500)
tree = NodeMgmt(root)

for num in bst_nums:
    tree.insert(num)

# check
for num in bst_nums:
    if tree.search(num) == False:
        print("Failed")

In [44]:
print(bst_nums, len(bst_nums))

{512, 513, 519, 29, 542, 35, 42, 556, 51, 574, 578, 78, 602, 109, 111, 115, 629, 635, 128, 640, 643, 649, 143, 657, 153, 666, 679, 702, 192, 706, 709, 214, 218, 734, 740, 232, 234, 749, 767, 779, 785, 277, 790, 793, 794, 795, 797, 290, 291, 810, 299, 814, 303, 310, 311, 318, 833, 837, 325, 326, 840, 331, 340, 852, 855, 859, 860, 351, 864, 355, 869, 874, 364, 876, 883, 884, 373, 894, 901, 395, 416, 420, 934, 423, 432, 440, 953, 446, 967, 456, 968, 457, 471, 987, 476, 989, 992, 483, 485, 505} 100


In [45]:
delete_nums = set()
bst_nums = list(bst_nums)
while len(delete_nums) != 10:
    delete_nums.add(bst_nums[random.randint(0,99)])

In [46]:
print(delete_nums, len(delete_nums))

{128, 355, 968, 299, 364, 395, 855, 602, 476, 351} 10


In [49]:
for num in delete_nums:
    tree.delete(num)

for num in delete_nums:
    print(tree.search(num))

False
False
False
False
False
False
False
False
False
False


### 6. 이진 탐색 트리의 시간 복잡도와 단점

##### 6.1. 시간 복잡도 (탐색시)

- depth를 h로 표기한다면 O(h)
- n개의 노드를 가진다면, h = $log_2(n)$ 에 가까우므로, O(logn)

##### 6.2. 단점

- 평균 시간 복잡도는 O(logn) 이지만 최악의 경우 링크드 리스트와 동일한 성능을 보여, O(n)
