# Tree
## 트리(Tree) 구조

- 트리: Node와 Branch를 이용해서, 사이클을 이루지 않도록 구성한 데이터 구조
- 실제로 어디에 많이 사용되나?
    - 트리 중 이진트리 (Binary Tree) 형태의 구조로, 탐색 알고리즘 구현을 위해 많이 사용함

## 알아둘 용어

- Node: 트리에서 데이터를 저장하는 기본 요소(데이터와 다른 연결된 노드에 대한 Branch 정보 포함)
- Root Node: 트리 맨 위에 있는 노드
- Level: 최상위 노드를 Level 0으로 하였을 때, 하위 Branch로 연결된 노드의 깊이를 나타냄
- Parent None: 어떤 노드의 다음 레벨에 연결된 노드
- Chile Node: 어떤 노드의 상위 레벨에 연결된 노드
- Leaf Node(Terminal Node): Child Node가 하나도 없는 노드
- Sibling: 동일한 Parent Node를 가지는 노드
- Depth: 트리에서 Node가 가질 수 있는 최대 Level

## 이진 트리와 이진 탐색 트리(Binary Search Tree)
- 이진 트리: 노드의 최대 Branch가 2인 트리
- 이진 탐색 트리(Binary Search Tree, BST): 이진 트리에 다음과 같은 추가적인 조건이 있는 트리
    - 왼쪽 노드는 해당 노드보다 작은 값, 오른쪽 노드는 해당 노드보다 큰 값을 가지고 있음

## 자료 구조 이진 탐색 트리의 장점과 주요 용도
- 주요 용도: 데이터 검색(탐색)
- 장점: 탐색 속도를 개선할 수 있음

## 트리 구현하기


In [2]:
class Node():
    def __init__(self, value):
        self.value = value
        self.left = None
        self.right = None

In [2]:
class MyBST():
    def __init__(self, head):
        self.head = head
    
    def insert(self, value):
        self.current_node = self.head
        while True:
            if self.current_node.value > value:
                if self.current_node.left != None:
                    self.current_node = self.current_node.left
                else:
                    self.current_node.left = Node(value)
                    break
            else:
                if self.current_node.right != None:
                    self.current_node = self.current_node.right
                else:
                    self.current_node.right = Node(value)
                    break

    def search(self, value):
        self.current_node = self.head
        while self.current_node:
            if self.current_node.value == value:
                return True
            elif self.current_node.value > value:
                self.current_node = self.current_node.left
            else:
                self.current_node = self.current_node.right
        return False


In [3]:
head = Node(10)
bst = MyBST(head)

In [4]:
bst.insert(1)
bst.insert(3)
bst.insert(15)
bst.insert(11)

In [11]:
print([bst.search(n) for n in [1, 2, 3, 4, 10, 11, 15]])

[True, False, True, False, True, True, True]


### Node 삭제의 경우 복잡하므로 경우의 수를 나누어 생각하는 것이 좋다.
- Leaf node인 경우
    - 해당 node를 삭제하고 해당 node를 가리키고 있는 parent node의 left 혹은 right이 None을 가리키게 한다.
- Child node가 하나인 경우
    - 해당 node를 삭제하고 parent node의 left 혹은 right를 해당 node의 child를 가리키게 한다.
- Child node가 2개인 경우
    - 해당 노드의 오른쪽 자식 중, 가장 작은 값을 삭제할 node의 parent node가 가리키도록 한다.
    - 해당 노드의 왼쪽 자식 중, 가장 큰 값을 삭제할 node의 parent node가 가리키도록 한다.


In [143]:
class MyBST():
    def __init__(self, head):
        self.head = head
    
    def insert(self, value):
        self.current_node = self.head
        while True:
            if self.current_node.value > value:
                if self.current_node.left != None:
                    self.current_node = self.current_node.left
                else:
                    self.current_node.left = Node(value)
                    break
            else:
                if self.current_node.right != None:
                    self.current_node = self.current_node.right
                else:
                    self.current_node.right = Node(value)
                    break

    def search(self, value):
        self.current_node = self.head
        while self.current_node:
            if self.current_node.value == value:
                return True
            elif self.current_node.value > value:
                self.current_node = self.current_node.left
            else:
                self.current_node = self.current_node.right
        return False

    def delete(self, value):
        searched = False
        self.current_node = self.head
        self.parent = self.head
        while self.current_node:
            if self.current_node.value == value:
                searched = True
                break
            elif self.current_node.value > value:
                self.parent = self.current_node
                self.current_node = self.current_node.left
            else:
                self.parent = self.current_node
                self.current_node = self.current_node.right
        if searched == False:
            return False
        
        # current_node 가 leaf node인 경우
        
        if self.current_node.left == None and self.current_node.right == None:
            if self.parent.value > value:
                self.parent.left = None
            else:
                self.parent.right = None
            del self.current_node
            
        # current_node의 child node가 하나 있는 경우
        elif self.current_node.left != None and self.current_node.right == None:
            if self.parent.value > value:
                self.parent.left = self.current_node.left
            else:
                self.parent.right = self.current_node.left
            del self.current_node
            
        elif self.current_node.left == None and self.current_node.right != None:
            if self.parent.value > value:
                self.parent.left = self.current_node.right
            else:
                self.parent.right = self.current_node.right
            del self.current_node
            
        # current_node의 child node가 둘 다 있는 경우
        elif self.current_node.left != None and self.current_node.right != None:
            if self.parent.value > value:
                self.change_node = self.current_node.right
                self.change_node_parent = self.current_node
                while self.change_node.left:
                    self.change_node_parent = self.change_node
                    self.change_node = self.change_node.left
                    
                if self.change_node == self.current_node.right: # 반례 부분
                        self.change_node.left = self.current_node.left
                        self.parent.left = self.change_node
                        return
                
                if self.change_node.right != None:
                    self.change_node_parent.left = self.change_node.right
                else:
                    self.change_node_parent.left = None
                self.parent.left = self.change_node
                self.change_node.left = self.current_node.left
                self.change_node.right = self.current_node
                
            else:
                self.change_node = self.current_node.right
                self.change_node_parent = self.current_node.right
                while self.change_node.left:
                    self.change_node_parent = self.change_node
                    self.change_node = self.change_node.left
                    
                if self.change_node == self.current_node.right:
                        self.change_node.left = self.current_node.left
                        self.parent.right = self.change_node
                        return
                    
                if self.change_node.right != None:
                    self.change_node_parent.left = self.change_node.right
                else:
                    self.change_node_parent.left = None
                self.parent.right = self.change_node
                self.change_node.left = self.current_node.left
                self.change_node.right = self.current_node.right
            del self.current_node

In [264]:
# 1 ~ 1000 숫자 중에서 임의로 100개를 추출해서, 이진 탐색 트리에 입력, 검색, 삭제
import random
nums = set()
# 100개 숫자 랜덤 선택
while len(nums) != 100:
    nums.add(random.randint(1, 1000))
print(nums)

# 해당 숫자 트리에 입력 및 루트 노드는 임의로 500
bst = MyBST(Node(500))
for num in nums:
    bst.insert(num)
# 해당 숫자 트리에 있는지 검색
for num in nums:
    if bst.search(num) == False:
        print('failed search', num)
# 해당 숫자 중 임의로 10개 골라서 트리에서 삭제
nums = list(nums)
delete_nums = set()
while len(delete_nums) != 10:
    delete_nums.add(nums[random.randint(0, 99)])
for num in delete_nums:
    print(num)
    if bst.delete(num) == False:
        print('failed delete', num)


{516, 519, 9, 531, 550, 54, 582, 584, 84, 597, 87, 599, 96, 105, 619, 113, 116, 630, 121, 129, 133, 653, 143, 663, 155, 676, 178, 183, 186, 705, 711, 712, 201, 203, 720, 723, 726, 216, 734, 225, 242, 758, 761, 762, 257, 771, 260, 262, 774, 275, 277, 796, 287, 799, 292, 296, 302, 311, 826, 837, 842, 847, 335, 339, 344, 857, 351, 866, 357, 876, 365, 885, 891, 893, 383, 388, 389, 906, 908, 911, 912, 917, 413, 927, 424, 942, 436, 449, 965, 976, 978, 979, 466, 474, 992, 994, 486, 487, 499, 511}
225
866
389
550
965
619
876
335
726
311


In [102]:
bst.head.right.right.right.value

562

### 이진 탐색 트리의 시간 복잡도와 단점

#### 시간 복잡도 (탐색시)

- depth를 h라고 표기한다면, $O(h)$
- n개의 노드를 가진다면, $h = log_2{n}$ 에 가까우므로 $O(logn)$
    - 한번 실행시마다, 50%의 실행할 수도 있는 명령을 제거한다는 의미, 즉 50%의 실행 시간을 단축 시킬 수 있다는 것을 의미함

#### 이진 탐색 트리 단점

- 평균 시간 복잡도는 $O(logn)$ 이지만, 루트 노드가 한 방향으로 치우쳐저 있는 경우 이는 링크드 리스트와 같은 구조가 되고 시간 복잡도는 $O(n)$이 된다.