## 트리
- 실제로 구현하기에 꽤 난이도가 높은 자료구조 이기 때문에 한번에 전체를 이해해서 코드로 구현하기 어려울 수 있다.
- 다만 회사 면접과 같은 때 많이 물어보는 자료구조 중 하나이다.
- Node 와 Branch 를 이용해서 사이클을 이루지 않도록 구성한 데이터 구조
- 실제로 사용되는 경우 : 이진 트리(Binary Tree) 형태의 구조로, 탐색(검색) 알고리즘 구현을 위해 많이 사용됨
    
#### 용어
- Node : 트리에서 데이터를 저장하는 기본 요소(데이터와 연결된 다른 노드에 대한 Branch 정보 포함)
- Root Node : 트리의 가장 위에 있는 노드
- Level : 최상위 노드를 Level 0 으로 하였을 때, 하위 Branch 로 연결된 노드의 깊이를 나타낸다.
- Parent Node : 어떤 노드의 다음 레벨에 연결된 노드
- Child Node : 어떤 노드의 상위 레벨에 연결된 노드
- Leaf Node(Terminal Node) : Child Node 를 하나도 가지고 있지 않은 노드
- Sibling(Brother Node) : 동일한 Parent Node 를 가진 노드
- Depth : 트리에서 Node 가 가질수 있는 최대 Level
    
    
#### 이진 트리와 이진 탐색 트리
- 이진 트리 : 노드의 최대 Branch 가 2인 트리
- 이진 탐색 트리(Binary Search Tree : BST) : 이진 트리에 다음과 같은 추가적인 조건이 있는 트리
    - 왼쪽 노드는 해당 노드보다 작은값, 오른쪽 노드는 해당 노드보다 큰 값을 가지고 있다.


#### 이진 탐색 트리의 장점과 주요 용도
- 주요 용도 : 데이터 검색(탐색)
- 장점 : 탐색 속도를 개선할 수 있다.
    - 숫자의 경우 루트 노드부터 시작하여 비교를 통해 빠르게 찾고자 하는 노드 데이터를 탐색할 수 있다.

- 이진 트리에서 각 노드는 왼쪽 Branch, 오른쪽 Branch 를 지칭하는 주소를 가지고 있다.
- 내부 구현의 경우 연결 리스트로 하면 편할것

In [1]:
# 노드 클래스 만들기
class Node:
    def __init__(self, value):
        self.value = value
        self.left = None
        self.right = None

In [4]:
# 이진 탐색 트리에 데이터 넣기
class NodeMgmt:
    def __init__(self, head):
        self.head = head
    
    def insert(self, value):
        self.current_node = self.head
        while True:
            if value < self.current_node.value: # 넣고자 하는 value 값이 현재 노드보다 크기가 작을 경우
                if self.current_node.left != None: # 현재 노드의 왼쪽에 노드가 있는지 확인한다.
                    self.current_node = self.current_node.left # 비교 대상을 현재 노드의 왼쪽 노드로 바꿔준다.
                else:
                    self.current_node.left = Node(value) # 왼쪽 노드가 존재하지 않는다면 왼쪽 노드로서 삽입해준다.
                    break
            else: # 넣고자 하는 value 값이 현재 노드와 크기가 같거나 큰 경우
                if self.current_node.right != None:
                    self.current_node = self.current_node.right
                else:
                    self.current_node.right = Node(value)
                    break
    
    # 이진 탐색 트리에 특정 노드가 있는지 없는지 확인하는 메소드
    def search(self, value):
        self.current_node = self.head # 노드를 순회해야 하기 때문에 루트 부터 시작
        while self.current_node: # 더 이상 노드가 존재하지 않아서 None 값이 반환될 경우 루프 종료
            if self.current_node.value == value:
                return True
            elif value < self.current_node.value:
                self.current_node = self.current_node.left
            else:
                self.current_node = self.current_node.right
        
        return False
            
                

In [7]:
head = Node(1)
bst = NodeMgmt(head) # 루트 노드를 세팅해준다.
bst.insert(2)
bst.insert(3)
bst.insert(0)
bst.insert(4)
bst.insert(8)

In [8]:
bst.search(8)

True

### 이진 탐색 트리에서의 삭제
- 매우 복잡하기에 나눠서 이해하는 것이 좋다.

#### Leaf Node 삭제
- Leaf Node : Child Node 가 없는 Node
- 삭제할 Node 의 Parent Node 가 삭제할 Node 를 가리키지 않도록 한다.

#### Child Node 가 하나인 Node 삭제
- 삭제할 Node 의 Parent Node 가 삭제할 Node 의 Child Node 를 가리키도록 한다.

#### Child Node 가 두 개인 Node 삭제(택1)
- 삭제할 Node 의 오른쪽 자식 중, 가장 작은 값을 삭제할 Node 의 Parent Node 가 가리키도록 한다.
    - 삭제할 Node 의 오른쪽 자식 선택
    - 오른쪽 자식의 가장 왼쪽에 있는 Node 를 선택
    - 해당 Node 를 삭제할 Node 의 Parent Node 의 왼쪽 Branch(또는 오른쪽 - 삭제할 Node 가 Parent Node 로부터 왼쪽 또는 오른쪽에 있는지에 따라 처리를 다르게 해줘야 한다.) 가 가리키게 함
    - 해당 Node 의 왼쪽 Branch 가 삭제할 Node 의 왼쪽 Child Node 를 가리키게 함
    - 해당 Node 의 오른쪽 Branch 가 삭제할 Node 의 오른쪽 Child Node 를 가리키게 함
    - 만약, 해당 Node 가 기존에 오른쪽 Child Node 를 가지고 있었을 경우 해당 Node 의 본래 Parent Node 의 왼쪽 Branch 가 해당 오른쪽 Child Node 를 가리키게 함
- 삭제할 Node 의 왼쪽 자식 중, 가장 큰 값을 삭제할 Node 의 Parent Node 가 가리키도록 한다.

#### 참고
- 위에서 Child Node 가 2개인 Node 를 삭제하는 경우와 같이 굉장히 복잡한 과정을 풀어내야 하는 경우 풀이 과정을 여러갈래로 세분화 하여 하나씩 하나씩 문제를 해결해나간다.
- 이와 같은 풀이 방법 또는 알고리즘을 분할 정복(Divide and Conquer) 라고 한다.

In [3]:
# 1. 삭제할 Node 가 있는지 탐색한다.
def delete(self, value):
    searched = False # Node 탐색 검증 변수
    self.current_node = self.head
    self.parent = self.head
    while self.current_node:
        if self.current_node.value == value:
            searched = True
            break
        elif value < current_node.value:
            self.parent = self.current_node
            self.current_node = self.current_node.left
        else:
            self.parent = self.current_node
            self.current_node = self.current_node.right
    
    # Node 를 찾지 못했을 경우
    if searched == False:
        return False
    
    # Node 를 찾았을 경우 삭제 로직 시작
    
    # case 1 : 삭제할 Node 가 Leaf Node 인 경우
    # self.current_node 가 삭제할 Node, self.parent 는 삭제할 Node 의 Parent Node 인 상태
    if self.current_node.left == None and self.current_node.right == None:
        if value < self.parent.value:
            self.parent.left = None
        else:
            self.parent.right = None
        del self.current_node
    # case 2 : 삭제할 Node 가 Child Node 를 하나 가지고 있을 경우
    # Child Node 가 왼쪽 노드를 가지고 있느냐 오른쪽 노드를 가지고 있느냐로 다시 세분화가 가능하다.
    # Child Node 가 왼쪽 노드에 있을 경우
    if self.current_node.left != None and self.current_node.right == None:
        # 삭제할 노드가 부모 노드 기준 왼쪽 노드이냐 오른쪽 노드이냐도 판별해야 한다.
        if value < self.parent.value: # 삭제할 노드의 데이터가 부모 노드의 데이터보다 작을 경우
            self.parent.left = self.current_node.left # 부모 노드의 왼쪽에 삭제할 노드의 왼쪽 Child Node 를 연결해준다.
        else: # 삭제할 노드의 데이터가 부모 노드의 데이터보다 크거나 같은 경우
            self.parent.right = self.current_node.left # 부모 노드의 오른쪽에 삭제할 노드의 왼쪽 Child Node 를 연결해준다.
    # Child Node 가 오른쪽 노드에 있을 경우    
    elif self.current_node.left == None and self.current_node.right != None:
        if value < self.parent.value:
            self.parent.left = self.current_node.right
        else:
            self.parent.right = self.current_node.right
            
    # case 3-1 : 삭제할 Node 가 Child Node 를 두개 가지고 있을 경우 (삭제할 Node 가 Parent Node 의 왼쪽에 있을 때)
    # 기본 사용가능 전략
    # 1. 삭제할 Node 의 오른쪽 자식 중, 가장 작은 값을 삭제할 Node 의 Parent Node 가 가리키도록 한다.
    # 2. 삭제할 Node 의 왼쪽 자식 중, 가장 큰 값을 삭제할 Node 의 Parent Node 가 가리키도록 한다.
    # 위의 두 전략중 1번 전략을 사용해보자.
    # 여기에서 경우의 수가 또 두 갈래로 나뉜다.
    # case 3-1-1 : 삭제할 Node 가 Parent Node 의 왼쪽에 있고, 
    # 삭제할 Node 의 오른쪽 자식중, 가장 작은 값을 가진 Node 의 Child Node 가 없을때
    # (삭제할 노드의 오른쪽에서 왼쪽 끝에 있는 노드가 Leaf Node 일때 - 오른쪽 노드를 따로 가지고 있지 않을때)
    # case 3-2-2 : 식제할 Node 가 Parent Node 의 왼쪽에 있고,
    # 삭제할 Node 의 오른쪽 자식 중, 가장 작은 값을 가진 Node 의 오른쪽에 Child Node 가 있을때
    
    if self.current_node.left != None and self.current_node.right != None: # 삭제할 노드가 두개의 노드를 가지고 있는 경우
        if value < self.parent.value: # 삭제할 노드가 부모 노드의 왼쪽에 있는 경우
            self.change_node = self.current_node.right
            self.change_node_parent = current_node.right
            
            while self.change_node.left != None: # 삭제할 노드의 오른쪽에서 가장 작은 값을 찾는다.
                self.change_node_parent = self.change_node
                self.change_node = self.change_node.left
            
            # 가장 작은 노드를 찾은 이후
            if self.change_node.right != None: # 가장 작은 노드가 오른쪽 노드를 가지고 있는 경우
                self.change_node_parent.left = self.change_node.right 
                # 오른쪽 노드를 원래 가장 작은 노드가 있던 위치로 옮겨준다.(부모 노드와의 연결)
            else: # 오른쪽 노드를 가지고 있지 않은 경우
                 self.change_node_parent.left = None 
                    # 가장 작은 노드의 부모 노드와의 연결을 끊어준다.
                    #(삭제한 노드의 위치로 올려야 하기 때문)
            # 오른쪽에서 가장 작은 노드를 삭제한 데이터의 위치로 올려준다.
            self.parent.left = self.change_node 
            # 삭제한 노드가 가지고 있는 자식 노드들의 정보를 적재해준다.
            self.change_node.left = self.current_node.left
            if current_node.right != change_node:# 오른쪽 노드에서 왼쪽으로 한번이라도 갔을 경우
                    self.change_node.right = self.current_node.right
            
    # case 3-2 : 삭제할 Node 가 Child Node 를 두개 가지고 있을 경우 (삭제할 Node 가 Parent Node 의 오른쪽에 있을 때)
    # case 3-1 과 마찬가지로 1번 전략을 사용함(오른쪽 노드에서 가장 작은 값을 삭제할 Node 의 Parent Node 가 가리키도록 한다.)
    # case 3-2-1 : 삭제할 Node 가 Parent Node 의 오른쪽에 있고 
    # 삭제할 Node 의 오른쪽 자식 중, 가장 작은 값을 가진 Node 의 Child Node 가 없을 때
    # case 3-2-2 : 삭제할 Node 가 Parent Node 의 오른쪽에 있고
    # 삭제할 Node 의 오른쪽 자식 중, 가장 작은 값을 가진 Node 의 오른쪽에 Child Node 가 있을 때
        else:
            self.change_node = self.current_node.right
            self.change_node_parent = self.current_node.right
            while self.change_node.left != None:
                self.change_node_parent = self.change_node
                self.change_node = self.change_node.left
            if self.change_node.right != None:
                self.change_node_parent.left = change_node.right
            else:
                self.change_node_parent.left = None
            self.parent.right = self.change_node
            self.change_node.left = current_node.left
            if current_node.right != change_node:# 오른쪽 노드에서 왼쪽으로 한번이라도 갔을 경우
                    self.change_node.right = self.current_node.right
            
        
                
                
            

In [6]:
# 전체 코드 가져오기
class Node:
    def __init__(self, value):
        self.value = value
        self.left = None
        self.right = None
        
class NodeMgmt:
    def __init__(self, head):
        self.head = head
    
    def insert(self, value):
        self.current_node = self.head
        while True:
            if value < self.current_node.value: # 넣고자 하는 value 값이 현재 노드보다 크기가 작을 경우
                if self.current_node.left != None: # 현재 노드의 왼쪽에 노드가 있는지 확인한다.
                    self.current_node = self.current_node.left # 비교 대상을 현재 노드의 왼쪽 노드로 바꿔준다.
                else:
                    self.current_node.left = Node(value) # 왼쪽 노드가 존재하지 않는다면 왼쪽 노드로서 삽입해준다.
                    break
            else: # 넣고자 하는 value 값이 현재 노드와 크기가 같거나 큰 경우
                if self.current_node.right != None:
                    self.current_node = self.current_node.right
                else:
                    self.current_node.right = Node(value)
                    break
    
    # 이진 탐색 트리에 특정 노드가 있는지 없는지 확인하는 메소드
    def search(self, value):
        self.current_node = self.head # 노드를 순회해야 하기 때문에 루트 부터 시작
        while self.current_node: # 더 이상 노드가 존재하지 않아서 None 값이 반환될 경우 루프 종료
            if self.current_node.value == value:
                return True
            elif value < self.current_node.value:
                self.current_node = self.current_node.left
            else:
                self.current_node = self.current_node.right
        
        return False
    
    def delete(self, value):
        # 노드가 있는지 부터 확인
        searched = False 
        self.current_node = self.head
        self.parent = self.head
        while self.current_node:
            if self.current_node.value == value:
                searched = True
                break
            elif value < self.current_node.value:
                self.parent = self.current_node
                self.current_node = self.current_node.left
            else:
                self.parent = self.current_node
                self.current_node = self.current_node.right
    
        if searched == False:
            return False
        
        # 노드가 존재하는 경우
        # 해당 노드가 Leaf Node 인 경우
        if self.current_node.left == None and self.current_node.right == None:
            if value < self.parent.value:
                self.parent.left = None
            else:
                self.parent.right = None
            del self.current_node
            
        # 해당 노드가 왼쪽 Child Node 를 가지고 있을 경우
        if self.current_node.left != None and self.current_node.right == None:
            if value < self.parent.value: 
                self.parent.left = self.current_node.left 
            else: 
                self.parent.right = self.current_node.left 
        # 해당 노드가 오른쪽 Child Node 를 가지고 있을 경우
        elif self.current_node.left == None and self.current_node.right != None:
            if value < self.parent.value:
                self.parent.left = self.current_node.right
            else:
                self.parent.right = self.current_node.right
            
        # 해당 노드가 두 개의 Node 를 가지고 있는 경우
        if self.current_node.left != None and self.current_node.right != None:
            if value < self.parent.value:
                self.change_node = self.current_node.right
                self.change_node_parent = self.current_node.right
            
                while self.change_node.left != None: 
                    self.change_node_parent = self.change_node
                    self.change_node = self.change_node.left
            
                if self.change_node.right != None:
                    self.change_node_parent.left = self.change_node.right 
                else:
                     self.change_node_parent.left = None 
                        
                self.parent.left = self.change_node 
                self.change_node.left = self.current_node.left
                if current_node.right != change_node:# 오른쪽 노드에서 왼쪽으로 한번이라도 갔을 경우
                    self.change_node.right = self.current_node.right
                # 오른쪽 노드에서 왼쪽으로 한번도 이동하지 않았다면 change_node.right 값을 건드릴 필요가 없다.
                # change_node.right 값을 계속 유지 시켜 주면 됨

            else:
                self.change_node = self.current_node.right
                self.change_node_parent = self.current_node.right
                while self.change_node.left != None:
                    self.change_node_parent = self.change_node
                    self.change_node = self.change_node.left
                if self.change_node.right != None: 
                    self.change_node_parent.left = change_node.right
                else:
                    self.change_node_parent.left = None
                    
                self.parent.right = self.change_node
                self.change_node.left = self.current_node.left
                if self.current_node.right != change_node: # 오른쪽 노드에서 왼쪽으로 한번이라도 갔을 경우
                    self.change_node.right = self.current_node.right
        
        return True

In [7]:
# 0 ~ 999 까지의 숫자 중에서 임의로 100 개를 추출하여 이진 탐색 트리에 입력, 검색, 삭제
# 임의의 숫자를 뽑아내기 위해 random 라이브러리를 활용한다.
# random.randint(첫번째 숫자, 마지막 숫자) : 첫번째 숫자부터 마지막 숫자 사이에 있는 숫자를 랜덤하게 선택해서 리턴
# 예시 : random.randint(0, 99) : 0 에서 99 까지 숫자중 특정 숫자를 랜덤하게 선택해서 리턴해줌
import random
# 0 ~ 999 중, 100개의 숫자를 랜덤으로 선택한다.
bst_nums = set() # 숫자 중복을 방지하기 위해 set() 사용 - 자바에서는 Set 클래스로 사용가능
while len(bst_nums) != 100:
    bst_nums.add(random.randint(0,999))

# 선택된 100 개의 숫자를 이진 탐색 트리에 입력, 임의로 루트 노드는 500을 넣기로 함
# (0 이나 1을 루트 노드로 삼으면 트리의 구조가 한쪽으로 치우치게됨)
head = Node(500)
binary_tree = NodeMgmt(head)
for num in bst_nums:
    binary_tree.insert(num)
# 입력한 100개의 숫자 검색(검색 기능 확인)
for num in bst_nums:
    if binary_tree.search(num) == False: # 데이터 삽입이 하나라도 제대로 이루어지지 않았다면
        print('search fail', num)
# 입력한 100 개의 숫자 중 10개의 숫자를 랜덤 선택
delete_nums = set()
bst_nums = list(bst_nums) # 인덱스로 접근하기 위해 list 타입으로 변경
while len(delete_nums) != 10:
    delete_nums.add(bst_nums[random.randint(0,99)]) # 랜덤으로 인덱스를 선택하여 추가
    
# 선택한 10개의 숫자를 삭제(삭제기능 확인)
for del_num in delete_nums:
    if binary_tree.delete(del_num) == False: # 삭제할 데이터가 트리에 존재하지 않는 경우
        print('delete fail', del_num)

### 이진 탐색 트리의 시간 복잡도와 단점
- 이진 탐색 트리에서 가장 중요한 것은 저장된 데이터를 얼마나 빨리 찾느냐 이다.
- 이진 탐색 트리의 depth(트리의 높이) 를 h 라고 표기한다면 O(h)
- n 개의 노드를 가진다면 h = log2n 에 가까우므로, 시간복잡도는 O(log n)
    - 빅오 표기법에서 log n 에서의 log 의 밑은 10 이 아니라 2 이다.
    - 한번 실행시 마다 50% 의 실행할 수도 있는 명령을 제거한다는 의미
    - 즉 50% 의 실행시간을 단축시킬 수 있다는 것을 의미한다.

* 이진 탐색 트리의 단점(최악의 경우)
- 이진 탐색 트리의 평균 시간 복잡도는 O(log n) 이지만, 이는 트리가 균형잡혀 있는 때의 평균 시간 복잡도이며, 트리가 한쪽으로 치우쳐져 있을 경우(최악의 경우) 연결 리스트 등과 동일한 성능을 보여주게 된다.(O(n))