# TREE 개념, Binary Search Tree 구현

### 1. 트리 구조 : 
* 그래프의 특수한 형태로, 노드(Node)와 선분(Branch)을 이용해 사이클을 이루지 않도록 구성한 자료구조
* 자료 사이의 관계성이 계층 형식으로 나타나는 구조
* 1:n 구조이며 역으로는 1:1 대응 구조

* 트리의 용어
    * Node : 트리에서 데이터를 저장하는 기본 요소(데이터와 다른 연결된 노드에 대한 Branch 정보 포함)
    * Root Node : 트리의 뿌리가(맨 위) 되는 노드
    * Parent Node : 각 노드의 바로 상위 레벨에 있는 노드
    * Child Node : 각 노드에 연결되어 있는 다음 레벨의 노드
    * Leaf Node : 단노드(Teminate Node)라고도 하며 노드의 차수가 0인 노드 또는 자식이 없는 노드를 말한다.
    * sibling Node : 동일한 Parent Node를 가진 노드
    * Level : 최상위 노드를 Level 0으로 했을 때, 하위 Branch로 연결된 노드의 깊이를 나타냄
    * Degree(차수) : 각 노드가 가지고 있는 자식 노드의 수를 말한다.
    * Depth : 트리에서 노드가 가질 수 있는 최대 Level
 <img src="http://www.fun-coding.org/00_Images/tree.png"/>

### 2 이진 트리와 이진 탐색 트리
* 이진 트리 : 노드의 최대 Branch가 2인 트리
* 이진 탐색 트리(Binary Search Tree, BST) : 이진 트리에 다음과 같은 추가적인 조건이 있는 트리
    * 왼쪽 노드는 해당 노드보다 작은 값, 오른쪽 노드는 해당 노드보다 큰 값을 가지고 있음
<img src="https://www.mathwarehouse.com/programming/images/binary-search-tree/binary-search-tree-insertion-animation.gif" />

### 3. 이진 탐색 트리의 장점과 주요용도
* 주요 용도 : 데이터 검색(탐색)
* 장점 : 탐색 속도를 개선할 수 있음
<br><br>

### 이진트리와 정렬된 배열간의 탐색 비교
<img src="https://www.mathwarehouse.com/programming/images/binary-search-tree/binary-search-tree-sorted-array-animation.gif" />

## 5. 이진 탐색 트리(Binary Search Tree) 구현하기
* 최종 형태

In [1]:
class Node():
    def __init__(self, value):
        self.value = value
        self.left = None
        self.right = None
    
class BSTree():
    def __init__(self, head):
        self.head = head
        
    def insert(self, value):
        self.current_node = self.head
        while True:
            # 1. 새로 들어온 값이 중앙값보다 작을 경우(왼쪽)
            if value < self.current_node.value:
                # 1-1.자식 노드가 없을 경우
                if self.current_node.left == None:
                    self.current_node.left = Node(value)
                    break
                else:
                    # 1-2 자식 노드가 있을 경우 -> 순환
                    self.current_node = self.current_node.left
            # 2. 새로 들어온 값이 중앙값보다 크거나 같을 경우(오른쪽)
            else:
                # 2.1 자식 노드가 없을 경우
                if self.current_node.right == None:
                    self.current_node.right = Node(value)
                    break
                # 2.2 자식 노드가 있을 경우 -> 순환
                else:
                    self.current_node = self.current_node.right
                    
    def search(self, value):
        self.current_node = self.head
        while self.current_node:
            if value == self.current_node.value:
                return True
            elif value < self.current_node.value:
                self.current_node = self.current_node.left
            else:
                self.current_node = self.current_node.right
        return False
    
    def delete(self, value):
        ## 1. 삭제할 노드까지 찾아가기
        searched = False
        self.current_node = self.head
        self.parent = self.head
        while self.current_node:
            if value == self.current_node.value:
                searched = True
                break
            elif value < self.current_node.value:
                self.parent = self.current_node
                self.current_node = self.current_node.left
            else:
                self.parent = self.current_node
                self.current_node = self.current_node.right
              
        ## 원하는 삭제 노드가 트리에 없음
        if searched == False:
            return False
        
        
        ## 2. 노드 삭제
        ## 2-1. 삭제할 노드가 Leaf Node일 경우
        if self.current_node.left == None and self.current_node.right == None:
            ## 삭제 대상 노드의 부모 노드 left edge 끊어버리기
            if value < self.parent.value:
                self.parent.left = None
            ## 삭제 대상 노드의 부모 노드 right edge 끊어버리기
            else:
                self.parent.right = None
            ## 자식 노드 삭제
            del self.current_node
            
        ## 2-2 삭제할 노드가 자식 노드 하나를 갖고 있는 경우
        if self.current_node.left != None and self.current_node.right == None:
            if value < self.parent.value:
                self.parent.left = self.current_node.left
            else:
                self.parent.right = self.current_node.left
        elif self.current_node.left == None and self.current_node.right != None:
            if value < self.parent.value:
                self.parent.left = self.current_node.right
            else:
                self.parent.right = self.current_node.right
                
        ## 2-3 삭제할 노드가 자식 노드 두개를 갖고 있는 경우
        if self.current_node.left != None and self.current_node.right != None: # case3
            ## 2-3-1 삭제할 노드가 부모의 왼쪽에 있을 경우
            if value < self.parent.value:
                # 삭제 노드를 삭제노드의 오른쪽 자식 중에 가장 작은 값으로 대체하기 위한 설정
                self.change_node = self.current_node.right
                self.change_node_parent = self.current_node.right
                # 가장 작은 값으로 내려가자
                while self.change_node.left != None:
                    self.change_node_parent = self.change_node
                    self.change_node = self.change_node.left
                
                # 2-3-1-1 가장 작은 값의 노드에 오른쪽 자식이 없을 경우
                if self.change_node.right == None:
                    self.change_node_parent = None
                # 2-3-1-2 가장 작은 값의 노드에 오른쪽 자식이 있을 경우
                else:
                    self.change_node.parent.left = self.change_node.right
                self.parent.left = self.change_node
                self.change_node.left = self.current_node.left
                self.change_node.right = self.current_node.right                    
                    
            ## 2-3-2 삭제할 노드가 부모의 오른쪽에 있을 경우
            else:
                # 삭제 노드를 삭제노드의 오른쪽 자식 중에 가장 작은 값으로 대체하기 위한 설
                self.change_node = self.current_node.right
                self.change_node_parent = self.current_node.right
                # 가장 작은 값으로 내려가자
                while self.change_node.left != None:
                    self.change_node_parent = self.change_node
                    self.change_node = self.change_node.left
                    
                # 2-3-2-1 가장 작은 값의 노드에 오른쪽 자식이 없을 경우
                if self.change_node.right == None:
                    self.change_node_parent.left = None
                # 2-3-2-2 가장 작은 값의 노드에 오른쪽 자식이 있을 경우
                else:
                    self.change_node_parent.left = self.change_node.right
                self.parent.right = self.change_node
                self.change_node.left = self.current_node.left
                self.change_node.right = self.current_node.right
        
        return True
                    
head = Node(10)
bst = BSTree(head)
bst.insert(5)
bst.insert(15)
bst.insert(6)
bst.insert(19)

bst.delete(5)
print(bst.search(6))
print(bst.search(5))

print(bst.search(15))
bst.delete(15)
print(bst.search(15))
print(bst.search(19))

            

True
False
True
False
True


### 구현 결과 확인을 위한 코드

In [2]:
# 0 ~ 999 숫자 중에서 임의로 100개를 추출해서, 이진 탐색 트리에 입력, 검색, 삭제
import random

# 0 ~ 999 중, 100 개의 숫자 랜덤 선택
bst_nums = set()
while len(bst_nums) != 100:
    bst_nums.add(random.randint(0, 999))
# print (bst_nums)

# 선택된 100개의 숫자를 이진 탐색 트리에 입력, 임의로 루트노드는 500을 넣기로 함
head = Node(500)
binary_tree = BSTree(head)
for num in bst_nums:
    binary_tree.insert(num)
    
# 입력한 100개의 숫자 검색 (검색 기능 확인)
for num in bst_nums:
    if binary_tree.search(num) == False:
        print ('search failed', num)

# 입력한 100개의 숫자 중 10개의 숫자를 랜덤 선택
delete_nums = set()
bst_nums = list(bst_nums)
while len(delete_nums) != 10:
    delete_nums.add(bst_nums[random.randint(0, 99)])

# 선택한 10개의 숫자를 삭제 (삭제 기능 확인)
for del_num in delete_nums:
    if binary_tree.delete(del_num) == False:
        print('delete failed', del_num)

## 6. 코드 분석

### 6.1. 노드 클래스 만들기

In [None]:
class Node():
    def __init__(self, value):
        self.value = value
        self.left = None
        self.right = None
    

### 6.2 이진 탐색 트리에 데이터 넣기

In [None]:
class BSTree():
    def __init__(self, head):
        self.head = head
        
    def insert(self, value):
        self.current_node = self.head
        while True:
            # 1. 새로 들어온 값이 중앙값보다 작을 경우(왼쪽)
            if value < self.current_node.value:
                # 1-1.자식 노드가 없을 경우
                if self.current_node.left == None:
                    self.current_node.left = Node(value)
                    break
                else:
                    # 1-2 자식 노드가 있을 경우 -> 순환
                    self.current_node = self.current_node.left
            # 2. 새로 들어온 값이 중앙값보다 크거나 같을 경우(오른쪽)
            else:
                # 2.1 자식 노드가 없을 경우
                if self.current_node.right == None:
                    self.current_node.right = Node(value)
                    break
                # 2.2 자식 노드가 있을 경우 -> 순환
                else:
                    self.current_node = self.current_node.right
                    

### 6.3 이진 탐색 트리 내 데이터 검색

In [None]:
    def search(self, value):
        self.current_node = self.head
        while self.current_node:
            if value == self.current_node.value:
                return True
            elif value < self.current_node.value:
                self.current_node = self.current_node.left
            else:
                self.current_node = self.current_node.right
        return False
    

### 6.4 이진 탐색 트리 내 데이터 삭제
#### 삭제를 위한 다양한 경우의 수 고려 필요
* 6.4.1 Leaf Node 삭제 
* 6.4.2 Child Node 가 하나인 Node 삭제
* 6.4.3 Child Node 가 두 개인 Node 삭제

#### 6.4.0 삭제할 Node 탐색
- 삭제할 Node가 없는 경우도 처리해야 함
  - 이를 위해 삭제할 Node가 없는 경우는 False를 리턴하고, 함수를 종료 시킴

In [None]:
    def delete(self, value):
        ## 1. 삭제할 노드까지 찾아가기
        searched = False
        self.current_node = self.head
        self.parent = self.head
        while self.current_node:
            if value == self.current_node.value:
                searched = True
                break
            elif value < self.current_node.value:
                self.parent = self.current_node
                self.current_node = self.current_node.left
            else:
                self.parent = self.current_node
                self.current_node = self.current_node.right
              
        ## 원하는 삭제 노드가 트리에 없음
        if searched == False:
            return False

#### 6.4.1. Case1: 삭제할 Node가 Leaf Node인 경우
<img src="http://www.fun-coding.org/00_Images/tree_remove_leaf_code.png" width="600" />

In [None]:
        ## 2. 노드 삭제
        ## 2-1. 삭제할 노드가 Leaf Node일 경우
        if self.current_node.left == None and self.current_node.right == None:
            ## 삭제 대상 노드의 부모 노드 left edge 끊어버리기
            if value < self.parent.value:
                self.parent.left = None
            ## 삭제 대상 노드의 부모 노드 right edge 끊어버리기
            else:
                self.parent.right = None
            ## 자식 노드 삭제
            del self.current_node
 

#### 6.4.2. Case2: 삭제할 Node가 Child Node를 한 개 가지고 있을 경우
<img src="http://www.fun-coding.org/00_Images/tree_remove_1child_code.png" width="400" />

In [None]:
        ## 2-2 삭제할 노드가 자식 노드 하나를 갖고 있는 경우
        if self.current_node.left != None and self.current_node.right == None:
            if value < self.parent.value:
                self.parent.left = self.current_node.left
            else:
                self.parent.right = self.current_node.left
        elif self.current_node.left == None and self.current_node.right != None:
            if value < self.parent.value:
                self.parent.left = self.current_node.right
            else:
                self.parent.right = self.current_node.right

#### 6.4.3. Case3-1: 삭제할 Node가 Child Node를 두 개 가지고 있을 경우 (삭제할 Node가 Parent Node 왼쪽에 있을 때)
* 기본 사용 가능 전략
  1. **삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 삭제할 Node의 Parent Node가 가리키도록 한다.**
  2. 삭제할 Node의 왼쪽 자식 중, 가장 큰 값을 삭제할 Node의 Parent Node가 가리키도록 한다.
* 기본 사용 가능 전략 중, 1번 전략을 사용하여 코드를 구현하기로 함
  - 경우의 수가 또다시 두가지가 있음
    - **Case3-1-1:** 삭제할 Node가 Parent Node의 왼쪽에 있고, 삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 가진 Node의 Child Node가 없을 때
    - **Case3-1-2:** 삭제할 Node가 Parent Node의 왼쪽에 있고, 삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 가진 Node의 오른쪽에 Child Node가 있을 때
       - 가장 작은 값을 가진 Node의 Child Node가 왼쪽에 있을 경우는 없음, 왜냐하면 왼쪽 Node가 있다는 것은 해당 Node보다 더 작은 값을 가진 Node가 있다는 뜻이기 때문임


<img src="http://www.fun-coding.org/00_Images/tree_remove_2child_code_left.png" width="600" />

In [None]:
        ## 2-3 삭제할 노드가 자식 노드 두개를 갖고 있는 경우
        if self.current_node.left != None and self.current_node.right != None: # case3
            ## 2-3-1 삭제할 노드가 부모의 왼쪽에 있을 경우
            if value < self.parent.value:
                # 삭제 노드를 삭제노드의 오른쪽 자식 중에 가장 작은 값으로 대체하기 위한 설정
                self.change_node = self.current_node.right
                self.change_node_parent = self.current_node.right
                # 가장 작은 값으로 내려가자
                while self.change_node.left != None:
                    self.change_node_parent = self.change_node
                    self.change_node = self.change_node.left
                
                # 2-3-1-1 가장 작은 값의 노드에 오른쪽 자식이 없을 경우
                if self.change_node.right == None:
                    self.change_node_parent = None
                # 2-3-1-2 가장 작은 값의 노드에 오른쪽 자식이 있을 경우
                else:
                    self.change_node.parent.left = self.change_node.right
                self.parent.left = self.change_node
                self.change_node.left = self.current_node.left
                self.change_node.right = self.current_node.right                    
            

#### 6.4.3. Case3-2: 삭제할 Node가 Child Node를 두 개 가지고 있을 경우 (삭제할 Node가 Parent Node 오른쪽에 있을 때)
* 기본 사용 가능 전략
  1. **삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 삭제할 Node의 Parent Node가 가리키도록 한다.**
  2. 삭제할 Node의 왼쪽 자식 중, 가장 큰 값을 삭제할 Node의 Parent Node가 가리키도록 한다.
* 기본 사용 가능 전략 중, 1번 전략을 사용하여 코드를 구현하기로 함
  - 경우의 수가 또다시 두가지가 있음
    - **Case3-2-1:** 삭제할 Node가 Parent Node의 오른쪽에 있고, 삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 가진 Node의 Child Node가 없을 때
    - **Case3-2-2:** 삭제할 Node가 Parent Node의 오른쪽에 있고, 삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 가진 Node의 오른쪽에 Child Node가 있을 때
       - 가장 작은 값을 가진 Node의 Child Node가 왼쪽에 있을 경우는 없음, 왜냐하면 왼쪽 Node가 있다는 것은 해당 Node보다 더 작은 값을 가진 Node가 있다는 뜻이기 때문임


<img src="http://www.fun-coding.org/00_Images/tree_remove_2child_code_right.png" width="600" />

In [None]:
            ## 2-3-2 삭제할 노드가 부모의 오른쪽에 있을 경우
            else:
                # 삭제 노드를 삭제노드의 오른쪽 자식 중에 가장 작은 값으로 대체하기 위한 설
                self.change_node = self.current_node.right
                self.change_node_parent = self.current_node.right
                # 가장 작은 값으로 내려가자
                while self.change_node.left != None:
                    self.change_node_parent = self.change_node
                    self.change_node = self.change_node.left
                    
                # 2-3-2-1 가장 작은 값의 노드에 오른쪽 자식이 없을 경우
                if self.change_node.right == None:
                    self.change_node_parent.left = None
                # 2-3-2-2 가장 작은 값의 노드에 오른쪽 자식이 있을 경우
                else:
                    self.change_node_parent.left = self.change_node.right
                self.parent.right = self.change_node
                self.change_node.left = self.current_node.left
                self.change_node.right = self.current_node.right
        
        return True