# Tree

### 1. Tree 구조 (꼭 알기)
- **Tree : Node와 Branch를 이용해서 사이클을 이루지 않도록 구성한 데이터 구조**
- 실제로 어디에서 많이 사용되나?
    - 트리 중 **이진 트리(Binary Tree) -> 탐색(검색) 알고리즘** 구현에서 많이 사용됨

### 2. 알아둘 용어
- Node
    - 트리에서 데이터를 저장하는 기본 요소 (데이터와 다른 연결된 노드에 대한 Branch 정보 포함)
- Root Node
    - 트리 맨 위에 있는 노드
- Level
    - 최상위 노드를 level 0으로 했을 때, 하위 Branch로 연결된 노드의 깊이를 나타냄
- Parent Node
    - 어떤 노드의 다음 레벨에 연결된 노드
- Child Node
    - 어떤 노드의 상위 레벨에 연결된 노드
- Leaf Node (=Terminal Node)
    - Child Node가 하나도 없는 노드
- Sibling Node (=Brother Node)
    - 동일한 Parent Node를 가진 노드
- Depth
    - 트리에서 Node가 가질 수 있는 최대 level

### 3. 이진 트리(Binary Tree)와 이진 탐색 트리(Binary Search Tree)
* 이진 트리(Binary Tree)
    - 노드의 <u>최대 Branch가 2인 트리</u>
* 이진 탐색 트리(Binary Search Tree, BST)
    - 이진 트리의 구조 + 추가 조건
    - <u>왼쪽노드는 해당 노드보다 작은 값, 오른쪽 노드는 해당 노드보다 큰 값</u>을 가지는 추가적인 조건을 가지는 트리

### 4. 이진 탐색 트리의 장점과 주요 용도
* 주요 용도 : **데이터 검색(탐색)**
* 장점 : 탐색 **속도 개선**
    - <u>균형 잡힌 트리</u>의 경우 평균 시간 복잡도 -> **<u>O(log n)</u>**
* 단점 : <u>완전히 한쪽에 편중된 트리</u>의 경우 -> **<u>O(n)</u>**
    - 최악의 경우 링크드 리스트와 동일한 성능

#### 이진트리 vs 정렬된 배열 탐색 비교
- 이진트리 : $O(h)$ \*h는 트리의 depth (O(log n)에 근접)
- 정렬된 배열 : $O(n)$

### 5. 파이썬으로 링크드 리스트 구현하기

#### 5.1. 노드 클래스 만들기

In [None]:
class Node:
    def __init__(self, value):
        self.value = value
        self.left = None
        self.right = None

#### 5.2. 이진 탐색 트리에 데이터 넣기
- 이진 탐색 트리 조건에 부합하게 데이터를 넣어야 함

In [None]:
class NodeMgmt:
    def __init__(self, head):
        self.head = head # root node

    def insert(self, value):
        self.current_node = self.head
        while True:
            if value < self.current_node.value: #작으면 왼쪽으로
                if self.current_node.left != None:
                    self.current_node = self.current_node.left
                else:
                    self.current_node.left = Node(value) #없다면 새로 만들어줌
                    break
            else: #같거나 크면 오른쪽으로
                if self.current_node.right != None:
                    self.current_node = self.current_node.right
                else:
                    self.current_node.right = Node(value)
                    break

    def search(self, value):
        self.current_node = self.head
        while self.current_node:
            if value == self.current_node.value: #작으면 왼쪽으로
                return True #해당 value를 가진 node가 있다
            elif value < self.current_node.value:
                self.current_node = self.current_node.left
            else: #같거나 크면 오른쪽으로
                self.current_node = self.current_node.right

        return False #해당 value를 가진 node가 없다

#### 5.3. 이진 탐색 트리를 탐색

In [None]:
head = Node(1)
bst = NodeMgmt(head)

bst.insert(2)
bst.insert(3)
bst.insert(0)
bst.insert(4)
bst.insert(8)

In [None]:
print(bst.search(5))
print(bst.search(8))

#### 5.4. 이진 트리 삭제
- 매우 복잡함. **경우를 나눠서 이해하는 것이 좋음**
    - 3가지 경우
        - Leaf Node 삭제
        - Child Node가 하나인 Node 삭제
        - <u>Child Node가 두 개인 Node 삭제 (★ 외우면 좋다)</u>


#### 5.4.1. Leaf Node 삭제
- Leaf Node : Child Node가 없는 Node
- 삭제할 Node의 Parnet Node가 삭제할 Node를 가리키지 않도록 해야 함

```
  ○
 /
●     <-삭제
```
#### 5.4.2. Child Node가 하나인 Node 삭제
- 삭제할 Node의 Parnet Node가 삭제할 Node의 Child Node를 가리키도록 해야 함

```
  ●   <- 삭제
 /
○
```

#### 5.4.3. Child Node가 두 개인 Node 삭제
- 두 가지 방법 중 하나
1. **삭제할 Node의 <u>오른쪽 자식 중 가장 작은 값</u>을 삭제할 Node의 Parent Node가 가리키도록 해야 함**
2. 삭제할 Node의 <u>왼쪽 자식 중 가장 큰 값</u>을 삭제할 Node의 Parent Node가 가리키도록 해야 함

```
  ●   <- 삭제
 / ＼
○   ○
```

#### 1. 삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 삭제할 Node의 Parent Node가 가리키게 할 경우
* 순서 sudo
  1. DeleteNode.RightChild 선택
  2. DeleteNode.RightChild의 가장 왼쪽에 있는 MinimumNode 선택
  3. DeleteNode.ParentNode.LeftBranch = MinimumNode 가리키게 함
  4. MinimumNode.LeftBranch = DeleteNode.LeftChild 가리키게 함
  5. MinimumNode.RightBrach = DeleteNode.RightChild 가리키게 함
  6. if MinimumNode.RightChild != None: OriginalMinimumNode.ParentNode.LeftBranch = OriginalMinimumNode.RightChild

#### 5.5. 이진 탐색 트리 삭제 코드 구현과 분석

#### 5.5.1. 삭제할 Node 탐색
- 삭제할 Node가 없는 경우도 처리해야 함
    - 이를 위해 삭제할 Node가 없는 경우는 Fasle를 리턴하고, 함수를 종료 시킴



In [None]:
# 여기서 작성하고 추후에 NodeMgmt 클래스에 코드 넣을 것
def delete(self, value):
    # 1. value가진 노드가 있는지 확인
    searched = False
    self.current_node = self.head #삭제할 노드
    self.parent = self.head #삭제할 노드의 부모노드

    while self.current_node:
        if value == self.current_node.value:
            searched = True
            break
        elif value < self.current_node:
            self.parent = self.current_node
            self.current_node = self.current_node.left
        else:
            self.parent = self.current_node
            self.current_node = self.current_node.right
    
    if searched == False:
        return False

    ### 여기부터 삭제 Case 1, 2, 3 작성 ###
    

#### 삭제 Case 1, 2, 3 작성
- self.current_node가 삭제할 Node
- self.parent는 삭제할 Node의 Parent Node인 상태

#### Case 1 : 삭제할 Node가 Leaf Node인 경우
Leaf Node의 위치가 왼쪽에 있을 때, 오른쪽에 있을 때 2가지로 나뉨
````
     ○
    / ＼
   ○   ○
  /＼   /＼
 ○  ○ ●  ●   -> Leaf Node가 왼쪽 / 오른쪽에 위치
 ````

In [None]:
# def delete(self, value):
    if self.current_node.left == None and self.current_node.right == None:
        if value < self.parent.value:
            self.parent.left = None
        else:
            self.parent.right = None
        del self.current_node

#### Case 2 : 삭제할 Node가 Child Node를 한 개 가지고 있는 경우
Child를 왼쪽에 가질 때, 오른쪽에 가질 때 2가지로 나뉨
```
     ○
    / ＼
   ●   ●    -> Child가 왼쪽에 위치
  /    /
 ○   ○

     ○
    / ＼
   ●   ●    -> Child가 오른쪽에 위치
   ＼    ＼
     ○    ○
```

In [None]:
# def delete(self, value):
    # 삭제할 Node가 Child를 왼쪽에만 가지고 있을 때
    if self.current_node.left != None and self.current_node.right == None:
        if value < self.parent.value:
            self.parent.left = self.current_node.left
        else:
            self.parent.right = self.current_node.left
    # 삭제할 Node가 Child를 오른쪽에만 가지고 있을 때
    elif self.current_node.left == None and self.current_node.right != None:
        if value < self.parent.value:
            self.parent.left = self.current_node.right
        else:
            self.parent.right = self.current_node.right


#### Case 3 : 삭제할 Node가 Child Node를 두 개 가지고 있는 경우
삭제할 Node가 Parent Node의 왼쪽 / 오른쪽에 위치 하는 경우 2가지로 나뉨
```
     ○
    /＼
   ●  ○    -> Parent Node의 왼쪽에 위치
  /＼   /＼
 ○ ○  ○ ○
 
     ○
    /＼
   ○  ●    -> Parent Node의 오른쪽에 위치
  /＼   /＼
 ○ ○  ○ ○
```

#### 5.5.3. Case3-1 : 삭제할 Node가 Parent Node의 왼쪽에 위치한 경우
* 기본 사용 가능 전략
    1. 삭제할 Node의 오른쪽 자식 중 가장 작은 값을 삭제할 Node의 Parent Node가 가리키도록 함
    2. 삭제할 Node의 왼쪽 자식 중 가장 큰 값을 삭제할 Node의 Parent Node가 가리키도록 함
* 기본 사용 가능 전략 중, 1번 전략을 사용하여 코드를 구현하기로 함
    - 경우의 수가 또다시 두가지가 있음
        - **Case3-1-1**:
            - 삭제할 Node가 Parent Node의 왼쪽에 있고,
            - 삭제할 Node의 **오른쪽 자식 중 가장 작은 값을 가진 Node**의 <u>Child Node가 있을 때</u> (=또 자식이 딸려있을 때)
        - Case3-1-2:
            - 삭제할 Node가 Parent Node의 왼쪽에 있고,
            - 삭제할 Node의 **오른쪽 자식 중 가장 작은 값을 가진 Node의** <u>오른쪽에 Child Node가 있을 때</u>
                - 가장 작은 값을 가진 Node의 Child Node가 왼쪽에 있을 경우는 없음! 왜냐하면 왼쪽 Node가 있다는 것은 해당 Node보다 더 작은 Node가 있다는 뜻이기 때문 -> 왼쪽이 있었다면 삭제할 Node에 걔가 들어갔을 것!
```
        ○           -> Parent
      /   ＼
     ●      ○       -> 색칠이 삭제할 노드
    /＼       /＼
   ○ ◎     ○ ○
  /＼ /＼
 ○○ ◎○              -> 왼쪽에서 세번째 노드가 가장 작은 값
       ＼
         ◎          -> 얘가 Case3-1-1에 해당하는 노드 (자식이 또 딸려있을 때)
```

#### 5.5.4. Case3-2 : 삭제할 Node가 Parent Node의 오른쪽에 위치한 경우
**(트리 모양 빼고 위의 전략 내용과 동일)**

* 기본 사용 가능 전략
    1. 삭제할 Node의 오른쪽 자식 중 가장 작은 값을 삭제할 Node의 Parent Node가 가리키도록 함
    2. 삭제할 Node의 왼쪽 자식 중 가장 큰 값을 삭제할 Node의 Parent Node가 가리키도록 함
* 기본 사용 가능 전략 중, 1번 전략을 사용하여 코드를 구현하기로 함
    - 경우의 수가 또다시 두가지가 있음
        - **Case3-2-1**:
            - 삭제할 Node가 Parent Node의 왼쪽에 있고,
            - 삭제할 Node의 **오른쪽 자식 중 가장 작은 값을 가진 Node**의 <u>Child Node가 있을 때</u> (=또 자식이 딸려있을 때)
        - Case3-2-2:
            - 삭제할 Node가 Parent Node의 왼쪽에 있고,
            - 삭제할 Node의 **오른쪽 자식 중 가장 작은 값을 가진 Node의** <u>오른쪽에 Child Node가 있을 때</u>
                - 가장 작은 값을 가진 Node의 Child Node가 왼쪽에 있을 경우는 없음! 왜냐하면 왼쪽 Node가 있다는 것은 해당 Node보다 더 작은 Node가 있다는 뜻이기 때문 -> 왼쪽이 있었다면 삭제할 Node에 걔가 들어갔을 것!
```
        ○                       -> Parent
      /   ＼
     ○      ●                   -> 색칠이 삭제할 노드
    /＼       /＼
   ○ ○     ○ ◎
             /＼ /＼
            ○○ ◎○              -> 왼쪽에서 세번째 노드가 가장 작은 값
                  ＼
                    ◎          -> 얘가 Case3-1-1에 해당하는 노드 (자식이 또 딸려있을 때)
```

In [None]:
# def delete(self, value): 
    if self.current_node.left != None and self.current_node.right != None: # Case3
        if value < self.parent: # Case3-1, 삭제할 노드가 왼쪽에 있어서 오른쪽 자식들을 순회
            
            #0 change할 node 정보 저장
            self.change_node = self.current_node.right
            self.change_node_parent = self.current_node.right

            #1 가장 작은 노드 찾기 위해 순회
            while self.change_node.left != None: #왼쪽을 순차적으로 탐색
                self.change_node_parent = self.change_node
                self.change_node = self.change_node.left
            
            #2 가장 작은 노드 찾았으니 change_node 처리
            self.change_node_parent.left = None
            if self.change_node.right != None: # Case3-1-1
                self.change_node_parent.left = self.change_node.right
            else:
                self.change_node_parent.left = None

            #3 change_node를 위로 올리자
            self.parent.left = self.change_node #부모가 처리
            self.change_node.right = self.current_node.right #내 양옆 처리
            self.change_node.left = self.current_node.left


        else: # Case3-2, 삭제할 노드가 오른쪽에 있어서 왼쪽 자식들을 순회
            
            #0 change할 node 정보 저장
            self.change_node = self.current_node.right
            self.change_node_parent = self.current_node.right

            #1 가장 작은 노드 찾기 위해 순회
            while self.change_node.left != None:
                self.change_node_parent = self.change_node
                self.change_node = self.change_node.left

            #2 가장 작은 노드 찾았으니 change_node처리
            if self.change_node.right != None:
                self.change_node_parent.left = self.change_node.right
            else:
                self.change_node_parent.left = None

            #3 change_node를 위로 올리자
            self.parent.right = self.change_node #부모가 처리
            self.change_node.left = self.current_node.left #내 양옆 처리
            self.change_node.right = self.current_node.right




#### 5.5.5. 파이썬 전체 코드 구현

In [41]:
class Node:
    def __init__(self, value):
        self.value = value
        self.left = None
        self.right = None

class NodeMgmt:
    def __init__(self, head):
        self.head = head # root node

    def insert(self, value):
        self.current_node = self.head
        while True:
            if value < self.current_node.value: #작으면 왼쪽으로
                if self.current_node.left != None:
                    self.current_node = self.current_node.left
                else:
                    self.current_node.left = Node(value) #없다면 새로 만들어줌
                    break
            else: #같거나 크면 오른쪽으로
                if self.current_node.right != None:
                    self.current_node = self.current_node.right
                else:
                    self.current_node.right = Node(value)
                    break

    def search(self, value):
        self.current_node = self.head
        while self.current_node:
            if value == self.current_node.value: #작으면 왼쪽으로
                return True #해당 value를 가진 node가 있다
            elif value < self.current_node.value:
                self.current_node = self.current_node.left
            else: #같거나 크면 오른쪽으로
                self.current_node = self.current_node.right

        return False #해당 value를 가진 node가 없다

    def delete(self, value):
        searched = False #value가진 노드가 있는지 확인
        self.current_node = self.head #삭제할 노드
        self.parent = self.head #삭제할 노드의 부모노드

        while self.current_node:
            if value == self.current_node.value:
                searched = True
                break
            elif value < self.current_node.value:
                self.parent = self.current_node
                self.current_node = self.current_node.left
            else:
                self.parent = self.current_node
                self.current_node = self.current_node.right
        
        if searched == False:
            return False


        # Case 1
        if self.current_node.left == None and self.current_node.right == None:
            if value < self.parent.value:
                self.parent.left = None
            else:
                self.parent.right = None
            del self.current_node

        # Case 2
        # 삭제할 Node가 Child를 왼쪽에만 가지고 있을 때
        if self.current_node.left != None and self.current_node.right == None:
            if value < self.parent.value:
                self.parent.left = self.current_node.left
            else:
                self.parent.right = self.current_node.left
        # 삭제할 Node가 Child를 오른쪽에만 가지고 있을 때
        elif self.current_node.left == None and self.current_node.right != None:
            if value < self.parent.value:
                self.parent.left = self.current_node.right
            else:
                self.parent.right = self.current_node.right

        # Case 3 
        if self.current_node.left != None and self.current_node.right != None:
            # Case 3-1, 삭제할 노드가 왼쪽에 있어서 오른쪽 자식들을 순회
            if value < self.parent.value: 
                
                #0 change할 node 정보 저장
                self.change_node = self.current_node.right
                self.change_node_parent = self.current_node.right

                #1 가장 작은 노드 찾기 위해 순회
                while self.change_node.left != None: #왼쪽을 순차적으로 탐색
                    self.change_node_parent = self.change_node
                    self.change_node = self.change_node.left
                
                #2 가장 작은 노드 찾았으니 change_node 처리
                self.change_node_parent.left = None
                if self.change_node.right != None: # Case3-1-1
                    self.change_node_parent.left = self.change_node.right
                else:
                    self.change_node_parent.left = None

                #3 change_node를 위로 올리자
                self.parent.left = self.change_node #부모가 처리
                self.change_node.right = self.current_node.right #내 양옆 처리
                self.change_node.left = self.current_node.left


            # Case 3-2, 삭제할 노드가 오른쪽에 있어서 왼쪽 자식들을 순회
            else:                 
                #0 change할 node 정보 저장
                self.change_node = self.current_node.right
                self.change_node_parent = self.current_node.right

                #1 가장 작은 노드 찾기 위해 순회
                while self.change_node.left != None:
                    self.change_node_parent = self.change_node
                    self.change_node = self.change_node.left

                #2 가장 작은 노드 찾았으니 change_node처리
                if self.change_node.right != None:
                    self.change_node_parent.left = self.change_node.right
                else:
                    self.change_node_parent.left = None

                #3 change_node를 위로 올리자
                self.parent.right = self.change_node #부모가 처리
                self.change_node.left = self.current_node.left #내 양옆 처리
                self.change_node.right = self.current_node.right




#### 5.5.6. 파이썬 전체 코드 테스트
- random 라이브러리 활용
    - random.randint(첫번째 숫자, 마지막 숫자)
        - 첫번째 숫자부터 마지막 숫자 사이에 있는 숫자를 랜덤하게 선택해서 리턴
        - ex) random.randint(0, 99) : 0 ~ 99 중에서 특정 숫자를 랜덤하게 선택해서 리턴

In [47]:
# 0 ~ 999 중에서 임의로 100개 추출 후, 이진 탐색 트리에 입력->검색->삭제하여 테스트
import random

# 0 ~ 999 중, 100개의 숫자 랜덤 선택
bst_nums = set() # 중복 제거 위해서 집합 사용
while len(bst_nums) < 100:
    bst_nums.add(random.randint(0, 999))

# 선택된 100개의 숫자를 이진 탐색 트리에 입력, 임의로 루트 노드는 500을 넣음 (중간정도 값)
head = Node(500)
bst = NodeMgmt(head)
for num in bst_nums:
    bst.insert(num)

# 입력한 100개의 숫자 검색 (검색 기능 확인)
print("########### before delete ###########")
before_cnt = 0
for num in bst_nums:
    if bst.search(num) == False:
        print("search failed", num)
    else: # search success
        print(num)
        before_cnt += 1
print("before_cnt:", before_cnt)
print("#####################################")
print()

# 삭제를 위해 입력한 100개의 숫자 중 10개의 숫자를 랜덤 선택
delete_nums = set()
bst_nums = list(bst_nums) #list로 변형하여 인덱스번호로 접근가능해짐
while len(delete_nums) < 10:
    delete_nums.add(bst_nums[random.randint(0, 99)])

# 선택한 10개의 숫자를 삭제 (삭제 기능 확인)
print("########### delete nums ###########")
after_cnt = 0
for del_num in delete_nums:
    if bst.delete(del_num) == False:
        print("delete faild", del_num)
    else: # delete success
        print(del_num)
        after_cnt += 1
print("deleted_cnt:", after_cnt)
print("#####################################")


########### before delete ###########
7
525
14
15
22
544
548
551
39
555
44
48
560
566
60
575
93
100
613
104
112
636
124
638
129
131
645
647
651
653
150
673
164
681
171
173
690
711
712
713
715
720
214
215
217
732
734
735
227
229
235
748
749
241
756
765
256
770
281
283
284
286
803
808
817
312
318
319
832
326
840
841
842
332
846
856
348
354
361
882
371
377
898
899
419
428
941
949
957
454
457
985
476
481
488
490
491
492
496
504
before_cnt: 100
#####################################

########### delete nums ###########
354
803
229
645
647
235
651
173
112
284
deleted_cnt: 10
#####################################


In [48]:
print(len(bst_nums))
print(bst_nums)

100
[7, 525, 14, 15, 22, 544, 548, 551, 39, 555, 44, 48, 560, 566, 60, 575, 93, 100, 613, 104, 112, 636, 124, 638, 129, 131, 645, 647, 651, 653, 150, 673, 164, 681, 171, 173, 690, 711, 712, 713, 715, 720, 214, 215, 217, 732, 734, 735, 227, 229, 235, 748, 749, 241, 756, 765, 256, 770, 281, 283, 284, 286, 803, 808, 817, 312, 318, 319, 832, 326, 840, 841, 842, 332, 846, 856, 348, 354, 361, 882, 371, 377, 898, 899, 419, 428, 941, 949, 957, 454, 457, 985, 476, 481, 488, 490, 491, 492, 496, 504]


### 6. 이진 탐색 트리의 시간 복잡도와 단점
#### 6.1. 시간 복잡도 (탐색)
- **depth** (트리의 높이)를 h라고 표기한다면 -> $O(h)$
- n개의 노드를 가진다면, $h = log₂n$에 가까우므로, <u>시간 복잡도는 $O(log n)$</u>
    - 참고 : 빅오 표기법에서 log n에서의 log 밑은 10이 아니라 2이다!
    - 한번 실행시마다, 50%의 실행할 수도 있는 명령을 제거한다는 의미. 즉, 50%의 실행시간을 단축시킬 수 있다는 것을 의미

#### 6.2. 이진 탐색 트리의 단점
- 평균 시간 복잡도는 O(log n)이지만, 이는 트리가 균형잡혔을떄의 평균 시간복잡도다
- 완전히 한쪽에 편중된 트리의 경우, 최악의 경우 링크드 리스트와 동일한 성능을 보여줌 O(n)