# 맵 추상 자료형 2부

## 이진탐색트리

이진트리에 값을 저장하여 항목 탐색을 키와 값의 관계로 작동하도록 할 수 있다.
즉, 이진트리를 맵(Map) 추상 자료형으로 활용하여 매우 효율적인 탐색을
실행할 수 있다.

### 정의

**이진탐색트리**의 마디에 사용되는 키는 모두 아래 특성을 만족한다.

- 부모 마디보다 작은 키: 부모의 왼쪽 서브트리에 위치
- 부모 마디보다 큰 키: 부모의 오른쪽 서브트리에 위치

**예제**

아래 그림은 70, 31, 93, 94, 14, 23, 73를 차례대로 이진탐색트리에 
추가한 결과를 보여준다.

- 70 추가: 루트
- 31 추가: 루트 왼쪽 자식 마디
- 93 추가: 루트 오른쪽 자식 마디
- 94 추가: 93의 오른쪽 자식 마디
- 14 추가: 31의 왼쪽 자식 마디
- 23 추가: 14의 오른쪽 자식 마디
- 73 추가: 93의 왼쪽 자식 마디

<figure>
<div align="center"><img src="https://runestone.academy/runestone/books/published/pythonds3/_images/simpleBST.png" width="40%"></div>
</figure>

### 구현

[8장 트리와 힙](https://codingalzi.github.io/algopy/notebooks/algopy08_TreesHeaps.html)에서 정의한 `BinaryTree` 클래스를 이용하여 이진탐색트리를 구현하기에는
다음 두 요소 때문에 매우 어렵다.

- 트리의 루트 마디를 별도로 기억해야 한다. 
- 각 마디에 저장되는 부모자식 정보가 항목이 추가 또는 삭제될 때마다 수정되어야 한다.

#### `BinarySearchTree` 클래스와 `TreeNode` 클래스

여기서는 아래 두 개의 클래스를 활용하여 이진탐색트리를 구현한다.

- `BinarySearchTree` 클래스
    - `root` 속성: 이진탐색트리의 루트 마디 지정.
        - 기본값: `None`. 즉, 마디가 전혀 없는 이진탐색트리 생성.
    - 지정되는 루트 마디는 `TreeNode` 클래스의 객체
    - 예제: 아래 그림의 빨강 화살표.
- `TreeNode` 클래스
    - 부모 마디와 자식 마디 사이의 관계를 지정함.
        - `parent`: 부모 마디
        - `left_child`: 왼쪽 자식 마디
        - `right_child`: 오른쪽 자식 마디
    - 예제: 아래 그림 참조
        - 빨강 화살표: 루트 마디 참조
        - 검정 화살표: 자식 참조
        - 파랑 화살표: 부모 참조

<figure>
<div align="center"><img src="https://raw.githubusercontent.com/codingalzi/algopy/master/notebooks/_images/BinarySearchTree.png" width="47%"></div>
</figure>

**두 클래스의 상호작용**

`BinarySearchTree` 클래스의 객체는 루트가 존재하는지 여부만을 확인하며,
`TreeNode` 객체를 루트로 사용하는 경우 마디의 추가/삭제와 업데이트,
부모-자식간의 관계 정보 확인 및 업데이트 등을
활용하는 메서드를 제공한다. 
반면에 `TreeNode` 객체는 `BinarySearchTree` 클래스의 메서드가
수행하는 기능을 지원하는 메서드를 포함한다.

**`TreeNode` 클래스의 메서드**

`TreeNode` 클래스는 기본적으로 자식과 부모 마디에 대한 정보를 저장하고 활용하며,
이를 위해 제공되는 메서드는 다음과 같다.

- 속성 변수
    - `self.key`: 마디의 키
    - `self.value`: 키와 연관된 값
    - `self.left_child`: 왼쪽 자식 마디(`TreeNode` 객체)
    - `self.right_child`: 오른쪽 자식 마디(`TreeNode` 객체)
    - `self.parent`: 부모 마디(`TreeNode` 객체)
- `is_left_child(self)`: 자신이 부모 마디의 왼쪽 자식인지 여부 판단
- `is_right_child(self)`: 자신이 부모 마디의 오른쪽 자식인지 여부 판단
- `is_root(self)`: 자신이 루트 마디인지 여부 판단. 즉, 부모 마디가 없는지 여부 판단.
- `is_leaf(self)`: 자신이 잎루 마디인지 여부 판단. 즉, 자식 마디를 전혀 갖지 않는지 여부 판단.
- `has_a_child(self)`: 하나 이상의 자식 마디를 갖는지 여부 판단.
- `has_children(self)`: 왼쪽, 오른쪽 자식 마디 모두 갖는지 여부 판단.
- `replace_valuee(self, key, value, left, right)`: 
    - 자신의 키와 값 변경
    - 왼쪽, 오른쪽 자식 마디 지정 후 자신을 해당 마디들의 부모로 지정
- `find_successor(self)`: 현재 마디의 계승자 탐색
    - 좌우 자식 모두를 갖는 마디를 삭제하고자 할 경우 우측 서브트리의 최소 키(key)를 
        갖는 마디를 계승자로 지정.
    - 일반적으로 현재 마디의 키 다음으로 큰 키를 갖는 마디를 찾아야 함.
        프로그래밍 실습 문제 참조.
    - 계승자는 최대 한 개의 자식 마디를 가지게 됨.
- `find_min(self)`: 현재 마디를 루트로 갖는 서브트리에서 사용된 키의 최솟값
    - 맨 하단 좌측에 위치한 마디의 키
- `splice_out(self)`: 계승자 제거.
    - 제거되는 마디의 위치로 계승자를 옮기기 위해
        계승자가 원래 있던 자리에서 제거하는 과정
    - 계승자는 최대 하나의 자식 마디를 갖기에 나머지 마디를 계승자의 부모 마디에
        연결만 해주면 됨.
- `__iter__(self)`: 중위순회방식으로 루트마디에서 연결된 모드 마디의 키(key)를
    확인하는 이터레이터

`TreeNode` 클래스 전체 코드는 다음과 같다.

In [1]:
# 트리의 마디 클래스: 키와 값으로 이루어지며 좌우 자식과 부모 마디 정보 함께 보유
class TreeNode:
    def __init__(self, key, value, left=None, right=None, parent=None):
        self.key = key             # 키
        self.value = value         # 값
        self.left_child = left     # 좌측 자식 마디
        self.right_child = right   # 우측 자식 마디
        self.parent = parent       # 부모 마디

    # 좌측 자식 마디: 부모의 좌측 자식 마디 여부
    def is_left_child(self):
        return self.parent and self.parent.left_child is self

    # 우측 자식 마디: 부모의 우측 자식 마디 여부
    def is_right_child(self):
        return self.parent and self.parent.right_child is self

    # 루트: 부모가 없을 때
    def is_root(self):
        return not self.parent

    # 잎: 자식이 없을 때
    def is_leaf(self):
        return not (self.right_child or self.left_child)

    # 자식 존재 여부
    def has_a_child(self):
        return self.right_child or self.left_child

    # 좌우측 두 자식 모두 존재 여부
    def has_children(self):
        return self.right_child and self.left_child

    # 키, 값, 좌우 자식 지정
    def replace_value(self, key, value, left, right):
        self.key = key
        self.value = value
        self.left_child = left
        self.right_child = right
      
        # 새 자식의 부모로 자신을 지정
        if self.left_child:
            self.left_child.parent = self
        if self.right_child:
            self.right_child.parent = self

    # 현재 마디의 계승자 마디 탐색
    # 우측 자식이 있는 경우만 다뤄도 여기서는 목적 달성.
    # 모든 경우를 다루는 경우는 프로그래밍 실습 과제 참조.
    def find_successor(self):
        if self.has_children():
            successor = self.right_child.find_min()
        return successor
    
    # 현재 트리에 사용된 가장 작은 키
    def find_min(self):
        current = self
        while current.left_child:
            current = current.left_child
        return current

    # 계승자 마디 삭제 후 자식 마디들을 부모 마디에 이어 붙이기
    # 계승자는 자식을 하나만 갖기에 가능함.
    def splice_out(self):
        if self.is_leaf():
            if self.is_left_child():
                self.parent.left_child = None
            else:
                self.parent.right_child = None
        elif self.left_child:
            if self.is_left_child():
                self.parent.left_child = self.left_child
            else:
                self.parent.right_child = self.left_child
            
            self.left_child.parent = self.parent
        else:
            if self.is_left_child():
                self.parent.left_child = self.right_child
            else:
                self.parent.right_child = self.right_child
            
            self.right_child.parent = self.parent

    # 이터레이터: 중위순회방식으로 키(key) 확인
    def __iter__(self):
        if self:
            if self.left_child:
                for elem in self.left_child:
                    yield elem
            yield self.key
            if self.right_child:
                for elem in self.right_child:
                    yield elem

**`BinarySearchTree` 클래스의 메서드**

`BinarySearchTree` 클래스에서 제공하는 기능은 다음과 같다.

기능 1: 항목 추가

지정된 키와 값을 하나의 마디에 추가하거나 업데이트 한다. 

- `put(self, key, value)`: 적절한 위치의 마디의 키(key)와 값으로 지정.
    - 루트가 없는 경우: 루트 마디로 지정
    - 루트가 있는 경우: `_put(self, key, value, current_node)` 재귀 메서드를 활용하여 적절한 위치의 마디로 지정.
    - 키(key)가 이미 존재하는 경우 값(value) 업데이트.

아래 그림은 `19`를 `_put(self, key, value, current_node)` 함수가 적절한 위치에 넣는 
과정을 보여준다. 
`19`와 비교되는 마디는 회색 마디로 표시되었다.

<figure>
<div align="center"><img src="https://runestone.academy/runestone/books/published/pythonds3/_images/bstput.png" width="50%"></div>
</figure>

기능 2: 키의 값 확인

지정된 키(key)의 값(value)를 확인하는 일은 `put()` 메서드와 유사하다.

- `get(self, key)`: 지정된 키(key)를 갖는 마디에 저장된 값(value) 확인.
    - 루트가 없는 경우: `None` 반환
    - 루트가 있는 경우: `_get(self, key, current_node)` 재귀 메서드를 활용하여 적절한 위치의 마디에 저장된 값 반환
    - 키가 없으면 `None` 반환.

기능 3: 대괄호 연산자(`[]`) 지원

아래 두 메서드가 필요하다.

- `__setitem__(self, key, value)`
    - 예제: `my_zip_tree['Plymouth'] = 55446` 
    - `self.put(key, value)` 활용

- `__getitem__(self, key)`
    - 예제: `z = my_zip_tree['Plymouth']` 
    - `self.get(key)` 활용

기능 4: `in` 연산자 지원

아래 메서드가 필요하다.

- `__contains__(self, key)`
    - 예제: `if Plymouth in my_zip_tree: print(True)` 
    - 반환값: `bool(self._get(key, self.root))`

기능 5: 키-값 항목 제거

지정된 키(key)를 사용하는 마디를 제거한다.

- `delete(self, key)`:
    - 트리의 사이즈가 1, 즉 루트만 존재하는 경우: 루트의 키를 확인한 후 동일하면 루트 제거
    - 트리의 사이즈가 1보다 큰 경우: `self._get(key)` 를 이용하여 제거해야 할 마디 확인 후 
        `_delete()` 메서드로 해당 마디 제거.
    - 제거 대상 키가 존재하지 않는 경우 `KeyError` 오류 발생.
- `_delete(self, current_node)`: 지정된 마디 제거 후 자식 마디 재설정
    - 자식이 없는 잎 마디: 그냥 삭제. 부모 마디의 해당 자식 마디에 대한 정보 삭제.
    - 자식을 하나 갖는 마디: 해당 마디 삭제 후 자식 마디를 부모 마디에 연결.
    - 좌우 자식 모두 갖는 경우: 해당 마디를 계승자의 키-값으로 교체한 후 계승자 삭제.
- `__delitem__(self, key)`: `del` 연산자 지원.

`_delete()` 메서드가 작동하는 과정을 예를 들어 설명하면 다음과 같다.

- 잎 마디 제거: `16`을 키로 갖는 마디 제거

<figure>
<div align="center"><img src="https://runestone.academy/runestone/books/published/pythonds3/_images/bstdel1.png" width="80%"></div>
</figure>

- 자식을 하나 갖는 마디 제거: `25`를 키로 갖는 마디 제거

<figure>
<div align="center"><img src="https://runestone.academy/runestone/books/published/pythonds3/_images/bstdel2.png" width="85%"></div>
</figure>

- 좌우 자식 모두 갖는 마디 제거: `5`를 키로 갖는 마디 제거
    - 계승자 확인: `find_successor()` 활용
    - 계승자 제거: `splice_out()` 활용
    - 제거된 마디 정보 업데이트

<figure>
<div align="center"><img src="https://runestone.academy/runestone/books/published/pythonds3/_images/bstdel3.png" width="80%"></div>
</figure>

`BinarySearchTree` 클래스 전체 코드는 다음과 같다.

In [2]:
class BinarySearchTree:
    # 생성자: 아무 마디(TreeNode) 없는 이진탐색트리 생성. 
    # 자식 마디는 TreeNode에서 처리.
    def __init__(self):
        self.root = None    # TreeNode 객체
        self.size = 0

    # 트리 크기: 마디 개수
    def __len__(self):
        return self.size

    # 이터레이터: 모든 마디의 키를 중위순회방식으로 확인
    def __iter__(self):
        return self.root.__iter__()

    # 항목 추가: 루트 이외의 마디는 TreeNode에서 재귀적으로 처리
    def put(self, key, value):
        if not self.root:
            self.root = TreeNode(key, value)
        else:
            self._put(key, value, self.root)
        
        self.size = self.size + 1     # size를 1 키우기

    # 항목 추가 보조함수: 이진 탐색 트리 특성 유지
    def _put(self, key, value, current_node):
        if key < current_node.key:
            if current_node.left_child: 
                self._put(key, value, current_node.left_child)
            else: # 왼쪽 자식 없는 경우 마디 추가
                current_node.left_child = TreeNode(key, value, parent=current_node)
        elif key == current_node.key:  # value 업데이트
            current_node.value = value
            self.size = self.size - 1  # 키의 값을 대체하는 경우 size는 그대로 두기 위해
        else:
            if current_node.right_child:
                self._put(key, value, current_node.right_child)
            else: # 오른쪽 자식 없는 경우 마디 추가
                current_node.right_child = TreeNode(key, value, parent=current_node)

    # 사전식 키-값 지정: aBinTree[key] = value
    def __setitem__(self, key, value):
        self.put(key, value)

    #  키의 값 확인
    def get(self, key):
        if self.root:
            result = self._get(key, self.root)
            if result:
                return result.value
        return None

    # 키의 값 확인 보조함수: 키가 포함된 마디 반환. 재귀 적용
    def _get(self, key, current_node):
        if not current_node:
            return None
        if current_node.key == key:
            return current_node
        elif key < current_node.key:
            return self._get(key, current_node.left_child)
        else:
            return self._get(key, current_node.right_child)

    #  사전식 키의 값 확인: aBinTree[key]
    def __getitem__(self, key):
        return self.get(key)

    # 키 포함 여부 확인(in 연산자): key in aBinTree
    def __contains__(self, key):
        return bool(self._get(key, self.root))

    # 키 삭제: del 연산자에 활용됨
    def delete(self, key):
        # 하나의 마디만 있는 경우
        if self.size == 1 and self.root.key == key:
            self.root = None
            self.size = self.size - 1
        # 여러 마디가 있는 경우
        elif self.size > 1:
            # 삭제 대상 마디 확인
            node_to_remove = self._get(key, self.root)
            
            if node_to_remove:
                self._delete(node_to_remove)
                self.size = self.size - 1
            else:
                raise KeyError("키를 찾을 수 없음!")
        else:
            raise KeyError("키를 찾을 수 없음!")

    # 키 삭제 보조함수: 
    def _delete(self, current_node):
        # 잎 마디인 경우
        if current_node.is_leaf():
            if current_node == current_node.parent.left_child:
                current_node.parent.left_child = None
            else:
                current_node.parent.right_child = None
        
        # 좌우 자식 마디 모두 있는 경우: 계승자를 현재 마디로 옮김.
        elif current_node.has_children():
            successor = current_node.find_successor()
            successor.splice_out()
            current_node.key = successor.key
            current_node.value = successor.value
        
        # 자식 마디가 하나인 경우
        else:
            # 왼쪽 자식만 있는 경우
            if current_node.left_child:
                # 부모의 왼쪽 자식인 경우
                if current_node.is_left_child():
                    current_node.left_child.parent = current_node.parent
                    current_node.parent.left_child = current_node.left_child
                # 부모의 오른쪽 자식인 경우
                elif current_node.is_right_child():
                    current_node.left_child.parent = current_node.parent
                    current_node.parent.right_child = current_node.left_child
                # 루트인 경우
                else:
                    current_node.replace_value(
                        current_node.left_child.key,
                        current_node.left_child.value,
                        current_node.left_child.left_child,
                        current_node.left_child.right_child,
                    )
            
            # 오른쪽 자식만 있는 경우
            else:
                # 부모의 왼쪽 자식인 경우
                if current_node.is_left_child():
                    current_node.right_child.parent = current_node.parent
                    current_node.parent.left_child = current_node.right_child
                # 부모의 왼쪽 자식인 경우
                elif current_node.is_right_child():
                    current_node.right_child.parent = current_node.parent
                    current_node.parent.right_child = current_node.right_child
                # 루트인 경우
                else:
                    current_node.replace_value(
                        current_node.right_child.key,
                        current_node.right_child.value,
                        current_node.right_child.left_child,
                        current_node.right_child.right_child,
                    )
    
    # 키-값 쌍 삭제(del 연산자): del aBinTree[key]
    def __delitem__(self, key):
        self.delete(key)

**예제**

다음 키-값 쌍으로 이루어진 이진탐색트리를 생성한다.

```python
"a":"art"
"q":"quick"
"b":"brown"
"f":"fox"
"j":"jumps"
"o":"over"
"t":"the"
"l":"lazy"
"d":"dog"
```

이후 `"q"`의 값을 `"quiet"`로 수정한 후에
포함된 항목을 확인한다.

In [3]:
# 9개 항목 추가
my_tree = BinarySearchTree()
my_tree["a"] = "art"
my_tree["q"] = "quick"
my_tree["b"] = "brown"
my_tree["f"] = "fox"
my_tree["j"] = "jumps"
my_tree["o"] = "over"
my_tree["t"] = "the"
my_tree["l"] = "lazy"
my_tree["d"] = "dog"

# 추가된 항목 일부 확인
print("=== 추가된 항목 일부 확인 ===\n")
print("q의 값:", my_tree["q"])
print("l의 값:", my_tree["l"])

# q의 값 업데이트
my_tree["q"] = "quiet"

print("\n=== q의 값 업데이트 ===\n")
print("q의 값:", my_tree["q"])
print("l의 값:", my_tree["l"])

print("\n=== 트리 사이즈 ===\n")
print(f"이진탐색트리에 {len(my_tree)} 개의 항목이 있다.")

# 항목 삭제
my_tree.delete("a")
print(f"키 a를 삭제하면 {len(my_tree)} 개의 항목이 남는다.")

# 남은 항목의 키-값 확인
print("\n=== 트리 항목 ===\n")
print("남은 항목의 키-값은 다음과 같다.\n")
for node in my_tree:
    print(f"{node}: {my_tree[node]}")
print()

=== 추가된 항목 일부 확인 ===

q의 값: quick
l의 값: lazy

=== q의 값 업데이트 ===

q의 값: quiet
l의 값: lazy

=== 트리 사이즈 ===

이진탐색트리에 9 개의 항목이 있다.
키 a를 삭제하면 8 개의 항목이 남는다.

=== 트리 항목 ===

남은 항목의 키-값은 다음과 같다.

b: brown
d: dog
f: fox
j: jumps
l: lazy
o: over
q: quiet
t: the



### 이진탐색트리 분석

`put()`과 `get()` 메서드, `in`과 `del` 연산자 모두 
생성된 이진탐색트리의 높이(height)에 의존한다. 
트리의 사이즈가 $n$일 때 
무작위로 생성된 트리의 경우 높이가 대략 $\log_2{n}$이다.
그리고 이런 경우 모든 메서드와 연산자의 시간복잡도는 $O(\log_2{n})$이다.
하지만 아래의 경우 또한 발생할 수 있으며 그런 경우 시간복잡도는 최악의 경우
$O(n)$이다.

<figure>
<div align="center"><img src="https://runestone.academy/runestone/books/published/pythonds3/_images/skewedTree.png" width="30%"></div>
</figure>

**연습문제**

1. 리스트 `[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]`의 항목을 차례대로 추가한 이진탐색트리를 그려라.

1. 리스트 `[10, 9, 8, 7, 6, 5, 4, 3, 2, 1]`의 항목을 차례대로 추가한 이진탐색트리를 그려라.
    
1. 리스트 `[68, 88, 61, 89, 94, 50, 4, 76, 66, 82]`의 항목을 차례대로 추가한 이진탐색트리를 그려라.

1. 리스트를 무작위로 생성한 후에 해당 리스트의 항목을 차례대로 추가한 이진탐색트리를 그려라.

## 프로그래밍 실습 과제

1. 본문에서 `TreeNode`의 메섣드로 정의한 `find_successor()` 함수는 
    좌우측 자식을 모두 갖는 경우만 다룬다. 
    그렇지 않은 일반적인 경우까지 다루도록 하려면 아래와 같이
    수정해야 한다. 
   
    ```python
    def find_successor(self):
        successor = None
        if self.right_child:
            successor = self.right_child.find_min()
        else: # 우측 자식 없는 경우
            if self.parent:
                if self.is_left_child():
                    successor = self.parent
                else: # 부모의 우측 자식인 경우: 자신을 제외한 부모의 계승자 활용
                    self.parent.right_child = None 
                    successor = self.parent.find_successor()
                    self.parent.right_child = self
        return successor
    ```
    
    일반화된 `find_successor()` 메서드를 이용하여 중위순회(inorder traversal) 방식으로
    이진탐색트리를 순회하는 메서드를 구현하라.

1. 이진탐색트리 코드를 수정하여 스레드 이진탐색트리 클래스로 만들어라.
    그리고 스레드 이진탐색트리의 모든 마디를 순회하는 중위순회 알고리즘을 
    비재귀(non-recursive) 함수로 구현하라. 
    스레트 이진트리에 대한 설명은 [스레드 이진트리 개념](https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=royal2030&logNo=221544336513)를
    참조한다.