# 트리의 정의
- 부모-자식 관계로 정의하고, 부모에서 자식으로 간선이 이어져 있는 유향 그래프이다.
- 재귀로 정의된(Recursive Defined) 자기 참조(Self-Referential) 자료구조이다.\
(부모 노드 밑에 여러 자식 노드가 연결되고, 자식 노드 각각에 다시 자식 노드가 연결되는 재귀적 형태의 자료구조다. 쉽게 말해, 트리는 자식도 트리고 또 그 자식도 트리다)

# 트리의 각 명칭
![image.png](attachment:image.png)

- Node: 트리에서 데이터를 저장하는 기본 요소 (데이터와 다른 연결된 노드에 대한 Branch 정보 포함)
- Root Node: 트리에서 부모가 없는 최상위 노드, 트리의 시작점(루트는 자식 노드를 가지며, 간선(edge)로 연결되어 있다.
- Level: 루트 노드(level=0)부터 노드까지 연결된 간선 수의 합
- Parent Node: 루트 노드 방향으로 직접 연결된 노드
- Child Node: 어떤 노드의 상위 레벨에 연결된 노드
- Leaf Node (Terminal Node): Child Node가 하나도 없는 노드
- Degree: 자식 노드의 개수
- Sibling (Brother Node): 동일한 Parent Node를 가진 노드
- Depth: 트리에서 Node가 가질 수 있는 최대 Level
- Height: 가장 긴 루트 경로의 길이

# 그래프 VS 트리
<u>Q. 그래프와 트리의 차이점은 무엇일까?</u>
> "트리는 <b>순환 구조를 갖지 않는 그래프</b>이다."

- 트리는 특수한 형태의 그래프의 일종이며, 그래프와 달리 어떤 경우에도 한번 연결된 노드가 다시 연결되지 않는다.
- 단방향, 양방향을 모두 가리킬 수 있는 그래프와 달리, 트리는 부모 노드에서 자식 노드를 가리키는 <b>단방향</b>뿐이다.
- 하나의 부모 노드만 가져야 하고, 루트 또한 하나여야 한다.

# 이진 트리(Binary Tree)
- 이진 트리: 부모 노드 밑의 자식 노드 개수(=차수, degree)를 최대 2개로 제한하는, 가장 기본적인 트리
![image.png](attachment:image.png)

**이진 트리의 유형**
- 정 이진 트리(Full Binary Tree): 모든 노드가 0개 또는 2개의 자식 노드를 갖는다.
- 완전 이진 트리(Complete Binary Tree): 마지막 레벨을 제외하고 모든 레벨이 완전히 채워져 있으며, 마지막 레벨의 모든 노드는 가장 왼쪽부터 채워져 있다.
- 포화 이진 트리(Perfect Binary Tree): 모든 노드가 2개의 자식 노드를 갖고 있으며, 모든 리프 노드가 동일한 깊이 또는 레벨을 갖는다. 문자 그대로, 가장 완벽한 유형의 트리다.

## 이진 트리 순회 방법
**In-order traversal(중위 순회)**
<img src="http://108.61.119.12/wp-content/uploads/2014/10/binary-tree-1-order-small.gif" width="400px" height="300px">
- 왼쪽 자손, 자신, 오른쪽 자손 순서로 방문하는 순회 방법. 이진 탐색 트리를 중위 순회하면 정렬된 결과를 얻을 수 있다.

**Pre-order traversal(전위 순회)**
<img src="http://108.61.119.12/wp-content/uploads/2014/10/binary-tree-1-pre-order-small.gif" width="400px" height="300px">
- 자신, 왼쪽 자손, 오른쪽 자손 순서로 방문하는 순회 방법

**Post-order traversal(후위 순회)**
<img src="http://108.61.119.12/wp-content/uploads/2014/10/binary-tree-1-post-order-small.gif" width="400px" height="300px">
- 왼쪽 자손, 오른쪽 자손, 자신 순서로 방문하는 순회 방법

**Level-order traversal(레벨 순서 순회)**
<img src="http://108.61.119.12/wp-content/uploads/2014/10/binary-tree-1-level-order-small.gif" width="400px" height="300px">
- 너비 우선 순회(Breadth-First traversal)라고도 한다. 노드를 레벨 순서로 방문하는 순회 방법. 위의 세 가지 방법은 스택을 활용하여 구현할 수 있는 반면 레벨 순서 순회는 큐를 활용해 구현할 수 있다.

# 이진 탐색 트리(Binary Search Tree, BST)
- 이진 탐색 트리 (Binary Search Tree, BST): 이진 트리에 다음과 같은 추가적인 조건이 있는 트리
  - 왼쪽 노드는 해당 노드보다 작은 값, 오른쪽 노드는 해당 노드보다 큰 값을 가지고 있다.
  - 정렬된 트리. 검색과 저장, 삭제의 시간 복잡도는 모두 $O(logN)$이고, worst case는 한 쪽으로 치우친 트리가 됐을 때 $O(N)$이다.
  
<img src="https://www.mathwarehouse.com/programming/images/binary-search-tree/binary-search-tree-insertion-animation.gif" />

(출처: https://www.mathwarehouse.com/programming/gifs/binary-search-tree.php#binary-search-tree-insertion-node)  

## 자료 구조 이진 탐색 트리의 장점과 주요 용도
- 주요 용도: 데이터 검색(탐색) 
- 장점: 탐색 속도를 개선할 수 있음

## 이진트리와 정렬된 배열간의 탐색 비교
<img src="https://www.mathwarehouse.com/programming/images/binary-search-tree/binary-search-tree-sorted-array-animation.gif" />

값을 찾을 때뿐만이 아니라 값을 삽입하거나 삭제할 때도 똑같은 과정을 거치므로, 이상적인 상황에서 탐색/삽입/삭제 모두 시간복잡도가 $O(log N)$이 된다.

(출처: https://www.mathwarehouse.com/programming/gifs/binary-search-tree.php#binary-search-tree-insertion-node)

---

# 파이썬 객체지향 프로그래밍으로 이진 탐색 트리 구현하기

## 노드 클래스 만들기

In [234]:
class Node(object):
    def __init__(self, data):
        self.data = data
        self.left = self.right = None

In [None]:
class BinarySearchTree(object):
    def __init__(self):
        self.root = None

## 이진 탐색 트리에 데이터 삽입
- 이진 탐색 트리 조건에 부합하게 데이터를 넣어야 함(재귀)

In [236]:
class BinarySearchTree(object):

    def insert(self, data):
        self.root = self._insert_value(self.root, data)
        return self.root is not None

    def _insert_value(self, node, data):
        if node is None: 
            node = Node(data) 
        else:
            if data <= node.data: # 삽입하려는 data가 현재 노드의 값보다 작다면
                node.left = self._insert_value(node.left, data) # 왼쪽 노드에 삽입
            else: # 현재 노드의 값보다 크다면
                node.right = self._insert_value(node.right, data) # 오른쪽 노드에 삽입
        return node

## 이진 탐색 트리 탐색

In [None]:
class BinarySearchTree(object):
    
    def find(self, key):
        return self._find_value(self.root, key)

    def _find_value(self, root, key):
        if root is None or root.data == key:
            return root is not None
        elif key < root.data: # key값이 현재 노드의 값보다 작다면
            return self._find_value(root.left, key) # 왼쪽 노드를 탐색
        else: # key값이 현재 노드의 값보다 크다면
            return self._find_value(root.right, key) # 오른쪽 노드를 탐색

## 이진 탐색 트리 삭제

### Leaf Node 삭제 
* Leaf Node: Child Node 가 없는 Node
* 삭제할 Node의 Parent Node가 삭제할 Node를 가리키지 않도록 한다. 
<img src="http://www.fun-coding.org/00_Images/tree_remove_leaf.png" width="800" />

### Child Node 가 하나인 Node 삭제 
* 삭제할 Node의 Parent Node가 삭제할 Node의 Child Node를 가리키도록 한다.
<img src="http://www.fun-coding.org/00_Images/tree_remove_1child.png" width="800" />

### Child Node 가 두 개인 Node 삭제
1. **삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 삭제할 Node의 Parent Node가 가리키도록 한다.**
2. 삭제할 Node의 왼쪽 자식 중, 가장 큰 값을 삭제할 Node의 Parent Node가 가리키도록 한다.
<img src="http://www.fun-coding.org/00_Images/tree_remove_2child.png" width="800" />

**EX.삭제할 Node의 오른쪽 자식중, 가장 작은 값을 삭제할 Node의 Parent Node가 가리키게 할 경우**
- 삭제할 Node의 오른쪽 자식 선택
- 오른쪽 자식의 가장 왼쪽에 있는 Node를 선택
- 해당 Node를 삭제할 Node의 Parent Node의 왼쪽 Branch가 가리키게 함
- 해당 Node의 왼쪽 Branch가 삭제할 Node의 왼쪽 Child Node를 가리키게 함
- 해당 Node의 오른쪽 Branch가 삭제할 Node의 오른쪽 Child Node를 가리키게 함
- 만약 해당 Node가 오른쪽 Child Node를 가지고 있었을 경우에는, 해당 Node의 본래 Parent Node의 왼쪽 Branch가 해당 오른쪽 Child Node를 가리키게 함

## 이진 탐색 트리 삭제 코드 구현과 분석

### 삭제할 Node 탐색
삭제할 Node가 없는 경우도 처리해야 함
- 이를 위해 삭제할 Node가 없는 경우는 False를 리턴하고, 함수를 종료 시킴

In [237]:
class BinarySearchTree(object):
    
    def delete(self, key):
        self.root, deleted = self._delete_value(self.root, key)
        return deleted

    def _delete_value(self, node, key):
        if node is None:
            return node, False

        deleted = False
        if key == node.data:
            deleted = True
            if node.left and node.right:
                # replace the node to the leftmost of node.right
                parent, child = node, node.right
                while child.left is not None:
                    parent, child = child, child.left
                child.left = node.left
                if parent != node:
                    parent.left = child.right
                    child.right = node.right
                node = child
            elif node.left or node.right:
                node = node.left or node.right
            else:
                node = None
        elif key < node.data:
            node.left, deleted = self._delete_value(node.left, key)
        else:
            node.right, deleted = self._delete_value(node.right, key)
        return node, deleted

### Case1: 삭제할 Node가 Leaf Node인 경우
![image.png](attachment:image.png)

### Case2: 삭제할 Node가 Child Node를 한 개 가지고 있을 경우
![image.png](attachment:image.png)

### Case3-1: 삭제할 Node가 Child Node를 두 개 가지고 있을 경우 (삭제할 Node가 Parent Node <u>왼쪽</u>에 있을 때)
* 기본 사용 가능 전략
  1. **삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 삭제할 Node의 Parent Node가 가리키도록 한다.**
  2. 삭제할 Node의 왼쪽 자식 중, 가장 큰 값을 삭제할 Node의 Parent Node가 가리키도록 한다.
  
  
* 기본 사용 가능 전략 중, 1번 전략을 사용하여 코드를 구현하기로 함
  - 경우의 수가 또다시 두가지가 있음
    - **Case3-1-1:** 삭제할 Node가 Parent Node의 왼쪽에 있고, 삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 가진 Node의 Child Node가 없을 때
    - **Case3-1-2:** 삭제할 Node가 Parent Node의 왼쪽에 있고, 삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 가진 Node의 오른쪽에 Child Node가 있을 때
       - 가장 작은 값을 가진 Node의 Child Node가 왼쪽에 있을 경우는 없음, 왜냐하면 왼쪽 Node가 있다는 것은 해당 Node보다 더 작은 값을 가진 Node가 있다는 뜻이기 때문임


<img src="http://www.fun-coding.org/00_Images/tree_remove_2child_code_left.png" width="600" />

### Case3-2: 삭제할 Node가 Child Node를 두 개 가지고 있을 경우 (삭제할 Node가 Parent Node <u>오른쪽</u>에 있을 때)
* 기본 사용 가능 전략
  1. **삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 삭제할 Node의 Parent Node가 가리키도록 한다.**
  2. 삭제할 Node의 왼쪽 자식 중, 가장 큰 값을 삭제할 Node의 Parent Node가 가리키도록 한다.
  
  
* 기본 사용 가능 전략 중, 1번 전략을 사용하여 코드를 구현하기로 함
  - 경우의 수가 또다시 두가지가 있음
    - **Case3-2-1:** 삭제할 Node가 Parent Node의 오른쪽에 있고, 삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 가진 Node의 Child Node가 없을 때
    - **Case3-2-2:** 삭제할 Node가 Parent Node의 오른쪽에 있고, 삭제할 Node의 오른쪽 자식 중, 가장 작은 값을 가진 Node의 오른쪽에 Child Node가 있을 때
       - 가장 작은 값을 가진 Node의 Child Node가 왼쪽에 있을 경우는 없음, 왜냐하면 왼쪽 Node가 있다는 것은 해당 Node보다 더 작은 값을 가진 Node가 있다는 뜻이기 때문임


<img src="http://www.fun-coding.org/00_Images/tree_remove_2child_code_right.png" width="600" />

## 이진 탐색 트리 전체 소스 코드

In [75]:
class Node(object):
    def __init__(self, data):
        self.data = data
        self.left = self.right = None
                
class BinarySearchTree(object):
    
    def __init__(self):
        self.root = None
        
    def insert(self, data):
        self.root = self._insert_value(self.root, data)
        return self.root is not None

    def _insert_value(self, node, data):
        if node is None:
            node = Node(data)
        else:
            if data <= node.data:
                node.left = self._insert_value(node.left, data)
            else:
                node.right = self._insert_value(node.right, data)
        return node
        
    def find(self, key):
        return self._find_value(self.root, key)

    def _find_value(self, root, key):
        if root is None or root.data == key:
            return root is not None
        elif key < root.data:
            return self._find_value(root.left, key)
        else:
            return self._find_value(root.right, key)
    
    def delete(self, key):
        self.root, deleted = self._delete_value(self.root, key)
        return deleted # 삭제 여부

    def _delete_value(self, node, key):
        if node is None:
            return node, False

        deleted = False # 삭제 여부
        if key == node.data: # 삭제할 노드를 찾으면
            deleted = True # 삭제 가능
            if node.left and node.right: # 삭제할 노드가 왼쪽, 오른쪽 자식 노드를 가지고 있을 경우
                # replace the node to the leftmost of node.right
                parent, child = node, node.right
                while child.left is not None: # 삭제할 노드의 오른쪽 노드 중 왼쪽 노드의 가장 작은 값
                    parent, child = child, child.left
                child.left = node.left
                if parent != node:
                    parent.left = child.right
                    child.right = node.right
                node = child
            elif node.left or node.right: # 삭제할 노드가 왼쪽 or 오른쪽 노드 중 하나를 가지고 있는 경우
                node = node.left or node.right
            else:
                node = None
        elif key < node.data:
            node.left, deleted = self._delete_value(node.left, key)
        else:
            node.right, deleted = self._delete_value(node.right, key)
        return node, deleted

In [221]:
array = [10, 7, 15, 6, 8, 13, 11, 14, 18, 16, 17, 19]

bst = BinarySearchTree()
for x in array:
    bst.insert(x)

# Find
print(bst.find(10)) # True
print(bst.find(20)) # False

# Delete
print(bst.delete(55)) # False
print(bst.delete(14)) # True
print(bst.delete(15)) # True

True
False
False
True
True


![image.png](attachment:image.png)

## 이진 탐색 트리의 시간 복잡도
**시간 복잡도 (탐색시)**
  - depth (트리의 높이) 를 h라고 표기한다면, O(h)
  - n개의 노드를 가진다면, $h = log_2{n} $ 에 가까우므로, 시간 복잡도는 $ O(log{n}) $ 
     - 참고: 빅오 표기법에서 $log{n}$ 에서의 log의 밑은 10이 아니라, 2입니다.
       - 한번 실행시마다, 50%의 실행할 수도 있는 명령을 제거한다는 의미. 즉 50%의 실행시간을 단축시킬 수 있다는 것을 의미함
<img src="https://www.mathwarehouse.com/programming/images/binary-search-tree/binary-search-tree-sorted-array-animation.gif" />

(출처: https://www.mathwarehouse.com/programming/gifs/binary-search-tree.php#binary-search-tree-insertion-node)

## 이진 탐색 트리 단점
  - 평균 시간 복잡도는 $ O(log{n}) $ 이지만, 
    - 이는 트리가 균형잡혀 있을 때의 평균 시간복잡도이며,
  - 다음 예와 같이 구성되어 있을 경우(정렬된 데이터), 최악의 경우는 모든 데이터를 살펴봐야 할 수 있어, 링크드 리스트등과 동일한 성능을 보여줌: $O(n)$
  - 오름차순이든 내림차순이든 정렬된 데이터가 입력되면 한쪽으로 치우친(skewed) 트리가 만들어지기 때문이다.
<img src="http://www.fun-coding.org/00_Images/worstcase_bst.png" width="300" />

**참고**
- http://ejklike.github.io/2018/01/09/traversing-a-binary-tree-1.html
- https://www.fun-coding.org/Chapter10-tree.html
- https://namu.wiki/w/%ED%8A%B8%EB%A6%AC(%EA%B7%B8%EB%9E%98%ED%94%84)