# 탐색트리

## 9.1 탐색트리란?

이진탐색트리(BST, Binary Search Tree): 효율적인 탐색을 위한 이진트리 기반의 자료구조이다.
- 모든 노드는 유일한 키 값을 갖는다.
- 왼쪽 서브트리의 키들은 루트의 키보다 작다.
- 오른쪽 서브트리의 키들은 루트의 키보다 크다.
- 왼쪽과 오른쪽 서브트리도 이진탐색트리이다.

![image](https://user-images.githubusercontent.com/68596881/107362600-4e30a800-6b1c-11eb-87a4-a6d3ec5824c7.png)

## 9.2 이진탐색트리의 연산

이진탐색트리는 탐색을 위한 자료구조이므로 노드의 데이터는 하나의 엔트리, 즉 (탐색키, 키에 대한 값)의 형태가 되어야 한다.  
이진탐색트리를 위한 노드 클래스 BSTNode를 다음과 같이 정의한다.

In [1]:
class BSTNode:
    def __init__(self, key, value):
        self.key = key
        self.value = value
        self.left = None
        self.right = None

### 탐색 연산
#### 키를 이용한 탐색

- key == 루트의 키 값: 루트가 찾는 노드임. 탐색 성공.
- key < 루트의 키 값: 찾는 노드는 왼쪽 서브트리에 있음. 탐색을 루트의 왼쪽 자식을 기준으로 다시 시작
- key > 루트의 키 값: 찾는 노드는 오른쪽 서브트리에 있음. 탐색을 루트의 오른쪽 자식을 기준으로 다시 시작

![image](https://user-images.githubusercontent.com/68596881/107362644-5c7ec400-6b1c-11eb-9bf8-0e93a66cef25.png)

In [2]:
#순환함수
def search_bst(n, key):
    if n == None:
        return None
    elif key == n.key:
        return n
    elif key < n.key:
        return search_bst(n.left, key)
    else:
        return search_bst(n.right, key)
    
#반복함수
def search_bst_iter(n, key):
    while n != None:
        if key == n.key:
            return n
        elif key < n.key:
            n = n.left
        else:
            n = n.right
    return None

#### 값을 이용한 탐색  
트리의 모든 노드를 하나씩 검사하면 된다. 탐색의 효율은 떨어진다. 왜냐하면 트리의 모든 노드를 검사해야하기 때문이다.  
시간 복잡도는 $O(n)$

In [3]:
#이진탐색트리 탐색연산(preorder사용): 값을 이용한 탐색
def search_value_bst(n, value):
    if n == None:
        return None
    elif value == n.value:
        return n
    res = search_value_bst(n.left, value) #왼쪽서브트리에서 탐색
    if res is not None: #성공하면 결과 반환
        return res
    else: #실패하면 오른쪽을 탐색해 결과 반환
        return search_value_bst(n.right, value)

#### 최대와 최소 노드 탐색
최대 키는 트리의 가장 오른쪽 노드에 있고, 최소 키는 트리의 가장 왼쪽 노드에 있다.

In [4]:
def search_max_bst(n):
    while n != None and n.right != None:
        n = n.right
    return n

def search_min_bst(n):
    while n != None and n.left != None:
        n = n.left
    return n

### 삽입 연산

삽입 연산을 위해서는 먼저 삽입할 노드의 키를 이용한 탐색 과정을 수행해야 하는데, 탐색에 실패한 위치가 바로 새로운 노드를 삽입해야 하는 위치이기 때문이다.  
<br>
![image](https://user-images.githubusercontent.com/68596881/107362674-67d1ef80-6b1c-11eb-82f7-de76dd4e1c57.png)

In [5]:
#이진탐색트리 삽입연산 (노드를 삽입함): 순환구조
def insert_bst(r, n):
    if n.key < r.key:
        if r.left is None:
            r.left = n
            return True
        else:
            return insert_bst(r.left, n)
    elif n.key > r.key:
        if r.right is None:
            r.right = n
            return True
        else:
            return insert_bst(r.right, n)
    else: #키가 중복되면 삽입하지 않음
        return False

### 삭제 연산

1) 삭제할 노드가 단말 노드인 경우  
2) 삭제할 노드가 하나의 자식을 갖는 경우  
3) 두 개의 자식을 모두 갖는 경우

#### case1
![image](https://user-images.githubusercontent.com/68596881/107362700-728c8480-6b1c-11eb-92a0-714b06fd1266.png)

In [6]:
def delete_bst_case1(parent, node, root):
    if parent is None: #삭제할 단말 노드가 루트이면
        root = None  #공백 트리가 됨
    else:
        if parent.left == node:
            parent.left = None
        else:
            parent.right = None
            
    return root #root가 변경될 수도 있으므로 반환

#### case2
![image](https://user-images.githubusercontent.com/68596881/107362721-7a4c2900-6b1c-11eb-9d48-3cab487b90bc.png)

In [7]:
def delete_bst_case2(parent, node, root):
    if node.left is not None: #삭제할 노드가 왼쪽 자식만 가짐
        child = node.left
    else: #삭제할 노드가 오른쪽 자식만 가짐
        child = node.right
    
    if node == root:
        root = child
    else:
        if node is parent.left:
            parent.left = child
        else:
            parent.right = child
    
    return root #root가 변경될 수도 있으므로 반환

#### case3
![image](https://user-images.githubusercontent.com/68596881/107362745-82a46400-6b1c-11eb-9d0a-3be09cb649d4.png)

In [8]:
def delete_bst_case3(parent, node, root):
    succp = node #후계장의 부모 노드
    succ = node.right #후계자 노드
    while (succ.left != None): #후계자와 부모노드 탐색
        succp = succ
        succ = succ.left
        
    if (succp.left == succ): #후계자가 왼쪽 자식이면
        succp.left = succ.right #후계자의 오른쪽 자식 연결
    else: #후계자가 오른쪽 자식이면
        succp.right = succ.right #후계자의 왼쪽 자식 연결
    
    #후계자의 키와 값을 삭제할 노드에 복사
    node.key = succ.key
    node.value = succ.value
    node = succ 
    
    return root #일관성을 위해 root 반환

In [9]:
#이진탐색트리 삭제연산
def delete_bst(root, key):
    if root == None:
        return None

    parent = None
    node = root
    while node != None and node.key != key:
        parent = node
        if key < node.key:
            node = node.left
        else:
            node = node.right
    
    if node == None: #삭제할 노드가 없음
        return None
    if node.left == None and node.right == None: #case1
        root = delete_bst_case1(parent, node, root)
    elif node.left == None or node.right == None: #case2
        root = delete_bst_case2(parent, node, root)
    else: #case3
        root = delete_bst_case3(parent, node, root)
    return root

## 9.3 이진탐색트리를 이용한 맵

In [21]:
#8장에서 구현한 함수
def count_node(n):
    if n is None:
        return 0
    else:
        return 1+count_node(n.left) + count_node(n.right)
    
def inorder(n):
    if n is not None:
        inorder(n.left) #먼저 왼쪽
        print(n.key, end = ' ') #루트노드 처리
        inorder(n.right)

In [22]:
class BSTMap():
    def __init__(self):
        self.root = None #트리의 루트 노드
        
    def isEmpty(self):
        return self.root == None
    
    def claer(self):
        self.root = None
    
    def size(self):
        return count_node(self.root)
    
    def search(self, key):
        return search_bst(self.root, key)
    
    def searchValue(self, key):
        return search_value_bst(self.root, key)
    
    def findMax(self):
        return search_max_bst(self.root)
    
    def findMin(self):
        return search_min_bst(self.root)
    
    def insert(self, key, value = None):
        n = BSTNode(key, value) #새로운 노드 생성
        if self.isEmpty(): #공백이면 루트노드로 삽입
            self.root = n
        else: #공백이 아니면 
            insert_bst(self.root, n)
    
    def delete(self, key):
        self.root = delete_bst(self.root, key)
    
    def display(self, msg = 'BSTMap :'):
        print(msg, end = '')
        inorder(self.root)
        print()

In [23]:
map = BSTMap()
data = [35, 18, 7, 26, 12, 3, 68, 22, 30, 99]

print('[삽입 연산] : ', data)
for key in data:
    map.insert(key)
map.display('[중위 순회] :')
if map.search(26) != None:
    print('[탐색 26] : 성공')
else:
    print('[탐색 26] : 실패')
if map.search(25) != None:
    print('[탐색 25] : 성공')
else:
    print('[탐색 25] : 실패')

map.delete(3); map.display("[   3 삭제] :")
map.delete(68); map.display("[  68 삭제] :")
map.delete(18); map.display("[  18 삭제] :")
map.delete(35); map.display("[  35 삭제] :")

[삽입 연산] :  [35, 18, 7, 26, 12, 3, 68, 22, 30, 99]
[중위 순회] :3 7 12 18 22 26 30 35 68 99 
[탐색 26] : 성공
[탐색 25] : 실패
[   3 삭제] :7 12 18 22 26 30 35 68 99 
[  68 삭제] :7 12 18 22 26 30 35 99 
[  18 삭제] :7 12 22 26 30 35 99 
[  35 삭제] :7 12 22 26 30 99 


## 9.4 심화 학습: 균형이진탐색트리

AVL트리: 모든 노드에서 왼쪽 서브트리와 오른쪽 서브트리의 높이 차가 1을 넘지 않는 이진탐색트리이다. 즉 모든 노드의 균형 인수는 0이나 $\pm$1이 되어야 한다.  
균형 인수: 왼쪽 서브트리의 높이와 오른쪽 서브트리의 높이 차

![image](https://user-images.githubusercontent.com/68596881/107525936-adfd8080-6bfa-11eb-866d-7cd5bcd954e9.png)

### AVL트리의 삽입 연산
새로 삽입된 노드 N으로부터 가장 가까우면서 균형 인수가 $\pm$2가 된 조상 노드를 A라고 하자.
- LL 타입: N이 A의 왼쪽 자식의 왼쪽 서브 트리에 삽입된다.
- LR 타입: N이 A의 왼쪽 자식의 오른쪽 서브 트리에 삽입된다.
- RR 타입: N이 A의 오른쪽 자식의 오른쪽 서브 트리에 삽입된다.
- RL 타입: N이 A의 오른쪽 자식의 왼쪽 서브 트리에 삽입된다.

#### LL 회전

![image](https://user-images.githubusercontent.com/68596881/107526014-c1a8e700-6bfa-11eb-87d2-9fc90733780b.png)

In [24]:
def rotateLL(A):
    B = A.left
    A.left = B.right
    B.right = A
    return B #새로운 루트 B를 반환

#### RR 회전

![image](https://user-images.githubusercontent.com/68596881/107526091-d38a8a00-6bfa-11eb-9e6d-a78f375e1853.png)

In [25]:
def rotateRR(A):
    B = A.right
    A.right = B.left
    B.left = A
    return B # 새로운 루트 B 반환

#### RL 회전

![image](https://user-images.githubusercontent.com/68596881/107526127-dc7b5b80-6bfa-11eb-90fd-a06e8309736f.png)

In [26]:
def rotateRL(A):
    B = A.right
    A.right = rotateLL(B)
    return rotateRR(A)

#### LR 회전

![image](https://user-images.githubusercontent.com/68596881/107526154-e69d5a00-6bfa-11eb-8eeb-f0a0119b66b6.png)


In [27]:
def rotateLR(A):
    B = A.left
    A.left = rotateRR(B)
    return rotateLL(A)

#### 재균형 함수

In [30]:
#8장에서 구현한 함수
def calc_height(n):
    if n is None: # 공백트리 --> 0 반환
        return 0
    hLeft = calc_height(n.left) # 왼쪽 트리의 높이
    hRight = calc_height(n.right) #오른쪽 트리의 높이
    if (hLeft > hRight): #더 높은 높이에 1을 더해 반환
        return hLeft + 1
    else:
        return hRight + 1

def calc_height_diff(n):
    if n is None:
        return 0
    return calc_height(n.left) - calc_height(n.right)

In [31]:
def reBalance(parent):
    hDiff = calc_height_diff(parent)
    
    if hDiff > 1:
        if calc_height_diff(parent.left) > 0:
            parent = rotateLL(parent)
        else:
            parent = rotateLR(parent)
    elif hDiff < -1:
        if calc_height_diff(parent.right) < 0:
            parent = rotateRR(parent)
        else:
            parent = rotateRL(parent)
    return parent

#### 삽입 함수
- 삽입이 끝나면 반드시 재균형 함수를 호출해서 균형을 확인해야 한다.
- 이진탐색트리에서와 달리 삽입 후 서브트리의 루트노드가 변경되는 경우가 많다. 따라서 루트를 반환해야 한다.

In [32]:
def insert_avl(parent, node):
    if node.key < parent.key:
        if parent.left != None:
            parent.left = insert_avl(parent.left, node)
        else:
            parent.left = node
        return reBalance(parent)
    
    elif node.key > parent.key:
        if parent.right != None:
            parent.right = insert_avl(parent.right, node)
        else:
            parent.right = node
        return reBalance(parent)
    else:
        print('중복된 키 에러')

### AVL트리를 이용한 맵

In [38]:
#8장에서 구현한 함수
def levelorder(root):
    queue = CircularQueue()
    queue.enqueue(root) # 최초에 큐에는 루트 노드만 들어있음
    while not queue.isEmpty(): # 큐가 공백상태가 아닌 동안
        n = queue.dequeue() #큐에서 맨 앞의 노드 n을 꺼냄
        if n is not None:
            print(n.key, end = ' ') #먼저 노드의 정보를 출력
            queue.enqueue(n.left) #왼쪽 자식 노드를 큐에 삽입
            queue.enqueue(n.right) #오른쪽 자식 노드를 큐에 삽입

MAX_QSIZE = 10
class CircularQueue:
    def __init__(self):
        self.front = 0
        self.rear = 0
        self.items = [None]*MAX_QSIZE

    def isEmpty(self):
        return self.front == self.rear

    def isFull(self):
        return self.front == (self.rear+1)%MAX_QSIZE

    def clear(self):
        self.front = self.rear

    def enqueue(self, item):
        if not self.isFull():
            self.rear = (self.rear+1)%MAX_QSIZE
            self.items[self.rear] = item

    def dequeue(self):
        if not self.isEmpty():
            self.front = (self.front+1)%MAX_QSIZE
            return self.items[self.front]

    def peek(self):
        if not self.isEmpty():
            return self.items[(self.front + 1) %MAX_QSIZE]

    def size(self):
        return (self.rear - self.front + MAX_QSIZE) % MAX_QSIZE

    def display(self):
        out = []
        if self.front < self.rear:
            out = self.items[self.front+1:self.rear+1]
        else:
            out = self.items[self.front+1:MAX_QSIZE] + self.items[0:self.rear+1]
        print("[f=%s,r=%d] ==> "%(self.front, self.rear), out)
        
#전체 노드개수
def count_node(n):
    if n is None:
        return 0
    else:
        return 1+count_node(n.left) + count_node(n.right)

#단말 노드 개수
def count_leaf(n):
    if n is None: #공백 트리 --> 0 반환
        return 0
    elif n.left is None and n.right is None: #단말노드 --> 1 반환
        return 1
    else: #비단말 노드: 좌우 서브트리의 결과 합을 반환
        return count_leaf(n.left) + count_leaf(n.right)

In [39]:
class AVLMap(BSTMap):
    def __init__(self):
        super().__init__()
    
    def insert(self, key, value = None):
        n = BSTNode(key, value)
        if self.isEmpty():
            self.root = n
        else:
            self.root = insert_avl(self.root, n)
    
    def display(self, msg = 'AVLMap :'):
        print(msg, end = '')
        levelorder(self.root)
        print()

In [40]:
node = [7,8,9,2,1,5,3,6,4]
map = AVLMap()

for i in node:
    map.insert(i)
    map.display("AVL(%d)"%i)

print(' 노드의 개수 = %d'% count_node(map.root))
print(' 단말의 개수 = %d'% count_leaf(map.root))
print(' 트리의 높이 = %d'% calc_height(map.root))

AVL(7)7 
AVL(8)7 8 
AVL(9)8 7 9 
AVL(2)8 7 9 2 
AVL(1)8 2 9 1 7 
AVL(5)7 2 8 1 5 9 
AVL(3)7 2 8 1 5 9 3 
AVL(6)7 2 8 1 5 9 3 6 
AVL(4)7 3 8 2 5 9 1 4 6 
 노드의 개수 = 9
 단말의 개수 = 4
 트리의 높이 = 4
