# 이진탐색(Binary Search)

- 1차원 리스트에 데이터가 정렬되어 있을 때 주어진 데이터를 효율적으로 찾는 알고리즘
- 데이터가 정렬되어 있지 않다면, 모든 원소들들 순차탐색(Sequential Search)를 수행해야 함
- 최악의 경우 O(N)
- 데이터를 미리 정렬하면 최악의 경우에도 logN

In [1]:
def binary_search(left, right, t):
    if left > right: return None  # 탐색 실패
    mid = (left + right) // 2  # 리스트에서 탐색할 부분의 중간 할목의 인덱스
    if a[mid] == t: return mid  # 탐색 성공
    if a[mid] > t: binary_search(left, mid-1, t)  # 앞부분 탐색
    else: binary_search(mid+1, right, t)  # 뒷부분 탐색

# 이진탐색트리(Binary Search Tree)

- 이진탐색의 개념을 트리 형태의 구조에 접목시킨 자료구조
- 이진탐색을 수행하기 위해 단순연결리스트를 변형시킨 구조
- 이진트리로서 각 노드가 다음과 같은 조건을 만족한다.
 - 각 노드 n의 키 값이 n의 왼쪽 서브트리에 있는 노드들의 키값들보다 코고, n의 오른쪽 서브트리에 있는 노드들의 키값들보다 작다.

In [5]:
class Node:
    def __init__(self, key, value, left=None, right=None):
        self.key = key
        self.value = value
        self.left = left
        self.right = right
        
class BST:
    def __init__(self):
        self.root = None
        
    def get(self, key):  # 탐색 연산
        return self.get_item(self.root, key)
    
    def get_item(self, n, key):
        if n == None: return None
        if n.key > key:
            return self.get_item(n.left, key)
        elif n.key < key:
            return self.get_item(n.right, key)
        else: return n.value
    
    def put(self, key, value):  # 삽입 연산
        self.root = self.put_item(self.root, key, value)
        
    def put_item(self, n, key, value):
        if n == None: return Node(key, value)
        if n.key > key:
            n.left = self.put_item(n.left, key, value)
        elif n.key < key:
            n.right = self.put_item(n.right, key, value)
        else:
            n.value = value  # key가 이미 있으므로 value만 갱신
        return n  # 부모노드와 연결하기 위해 노드 n을 리턴
    
    def min(self): # 최소값 가진 노드 찾기
        if self.root == None: return None
        return slef.minimum(self.root)
    
    def minimum(self, n):
        if n.left == None: return n
        return self.minimum(n.left)
    
    def delete_min(self):  # 최솟값 삭제
        if self.root == None:
            print('트리가 비어 있음')
        self.root = self.del_min(self.root)
        
    def del_min(self, n):
        if n.left == None: return n.right
        n.left = self.del_min(n.left)
        return n
    
    def delete(self, key):  # 삭제 연산
        self.root = self.del_node(self.root, key)
        
    def del_node(self, n, key):
        if n == None: return None
        if n.key > key:
            n.left = self.del_node(n.left, key)
        elif n.key < key:
            n.right = self.del_node(n.right, key)
        else:
            if n.right == None: return n.left
            if n.left == None: return n.right
            target = n
            n = self.minimum(target.right)
            n.right = self.del_min(target.right)
            n.left = target.left
        return n

In [6]:
t = BST()
t.put(500, 'apple')
t.put(600, 'banana')
t.put(200, 'melon')
t.put(100, 'orange')
t.put(400, 'lime')
t.put(250, 'kiwi')
t.put(150, 'grape')
t.put(800, 'peach')
t.put(700, 'cherry')
t.put(50, 'pear')
t.put(350, 'lemon')
t.put(10, 'plum')
print('전위순회:\t', end='')
t.preorder(t.root)
print('\n중위순회:\t', end='')
t.inorder(t.root)
print('\n250: ', t.get(250))
t.delete(200)
print('200 삭제 후:')
print('전위순회:\t', end='')
t.preorder(t.root)
print('\n중위순회:\t', end='')
t.inorder(t.root)

전위순회:	

AttributeError: 'BST' object has no attribute 'preorder'

# AVL 트리

- 트리가 한쪽으로 치우쳐 자라나는 현상을 방지하여 트리 높이의 균형(Balance)을 유지하는 이진탐색트리
- N개의 노드를 가진 트리의 모든 연산 수행시간은 O(logN)
- 삽입이나 삭제로 인해 균형이 깨지면 회전 연산을 통해 트리의 균형을 유지
- 임의의 노드 n에 대해 n의 왼쪽 서브트리의 높이와 오른쪽 서브트리의 높이 차이가 1을 넘지 않는 이진탐색트리
- N개의 노드를 가진 AVL 트리의 높이는 O(logN)

In [7]:
class Node:
    def __init__(self, key, value, height, left=None, right=None):
        self.key = key
        self.value = value
        self.height = height
        self.left = left
        self.right = right
        
class AVL:
    def __init__(self):
        self.root = None
        
    def height(self, n):
        if n == None: return 0
        return n.height
    
    def put(self, key, value):  # 삽입 연산
        self.root = self.put_item(self.root, key, value)
        
    def put_item(self, n, key, value):
        if n == None: return NOde(key, value, 1)
        if n.key > key:
            n.left = self.put_item(n.left, key, value)
        elif n.key < key:
            n.right = self.put_item(n.right, key, value)
        else:
            n.value = value
            return n
        n.height = max(self.height(n.left), self.height(n.right)) + 1
        return self.balance(n)
        
    def balance(self, n):
        if self.bf(n) > 1:
            if self.bf(n.left) < 0:
                n.left = self.rotate_left(n.left)
            n = self.rotate_right(n)
        elif self.bf(n) < -1:
            if self.bf(n.right) > 0:
                n.right = self.rotate_right(n.right)
            n = self.rotate_left(n)
        return n
    
    def bf(self, n):
        return self.height(n._left) - self.heigt(n._right)
    
    def rotate_right(self, n):  # 우로 회전
        x = n.left
        n.left = x.right
        x.right = n
        n.height = max(self.height(n.left), self.height(n.right)) + 1
        x.height = max(self.height(n.left), self.height(x.right)) + 1
                # 오타 체크해봐야 함    ^        
        return x
    
    def rotate_left(self, n):  # 좌로 회전
        x = n.right
        n.right = x.left
        x.left = n
        n.height = max(self.height(n.left), self.height(n.right)) + 1
        x.height = max(self.height(x.left), self.height(x.right)) + 1
        return x
    
    def delete(self, key): pass
    def delete_min(self): pass
    def min(self): pass

In [None]:
t = AVL()
t.put(75, 'apple')
t.put(80, 'grape')
t.put(85, 'lime')
t.put(20, 'mango')
t.put(10, 'strawberry')
t.put(50, 'banana')
t.put(30, 'cherry')
t.put(40, 'watermelon')
t.put(70, 'melon')
t.put(90, 'plum')

print('전위순회:\t', end='')
t.preorder(t.root)
print('\n중위순회:\t', end='')
t.inorder(t.root)
print('\n75, 85 삭제 후: ', t.get(250))
t.delete(75)
t.delete(85)
print('전위순회:\t', end='')
t.preorder(t.root)
print('\n중위순회:\t', end='')
t.inorder(t.root)

## 2-3 트리

- 내부노드의 차수가 2 또는 3인 균형 탐색트리
- 이파리노드들이 동일한 층에 있어야 하므로 트리가 위로 자라거나 낮아진다.

## 레드블랙트리

- 2-3 트리에서 각 3-노드에 있는 2개의 키를 두 노드로 분리 저장하고, 하나는 레드 다른 하나는 블랙으로 만든 형태와 같다.
- LLRB 트리는 이진탐색트리로서 다음 4가지 조건을 만족한다.
 - 루트와 None은 블랙
 - 루트로부터 각 None까지 2개의 연속된 레드 link는 없다.(연속 레드 link 규칙)
 - 루트로부터 각 None까지의 경로에 있는 블랙 link 수는 모두 같다.(동일 블랙 link 수 규칙)
 - 레드 link는 왼쪽으로 기울어져 있다.(레드 link 좌편향 규칙)
 
 
#### 응용

레드블랙트리는 반드시 제한된 시간 내에 연산이 수행되어야 하는 경우에 매우 적절한 자료구조.  
logN 시간보다 조금이라도 오랜 시간이 소요될 경우 매우 치명적인 상황이 될 수 있는 항공 교통 관제, 핵발전소의 원자로제어, 심장박동 조정장치 등에 사용된다.  
또한 자바의 java.util.TreeMap, java.util.TreeSet의 기본자료구조로 사용ㄷ괴며 C++의 map, multimap, set, multiset에서 사용되고, 리눅스의 스케줄러에도 사용된다.

## B-트리

- 노드에 수백에서 수천 개의 키를 지정하여 트리의 높이를 낮추자.
- 차수가 M인 B-트리는 다방향 탐색트리로서
 - 모든 이파리노드들은 동일한 깊이를 갖는다.
 - 각 내부노드의 자식 수는 M/2 이상 M 이하이다.
 - 루트의 자식 수는 2 이상이다.

## 요약

- 이진탐색트리는 이진탐색의 개념을 트리 형태의 구조에 접목시킨 자료구조
- 이진탐색트리는 이진트리로서 각 노드 n의 키가 n의 왼쪽 서브트리에 있는 노드들의 키들보다 크고, n의 오른쪽 서브트리에 잇는 노드들의 키들보다 작다.
- 이진탐색트리의 삭제는 삭제할 노드가 자식이 없는 경우, 하나인 경우, 둘인 경우로 나누어진다. 자식이 둘인 경우는 후위 후속자를 삭제할 노드로 이동하여 삭제를 수행한다.
- 이진탐색트리 탐색, 삽입, 삭제 연산의 수행시간은 각각 트리 높이에 비례한다.
- AVL 트리는 임의의 노드 n에 대해 노드 n의 왼쪽 서브트리의 높이와 오른쪽 서브트리의 높이 차이가 1을 넘지 않는 이진탐색트리이다.
- AVL 트리는 트리가 한쪽으로 치우쳐 자라나는 것을 LL, LR, RR, RL-회전 연산들을 통해 조절하여 트리 높이의 균형을 유지한다.
- AVL 트리의 탐색, 삽입, 삭제 연산의 수행시간은 각각 O(logN)이다.
- 2-3 트리는 내부노드의 차수가 2 또는 3인 완전 균형탐색트리이다. 삽입에는 분리 연산을 사용하고, 삭제에는 이동 연산과 통합 연산을 사용하여 트리의 완전한 균형을 유지한다.
- 2-3 트리의 탐색, 삽입, 삭제 연산의 수행시간은 각각 트리의 높이에 비례하므로 O(logN)이다.
- 2-3-4 트리는 2-3 트리를 확정한 트리로 4-노드까지 허용한다. 2-3 트리보다 높이가 낮아서 보다 빠른 탐색, 삽입, 삭제 연산이 실행된다. 그러나 각 연산의 이론적인 수행시간은 2-3 트리와 동일하다.
- 2-3-4 트리에서는 루트로부터 이파리노드로 한 번만 내려가며 미리 분리 또는 통합 연산을 수행하는 효육적인 삽입 및 삭제가 가능하다.
- 레드블랙트리는 노드의 색을 이용하여 트리의 균형을 유지하며, 탐색, 삽입, 삭제 연산의 수행시간이 각각 O(logN)을 넘지 않는 매우 효육적인 자료구조
- 좌편향 레드블랙트리는 삽입이나 삭제 시 고려해야 하는 경우의 수가 매우 작고 프로그램의 길이도 일반 레드블랙트리 프로그램의 1/5 정도에 불과하다.
- N개의 노드를 가진 레드블랙트리의 높이는 2logN보다 크지 않다. 탐색, 삽입, 삭제의 수행시간은 각각 트리의 높이에 비례하므로 O(logN)이다.
- B-트리는 다수의 키를 가진 노드로 구성되며 다방향 탐색이 가능한 완전 균형트리이다.
- 차수가 M인 B-트리는 모든 이파리노드들은 동일한 깊이를 갖고, 각 내부노드의 자식 수는 M/2이상 M이하이며, 루트의 자식 수는 2 이상이다.
- B-트리의 삽입과 삭제는 분리, 이동, 통합 연산을 사용한다.
- B*-트리는 B-트리로서 루트를 제외한 다른 노드의 자식 수가 2/3M~M이어야 한다. B*-트리는 노드의 공간을 B-트리보다 효율적으로 활용하는 자료구조이다.
- B+-트리는 키들 만을 가지고 B-트리를 만들고, 이파리노드에 키와 관련 정보를 저장한다.
- B-트리는 몇 개의 디스크 페이지(블록)를 메인 메모리로 읽어 들이는지가 더 중요하므로 1개의 노드가 1개의 디스크 페이지에 맞도록 차수 M을 정한다.