# 탐색 (Search)
- 애시당초 저장할때  ‘탐색’ 에 최적화된 형태로 저장
- 자료구조가 중요한 이유.
    - 애시당초 ‘목적’에 맞는 설계를 해야 한다
    - ex) 힙 → 애시당초 저장할때 ‘최댓값, 최솟값’  뽑아내기에 최적화된 형태의 이진트리로 저장됨.





# 이진 탐색 트리 (Binary Search Tree: BST) 
탐색(검색)에 특화된 자료구조

- 이진 탐색 트리의 노드에 저장된 키(key)는 유일! 
- 루트 노드의 키 > 왼쪽 서브 트리를 구성하는 키 
- 루트 노드의 키 < 오른쪽 서브 트리를 구성하는 키 
- 왼쪽과 오른쪽 서브 트리도 이진 탐색 트리!

![bst](https://upload.wikimedia.org/wikipedia/commons/thumb/d/da/Binary_search_tree.svg/200px-Binary_search_tree.svg.png)





# BST 에 새로운 데이터 추가 (insert)
![insert](https://www.techiedelight.com/wp-content/uploads/Insert-into-BST.png)




In [2]:
class NodeBst:
    def __init__(self, value=None):
        self.value = value
        self.left = None
        self.right = None
    
    def __repr__(self):
        return f'{self.value}'
    
    # 주어진 값(value)로 BST에 노드 추가, 재귀적으로 정의 recursive call
    def add_next_node(self, value):
        new_node = NodeBst(value)
        
        # 1. 자기보다 값이 크면 right로..
        if value > self.value:
            # self.right에 node가 존재하면 add_next_node, 값이 없으면 그 위치에 node 추가
            self.right = self.right and self.right.add_next_node(value) or new_node
            
        # 2. 자기보다 값이 작으면 left로..
        elif value < self.value:
            self.left = self.left and self.left.add_next_node(value) or new_node
            
        # 3. 같으면 불가
        else:
            print("중복된 노드를 허용하지 않습니다.")

        
        return self
    
    # BST에서 주어진 값(value)의 노드를 찾아서 리턴, 재귀적으로 정의
    # 못찾으면 None 리턴
    def search_for_node(self, value):
        if self.value == value: #찾았다
            return self.value
        
        # self.left가 None이 아니고 찾고자 하는 value가 현재node의 값보다 작다면
        if self.left and value < self.value:
            # self.left의 node의 값과 찾고자 하는 value를 다시 비교 (재귀호출)
            return self.left.search_for_node(value)
        if self.right and value > self.value:
            return self.right.search_for_node(value)
        
        # 만약 위 조건 모두 충족하지못하는 경우.
        # 즉, 찾고자 하는 value가 BST에 없는 경우
        return None
        

In [3]:
class BinarySearchTree:
    def __init__(self):
        self.root = None
    
    # BST에 새 노드(value) 추가. 중복되는 값은 불가
    def insert(self, value):
        if not self.root: # 루트가 None인경우 / 루트가 없는경우
            self.root = NodeBst(value)
        else: #루트로 부터 시작하여 BST에 value(노드) 추가
            self.root.add_next_node(value)
    
    # BST에서 특정 값(value)의 노드를 찾아서 노드 리턴, 못찾으면 None  리턴
    def search(self, value):
        return self.root and self.root.search_for_node(value)

In [4]:
bst = BinarySearchTree()

In [5]:
for i in [6, 4, 8, 2, 5, 7, 9, 1, 3]:
    bst.insert(i)

In [6]:
bst.root.left.left.right.left

In [7]:
i = 0
for i in range(10):
    print(bst.search(i))

i

None
1
2
3
4
5
6
7
8
9


9

In [8]:
import time
from datetime import timedelta
import random
import copy   # deepcopy 사용할거다

# 랜덤으로 리스트 작성
def gen_rand(num):
    data = [i for i in range(num)]
    random.shuffle(data)
    return data
    
# 오름차순 리스트 작성
def gen_asc(num):
    return [i for i in range(num)]

# 내림차순 리스트 작성
def gen_desc(num):
    return [i for i in range(num - 1, -1, -1)]

def test_search(obj, search_data, title):
    start_time = time.time()
    for data in search_data:
        obj.search(data)
    end_time = time.time()
    elapsed_time = end_time - start_time # 경과시간
    
    print('%s: 평균검색시간 %s' % (title, str(timedelta(seconds = elapsed_time / len(search_data)))))

# times 만큼 같은 데이터 에서 같은 조건으로 반복
def test_ntimes(title, gen = "랜덤", size = 1000, times=5):
    
    if gen == "랜덤":
        input_data = gen_rand(size)
    elif gen == "오름":
        input_data = gen_asc(size)
    elif gen == "내림":
        input_data = gen_desc(size)
    else:
        print('gen 오류')
        return 
    
    search_tree = BinarySearchTree()
    for data in input_data:
        search_tree.insert(data)
    
    
    ordered_data = gen_asc(size)  # 검색할 데이터
    for i in range(times):
        test_search(search_tree, ordered_data, ("%s-%s %d %d차" % (title, gen, size, i + 1)))
    






In [9]:
test_ntimes("BST", "랜덤", 20000, 3)
print()
test_ntimes("BST", "랜덤", 40000, 3)
print()
test_ntimes("BST", "랜덤", 70000, 3)

BST-랜덤 20000 1차: 평균검색시간 0:00:00.000004
BST-랜덤 20000 2차: 평균검색시간 0:00:00.000004
BST-랜덤 20000 3차: 평균검색시간 0:00:00.000004

BST-랜덤 40000 1차: 평균검색시간 0:00:00.000004
BST-랜덤 40000 2차: 평균검색시간 0:00:00.000004
BST-랜덤 40000 3차: 평균검색시간 0:00:00.000004

BST-랜덤 70000 1차: 평균검색시간 0:00:00.000004
BST-랜덤 70000 2차: 평균검색시간 0:00:00.000004
BST-랜덤 70000 3차: 평균검색시간 0:00:00.000004


---
## BST 의 최악의 상황 (Worst case 는 무엇일까?)
**skewed binary search tree (치우친상태)**    vs  **balanced binary search tree (균형잡힌 상태)**

치운친 상태에서는 **O(n)** 에 수렴한다

<img src="http://bluehawk.monmouth.edu/~rclayton/web-pages/s11-503/baltreesf1.png" style="float:left"/><br>





In [10]:
test_ntimes("BST", "오름", 100, 3)
print()
test_ntimes("BST", "오름", 200, 3)
print()
test_ntimes("BST", "오름", 400, 3)
print()
test_ntimes("BST", "오름", 800, 3)
print()

BST-오름 100 1차: 평균검색시간 0:00:00.000010
BST-오름 100 2차: 평균검색시간 0:00:00
BST-오름 100 3차: 평균검색시간 0:00:00.000010

BST-오름 200 1차: 평균검색시간 0:00:00.000020
BST-오름 200 2차: 평균검색시간 0:00:00.000020
BST-오름 200 3차: 평균검색시간 0:00:00.000020

BST-오름 400 1차: 평균검색시간 0:00:00.000037
BST-오름 400 2차: 평균검색시간 0:00:00.000015
BST-오름 400 3차: 평균검색시간 0:00:00.000039

BST-오름 800 1차: 평균검색시간 0:00:00.000096
BST-오름 800 2차: 평균검색시간 0:00:00.000078
BST-오름 800 3차: 평균검색시간 0:00:00.000078

