### 탐색 알고리즘

In [20]:
# linear search(선형 탐색)
def linear_search(array, k):
    # O(n)
    # n(array의 길이)이 10000일 때, k = 7800 이라면 7800번 걸림(최악의 경우 k = n 이라면 n번 걸림)
    for i in array:
        if i == k:
            return i

a = list(range(10000))
%timeit linear_search(a, 7800)

512 µs ± 28.5 µs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)


In [40]:
# binary search(이진 탐색)
def binary_search(array, k):
    # O(logn)
    # n(array의 길이)이 10000일 때, 13번 안에 원하는 수 k를 찾음(최악의 경우 14번째에 찾음)
    for i in array:
        if array[len(array)//2] < k:
            array = array[len(array)//2+1:]
        elif array[len(array)//2] > k:
            array = array[:len(array)//2]
        else:
            return k, i+1

a = list(range(10000))
%time binary_search(a, 7502)

CPU times: user 91 µs, sys: 2 µs, total: 93 µs
Wall time: 98 µs


(7502, 13)

### 정렬 알고리즘

In [173]:
# bubble sort(버블 정렬) - O(n^2)
def bubble_sort(L):
    for _ in range(len(L)-1):
        for i in range(len(L)-1):
            if L[i] > L[i+1]:
                L[i], L[i+1] = L[i+1], L[i]
    return L

# L = [5,2,6,3,1,4,4,7,5,6,2,1,7,5,7,9,7,5,4,3]
L = list(range(4000, 0, -1))
%timeit bubble_sort(L)
# bubble_sort(L)

2.48 s ± 81.9 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [172]:
# selection sort(선택 정렬) - O(n^2)
def selection_sort(L):
    for i in range(len(L)-1):
        minimum = L[i]
        idx = i
        for j in range(i, len(L)):
            if minimum > L[j]:
                minimum = L[j]
                idx = j
        L[idx] = L[i]
        L[i] = minimum
    return L
# L = [5,2,6,3,1,4,4,7,5,6,2,1,7,5,7,9,7,5,4,3]
L = list(range(4000, 0, -1))
%timeit selection_sort(L)
# selection_sort(L)

927 ms ± 38 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [171]:
# insertion sort(삽입 정렬) - O(n^2)
# for python -> 0.2 O(n^2) µs, for C -> 0.01 O(n^2) µs
def insertion_sort(L):
    for i in range(1, len(L)):
        if L[i-1] > L[i]:
            j = 0
            while L[i-1-j] > L[i-j] and i-1-j > -1:
                L[i-1-j], L[i-j] = L[i-j], L[i-1-j]
                j += 1
    return L

# L = [5,2,6,3,1,4,4,7,5,6,2,1,7,5,7,9,7,5,4,3]
L = list(range(4000, 0, -1))
%timeit insertion_sort(L)
# insertion_sort(L)

588 µs ± 3.88 µs per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [170]:
# merge sort(합병 정렬) - O(nlogn)
# for python -> 2.2 O(nlogn) µs
def merge_sort(L):
    if len(L) == 1:
        return L
    
    L_p = merge_sort(L[:len(L)//2])
    R_p = merge_sort(L[len(L)//2:])
    
    merged_L = []
    l = r = 0
    while l < len(L_p) and r < len(R_p):
        if L_p[l] > R_p[r]:
            merged_L.append(R_p[r])
            r += 1
        else:
            merged_L.append(L_p[l])
            l += 1
    
    merged_L += L_p[l:]
    merged_L += R_p[r:]
    
    return merged_L

# L = [5,2,6,3,1,4,4,7,5,6,2,1,7,5,7,9,7,5,4,3]
L = list(range(4000, 0, -1))
%timeit merge_sort(L)
# merge_sort(L)

22.8 ms ± 1.61 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


- 힙(heap) 자료구조를 사용하는 이유는 최대-힙의 경우 반복적으로 extact_max()를 사용하기 위해서이다.(최소-힙도 같은 이유)
    - extract_max(): 최대 key(즉, 루트)를 반환하고 집합 S에서 제거

In [174]:
class heapQ:
    def max_heapify(self, A, i):
        L = 2*i
        R = 2*i + 1
        
        if L <= len(A) and A[L-1] > A[i-1]:
            lagest = L
        else:
            lagest = i
        
        if R <= len(A) and A[R-1] > A[lagest-1]:
            lagest = R
        
        if lagest != i:
            A[i-1], A[lagest-1] = A[lagest-1], A[i-1]
            self.max_heapify(A, lagest)
        return A
    
    
    def min_heapify(self, A, i):
        L = 2*i
        R = 2*i + 1
        
        if L <= len(A) and A[L-1] < A[i-1]:
            smallest = L
        else:
            smallest = i
        
        if R <= len(A) and A[R-1] < A[smallest-1]:
            smallest = R
        
        if smallest != i:
            A[i-1], A[smallest-1] = A[smallest-1], A[i-1]
            self.min_heapify(A, smallest)
        return A
    
    
    def heap_pop(self, A):
        extract = A[0]
        A[0] = A.pop()
        if A[0] > A[1]:
            self.min_heapify(A, 1)
        elif A[0] < A[1]:
            self.max_heapify(A, 1)
        return extract
    
    
    def build_max_heap(self, A):
        for i in range(len(A)//2, 0, -1):
            max_heap = self.max_heapify(A, i)
        return None
    
    
    def build_min_heap(self, A):
        for i in range(len(A)//2, 0, -1):
            min_heap = self.min_heapify(A, i)
        return None

# L = [5,2,3,1,4,6,9,7,8]
L = list(range(4000, 0, -1))
%timeit heapQ().build_min_heap(L)
# print(L)
# print(heapQ().heap_pop(L))
# print(L)

2.86 ms ± 523 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


### binary search tree(이진 탐색 트리)

In [None]:
#트리를 구성하는 노드 클래스
from ctypes import pointer


class Node:
    """생성자"""
    def __init__(self, key,value):
        self.key = key  # 키
        self.value = value # 값
        self.pointers()
    def pointers(self):
        self.left = None # 왼쪽 자식 참조
        self.right = None # 오른쪽 자식 참조

class BinarySearchTree():	
    # 생성자
    def __init__(self):
        self.root = None  # 루트 설정

    # 검색하는 메소드
    def search(self, key):  # -> int
        '''
        루트에서 시작하여 찾고자 하는 키의 대소 관계를 판단한 결과에 따라
        노드 x에 대해 key(x) > k이면 왼쪽 or key(x) < k이면 오른쪽 서브트리를
        따라가면서 수행한다. 만약 key(x) = k이면 검색 성공.
        '''
        node = self.root
        while node is not None:  # 더이상 진행할 수 없을때까지 반복
            if key == node.key:
                return node.value  # 검색 성공
            elif key < node.key:
                node = node.left  # Go left
            else:
                node = node.right  # Go right
                
    # 노드 삽입(추가)하는 메소드
    def insert(self, key, value):  # -> bool
        '''
        노드 삽입시 트리의 형태가 이진 탐색 트리의 조건을 유지해야 한다는
        전제 조건이 있다. 따라서 노드 삽입 시에는 먼저 탐색을 통해
        삽입할 위치를 찾아낸 뒤에 수행한다.
        알고리즘은 다음과 같다.
            1. root가 있는지 파악한다.
                - root가 없으면 생성(삽입)
                - root가 있으면 root부터 삽입할 위치 검색 시작
            2. (root가 이미 존재한다는 전제) root -> 현재 노드 x로 지정하고,
            삽입하려는 값 k와 현재 노드의 key를 비교한다.
                - k == key(x)이면 중복이므로 중단
                - k < key(x)일 때, left(x) is None -> 그 자리에 삽입
                left(x) is not None -> current(x) = left(x)
                - k > key(x)일 때, right(x) is None -> 그 자리에 삽입
                right(x) is not None -> current(x) = right(x)
            3. 2번 과정을 더이상 진행할 수 없을때까지 반복한다.
            4. 2번 과정을 while 반복문이 아닌 꼬리 재귀 함수 호출로 구현했다.
        '''
        def loop(node, key, value):  # -> None
            if key == node.key:
                return False
            elif key < node.key:
                if node.left is None:
                    node.left = Node(key, value)
                else:
                    loop(node.left, key, value)
            else:
                if node.right is None:
                    node.right = Node(key, value)
                else:
                    loop(node.right, key, value)
            return True
        
        if self.root is None:
            self.root = Node(key, value)
            return True
        else:
            return loop(self.root, key, value)
            
    # 노드 삭제하는 메소드
    def remove(self, key):  # -> bool
        '''
        삭제 또한 삽입과 마찬가지로 
        알고리즘은 다음과 같다.
            1. root -> 현재 노드 x로 지정
            2. 삭제하려는 key와 key(x)를 비교한다.
                - key == key(x) -> 삭제할 key를 찾았으므로 비교 종료
                - key < key(x) -> x = left(x)
                - key > key(x) -> x = right(x)
            3. 2번에서 삭제할 키를 찾았다면 케이스를 다음과 같이 나눈다.
                3-1. 단말(leaf) 노드를 삭제하는 경우
                3-2. 1개의 자식만을 가진 노드를 삭제하는 경우
                3-3. 2개 자식을 모두 가진 노드를 삭제하는 경우
            4. 3번에 따라서 각각 다른 방법으로 진행한다.
        3번에서 언급한 각각의 케이스에 대해 살펴보면,
            3-1 -> 단말(leaf) 노드를 삭제하는 경우
                if x == left(parent(x)):
                    parent.left = None
                else:
                    parent.right = None
            3-2 -> 1개의 자식만을 가진 노드를 삭제하는 경우
                delete(x) & x = child(x), 그렇게 하면 child(x)를 루트로 하는
                서브트리의 모든 노드 y에 대해 x == right(parent(x))이면
                key(y) > key(parent(x))를, x == left(parent(x))이면
                key(y) < key(parent(x))를 만족한다.
                    - x == left(parent(x)) -> left(parent(x)) = child(x)
                    - x == right(parent(x)) -> right(parent(x)) = child(x)
            3-3 -> 2개 자식을 모두 가진 노드를 삭제하는 경우
        '''
        node = self.root
        parent = None
        is_left_child = None
        
        # 삭제할 노드 탐색
        while True:
            if node is None:
                return False
            
            if key == node.key:
                break
            else:
                parent = node
                if key < node.key:
                    node = node.left
                    is_left_child = True
                else:
                    node = node.right
                    is_left_child = False
        
        # case 1: 단말 노드인 경우
        if node.left is None:
            if node is self.root:
                self.root = node.right
            elif is_left_child:
                parent.left = node.right
            else:
                parent.right = node.right
    # 노드 출력하는 메소드
    def dump(self):
        pass
    
    # def in_order_traversal(self):
    #     def _in_order_traversal(root):
    #         if root is None:
    #             pass
    #         else:
    #             _in_order_traversal(root.left)
    #             print(root.data)
    #             _in_order_traversal(root.right)
    #     _in_order_traversal(self.root)