# 탐색

가장 일반적인 탐색(searching) 알고리즘은 순차 탐색(sequential search)과 이진 탐색(binary search)

순차 탐색은 배열이 정렬되어 있지 않거나, 연결 리스트와 같이 입력이 동적으로 할당되는 경우 흔히 사용한다. 

이진 탐색은 배열이 정렬되어 있는 경우 최선의 선택이다.

해시 테이블은 보조 메모리 공간을 사용하지만, 키를 이용하면 O(1)에 원하는 값을 검색할 수 있다.
==> 시간을 선택하고, 메모리적인 부분을 일부 포기

# 정렬되지 않은 배열

순차 탐색 (Sequential Search)

순서대로 리스트를 탐색하며 원하는 데이터를 찾는 알고리즘

시간복잡도 : 최선 O(1) 평균 O(2/n) 최악 O(n)

In [None]:
# 순차 탐색 구현
def sequential_search(seq, n):
    length = len(seq)
    for i in range(length):
        if seq[i] == n:
            return i
    
    return False

In [None]:
# 순차 탐색 테스트
def test(seq, n):
    idx = sequential_search(seq, n)
    if idx:
        print(f'값의 index = {idx}, 찾은 값 = {seq[idx]}')
    else:
        print('값을 찾지 못했습니다')


ary = [5, 10, 20 ,30, 2, 7 ,6]

print("원하는 값을 못찾은 케이스 : ")
test(ary, 1000)

print()
print("원하는 값을 찾은 케이스 : ")
test(ary, 10)

원하는 값을 못찾은 케이스 : 
값을 찾지 못했습니다

원하는 값을 찾은 케이스 : 
값의 index = 1, 찾은 값 = 10


빠른 선택과 순서통계량

In [1]:
import random


def quick_select_cache(seq, k):
    len_seq = len(seq)
    if len_seq < 2:
        return seq[0]

    # 피벗을 무작위로 선택할 수 있다.
    # pivot = random.choice(seq)
    ipivot = len_seq // 2
    pivot = seq[ipivot]

    smallerList = [x for i, x in enumerate(seq) if x <= pivot and i != ipivot]
    largerList = [x for i, x in enumerate(seq) if x > pivot and i != ipivot]

    m = len(smallerList)
    if k == m:
        return pivot
    elif k < m:
        return quick_select_cache(smallerList, k)
    else:
        return quick_select_cache(largerList, k-m-1)


def swap(seq, x, y):
    seq[x], seq[y] = seq[y], seq[x]


def quick_select(seq, k, left=None, right=None):
    left = left or 0
    right = right or len(seq) - 1
    ipivot = random.randint(left, right)
    pivot = seq[ipivot]

    # 피벗을 정렬 범위 밖으로 이동한다.
    swap(seq, ipivot, right)
    swapIndex, i = left, left
    while i < right:
        if pivot < seq[i]:
            swap(seq, i, swapIndex)
            swapIndex += 1
        i += 1

    # 피벗 위치를 확정한다.
    swap(seq, right, swapIndex)

    # 피벗 위치를 확인한다.
    rank = len(seq) - swapIndex
    if k == rank:
        return seq[swapIndex]
    elif k < rank:
        return quick_select(seq, k, swapIndex+1, right)
    else:
        return quick_select(seq, k, left, swapIndex-1)


if __name__ == "__main__":
    seq = [3, 7, 2, 1, 4, 6, 5, 10, 9, 11]
    k = len(seq) // 2
    print(sorted(seq))
    print(quick_select_cache(seq, k-1))

    # 아래 함수는 원본을 수정하므로 깊은 복사 실행
    import copy
    seq_copy = copy.deepcopy(seq)
    print(quick_select(seq_copy, k))

    # 중앙값(median) 출력을 위해서 넘파이를 사용함
    import numpy
    print(numpy.median(seq))

[1, 2, 3, 4, 5, 6, 7, 9, 10, 11]
5
5
5.5


In [2]:
# 재귀함수
def binary_search_rec(seq, target, low, high):
    if low > high:
        return None
    mid = (low + high) // 2
    if target == seq[mid]:
        return mid
    elif target < seq[mid]:
        return binary_search_rec(seq, target, low, mid-1)
    else:
        return binary_search_rec(seq, target, mid+1, high)


# 반복문
def binary_search_iter(seq, target):
    high, low = len(seq), 0
    while low < high:
        mid = (high + low) // 2
        if target == seq[mid]:
            return mid
        elif target < seq[mid]:
            high = mid
        else:
            low = mid + 1
    return None


def test_binary_search():
    seq = [1, 2, 5, 6, 7, 10, 12, 12, 14, 15]
    target = 6
    assert(binary_search_iter(seq, target) == 3)
    assert(binary_search_rec(seq, target, 0, len(seq)) == 3)
    print("테스트 통과!")


if __name__ == "__main__":
    test_binary_search()

테스트 통과!


In [3]:
def find_elem_matrix_bool(m1, value):
    found = False
    row = 0
    col = len(m1[0]) - 1
    while row < len(m1) and col >= 0:
        if m1[row][col] == value:
            found = True
            break
        elif m1[row][col] > value:
            col -= 1
        else:
            row += 1
    return found


def test_find_elem_matrix_bool():
    m1 = [[1, 2, 8, 9], [2, 4, 9, 12], [4, 7, 10, 13], [6, 8, 11, 15]]
    assert(find_elem_matrix_bool(m1, 8) is True)
    assert(find_elem_matrix_bool(m1, 3) is False)
    m2 = [[0]]
    assert(find_elem_matrix_bool(m2, 0) is True)
    print("테스트 통과!")


if __name__ == "__main__":
    test_find_elem_matrix_bool()

테스트 통과!


In [4]:
def searching_in_a_matrix(m1, value):
    rows = len(m1)
    cols = len(m1[0])
    lo = 0
    hi = rows*cols
    while lo < hi:
        mid = (lo + hi) // 2
        row = mid // cols
        col = mid % cols
        v = m1[row][col]
        if v == value:
            return True
        elif v > value:
            hi = mid
        else:
            lo = mid+1
    return False


def test_searching_in_a_matrix():
    a = [[1, 3, 5], [7, 9, 11], [13, 15, 17]]
    import numpy
    b = numpy.array([(1, 2), (3, 4)])
    assert(searching_in_a_matrix(a, 13) is True)
    assert(searching_in_a_matrix(a, 14) is False)
    assert(searching_in_a_matrix(b, 3) is True)
    assert(searching_in_a_matrix(b, 5) is False)
    print("테스트 통과!")


if __name__ == "__main__":
    test_searching_in_a_matrix()

테스트 통과!
