# CHPATER 10 검색

- **순차 검색** : 정렬되지 않은 배열 or 연결 리스트와 같이 입력이 동적으로 할당되는 경우

- **이진 검색** : 정렬되어 있는 배열의 경우 최선의 선택

- **해시 테이블** 사용시 --> O(1)

### 10.1 정렬되지 않은 배열

- 순차 검색 -> O(n)



In [None]:
def sequential_search(seq, n):  # n이 seq에 있는지 확인하는 함수
    for item, value in enumerate(seq):
        if value == n:
            return item
    return False

def test_sequential_search():
    seq = [1,5,6,8,3]
    n1 = 5
    n2 = 7
    assert(sequential_search(seq, n1) is 1)
    assert(sequential_search(seq, n2) is False)
    print("테스트 통과")

if __name__ == "__main__":
    test_sequential_search()

In [None]:
def ordered_sequential_search(seq, n):  # 정렬된 배열 순차검색
    item = 0
    for item in seq:
        if item > n:
            return False
        if item == n:
            return True
    return False

def test_ordered_sequential_search():
    seq = [1,2,4,5,6,8,10]
    n1 = 10
    n2 = 7
    assert(ordered_sequential_search(seq, n1) is True)
    assert(ordered_sequential_search(seq, n2) is False)
    print("테스트 통과!")

if __name__ == "__main__":
    test_ordered_sequential_search()

In [None]:
# 퀵 정렬 알고리즘으로 리스트에서 k번째로 작은 항목을 찾는 메서드

import random

def quick_select_cache(seq, k):
    len_seq = len(seq)
    if len_seq < 2:
        return seq[0]

    # 피벗을 무작위로 선택할 수 있다
    # pivot = random.choice(seq)
    ipivot = len_seq // 2
    pivot = seq[ipivot]  # 피벗을 중간에 있는 값으로 결정

    smallerList = [x for i, x in enumerate(seq) if x <= pivot and i != ipivot]  # pivot보다 작은 리스트
    largerList = [x for i, x in enumerate(seq) if x > pivot and i != ipivot]    # pivot보다 큰 리스트

    m = len(smallerList)
    if k == m:       # 오름차순으로 정렬된 리스트에서 k번째를 찾아야 하므로
        return pivot
    elif k < m:
        return quick_select_cache(smallerList, k)
    else:
        return quick_select_cache(largerList, k-m-1)

def swap(seq, x, y):
    seq[x], seq[y] = seq[y], seq[x]

def quick_select(seq, k, left=None, right=None):
    left = left or 0
    right = right or len(seq) - 1
    ipivot = random.randint(left, right)
    pivot = seq[ipivot]

    # 피벗을 정렬 범위 밖으로 이동
    swap(seq, ipivot, right)
    swapIndex, i = left, left
    while i < right:
        if pivot < seq[i]:
            swap(seq, i, swapIndex)
            swapIndex += 1
        i += 1

    # 피벗 위치 확정
    swap(seq, right, swapIndex)

    # 피벗 위치 확인
    rank = len(seq) - swapIndex
    if k == rank:
        return seq[swapIndex]
    elif k < rank:
        return quick_select(seq, k, swapIndex+1, right)
    else:
        return quick_select(seq, k, left, swapIndex-1)


if __name__ == "__main__":
    seq = [3, 7, 2, 1, 4, 6, 5, 10, 9, 11]
    k = len(seq) // 2
    print(sorted(seq))
    print(quick_select_cache(seq, k-1))

    # 아래 함수는 원본을 수정하므로 깊은 복사 실행
    import copy
    seq_copy = copy.deepcopy(seq)
    print(quick_select(seq_copy, k))

    # 중앙값(median) 출력을 위해서 넘파이 사용
    import numpy
    print(numpy.median(seq))

### 10.2 정렬된 배열

- 이진 검색 --> O(log n)


In [None]:
# 재귀 함수
def binary_search_rec(seq, target, low, high):
    if low > high:
        return None 
    mid = (low + high) // 2
    if target == seq[mid]:
        return mid
    elif target > seq[mid]:
        return binary_search_rec(seq, target, mid+1, high)
    else:
        return binary_search_rec(seq, target, low, mid-1)

# 반복문
def binary_search_iter(seq, target):
    high, low = len(seq), 0
    while low < high:
        mid = (high + low) // 2
        if target == seq[mid]:
            return mid
        elif target < seq[mid]:
            high = mid
        else:
            low = mid + 1
    return None

def test_binary_search():
    seq = [1,2,5,6,7,10,12,12,14,15]
    target = 6
    assert(binary_search_iter(seq, target) == 3)
    assert(binary_search_rec(seq, target, 0, len(seq)) == 3)
    print("테스트 통과!")


if __name__ == "__main__":
    test_binary_search()

In [None]:
# bisect 모듈로 이진 검색을 할 수 있다
from bisect import bisect

l = [0,3,4,5]
print(bisect(l,5))

# 빈 리스트 혹은 값이 없는 예외의 경우
print(bisect(l,-1))

print(bisect(l,1))

print(bisect(l,7))

print(bisect([],1))

### 10.3 연습문제

In [None]:
# 행렬 검색 --> O(m+n) 
def find_elem_matrix_bool(m1, value):
    found = False
    row = 0
    col = len(m1[0]) - 1
    while row < len(m1) and col >= 0:   # 1행 맨끝열부터 탐색 시작
        if m1[row][col] == value:
            found = True
            break
        elif m1[row][col] > value:
            col -= 1
        else:
            row += 1
    return found

def test_find_elem_matrix_bool():
    m1 = [[12,8,9], [2,4,9,12], [4,7,10,13], [6,8,11,15]]
    assert(find_elem_matrix_bool(m1,8) is True)
    assert(find_elem_matrix_bool(m1,3) is False)
    m2 = [[0]]
    assert(find_elem_matrix_bool(m2,0) is True)
    print("테스트 통과!")


if __name__ == "__main__":
    test_find_elem_matrix_bool()

In [None]:
# 이진 검색 알고리즘을 이용한 행렬 검색 --> O(log mn)
def searching_in_a_matrix(m1, value):
    rows = len(m1)
    cols = len(m1[0])
    lo = 0
    hi = rows*cols
    while lo < hi:
        mid = (lo + hi) // 2
        row = mid // cols
        col = mid % cols
        v = m1[row][col]
        if v == value:
            return True
        elif v > value:
            hi = mid
        else:
            lo = mid+1
    return False

def test_searching_in_a_matrix():
    a = [[1, 3, 5], [7, 9, 11], [13, 15, 17]]
    import numpy
    b = numpy.array([(1, 2), (3, 4)])
    assert(searching_in_a_matrix(a, 13) is True)
    assert(searching_in_a_matrix(a, 14) is False)
    assert(searching_in_a_matrix(b, 3) is True)
    assert(searching_in_a_matrix(b, 5) is False)
    print("테스트 통과!")


if __name__ == "__main__":
    test_searching_in_a_matrix()

In [None]:
# 단봉형 배열 (ex.정규분포) 을
#   이진 검색을 사용하여 최댓갑을 찾는 메서드
def find_max_unimodal_array(A):
    if len(A) <= 2:
        return None
    left = 0
    right = len(A)-1
    while right > left + 1:
        mid = (left + right) // 2
        if A[mid] > A[mid-1] and A[mid] > A[mid+1]:
            return A[mid]
        elif A[mid] > A[mid-1] and A[mid] < A[mid+1]:
            left = mid
        else:
            right = mid
    return None

def test_find_max_unimodal_array():
    seq = [1, 2, 5, 6, 7, 10, 12, 9, 8, 7, 6]
    assert(find_max_unimodal_array(seq) == max(seq))
    print("테스트 통과!")


if __name__ == "__main__":
    test_find_max_unimodal_array()

In [None]:
# 이진 검색으로 제곱근 구하기
def find_sqrt_bin_search(n, error=0.001):
    lower = n < 1 and n or 1
    upper = n < 1 and 1 or n    # n의 제곱근의 범위 == lower보다 크고, upper보다 작다
    mid = lower + (upper - lower) / 2.0
    square = mid * mid
    while abs(square - n) > error:  # 차이가 error보다 작아질 때까지
        if square < n:
            lower = mid
        else:
            upper = mid
        mid = lower + (upper - lower) / 2.0
        square = mid * mid
    return mid


if __name__ == "__main__":
    a = 2
    b = 9
    import math
    print(math.sqrt(a))
    print(find_sqrt_bin_search(a))
    print(math.sqrt(b))
    print(find_sqrt_bin_search(b))

In [None]:
# 정렬된 리스트에서 요소 k가 나타나는 횟수

def find_time_occurrence_list(seq, k):
    index_some_k = binary_search_iter(seq, k)
    count = 1
    sizet = len(seq)

    # binary_search로 찾은 index + 1부터 뒤로 가면서 검색
    for i in range(index_some_k+1, sizet):
        if seq[i] == k:
            count += 1
        else:
            break

    # binary_search로 찾은 index + 1부터 앞으로 가면서 검색
    for i in range(index_some_k-1, -1, -1):
        if seq[i] == k:
            count += 1
        else:
            break
    return count

def test_find_time_occurrence_list():
    seq = [1, 2, 2, 2, 2, 2, 2, 5, 6, 6, 7, 8, 9]
    k = 2
    assert(find_time_occurrence_list(seq, k) == 6)
    print("테스트 통과!")


if __name__ == "__main__":
    test_find_time_occurrence_list()

In [None]:
# 교집합 구하기

# 1) 파이썬 set 사용 - 가장 간단함, But 순서를 보장하지 않음
def intersection_two_arrays_sets(seq1, seq2):
    set1 = set(seq1)
    set2 = set(seq2)
    return set1.intersection(set2)

# 2) 병합 정렬 사용
def intersection_two_arrays_ms(seq1, seq2):
    res = []
    while seq1 and seq2:
        if seq1[-1] == seq2[-1]:
            res.append(seq1.pop())
            seq2.pop()
        elif seq1[-1] > seq2[-1]:
            seq1.pop()
        else:
            seq2.pop()
    res.reverse()
    return res

# 3) 이진 검색 사용
def intersection_two_arrays_bs(seq1, seq2):
    if len(seq1) > len(seq2):
        seq, key = seq1, seq2
    else:
        seq, key = seq2, seq1
    intersec = []
    for item in key:
        if binary_search_iter(seq, item):
            intersec.append(item)
    return intersec


def test_intersection_two_arrays():
    seq1 = [1, 2, 3, 5, 7, 8]
    seq2 = [3, 5, 6]
    assert(set(intersection_two_arrays_sets(seq1, seq2)) == set([3, 5]))
    assert(intersection_two_arrays_bs(seq1, seq2) == [3, 5])
    assert(intersection_two_arrays_ms(seq1, seq2) == [3, 5])
    print("테스트 통과!")


if __name__ == "__main__":
    test_intersection_two_arrays()