### 탐색 
- 탐색은 주어진 집합에서 특정 키(key)와 일치하는 원소를 찾는 작업을 말함 
- 집합의 여러가지 속성(attribute) 중 탐색 기준이 되는 속성을 키 필드(key field)라 함 
- 집합이 미리 정렬되있는 경우 탐색 효율이 높아 짐 

1. 순차 탐색 (Sequential Search)
- 탐색 대상에 아무 조건이 없으며 탐색 키를 찾을 때까지 순차적으로 반복 비교하는 방법  
- 원소들이 미리 정렬될 필요는 없지만, 성능에 큰 편차가 발생 
- best case의 경우 : 첫 번째 비교에서 탐색 키를 찾는 경우(1) 
- worst case의 경우 : 마지막 비교에서 탐색 키를 찾는 경우(n)
- 평균적으로 n/2번의 횟수가 필요하며 시간 복잡도는 O(n) 

In [2]:
# 순차  탐색
def seq_search(num, key, n):
    for i in range(n):
        if (num[i] == key): 
            return i
    return -1

num = [12, 5, 6, 19, 21, 3, 7, 81, 42, 15]
for item in [81, 90]:
    pos = seq_search(num, item, len(num))
    print("position = ", pos)

position =  7
position =  -1


2. 이진 탐색 (Binary Search)
- 정렬된 대상 원소의 중간 값(median)과 탐색 키를 비교하는 방법
- 1회 비교할 때마다 대상 원소의 수가 절반씩 감소 
- 비교 대상 원소의 수가 n일 때 시간 복잡도는 O(log2n)
- n이 클수록 순차 탐색보다 속도가 훨씬 빠르다 

- 이진 탐색 알고리즘
1. 정렬된 원소 리스트에서 중간 값(median)의 위치 계산
2. 탐색 키와 중간 값을 비교하여 일치하면 위치를 반환하고 종료
3. 탐색 키가 중간 값보다 작으면 중간 값의 원쪽 리스트로 탐색 범위 변경, 크면 오른쪽 리스트로 변경
4. 탐색 범위에 원소가 없으면 -1을 반환하고 탐색을 종료

In [2]:
def binary_search(num, key, left, right):
    while left <= right:
        mid = (left + right) // 2
        if key == num[mid]: 
            return mid 
        else: 
            if key < num[mid]:
                right = mid - 1
            else:
                left = mid + 1 
    return -1

lst = [0, 1, 5, 9, 13, 17, 23, 32, 45]
for item in [45, 8]:
    pos  = binary_search(lst, item, 0, len(lst)-1)
    print("position = ", pos)

position =  8
position =  -1


3. 보간 탐색(Interpolation Search)
- 이진 탐색의 성능을 개선할 목적으로 개발 
- 정렬된 리스트를 탐색한다는 점은 이진 탐색과 동일하지만,
- 보간 탐색은 탐색 범위에서 키 값의 차이와 위치(인덱스)의 차이가 비례한다는 가정을 바탕으로 함
- 탐색 키와 탐색 범위 경계의 차이를 고려하여 비교 위치를 결정 

- (list[right] - list[left]) : (key - list[left]) = (right - left) : (pos - left)
- 왼쪽 항은 탐색 범위 내 값의 차이, 오른쪽 항은 탐색 범위 내 인덱스 차이 의미 

- pos를 기준으로 식 재정립
- pos = left + ((right - left) * (key - list[left])) / (list[right] - list[left])

- 보간 탐색은 탐색 대상 원소들이 균등하게 분포되어 있다면 탐색 횟수를 낮추는데 효과적 

In [3]:
def interpolate_search(num, key, left, right):
    while left <= right:
        if key < num[left] or key > num[right]:
            break
        pos = left + \
            (key - num[left]) *(right-left) // (num[right] - num[left])

        if key > num[pos]:
            left = pos + 1 
        elif key < num[pos]:
            right = pos - 1 
        else :
            return pos
    return -1

lst = [2, 3, 5, 7, 9, 10, 13, 20, 25, 39, 45, 55]
for key in [39, 2, 55, 60, 1]:
    pos = interpolate_search(lst, key, 0, len(lst)-1)
    print("%2d is in %2d" % (key, pos))

39 is in  9
 2 is in  0
55 is in 11
60 is in -1
 1 is in -1


### 해싱
