# 모두의 알고리즘_12_이분 탐색

<h1>Table of Contents<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#일상생활-속의-탐색-문제" data-toc-modified-id="일상생활-속의-탐색-문제-1"><span class="toc-item-num">1&nbsp;&nbsp;</span>일상생활 속의 탐색 문제</a></span></li><li><span><a href="#이분-탐색-알고리즘" data-toc-modified-id="이분-탐색-알고리즘-2"><span class="toc-item-num">2&nbsp;&nbsp;</span>이분 탐색 알고리즘</a></span></li><li><span><a href="#알고리즘-분석" data-toc-modified-id="알고리즘-분석-3"><span class="toc-item-num">3&nbsp;&nbsp;</span>알고리즘 분석</a></span></li><li><span><a href="#연습문제" data-toc-modified-id="연습문제-4"><span class="toc-item-num">4&nbsp;&nbsp;</span>연습문제</a></span></li></ul></div>

자료의 크기 순서대로 절렬된 리스트에서 특정한 값이 있는지 찾아 그 위치를 돌려주는 알고리즘을 만들어 보세요. 리스트에 찾는 값이 없으면 -1을 돌려줍니다.

이분 탐색(Binary search)의 이분은 둘로 나눈다는 뜻입니다. 탐색할 자료를 둘로 나누어 찾는 값이 있을 법한 곳만 탐색하기 때문에 자료를 하나하나 찾아야 하는 차 탐색보다 원하는 자료를 훨씬 빨리 찾을 수 있습니다.

## 일상생활 속의 탐색 문제

+ 두꺼운 책을 한 권 앞에 두고 특정한 쪽 수(예를 들어 618쪽)를 찾는 과정
+ 굉장히 큰 호텔에서 원하는 방의 호수를 찾는 것

## 이분 탐색 알고리즘

1. 중간 위치를 찾습니다.
2. 찾는 값과 중간 위치 값을 비교합니다.
3. 같다면 원하는 값을 찾은 것이므로 위치 번호를 결괏값으로 돌려줍니다.
4. 찾는 값이 중간 위치 값보다 크다면 중간 위치의 오른쪽을 대상으로 다시 탐색합니다(1번 과정부터 반복).
5. 찾는 값이 중간 위치 값보다 작다면 중간 위치의 왼쪽을 대상으로 다시 탐색합니다(1번 과정부터 반복).

In [1]:
# 리스트에서 특정 숫자 위치 찾기(이분 탐색)
# 입력 : 리스트 a, 찾는 값 x
# 출력 : 찾으면 그 값의 위치, 찾지 못하면 -1

def binary_search(a, x):
    # 정렬
    a.sort()
    
    # 탐색할 범위를 저장하는 변수 start, end
    # 리스트 전체를 범위로 탐색 시장(0 ~ len(a)-1)
    start = 0
    end = len(a)-1
    
    while start <= end: # 탐색할 범위가 남아 있는 동안 반복
        mid = (start + end) // 2 # 탐색 범위의 중간 위치
        if x == a[mid]:
            return mid
        elif x > a[mid]:
            start = mid + 1
        else:
            end = mid -1
    return -1

In [4]:
d = [1, 6, 123, 56, 12, 76,8,0,2, 123,6,8,7,868,6,1,23,54,7,658,1,23,465,7,65,4657,45,6,456,456,45]
binary_search(d, 123)

d = [1, 4, 9, 16, 25, 36, 49, 64, 81]
print(binary_search(d, 36))
print(binary_search(d, 50))

5
-1


## 알고리즘 분석

이분 탐색의 계산 복잡도는 O(logn)으로, 순차 탐색의 계산 복잡도인 O(n)보다 훨씬 더 효율적입니다.

물론 이분 탐색을 가능하게 하려면 자료를 미리 정렬해 둬야 해서 번거로울 수 있습니다. 하지만 필요한 값을 여러 번 찾아야 한다면 시간이 조금 걸리더라도 자료를 한 번 정렬한 다음에 이분 탐색을 계속 이용하는 방법이 훨씬 효율적입니다.

## 연습문제

다음 과정을 참고하여 재귀 호출을 사용한 이분 탐색 알고리즘을 만들어보세요.

1. 주어진 탐색 대상이 비어 있다면 탐색할 필요가 없습니다(종료 조건).
2. 찾는 값과 주어진 탐색 대상의 중간 위치 값을 비교합니다.
3. 찾는 값과 중간 위치 값이 같다면 결괏값으로 중간 위치 값을 돌려줍니다.
4. 찾는 값이 중간 위치 값보다 크다면 중간 위치의 오른쪽을 대상으로 이분 탐색 함수를 재귀 호출합니다.
5. 찾는 값이 중간 위치 값보다 작다면 중간 위치의 왼쪽을 대상으로 이분 탐색 함수를 재귀 호출합니다.

In [5]:
def binary_self(a, x):
    if not a:
        return -1
    start = 0
    end = len(a)-1
    mid = (len(a) // 2)
    
    if x > a[mid]:
        return binary_self(a[mid+1:], x)
    elif x < a[mid]:
        return binary_self(a[:mid], x)
    else:
        return mid

In [6]:
d = [1, 4, 9, 16, 25, 36, 49, 64, 81]
print(binary_self(d, 36))
print(binary_self(d, 50))

0
-1
