## 탐색 알고리즘2: 이진 탐색(Binary Search)

### 1. 이진 탐색이란
- 탐색할 자료를 둘로 나누어 해당 데이터가 있을만한 곳을 탐색하는 방법

### 2. 분할 정복 알고리즘(Devide and Conquer)과 이진 탐색

- 이진 탐색 알고리즘은 분할 정복 알고리즘을 토대로 동작한다고 볼 수 있다.
- Devide = list를 2개의 sub-list로 나눈다
- Conquer
    - 검색할 숫자 > 중간값인 경우, 뒷 부분의 sub list에서 다시 검색
    - 검색할 숫자 < 중간값 인경우, 앞 부분의 sub list에서 다시 검색

In [1]:
def binary_search(data, search):
    print(data)
    if len(data) == 1 and search == data[0]:
        return True
    if len(data) == 1 and search != data[0]:
        return False
    if len(data) == 0:
        return False
    
    medium = len(data) // 2
    if search == data[medium]:
        return True
    else:
        if search > data[medium]:
            return binary_search(data[medium+1:], search)
        else:
            return binary_search(data[:medium], search)

In [2]:
import random
data = random.sample(range(100), 10)
data.sort()
data

[4, 5, 23, 30, 40, 43, 54, 63, 64, 93]

In [3]:
binary_search(data, 30)

[4, 5, 23, 30, 40, 43, 54, 63, 64, 93]
[4, 5, 23, 30, 40]
[30, 40]
[30]


True

### 3. 이진 탐색 알고리즘 분석

* n개의 리스트를 매번 2로 나누어 1이 될때 까지의 비교연산을 k회 진행
 - <font size=4em>n X $\frac { 1 }{ 2 }$ X $\frac { 1 }{ 2 }$ X $\frac { 1 }{ 2 }$ ... = 1</font>
  - <font size=4em>n X $\frac { 1 }{ 2 }^k$ = 1</font>
  - <font size=4em>n = $2^k$ = $log_2 n$ = $log_2 2^k$</font>
  - <font size=4em>$log_2 n$ = k</font>
* 결국 $O(log2n+1)$이고, 2와 1은 상수이므로 제거하면, $O(logn)$

#### 10000개의 데이터를 삽입/퀵 정렬로 정렬하는 함수 만들기 + 시간 측정하기

In [25]:
import datetime
import random
data_list = random.sample(range(10000),10000)

def qsort(data):
    if len(data) <= 1:
        return data
    
    left,right = list(), list()
    pivot = data[0]
    
    for index in range(1, len(data)):
        if pivot > data[index]:
            left.append(data[index])
        else:
            right.append(data[index])
    return qsort(left) + [pivot] + qsort(right)


def insertion_sort(data):
    for stand in range(len(data)-1):
        for index in range(stand +1, 0, -1):
            if data[index] < data[index - 1]:
                data[index], data[index -1] = data[index-1], data[index]
            else:
                break
    return data

now_time = datetime.datetime.now()
qsort(data_list)
end_time = datetime.datetime.now()
print(end_time-now_time)

now_time = datetime.datetime.now()
insertion_sort(data_list)
end_time = datetime.datetime.now()
print(end_time - now_time)

0:00:00.039039
0:00:10.841457
