## 탐색 알고리즘1: 이진 탐색 (Binary Search)

### 1. 이진 탐색 (Binary Search) 이란?
* 정렬된 자료를 둘로 나누어 해당 데이터가 있을만한 곳을 탐색하는 방법

### 이진 탐색의 이해 (순차 탐색과 비교하며 이해하기)

<img src="https://www.mathwarehouse.com/programming/images/binary-vs-linear-search/binary-and-linear-search-animations.gif">

### 지금까지의 탐색의 종류
* 순차 탐색
* 이진 탐색 트리
* 이진 트리 (최솟값 or 최댓값 탐색)
* 등등 ...

### 2. 분할 정복 알고리즘과 이진 탐색
- 분할 정복 알고리즘 (Divide and Conquer)
  - Divide: 문제를 하나 또는 둘 이상으로 나눈다.
  - Conquer: 나눠진 문제가 충분히 작고, 해결이 가능하다면 해결하고, 그렇지 않다면 다시 나눈다.
- 이진 탐색
  - Divide: 리스트를 두 개의 서브 리스트로 나눈다.
  - Comquer
    - 검색할 숫자 (search) > 중간값 이면, 뒷 부분의 서브 리스트에서 검색할 숫자를 찾는다.
    - 검색할 숫자 (search) < 중간값 이면, 앞 부분의 서브 리스트에서 검색할 숫자를 찾는다. 

### 3. 알고리즘 구현

In [33]:
def binary_search(data, search):
    print(data)
    if len(data) == 1 and search == data[0]:
        return True
    if len(data) == 1 and search != data[0]:
        return False
    if len(data) == 0:
        return False
    
    medium = len(data) // 2
    if search == data[medium]:
        return medium
    else:
        if search > data[medium]:
            return binary_search(data[medium+1:], search)
        else:
            return binary_search(data[:medium], search)
        
    

In [34]:
import random
data_list = random.sample(range(100),10)
data_list

[63, 74, 14, 35, 55, 93, 59, 15, 70, 29]

In [35]:
# .sort()함수는 
# sorted = data_list.sort 할 필요 없이,
# data_list 의 원형을 sort한다.
data_list.sort()
data_list

[14, 15, 29, 35, 55, 59, 63, 70, 74, 93]

In [40]:
binary_search(data_list, 15)

[14, 15, 29, 35, 55, 59, 63, 70, 74, 93]
[14, 15, 29, 35, 55]
[14, 15]


1

### 4. 알고리즘 분석
* n개의 리스트를 매번 2로 나누어 1이 될 때까지 비교연산을 k회 진행
  - <font size=4em>n X $\frac { 1 }{ 2 }$ X $\frac { 1 }{ 2 }$ X $\frac { 1 }{ 2 }$ ... = 1</font>
  - <font size=4em>n X $\frac { 1 }{ 2 }^k$ = 1</font>
  - <font size=4em>n = $2^k$ = $log_2 n$ = $log_2 2^k$</font>
  - <font size=4em>$log_2 n$ = k</font>
  - 빅 오 표기법으로는 k + 1 이 결국 최종 시간 복잡도임 (1이 되었을 때도, 비교연산을 한번 수행)
    - 결국 O($log_2 n$ + 1) 이고, 2와 1, 상수는 삭제 되므로, O($log n$)

<div class="alert alert-block alert-warning">
<strong><font color="blue" size="4em">프로그래밍 연습</font></strong><br>
다음 10000개의 데이터를 삽입 정렬, 퀵 정렬로 정렬하는 함수를 각각 만들어보고, 각각의 정렬 시간을 출력하기<br>
</div>

```python
# 데이터 셋
import random 
data_list = random.sample(range(100000), 10000)

# 현재 시간 구하기
import datetime
print (datetime.datetime.now())
```

In [50]:
import random 
import datetime

data_list = random.sample(range(100000),10000)

def qsort(data):
    if len(data) <= 1:
        return data
    
    pivot = data[0]
    left = [item for item in data[1:] if pivot > item ]
    right = [item for item in data[1:] if pivot <= item]
    
    return qsort(left)+[pivot]+qsort(right)

def msort(data):
    if len(data) <= 1:
        return data
    
    med = len(data) // 2
    left = msort(data[:med])
    right= msort(data[med:])
    
    return merge(left,right)

def merge(left,right):
    merged = list()
    left_point,right_point = 0,0
    
    while len(left) > left_point and len(right) > right_point:
        if left[left_point] < right[right_point]:
            merged.append(left[left_point])
            left_point +=1
        else:
            merged.append(right[right_point])
            right_point +=1
    while len(left) > left_point:
        merged.append(left[left_point])
        left_point+=1
        
    #case3 - right만 data가 남아 있을때
    while len(right) > right_point:
        merged.append(right[right_point])
        right_point+=1
    
    return merged

def BS(data,search):
    mid = len(data)//2
    if data[mid] == search:
        return True
    else:
        if search > data[mid]:
            return BS(data[mid+1:],search)
        else:
            return BS(data[:mid],search)
        
start = datetime.datetime.now()
sorted_list = qsort(data_list)
finish = datetime.datetime.now()
print(finish-start)
#약 0.02초 걸렷다고 보면 된다

0:00:00.024908
