# **1. 이진 탐색(Binary Search)**

* 탐색할 자료를 둘로 나누어 해당 데이터가 있을만한 곳을 탐색하는 방법

### **1-1. 이진 탐색과 순차 탐색의 비교**

<img src="https://www.mathwarehouse.com/programming/images/binary-vs-linear-search/binary-and-linear-search-animations.gif">

# **2. 분할 정복 알고리즘과 이진 탐색**

* 분할 정복 알고리즘
  * Divide : 문제를 하나 또는 둘 이상으로 나눔
  * Conquer : 나눠진 문제가 충분히 작고 해결이 가능하다면 해결하고, 그렇지 않다면 다시 나눔
* 이진 탐색
  * Divide : 리스트를 두 개의 서브 리스트로 나눔
  * Conquer
    * 검색할 숫자(search) > 중간값이면 뒷부분의 서브 리스트에서 검색할 숫자를 찾음
    * 검색할 숫자(search) < 중간값이면 앞부분의 서브 리스트에서 검색할 숫자를 찾음

# **3. 알고리즘 구현**

* 이진 탐색은 데이터가 정렬되어 있는 상태에서 진행
* 데이터가 [2, 3, 8, 12, 20] 일 때
  * binary_search(data_list, find_data) 함수로 만듦
    * data_list : 데이터 리스트
    * find_data : 찾는 숫자
    * data_list의 중간값을 find_data와 비교
      * find_data < 중간값이면
        * 맨 앞부터 중간값까지로 끊어서 다시 find_data를 찾기
      * find_data > 중간값이면
        * 중간값부터 맨 끝까지로 끊어서 다시 find_data를 찾기
      * 그렇지 않다면 find_data는 data_list의 중간값이므로 return data_list 중간위치

In [10]:
def binary_search(data, search):
  print(data)
  if len(data) == 1 and search == data[0]:
    return True
  if len(data) == 1 and search != data[0]:
    return False
  if len(data) == 0:
    return False

  med_idx = len(data) // 2
  if search < data[med_idx]:
    return binary_search(data[:med_idx], search)
  elif search > data[med_idx]:
    return binary_search(data[med_idx+1:], search)
  else:
    return True

In [11]:
import random
data_list = random.sample(range(100), 10)
data_list

[27, 20, 51, 57, 79, 16, 78, 10, 84, 4]

In [12]:
data_list.sort()

In [13]:
binary_search(data_list, 10) # True

[4, 10, 16, 20, 27, 51, 57, 78, 79, 84]
[4, 10, 16, 20, 27]
[4, 10]


True

In [14]:
binary_search(data_list, 80) # False

[4, 10, 16, 20, 27, 51, 57, 78, 79, 84]
[57, 78, 79, 84]
[84]


False

# **4. 알고리즘 분석**

* n개의 리스트를 매번 2로 나누어 1이 될 때까지 비교연산을 k회 실행
  - <font size=4em>n X $\frac { 1 }{ 2 }$ X $\frac { 1 }{ 2 }$ X $\frac { 1 }{ 2 }$ ... = 1</font>
  - <font size=4em>n X $\frac { 1 }{ 2 }^k$ = 1</font>
  - <font size=4em>n = $2^k$ = $log_2 n$ = $log_2 2^k$</font>
  - <font size=4em>$log_2 n$ = k</font>
  - 빅 오 표기법으로는 k + 1 이 결국 최종 시간 복잡도임 (1이 되었을 때도, 비교연산을 한번 수행)
    - 결국 O($log_2 n$ + 1) 이고, 2와 1, 상수는 삭제 되므로, O($log n$)