# 1. 이진 탐색 Binary Search 

* 탐색할 자료를 둘로 나누어 해당 데이터가 있을만한 곳을 탐색하는 방법 

### 1-1. 이진 탐색과 순차 탐색의 비교 

<img src="https://www.mathwarehouse.com/programming/images/binary-vs-linear-search/binary-and-linear-search-animations.gif">

# 2. 분할 정복 알고리즘과 이진 탐색 

* 분할 정복 (Divide Conquer) 알고리즘:
  * divide: 문제를 하나 또는 둘 이상으로 나눔 
  * conquer: 나눠진 문제가 충분히 작고, 해결이 가능하다면 해결하고, 그렇지 않다면 다시 나눔 

* 이진 탐색
  * divide: 리스트를 두개의 서브 리스트로 나눔
  * conquer: 
    * 검색할 숫자 > 중간값: 뒷 부분의 서브 리스트에서 검색할 숫자를 찾음 
    * 검색할 숫자 < 중간값: 앞 부분의 서브 리스트에서 검색할 숫자를 찾음 

# 3. 동작 방식

1. 배열의 중간 값을 가져온다.
2. 중간 값과 검색 값을 비교한다.
    * 중간값과 검색값이 같다면 종료
    * 중간값 보다 검색값이 크다면 리스트의 오른쪽 탐색
    * 중간값 보다 검색값이 작아면 리스트의 왼쪽을 탐색
3. 값을 찾거나 간격이 비었을 때까지 2를 반복 

# 4. 시간 복잡도

* Best = O(1)
* Average = O($logn$)
* Worst = O($logn$)
    * n개의 리스트를 매번 2로 나눠 1이 될때까지 비교연산을 k회 진행 
      - <font size=4em>n X $\frac { 1 }{ 2 }$ X $\frac { 1 }{ 2 }$ X $\frac { 1 }{ 2 }$ ... = 1</font>
      - <font size=4em>n X $\frac { 1 }{ 2 }^k$ = 1</font>
      - <font size=4em>n = $2^k$ = $log_2 n$ = $log_2 2^k$</font>
      - <font size=4em>$log_2 n$ = k</font>
      - 빅 오 표기법으로는 k+1이 결국 최종 시간 복잡도임
      - 결국 O($log_2 n$ + 1) 이며, 2와 1, 상수는 삭제 되므로 O($log n$)

# 5. 알고리즘 구현 

* 이진 탐색은 데이터가 정렬되어 있는 상태에서 진행 
* 데이터가 [2, 3, 8, 12, 20] 일 때
  * binary_serach(data_list, find_data) 
    * data_list: 데이터 리스트
    * find_data: 찾는 숫자 
    * data_list의 중간값을 find_data와 비교해서 
      * find_data < data_list의 중간값: 맨 앞부터 data_list의 중간까지에서 다시 fnd_data를 찾기 
      * find_data > data_list의 중간값: data_list의 중간부터 맨 끝까지 다시 find_data를 찾기 
      * find_data == data_list의 중간값:
      return data_list 중간값 

In [21]:
def binary_search(data, search):
  
  print(data)
  # 방어코드
  # when there is only one data point and equals to search 
  if len(data) == 1 and search == data[0]:
    return True
  # when there is only one data point and not equals to search  
  if len(data) == 1 and search != data[0]:
    return False
  # when there is no data 
  if len(data) == 0:
    return False 

  middle = int(len(data) / 2)
  if data[middle] == search:
    return True
  else: 
    if search > data[middle]:
      return binary_search(data[middle+1:], search)
    else: 
      return binary_search(data[:middle], search)
  

In [12]:
import random

random.seed(35)
data_list = random.sample(range(100), 10)
data_list.sort()
data_list

[16, 19, 32, 36, 42, 43, 55, 70, 95, 96]

In [22]:
binary_search(data_list, 96), binary_search(data_list, 19)

[16, 19, 32, 36, 42, 43, 55, 70, 95, 96]
[55, 70, 95, 96]
[96]
[16, 19, 32, 36, 42, 43, 55, 70, 95, 96]
[16, 19, 32, 36, 42]
[16, 19]


(True, True)

In [23]:
binary_search(data_list, 5)

[16, 19, 32, 36, 42, 43, 55, 70, 95, 96]
[16, 19, 32, 36, 42]
[16, 19]
[16]


False

# 6. 예상 질문

이진 탐색 알고리즘은 어떻게 동작하나요?

> 이진 탐색은 정렬된 배열에서 중간 값을 선택하고 찾고자 하는 값과 비교합니다. 만약 중간 값이 찾고자 하는 값과 같다면 찾았다고 판단하고, 그렇지 않은 경우 찾고자 하는 값이 중간 값보다 작으면 왼쪽 반 배열을, 크면 오른쪽 반 배열을 대상으로 동일한 과정을 반복합니다. 이를 반복하여 찾고자 하는 값을 찾거나 배열을 모두 확인할 때까지 진행합니다.

이진 탐색의 시간 복잡도는 어떻게 되나요?

> 이진 탐색의 시간 복잡도는 O(log n)입니다. 이는 배열을 반으로 나누어가며 탐색하기 때문에 탐색 범위를 로그 시간에 줄일 수 있습니다. 이는 배열이 정렬되어 있어야 한다는 전제 조건이 필요하지만, 정렬된 데이터에서 빠른 검색을 제공합니다.

이진 탐색과 선형 탐색의 차이는 무엇인가요?

> 이진 탐색은 정렬된 배열에서 중간 값을 활용하여 탐색 범위를 반으로 줄여가며 효율적으로 탐색하는 반면, 선형 탐색은 배열을 처음부터 끝까지 하나씩 순차적으로 확인하는 방식입니다. 이진 탐색은 O(log n)의 시간 복잡도를 가지며 효율적으로 동작하는 반면, 선형 탐색은 O(n)의 시간 복잡도를 가지며 비교적 느립니다.