# 1-1. 이진탐색 _ Binary Search

오름차순으로 정렬된 리스트에서, 특정한 값 `x`의 위치를 찾는 알고리즘.


**원리:**  
리스트가 정렬이 되었다는 전제 하에;  
리스트의 중간 값 `n`을 임의로 선택해서, `x`와 `n`을 비교하는 과정을 거친다(1)

`n`이 `x`보다 크다면, 정렬된 리스트의 새로운 최고값이  
`n`이 `x`보다 작다면, 정렬된 리스트의 새로운 최하값으로 설정되어

다시 한번 (1)의 과정을 거치는 방식이다.

**효과:**  
정렬된 리스트의 최소값부터 하나씩 `x`와 비교하는 선형 탐색(linear search, simple search)은 최대 n번의 탐색이 필요할 수 있지만,  

이진 탐색의 경우 주어진 리스트의 절반을 제외하며 최대 $\log_{2}n$번의 탐색을 통해 `x`의 값을 찾을 수 있다.

ex) Linear search vs Binary search

In [33]:
my_list = list(range(0, 10000000))

In [34]:
# Linear search

def linear_search(list, x):
    low = 0
    high = len(list)-1
    
    while low <= high:
        if x != list[low]:
            low += 1
        else:
            break
    return low

In [35]:
%%timeit
linear_search(my_list, 3498534)

426 ms ± 17.4 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [36]:
# Binary search

def binary_search(list, x):
    low = 0
    high = len(list)-1         # 탐색의 범위 지정; low ~ high
    
    while low <= high:
        mid = (low+high)// 2     # 중간 값 n 지정
        guess = list[mid]
        if guess == x:
            return mid
        if guess > x:
            high = mid-1
        else:
            low = mid + 1
    return None

In [37]:
%%timeit
binary_search(my_list, 3498534)

6.21 µs ± 204 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


# 1-2. 빅오표기법 _ Big O Notation

알고리즘이 얼마나 빠른지 성능을 표시하는 방법

**표기법**  

$O(n)$  
n = 데이터의 크기

**개념**  
- 알고리즘의 속도는 시간이 아닌 처리 횟수로 측정한다.
- 빅오 표기법은 최악의 경우에 대한 성능을 표기한다.
- 속도의 측정은 입력데이터의 증가에 따른 처리속도의 차이로 계산할 수 있다

**ex)**

$O(n)$
- 입력되는 데이터의 양에 따라 비례해서 처리 시간이 증가하는 알고리즘

$O(n^2)$  
- 입력데이터의 크기의 제곱에 비례해서 증가하는 상황

$O(2^n)$
- 입력 데이터가 하나 증가할 때마다 처리시간이 두배씩 증가하는 경우

$O(\log_{2}n)$
- 이진 탐색에 걸리는 시간