## 이진 탐색

- 데이터가 **`정렬된 배열`**에서 **`특정한 값을 찾아내는`** 알고리즘
- 탐색 범위를 반으로 좁혀가며 빠르게 탐색하는 알고리즘

< 이진 탐색 방법 >
> - (1) 배열의 중간에 있는 임의의 값을 선택하여 찾고자 하는 값 X와 비교
> - (2) x가 중간 값보다 작으면 중간 값을 기준으로 좌측의 데이터들을 대상으로, X가 중간값보다 크면 배열의 우축을 대상으로 다시 탐색
> - (3) 동일한 방법 반복


- `변수 3개(start, end, mid)`를 사용하여 탐색함
- 찾으려는 데이터와 중간점 위치에 있는 데이터를 반복적 비교
- 데이터의 개수가 1,000만 개를 넘어가거나 탐색 범위의 크기가 1,000억 이상이라면 이진 탐색 알고리즘을 의심
- 입력 데이터의 개수가 많은 문제에 input() 함수를 넣으면 시간 초과로 오답 판정을 받을 수 있음
- > **`sys 라이브러리의 readline() 함수를 이용`**
  > - 주피터에서는 sys.stdin.readline() 작동안함

In [3]:
import sys
input_data = sys.stdin.readline().rstrip()
print(input_data)




#### 재귀 함수로 구현한 이진 탐색(이분 탐색)

In [4]:
def binary_search(array, target, start, end):
    
    if start > end:
        return None
    mid = (start+end)//2
    
    if array[mid] == target:
        return mid
    
    elif array[mid] > target:
        return binary_search(array, target, start, mid-1)
        
    else:
        return binary_search(array, target, mid+1, end)

        
n, target = map(int, input().split())
array = list(map(int, input().split()))
result = binary_search(array, target, 0, n-1)
    
if result is None:
    print('No elements')
    
else:
    print(result+1)

10 7
1 3 5 7 9 11 13 15 17 19
4


In [5]:
def binarySearch(array, target, start, end):
    
    while start<=end:
        mid= (start+end)//2
        
        if array[mid] == target:
            return mid

        elif array[mid] > target:
            return binarySearch(array, target, start, mid-1)

        else:
            return binarySearch(array, target, mid+1, end)
            
    return None

n, target = map(int, input().split())
array = list(map(int, input().split()))

result = binarySearch(array, target, 0, n-1)

if result is None:
    print('해당 원소 없음')

else:
    print(result+1)
                

10 7
1 3 5 6 9 11 13 15 17 19
해당 원소 없음


#### 반복문으로 구현한 이진 탐색(이분 탐색)

In [6]:
def binary_search(array, target, start, end):
    
    while start <= end:
        mid = (start+end)//2
        
        if array[mid] == target:
            return mid
        
        elif array[mid] > target:
            end = mid-1
            
        else:
            start = mid+1
              
    return None

n,target = map(int, input().split())
array = list(map(int, input().split()))

result = binary_search(array, target, 0, n-1)

if result is None:
    print('원소 없음')
    
else:
    print(result+1)

10 7
1 3 5 6 9 11 13 15 17 19
원소 없음


-------------
### `binary search` 알고리즘 문제

**Q1. 부품찾기**

    전자 매장에 부품이 N개 있다. 각 부품은 정수 형태의 고유한 번호가 있다.
    어느 날 손님이 M개 종류의 부품을 대량으로 구매하겠다며 당일 날 견적서를 요청했다.
    손님이 문의한 부품 M개 종류를 모두 확인해서 견적서를 작성해야 한다.
    이 때 가게 안에 부품이 모두 있는지 확인하는 프로그램을 작성해보자
    
    예) 가게의 부품이 총 5개 일 때(N=5), 부품 번호는 [8, 3, 7, 9, 2]
    
    손님은 총 3개의 부품이 있는지 확인 요청했는데, 부품 번호는 [5,7,9]와 같다.
    
    이때 손님이 요청한 부품 번호의 순서대로 부품을 확인해 부품이 있으면 YES, 없으면 NO 출력, 구분은 0
    
    <입력 조건>
    - 첫째 줄에 정수 N이 주어진다. (1<=N<=1,000,000)
    - 둘째 줄에는 공백으로 구분하여 N개의 정수가 주어진다. 이때 정수는 1보다 크고, 1,000,000 이하이다.
    - 셋째 줄에는 정수 M이 주어진다. (1<=N<=100,000)
    - 넷째 줄에는 공백으로 구분하여 M개의 정수가 주어진다. 이때 정수는 1보다 크고 1,000,000 이하이다.
    
    <출력 조건>
    - 첫째 줄에 공백으로 구분하여 각 부품이 존재하면 YES, 없으면 NO를 출력한다.
    
    <입력 예시>
    5
    8 3 7 9 2
    3
    5 7 9
    
    <출력 예시>
    no yes yes

In [15]:
def binary_search_ex(array, target, start, end):
    
    while start <= end:
        mid = (start+end)//2
        cnt = 0
        
        for arr in array:
            if array[mid] == target:
                return mid
            
            elif array[mid] > target:
                end = mid-1
                
            else:
                start = mid+1
        
    return None
        
                
n = int(input())
lst_arr = list(map(int, input().split()))
lst_arr.sort()

m = int(input())
find_arr = list(map(int, input().split()))


for x in find_arr:
    result = binary_search_ex(lst_arr, x, 0, n-1)
    
    if result is None:
        print('no', end= ' ')
        
    else:
        print('yes', end= ' ')
    
    

5
8 3 7 9 2
3
5 7 9
no yes yes 

##### 계수 정렬 이용

In [18]:
# n(가게의 부품 개수 입력 받기)
n = int(input())
lst_arr = [0] * 1000001

# 가게에 있는 전체 부품 번호를 입력 받아서 기록
for i in input().split():
    lst_arr[int(i)] = 1
    
# m(손님이 확인 요청한 부품 개수 입력 받기)

m = int(input())
# 손님이 확인 요청한 전체 부품 번호 공백으로 구분하여 입력
find_arr = list(map(int, input().split()))


# 손님이 확인 요청한 부품 번호 하나씪 확인

for i in find_arr:
    
    # 해당부품이 존재하는지 확인
    if lst_arr[i] == 1:
        print('yes', end =' ')
        
    else:
        print('no', end=' ')
    

5
8 3 7 9 2
3
5 7 9
no yes yes 

**Q2. 부품찾기**

    한 떡볶이 집의 떡의 길이가 일정하지 않으나, 대신 한 봉지 안에 들어 있는 가는 떡의 총 길이는 절단기로 맞춰준다.
    절단기의 높이 (H)를 지정하면 줄지어진 떡을 한 번에 절단한다. 높이가 H보다 긴 떡은 H 위의 부분이 잘릴 것이고, 낮은 떡은 잘리지 않는다.
    예를 들어 높이가 19, 14, 10, 17cm 인 떡이 나란히 있고, 절단기의 높이를 15cm로 지정하면 자른 뒤 떡의 높이는 15,14,10,15cm가 된다.
    잘린 떡의 길이는 차례대로 4, 0, 0, 2cm 이다. 손님은 6cm 만큼의 길이를 가져간다.
    손님이 왔을 때 요청한 총 길이가 M일 때, 적어도 M 만큼의 떡을 얻기 위해 절단기에 설정할 수 있는 높이의 최댓값을 구하는 프로그램 작성
    
    <입력 조건>
    - 첫째 줄에 떡의 개수 N과 요청한 떡의 길이 M이 주어진다. (1<= N <=1,000,000, 1<=M<=2,000,000,000)
    - 둘째 줄에는 떡의 개별 높이가 주어진다. 떡 높이의 총합은 항상 M 이상이므로, 손님은 필요한 양만큼만 떡을 사갈 수 있다.
    높이는 10억보다 작거나 같은 양의 정수 또는 0이다.
    
    <출력 조건>
    - 적어도 M만큼의 떡을 집에 가져가기 위해 절단기에 설정할 수 있는 높이의 최댓값을 출력한다.
    
    <입력 예시>
    4 6
    19 15 10 17
    <출력 예시>
    15

-> 전형적인 `이진 탐색 문제` 이자 `파라메트릭 서치(Parametric Search)` 유형
>- **`파라메트릭 서치(Parametric Search)`** 
>- 최적화 문제(문제의 상황을 만족하는 특정 변수의 최솟값, 최댓값을 구하는 문제)를 결정 문제로 바꾸어 푸는 것
>- (1) 결정 문제를 정의했을 때, 쉽게 풀 수 있는 경우
>- (2) (최솟값을 구하는 경우) 최솟값이 x라면, x이상의 값에 대해서는 모두 조건을 만족
>- (3) (최댓값을 구하는 경우) 최댓값이 x라면, x이하의 값에 대해서는 모두 조건을 만족


In [32]:
def binary_search_dduck(array, target, start, end):
    
    result = 0
    while start<=end:
        mid = (start+end)//2
        cnt = 0
        
        for arr in array:
            if arr >= mid:
                cnt += arr-mid
                
                if cnt > target:
                    break
                
        if cnt >= target:
            start = mid+1            
            
        else:
            end = mid-1
            
    return end        
            
    
    
N, M = map(int, input().split())
array = list(map(int, input().split()))
start, end = 1, max(array)

result = binary_search_dduck(array, M, start, end)
print(result)

4 6
19 15 10 17
15


In [31]:
N, M = map(int, input().split())
array = list(map(int, input().split()))

start, end, result = 1, max(array),0

while start<=end:
    mid = (start+end)//2
    cnt = 0
    
    for arr in array:
        if arr >= mid:
            cnt += arr-mid
            
            if cnt > M:
                break
                    
    if cnt >= M:
        start = mid+1

    else:
        end = mid-1

print(end)

4 6
19 15 10 17
15


------------------

 **Q3**.

    연초가되어 카카오에서 고생한 직원 100명을 뽑아서 카카오해변으로 휴가를 보내주었습니다. 1년 동안 힘들게 일한 라이언은 신이나서 해변에 멋진 작품을 만들고 밥을 먹고 돌아왔습니다. 돌아오니 아니 웬걸, 라이언이 공들여 만든 작품은 망가져있고 모래사장에 발자국이 하나 찍혀 있었습니다. 해변에는 100명의 사람들이 있습니다. 발자국 길이를 잰 라이언은 어떻게 하면 빠르게 범인을 찾을 수 있을까요?
    
    범인을 찾는 두 가지 방법이 있습니다.
    
    [방법 1] 해변에 찍힌 발자국의 길이와 같은 사람이 나올때까지 만나는 사람마다 발 크기를 재는 방
    [방법 2] 사람드에게 신발 크기가 작은 순서부터 큰 순서로 서 있게 한 다음에 중간에 서 있는 사람의 발 크기부터 비교합니다.

In [33]:
def binarySearch(array, target, start, end):
    
    while start<=end:
        mid = (start+end)//2
        
        if arr[mid] == target:
            return mid
        
        elif arr[mid] > target:
            binarySearch(array, target, start, end-1)
            
        else:
            binarySearch(array, target, mid+1, end)       

In [34]:
def binarySearch(array, value, low, hight):
    
    if low > high:
        return False
    
    mid = (low+high) / 2
    
    if array[mid] > value:
        return binarySearch(array, value, low, mid-1)
    
    elif arry[mid] < value:
        return binarySearch(array, value, mid+1, high)
    
    else:
        return mid

https://www.acmicpc.net/problem/2805

**Q4. 백준 2805**
    
    
    상근이는 나무 M미터가 필요하다. 근처에 나무를 구입할 곳이 모두 망해버렸기 때문에, 정부에 벌목 허가를 요청했다. 정부는 상근이네 집 근처의 나무 한 줄에 대한 벌목 허가를 내주었고, 상근이는 새로 구입한 목재절단기를 이용해서 나무를 구할것이다.
    
    목재절단기는 다음과 같이 동작한다. 먼저, 상근이는 절단기에 높이 H를 지정해야 한다. 높이를 지정하면 톱날이 땅으로부터 H미터 위로 올라간다. 그 다음, 한 줄에 연속해있는 나무를 모두 절단해버린다. 따라서, 높이가 H보다 큰 나무는 H 위의 부분이 잘릴 것이고, 낮은 나무는 잘리지 않을 것이다. 예를 들어, 한 줄에 연속해있는 나무의 높이가 20, 15, 10, 17이라고 하자. 상근이가 높이를 15로 지정했다면, 나무를 자른 뒤의 높이는 15, 15, 10, 15가 될 것이고, 상근이는 길이가 5인 나무와 2인 나무를 들고 집에 갈 것이다. (총 7미터를 집에 들고 간다) 절단기에 설정할 수 있는 높이는 양의 정수 또는 0이다.
    
    상근이는 환경에 매우 관심이 많기 때문에, 나무를 필요한 만큼만 집으로 가져가려고 한다. 이때, 적어도 M미터의 나무를 집에 가져가기 위해서 절단기에 설정할 수 있는 높이의 최댓값을 구하는 프로그램을 작성하시오.
    
    
    <입력>
    
    첫째 줄에 나무의 수 N과 상근이가 집으로 가져가려고 하는 나무의 길이 M이 주어진다. (1 ≤ N ≤ 1,000,000, 1 ≤ M ≤ 2,000,000,000)
    
    둘째 줄에는 나무의 높이가 주어진다. 나무의 높이의 합은 항상 M보다 크거나 같기 때문에, 상근이는 집에 필요한 나무를 항상 가져갈 수 있다. 높이는 1,000,000,000보다 작거나 같은 양의 정수 또는 0이다.
    
    <출력>
    
    적어도 M미터의 나무를 집에 가져가기 위해서 절단기에 설정할 수 있는 높이의 최댓값을 출력한다.
  
  
![image.png](attachment:image.png)

In [35]:
# import sys
# input = sys.stdin.readline

# n, target = map(int, input().split())
# trees = [map(int, input().split())]

<시간초과 걸림>

In [36]:
n, target = map(int, input().split())
trees = list(map(int, input().split()))

min_len, max_len = 1, max(trees)

while min_len <= max_len:
    mid = (min_len + max_len)//2
    cnt = 0
    
    for tree in trees:
        if tree >= mid:
            cnt += tree-mid
        
    if cnt >= target:
        min_len = mid+1
        
    else:
        max_len = mid-1
        
print(max_len)        

4 7
20 15 10 17
15


<시간 초과 해결>

In [37]:
n, target = map(int, input().split())
trees = list(map(int, input().split()))

min_len, max_len = 1, max(trees)

while min_len <= max_len:
    mid = (min_len + max_len)//2
    cnt = 0
    
    for tree in trees:
        if tree >= mid:
            cnt += tree-mid
            
            if cnt > target:
                break
            
        
    if cnt >= target:
        min_len = mid+1
        
    else:
        max_len = mid-1
        
print(max_len)

5 20
4 42 40 26 46
36


In [48]:
def binary_search_tree(array, target, start, end):
    result = 0
    
    while start <= end:
        mid = (start+end)//2
        cnt = 0
        
        for arr in array:
            if arr > mid:
                cnt += arr-mid
                
                if cnt > target:
                    break
                    
        if cnt >= target:
            start = mid+1
            
        else:
            end = mid-1
    
    return end
    
N, M = map(int, input().split())
array = list(map(int, input().split()))

result = binary_search_tree(array, M, 1, max(array))
print(result)

5 20
4 42 40 26 46
36


https://www.acmicpc.net/problem/1654


**Q5. 백준 1654**
    
    집에서 시간을 보내던 오영식은 박성원의 부름을 받고 급히 달려왔다. 박성원이 캠프 때 쓸 N개의 랜선을 만들어야 하는데 너무 바빠서 영식이에게 도움을 청했다.

    이미 오영식은 자체적으로 K개의 랜선을 가지고 있다. 그러나 K개의 랜선은 길이가 제각각이다. 박성원은 랜선을 모두 N개의 같은 길이의 랜선으로 만들고 싶었기 때문에 K개의 랜선을 잘라서 만들어야 한다. 예를 들어 300cm 짜리 랜선에서 140cm 짜리 랜선을 두 개 잘라내면 20cm는 버려야 한다. (이미 자른 랜선은 붙일 수 없다.)

    편의를 위해 랜선을 자르거나 만들 때 손실되는 길이는 없다고 가정하며, 기존의 K개의 랜선으로 N개의 랜선을 만들 수 없는 경우는 없다고 가정하자. 그리고 자를 때는 항상 센티미터 단위로 정수길이만큼 자른다고 가정하자. N개보다 많이 만드는 것도 N개를 만드는 것에 포함된다. 이때 만들 수 있는 최대 랜선의 길이를 구하는 프로그램을 작성하시오.
    
    
    <입력>
    
    첫째 줄에는 오영식이 이미 가지고 있는 랜선의 개수 K, 그리고 필요한 랜선의 개수 N이 입력된다. K는 1이상 10,000이하의 정수이고, N은 1이상 1,000,000이하의 정수이다. 그리고 항상 K ≦ N 이다. 그 후 K줄에 걸쳐 이미 가지고 있는 각 랜선의 길이가 센티미터 단위의 정수로 입력된다. 랜선의 길이는 2^31-1보다 작거나 같은 자연수이다.
    
    <출력>
    
    첫째 줄에 N개를 만들 수 있는 랜선의 최대 길이를 센티미터 단위의 정수로 출력한다.
    
    
![image.png](attachment:image.png)

    802cm 랜선에서 4개, 743cm 랜선에서 3개, 457cm 랜선에서 2개, 539cm 랜선에서 2개를 잘라내 모두 11개를 만들 수 있다.

In [47]:
n, target = map(int, input().split())
lines = [int(input()) for _ in range(n)]

min_len=1
max_len=max(lines)
result = 0

while min_len<=max_len:
    mid = (min_len+max_len)//2
    cnt = 0
    
    for line in lines:
        cnt += line//mid
    
    
    if cnt >= target:
        result = mid
        min_len = mid+1
               
    else:
        max_len = mid-1
        
print(result)

4 11
802
743
457
539
200


In [49]:

def binary_serach_len(array, M, start, end):
    result = 0 
    while start<=end:
        mid = (start+end)//2
        cnt = 0

        for arr in array:
            if arr > mid:
                cnt += arr//mid

                if cnt > M:
                    break

        if cnt >= M:
            start = mid+1
            result = mid

        else:
            end = mid-1

    return result


K, M = map(int, input().split())
array = [int(input()) for _ in range(K)]
result = binary_serach_len(array, M, 1, max(array))
print(result)  

4 11
802
743
457
539
200


#### Python `bisect` 라이브러리(모듈) 사용 이진 탐색

![image.png](attachment:image.png)

- bisect_left(a, x) : 정렬된 순서를 유지하면서 리스트 a에 데이터 x를 삽입할 가장 왼쪽 인덱스를 찾음
- bisect_right(a, x) : 정렬된 순서를 유지하면서 리스트 a에 데이터 x를 삽입할 가장 오른쪽 인덱스를 찾음


> `정렬된 리스트`에서 값이 `특정 범위에 속하는 원소의 개수`를 구하고자 할때 효과적으로 사용

In [50]:
from bisect import bisect_left, bisect_right

a = [1,2,4,4,8]
x = 4
# 새롭게 데이터 4를 삽입하려고 가정

print(bisect_left(a,x))
print(bisect_right(a,x))


2
4


In [51]:
from bisect import bisect_left, bisect_right


def add_elements(a, left, right):
    
    left_idx = bisect_left(a,left)
    right_idx = bisect_right(a,right)
    
    return left_idx, right_idx

In [52]:
lst = [0,1,2,3,4,5,6,7,8,9]
add_elements(lst,5,5)

(5, 6)

**Q3.** 
    
    **[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 의 정렬된 배열이 있을 때,
    현재 정렬된 상태를 유지하면서 n = 5 이라는 요소를 배열에 추가하고 싶다고 해봅시다.
    어떤 인덱스에 넣어야하는지 계산하는 함수를 구하기**

`count_by_range(a, left_value, right_range) 사용자 함수`

- 정렬된 리스트에서 값이 [left_value, right_value] 에 속하는 데이터의 개수를 반환
- 원소의 개수의 값을 x, left_value <= x <= right_value 인 원소의 개수를 O(logN)으로 빠르게 계산 가능

In [53]:
# 값이 [left_value, right_value] 인 데이터의 개수를 반환하는 함수

def count_by_range(a, left_value, right_value):
    right_index = bisect_right(a, right_value)
    left_index= bisect_left(a, left_value)
    
    return right_index - left_index


a = [1,2,3,3,3,4,4,8,9]

# 값이 4인 데이터 개수 출력
print(count_by_range(a, 4, 4))

# 값이 -1,3 범위에 있는 데이터 개수 출력
print(count_by_range(a, -1, 3))

2
5
