# Week5. 이진탐색

## 1. 순차탐색  
* 리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 차례대로 (순차적으로) 확인하는 방법  
* **정렬되지 않은 리스트**에서 데이터를 찾을 때 사용  
* `count` 메소드를 이용할 때도 내부에서는 순차 탐색이 수행됨  
* 데이터 정렬 여부와 관계없이 가장 앞의 원소부터 하나씩 확인 → 시간복잡도 $O(N)$

In [1]:
def sequential_search(n, target, array):
    # 각 원소를 하나씩 확인하며
    for i in range(n):
        # 현재의 원소가 찾고자 하는 원소와 동일한 경우
        if array[i] == target:
            return i+1 # 현재의 위치 반환

print('생성할 원소 개수를 입력한 다음 한 칸 띄고 찾을 문자열을 입력하세요.')
input_data = input().split()
n = int(input_data[0]) # 원소의 개수
target = input_data[1] # 찾고자 하는 문자열

print('앞서 적은 원소 개수만큼 문자열을 입력하세요. 구분은 띄어쓰기 한 칸으로 합니다.')
array = input().split()

# 순차 탐색 수행 결과 출력
print(sequential_search(n, target, array))

생성할 원소 개수를 입력한 다음 한 칸 띄고 찾을 문자열을 입력하세요.
5 Dongbin
앞서 적은 원소 개수만큼 문자열을 입력하세요. 구분은 띄어쓰기 한 칸으로 합니다.
bbomin hrlee Dongbin yunee
3


## 2. 이진탐색 : 반으로 쪼개면서 탐색하기  
* **배열 내부의 데이터가 정렬되어 있어야만 사용가능**한 알고리즘  
* 데이터가 이미 정렬되어 있다면 매우 빠르게 데이터를 찾을 수 있음  
* 탐색 범위를 절반씩 좁혀가며 데이터를 탐색  

* 사용 변수 : `시작점`, `끝점`, `중간점`  
* 찾으려는 데이터와 중간점 위치에 있는 데이터를 반복적으로 비교해서 원하는 데이터를 찾음  
* 시간 복잡도 : $O(logN)$

### 구현방법1 : 재귀함수

In [2]:
# 이진 탐색 소스코드 구현 (재귀 함수)
def binary_search(array, target, start, end):
    if start > end:
        return None
    mid = (start + end) // 2
    # 찾은 경우 중간점 인덱스 반환
    if array[mid] == target:
        return mid
    # 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인
    elif array[mid] > target:
        return binary_search(array, target, start, mid-1)
    # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
    else:
        return binary_search(array, target, mid+1, end)
    
# n(원소의 개수)과 target(찾고자 하는 문자열)을 입력받기
n, target = list(map(int, input().split()))
# 전체 원소 입력받기
array = list(map(int, input().split()))

# 이진 탐색 수행 결과 출력
result = binary_search(array, target, 0, n-1)
if result == None:
    print('원소가 존재하지 않습니다')
else:
    print(result+1)

10 7
1 3 5 7 11 13 15 17 19
4


In [3]:
# n(원소의 개수)과 target(찾고자 하는 문자열)을 입력받기
n, target = list(map(int, input().split()))
# 전체 원소 입력받기
array = list(map(int, input().split()))

# 이진 탐색 수행 결과 출력
result = binary_search(array, target, 0, n-1)
if result == None:
    print('원소가 존재하지 않습니다')
else:
    print(result+1)

10 7
1 3 5 6 9 11 13 15 17 19
원소가 존재하지 않습니다


### 구현방법2 : 반복문

In [4]:
def binary_search(array, target, start, end):
    while start <= end:
        mid = (start + end) // 2
        # 찾은 경우 중간점 인덱스 반환
        if array[mid] == target:
            return mid
        # 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인
        elif array[mid] > target:
            end = mid - 1
        # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
        else:
            start = mid + 1
    return None

# n(원소의 개수)과 target(찾고자 하는 문자열)을 입력받기
n, target = list(map(int, input().split()))
# 전체 원소 입력받기
array = list(map(int, input().split()))

# 이진 탐색 수행 결과 출력
result = binary_search(array, target, 0, n-1)
if result == None:
    print('원소가 존재하지 않습니다')
else:
    print(result+1)

10 7
1 3 5 6 9 11 13 15 17 19
원소가 존재하지 않습니다


###  유의할 점

* 탐색 범위가 **2000**이 넘어가면 이진 탐색으로 접근해보기  

## 3. 트리 자료구조  
* 파일 시스템 같은 계층적이고 정렬된 데이터를 다루기 적합

### 이진 탐색 트리  
* 부모 노드보다 왼쪽 자식 노드가 작음  
* 부모 노드보다 오른쪽 자식 노드가 큼  
* `왼쪽 자식 노드 < 부모 노드 < 오른쪽 자식 노드`

### 이진 탐색 문제 특징  
* 입력 데이터가 많고, 탐색 범위가 넓음  
* 이 때 `input()`을 사용하면 런타임 에러.. 
* **sys 라이브러리의 `readline()`** 이용하기

In [6]:
import sys

# 하나의 문자열 데이터 입력받기  
input_data = sys.stdin.readline().rstrip()

# 입력받은 문자열 그대로 출력  
print(input_data)




`rstrip` 필수 : 줄바꿈 기호로 \n 사용되므로, 공백 문자를 지워야 함

## 4. 예제

### 부품 찾기

#### My code

In [2]:
# 물품 리스트
N = int(input())
n_list = list(map(int, input().split(' ')))

# 확인이 필요한 물품
M = int(input())
m_list = list(map(int, input().split(' ')))

res = []
for m in range(M):
    target = m_list[m]
    score = 0
    for n in range(N):
        if target == n_list[n]:
            score += 1 # target이 n_list 중 하나와 같으면 score += 1
    if score == 1:
        res.append('yes')
    else: # score == 0
        res.append('no')
print(res)

5
8 3 7 9 2
3
5 7 9
['no', 'yes', 'yes']


#### 예시 : 이진 탐색

In [5]:
def binary_search(array, target, start, end):
    while start <= end:
        mid = (start + end) // 2
        # 찾은 경우 중간점 인덱스 반환
        if array[mid] == target:
            return mid
        # 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인
        elif array[mid] > target:
            end = mid - 1
        # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
        else:
            start = mid + 1
    return None

# 물품 리스트
N = int(input())
n_list = list(map(int, input().split(' ')))
n_list.sort() # 이진 탐색 수행을 위해 사전에 정렬 수행

# 확인이 필요한 물품
M = int(input())
m_list = list(map(int, input().split(' ')))

for i in m_list:
    # 해당 부품이 존재하는지 확인
    result = binary_search(n_list, i, 0, N-1)
    if result != None:
        print('yes', end=' ')
    else:
        print('no', end = ' ')

5
8 3 7 9 2
3
5 7 9
no yes yes 

#### 예시 : 계수 정렬  
* 모든 원소의 번호를 포함할 수 있는 크기의 리스트를 만든 후
* 리스트의 인덱스에 직접 접근하여 특정한 번호의 부품이 매장에 존재하는지 확인

In [6]:
# N(가게의 부품 개수)을 입력받기
N = int(input())
array = [0] * 100001

# 가게에 있는 전체 부품 번호를 입력받아서 기록
for i in input().split():
    array[int(i)] = 1

# M(손님이 확인요청한 부품개수)을 입력받기
m = int(input())
# 손님이 확인요청한 전체 부품번호를 공백으로 구분하여 입력
x = list(map(int, input().split()))

# 손님이 확인요청한 부품번호를 하나씩 확인
for i in x:
    # 해당 부품이 존재하는지 확인
    if array[i] == 1:
        print('yes', end=' ')
    else:
        print('no', end=' ')

5
8 3 7 9 2
3
5 7 9
no yes yes 

#### 예제 : 집합 자료형

In [8]:
# N(가게의 부품 개수)을 입력받기
N = int(input())
array = set(map(int, input().split()))

# M(손님이 확인요청한 부품개수)을 입력받기
m = int(input())
# 손님이 확인요청한 전체 부품번호를 공백으로 구분하여 입력
x = list(map(int, input().split()))

# 손님이 확인요청한 부품번호를 하나씩 확인
for i in x:
    # 해당 부품이 존재하는지 확인
    if i in array:
        print('yes', end=' ')
    else:
        print('no', end=' ')

5
8 3 7 9 2
3
5 7 9
no yes yes 

### 떡볶이 떡 만들기  
* 전형적인 이진 탐색 문제  
* **파라메트릭 서치 문제** : 최적화 문제를 결정 문제로 바꾸어 해결하는 기법 → 보통 이진탐색 이용  
  `원하는 조건을 만족하는 가장 알맞은 값을 찾는 문제`  

In [10]:
N, M = map(int, input().split(' '))
array = list(map(int, input().split()))

# 이진 탐색을 위한 시작점과 끝점 설정
start = 0
end = max(array)

# 이진 탐색 수행 (반복적)
result = 0
while (start <= end):
    total = 0
    mid = (start + end) // 2
    for x in array:
        # 잘랐을 때의 떡의 양 계산
        if x > mid:
            total += x-mid
    
    # 떡의 양이 부족한 경우 더 많이 자르기 (왼쪽 부분 탐색)
    if total < m:
        end = mid - 1
    # 떡의 양이 충분한 경우 덜 자르기 (오른쪽 부분 탐색)
    else:
        result = mid # 최대한 덜 잘랐을 때가 정답이므로, 여기에서 result에 기록
        start = mid + 1
        
# 정답 출력
print(result)

4 6
19 15 10 17
16
