# 범위를 반씩 좁혀가는 탐색

## 순차 탐색

* 리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 차례대로 확인하는 방법
* 시간복잡도 $O(N)$

In [None]:
# 리스트의 길이, 찾을 데이터, 리스트
def sequential_search(n, target, array):
    for i in range(n): # 원소를 하나씩 확인
        if array[i] == target: # 현재 원소가 타깃과 동일
            return i + 1 # 위치 반환

print("생성할 원소 개수를 입력한 다음, 한 칸 띄고 찾을 문자열을 입력하세요.")
input_data = input().split()
n = int(input_data[0])
target = input_data[1]

print("앞서 적은 원소 개수만큼 문자열을 입력하세요. 구분은 띄어쓰기 한 칸으로 합니다.")
array = input().split()

# 순차 탐색 수행 결과
print(sequential_search(n, target, array))

생성할 원소 개수를 입력한 다음, 한 칸 띄고 찾을 문자열을 입력하세요.
8 야도란
앞서 적은 원소 개수만큼 문자열을 입력하세요. 구분은 띄어쓰기 한 칸으로 합니다.
피카츄 라이츄 파이리 꼬부기 버터플 야도란 피죤투 또가스
6


## 이진 탐색
* 배열 내부의 데이터가 정렬되어 있으면, 매우 빠르게 데이터 탐색 가능
* 변수 3개: 탐색 범위의 **시작점, 끝점, 중간점**
* 찾으려는 데이터와 중간점 위치의 데이터를 반복적으로 비교하기
    * 찾으려는 데이터 < 중간점 데이터: 끝점을 `중간점 - 1`로
    * 찾으려는 데이터 > 중간점 데이터: 시작점을 `중간점 + 1`로
* 1번 확인할 때마다 원소의 개수가 절반씩 줄어듦 - 시간복잡도 $O(log N)$

In [1]:
# 재귀함수 구현
def binary_search(array, target, start, end):
    if start > end:
        return None
    mid = (start + end) // 2

    if array[mid] < target:
        # 중간점보다 찾고자 하는 값이 큰 경우: 오른쪽 확인
        return binary_search(array, target, mid + 1, end)
    elif array[mid] > target:
        # 중간점보다 찾고자 하는 값이 작은 경우: 왼쪽 확인
        return binary_search(array, target, start, mid - 1)
    else:
        # 찾은 경우: 중간점 인덱스 반환
        return mid

# 원소 개수, 찾고자 하는 문자열
n, target = map(int, input().split())

# 전체 원소
array = list(map(int, input().split()))

result = binary_search(array, target, 0, n - 1)
if result == None:
    print("원소 없음")
else:
    print(result + 1)

10 7
1 3 5 7 9 11 13 15 17 19
4


In [2]:
# 반복문
def binary_search(array, target, start, end):
    while start <= end:
        mid = (start + end) // 2

        if array[mid] < target:
            # 중간점보다 찾고자 하는 값이 큰 경우: 오른쪽 확인
            start = mid + 1
        elif array[mid] > target:
            # 중간점보다 찾고자 하는 값이 작은 경우: 왼쪽 확인
            end = mid - 1
        else:
            # 찾은 경우: 중간점 인덱스 반환
            return mid
    return None

# 원소 개수, 찾고자 하는 문자열
n, target = map(int, input().split())

# 전체 원소
array = list(map(int, input().split()))

result = binary_search(array, target, 0, n - 1)
if result == None:
    print("원소 없음")
else:
    print(result + 1)

10 7
1 3 5 6 9 11 13 15 17 199
원소 없음


## 트리 자료구조

* 데이터베이스는 내부적으로 대용량 데이터 처리에 적합한 트리 자료구조를 이용하여 항상 데이터가 정렬되어 있음
* 부모 노드와 자식 노드의 관계로 표현됨
    * 최상단 노드: 루트 노드
    * 최하단 노드: 단말 노드
    * 트리의 일부를 떼어내도 트리 (서브트리)
    * 파일시스템과 같이 계층적이고 정렬된 데이터를 다루기에 적합함

## 이진 탐색 트리
* 왼쪽 자식 노드 < 부모 노드 < 오른쪽 자식 노드
* 루트 노드부터 방문
* 노드의 값보다 찾을 원소값이 크면 오른쪽 노드를, 작으면 왼쪽 노드를 방문
* 자식 노드가 없을 때까지 원소를 찾지 못했다면, 이진 탐색 트리에 원소가 없는 것

# [실전] 부품 찾기

In [5]:
def binary_search(target):
    start = 0
    end = n - 1
    while start <= end:
        mid = (start + end) // 2
        if store[mid] == target:
            return mid
        elif store[mid] < target:
            start = mid + 1
        else:
            end = mid - 1
    return None

n = int(input())
store = list(map(int, input().split()))
store.sort() # 이거 잊지 말기!!
m = int(input())
check = list(map(int, input().split()))

# O(M log N)
for i in check:
    if binary_search(i) == None:
        print("no", end=" ")
    else:
        print("yes", end=" ")


5
8 3 7 9 2
3
5 7 9
no yes yes 

* 미리 array를 정렬하는 것은 필수!
* binary search를 통해 $O(N log N)$ (정렬) 및 $O(M log N)$ (탐색)의 시간 복잡도로 해결 가능. 즉 $O((M + N) \times log N)$

In [6]:
# 다른 풀이 1: 계수 정렬 (근데 공간복잡도가 심히 비효율적일듯)
n = int(input())
store = [0] * 1000001

for i in input().split():
    array[int(i)] = 1

m = int(input())
check = list(map(int, input().split()))

for i in check:
    if array[i] == 1:
        print('yes', end=" ")
    else:
        print("no", end=" ")

5
8 3 7 9 2
3
5 7 9
no yes yes 

In [None]:
# 다른 풀이 2: 집합 - 어차피 1번만 등장
n = int(input())
store = set(map(int, input().split()))

m = int(input())
check = list(map(int, input().split()))

for i in check:
    if i in store:
        print('yes', end=" ")
    else:
        print("no", end=" ")

# [실전] 떡볶이 떡 만들기

In [7]:
n, m = map(int, input().split())
lengths = list(map(int, input().split()))

left = 0
right = max(lengths)

while left <= right:
    mid = (left + right) // 2

    cut_sum = 0
    for l in lengths:
        cut_sum += max(l - mid, 0)

    if cut_sum < m:
        # 절단기의 높이를 줄여야 함
        right = mid - 1
    elif cut_sum >= m:
        # 절단기의 높이를 더 높일 수 있나?
        result = mid
        left = mid + 1

print(result)

4 6
19 15 10 17
15


* **파라메트릭 서치**: 최적화 문제를 결정 문제(예? 아니오?)로 바꿔 풀기 -> 이진 탐색으로 해결
    * 원하는 조건을 만족하는 가장 알맞은 값
    * e..g, 범위 내에서 조건을 만족하는 가장 큰 값

* 적절한 높이를 찾을 때까지 절단기의 높이 H를 조정
    * 현재 이 높이로 자를 수 있을까? -> 예/아니오에 따라 탐색 범위를 조정

* 높이는 10억보다 작은 정수... 바로 이진 탐색을 떠올려야 함.

* 반복하면서 얻을 수 있는 떡의 길이 합이 필요한 떡의 길이보다 크거나 같을 때마다, 결괏값을 중간점 값으로 갱신.