## 이진 탐색
- 탐색 범위를 반으로 줄여나가면서 데이터를 빠르게 탐색하는 기법
- 배열 내부의 데이터가 정렬되어 있을 때만 사용할 수 있음

## bisect 클래스
- 단순히 정렬된 배열에서 특정한 데이터를 찾도록 요구하는 문제에서는 직접 구현 없이 파이썬의 표준 라이브러리 중 bisect 모듈 이용 가능

# 예제 27 : 정렬된 배열에서 특정 수의 개수 구하기
N개의 원소를 포함하고 있는 수열이 오름차순으로 정렬되어 있을 때, x가 등장하는 횟수를 계산하라

### 내 풀이

In [3]:
# 입력 조건
# 첫째 줄에 N과 x가 정수 형태로 공백으로 구분되어 입력됨
n, x = map(int, input().split())
# 둘째 줄에 N개의 원소가 정수 형태로 공백으로 구분되어 입력됨
array = list(map(int, input().split()))

# 이진 탐색
def binary_search(array, target, start, end):
    if start > end:
        return None
    mid = (start + end) // 2
    if array[mid] == target:
        return mid
    elif array[mid] > target:
        return binary_search(array, target, start, mid - 1)
    else:
        return binary_search(array, target, mid + 1, end)
        
# x가 배열 안에 있는 경우 몇개 있는지 카운트
def count_x(array, target, index):
    count = 0
    for i in range(index, -1, -1):
        if array[i] == target:
            count += 1
        else:
            break
    for i in range(index + 1, n):
        if array[i] == target:
            count += 1
        else:
            break
    return count
        
# array에서 x를 찾자
index = binary_search(array, x, 0, n - 1)
if index == None:
    print(-1)
else:
    print(count_x(array, x, index))
    

7 2
1 1 2 2 2 2 3
4


### 정답 코드 1
x가 처음 등장하는 인덱스와 x가 마지막으로 등장하는 인덱스를 각각 계산하여 두 인덱스의 차이를 구한다!  
즉, 이진 탐색 함수를 2개 작성하여 문제를 해결하자

In [None]:
# 정렬된 수열에서 값이 x인 원소의 개수를 세는 메서드
def count_by_value:
    # 데이터의 개수
    n = len(array)
    
    # x가 처음 등장한 인덱스 계산
    a = first(array, x, 0, n - 1)
    
    # 수열에 x가 존재하지 않을 경우
    if a == None:
        return 0 # 값이 x인 원소의 개수는 0개이므로 0 반환
    
    # x가 마지막으로 등장한 인덱스 계산
    b = last(array, x, 0, n - 1)
    
    # 개수를 반환 
    return b - a + 1

# 처음 위치를 찾는 이진 탐색 메서드
def first(array, target, start, end):
    if start > end:
        return None
    mid = (start + end) // 2
    # 해당 값을 가지는 원소 중에서 가장 왼쪽에 있는 경우에만 인덱스 반환
    if (mid == 0 or target > arrray[mid - 1]) and array[mid] == target:
        return mid
    # 중간점의 값 보다 찾고자 하는 값이 작거나 같은 경우 왼쪽 확인
    elif array[mid] > target:
        return first(array, target, start, mid - 1)
    else:
        return first(array, target, mid + 1, end)
    
# 마지막 위치를 찾는 이진 탐색 메서드
def last(array, target, start, end):
    if start > end:
        return None
    mid = (start + end) // 2
    # 해당 값을 가지는 원소 중에서 가장 오른쪽에 있는 경우에만 인덱스 반환
    if (mid == n - 1 or target < array[mid + 1]) and array[mid] == target:
        return mid
    elif array[mid] > target:
        return first(array, target, start, mid - 1)
    else:
        return first(array, target, mid + 1, end)
    
n, x = map(int, input().split())
array = list(map(int, input().split()))

# 값이 x인 데이터의 개수 계산
count = count_by_value(array, x)

# 값이 x인 원소가 존재하지 않는다면
if count == 0:
    print(-1)
else:
    print(count)

### 정답 코드 2
단순히 정렬된 수열에서 특정한 값을 가지는 원소의 개수를 구하는 문제이므로, bisect 라이브러리 활용

In [None]:
from bisect import bisect_left, bisect_right

# 값이 [left_value, right_value]인 데이터의 개수를 반환하는 함수
def count_by_range(array, left_value, right_value):
    right_index = bisec_right(array, right_value)
    left_index = bisect_left(array, left_value)
    return right_index - left_index

n, x = map(int, input().split())
array = list(map(int, input().split()))

# 값이 x인 데이터의 개수 계산
count = count_by_range(array, x, x)

# 값이 x인 원소가 존재하지 않는다면
if count == 0:
    print(-1)
else:
    print(count)

# 예제 28 : 고정점 찾기
하나의 수열이 N개의 서로 다른 원소를 포함하고 있으며, 모든 원소가 오름차순으로 정렬되어 있을 때  
수열에서 고정점(고정점이란, 수열의 원소 중 그 값이 인덱스와 동일한 원소를 의미)이 있다면 고정점을 출력, 없으면 -1 출력

### 내 코드

In [11]:
# 입력 조건
# 첫째 줄에 N이 입력됨
n = int(input())
# 둘째 줄에 N개의 원소가 정수 형태로 공백으로 구분되어 입력됨
array = list(map(int, input().split()))

# 이진 탐색 구현
def binary_search(array, start, end):
    if start > end:
        return None
    mid = (start + end) // 2
    if array[mid] == mid:
        return mid
    elif array[mid] > mid:
        return binary_search(array, start, mid - 1)
    else:
        return binary_search(array, mid + 1, end)
        
result = binary_search(array, 0, n - 1)
if result == None:
    print(-1)
else:
    print(result)

5
-15 -6 1 3 7
3


# 예제 29 : 공유기 설치
집 N개가 수직선 위에 있을 때, C개의 공유기를 N개의 집에 적당히 설치하여 가장 인접한 두 공유기 사이의 거리를 최대로 하는 프로그램을 작성하라

### 정답 코드
- '가장 인접한 두 공유기 사이의 거리'의 최댓값을 탐색해야 하는 문제
- 이진 탐색으로 가장 인접한 거리를 조절해가며 C보다 많은 개수로 공유기를 설치할 수 있는지 체크
- 파라메트릭 서치 유형의 문제

In [None]:
# 집의 개수 N과 공유기의 개수 C 입력받기
n, c = list(map(int, input().split(' ')))

# 전체 집의 좌표 정보 입력받기
array = []
for _ in range(n):
    array.append(int(input()))
array.sort() # 이진 탐색 수행을 위해 정렬 수행

start = array[1] - array[0] # 집의 좌표 중에 가장 작은 값
end = array[-1] - array[0] # 집의 좌표 중에 가장 큰 값
result = 0

while(start <= end):
    mid = (start + end) // 2 # mid는 가장 인접한 두 공유기 사이의 거리(gap)를 의미
    value = array[0]
    count = 1
    # 현재의 mid값을 이용해 공유기를 설치
    for i in range(1, n): # 앞에서부터 차근차근 설치
        if array[i] >= value + mid:
            value = array[i]
            count += 1
    if count >= c: # C개 이상의 공유기를 설치할 수 있는 경우, 거리를 증가시킴
        start = mid + 1
        result = mid
    else: # C개 이상의 공유기를 설치할 수 없는 경우, 거리를 감소
        end = mid - 1
        
print(result)

# 예제 30 : 가사 검색
가사에 사용된 모든 단어들이 담긴 배열 words와 찾고자 하는 키워드가 담긴 배열 queries가 주어질 때,  
각 키워드별로 매치된 단어가 몇 개인지 순서대로 배열에 담아 반환하라

### 정답 코드
1. 각 단어를 길이에 따라서 나누어 리스트에 저장
2. 모든 리스트를 정렬
3. 각 쿼리에 대해 이진 탐색 수행  
ex) fro?? 라는 쿼리가 들어왔을 때, 길이가 5인 단어 리스트에서 'fro'로 시작되는 첫 단어의 위치와 마지막 단어의 위치를 찾아서 그 차이를 계산
4. 혹은 count_by_range() 함수 이용  
ex) fro?? 라는 쿼리가 들어왔을 때, 'froaa'보다 크거나 같으면서 'frozz'보다 작거나 같은 단어의 개수를 세도록 구현
5. 접두사에 와일드카드 '?'가 등장하는 경우, 뒤집힌 단어 리스트를 대상으로 이진 탐색 수행

In [None]:
from bisect import bisect_left, bisect_right

# 값이 [left_value, right_value]인 데이터의 개수를 반환하는 함수
def count_by_range(array, left_value, right_value):
    right_index = bisec_right(array, right_value)
    left_index = bisect_left(array, left_value)
    return right_index - left_index

# 모든 단어를 길이마다 나누어서 저장하기 위한 리스트
array = [[] for _ in range(10001)]
# 모든 단어를 길이마다 나누어서 뒤집어 저장하기 위한 리스트
reversed_array = [[] for _ in range(10001)]

def solution(words, queries):
    answer = []
    for word in words: # 모든 단어를 접미사 와일드카드 배열, 접두사 와일드카드 배열에 각각 삽입
        array[len(word)].append(word) # 단어 삽입
        reversed_array[len(word)].append(word[::-1]) # 단어를 뒤집어서 삽입
        
    for i in range(10001): # 이진 탐색을 수행하기 위해 각 단어 리스트 정렬
        array[i].sort()
        reversed_array[i].sort()
        
    for q in queries: # 퀴리를 하나씩 확인하며 처리
        if q[0] != '?': # 접미사에 와일드카드가 붙은 경우
            res = count_by_range(array[len(q)], q.replace('?', 'a'), q.replace('?', 'z'))
        else: # 접두사에 와일드카드가 붙은 경우 
            res = count_by_range(array[len(q)], q[::-1].replace('?', 'a'), q[::-1].replace('?', 'z'))
        # 검색된 단어의 개수를 저장
        answer.append(res)
    return answer