# 순차 탐색
리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 차례대로 확인하는 방법  
- 정렬되지 않은 리스트에서 데이터를 찾아야 할 때 사용  
- 리스트 자료형에서 특정한 값을 가지는 원소의 개수를 세는 count() 메서드를 이용할 때도 내부적으로 순차 탐색 수행됨
- 최악의 경우 시간 복잡도는 O(N)

In [None]:
# 순차 탐색 소스코드
def sequential_search(n, target, array):
    # 각 원소를 하나씩 확인하며
    for i in range(n):
        # 현재의 원소가 찾고자 하는 원소와 동일한 경우
        if array[i] == target:
            return i + 1 #현재의 위치 반환(인덱스는 0부터 시작하므로 1 더함)
        
print('생성할 원소 개수와 찾을 문자열을 공백으로 구분하여 입력')
input_data = input().split()
n = int(input_data[0]) # 원소의 개수
target = input_data[1] # 찾고자 하는 문자열

print("앞서 적은 원소 개수만큼 문자열을 공백으로 구분하여 입력")
array = input().split()

# 순차 탐색 수행 결과 출력
print(sequential_search(n, target, array))

# 이진 탐색 : 반으로 쪼개면서 탐색하기
찾으려는 데이터와 중간점 위치에 있는 데이터를 반복적으로 비교해서 원하는 데이터를 찾는 방법
- 배열 내부의 데이터가 정렬되어 있어야만 사용 가능
- 시작점과 끝점, 중간점(실수인 경우 소수점 이하 버림)을 정해 탐색 범위를 절반씩 좁혀가며 탐색
- 한 번 확인할 때마다 확인하는 원소의 개수가 절반씩 줄어들어 시간 복잡도가 O(logN)
- 재귀함수 or 반복문을 이용해 구현 가능

In [2]:
# 재귀 함수로 이진 탐색 구현하기
def binary_search(array, target, start, end):
    if start > end:
        return None
    mid = (start + end) // 2
    # 찾은 경우 중간점 인덱스 반환
    if array[mid] == target:
        return mid
    # 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인
    elif array[mid] > target:
        return binary_search(array, target, start, mid - 1)
    # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
    else:
        return binary_search(array, target, mid + 1, end)
    
# n(원소의 개수)과 target(찾고자 하는 문자열)을 입력받기
n, target = list(map(int, input().split()))
# 전체 원소 입력받기
array = list(map(int, input().split()))

# 이진 탐색 수행 결과 출력
result = binary_search(array, target, 0, n - 1)
if result == None:
    print('원소가 존재하지 않습니다')
else:
    print(result + 1)

10 7 
1 3 5 7 9 11 13 15 17 19
4


In [None]:
# 반복문으로 이진 탐색 구현하기
def binary_search(array, target, start, end):
    while start <= end:
        mid = (start + end) // 2
        # 찾은 경우 중간점 인덱스 반환
        if array[mid] == target:
            return mid
        # 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인
        elif array[mid] > target:
            end = mid - 1
        # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
        else:
            start = mid + 1
    return None

# n(원소의 개수)과 target(찾고자 하는 문자열)을 입력받기
n, target = list(map(int, input().split()))
# 전체 원소 입력받기
array = list(map(int, input().split()))

# 이진 탐색 수행 결과 출력
result = binary_search(array, target, 0, n - 1)
if result == None:
    print('원소가 존재하지 않습니다')
else:
    print(result + 1)

- 이진 탐색 코드는 암기해두자
- 탐색 범위가 2,000만을 넘어가면 이진 탐색으로 문제에 접근해보자
- 처리해야 할 데이터의 개수나 값이 1,000만 단위 이상으로 넘어가면 이진 탐색과 같이 O(logN)의 속도를 내는 알고리즘이 필요하다

# 트리 자료구조
- 데이터베이스는 내부적으로 대용량 데이터 처리에 적합한 트리 자료구조를 이용하여 항상 데이터가 정렬되어 있음

### 트리 자료구조 특징
- 트리는 부모 노드와 자식 노드의 관계로 표현됨
- 트리의 최상단 노드를 루트 노드라고 함
- 트리의 최하단 노드를 단말 노드라고 함
- 트리에서 일부를 떼어내도 트리 구조이며 이를 서브 트리라고 함
- 트리는 파일 시스템과 같이 계층적이고 정렬된 데이터를 다루기에 적합


# 이진 탐색 트리
이진 탐색이 동작할 수 있도록 고안된, 효율적인 탐색이 가능한 자료구조  

### 이진 탐색 트리 특징
- 부모 노드보다 왼쪽 자식 노드가 작다
- 부모 노드보다 오른쪽 자식 노드가 크다  
<b>왼쪽 자식 노드 < 부모 노드 < 오른쪽 자식 노드</b>

In [6]:
# 입력 데이터가 1,000만개 이상일 경우 빠르게 입력받기
import sys
# 하나의 문자열 데이터 입력받기
input_data = sys.stdin.readline().rstrip()
# rstrip()으로 줄 바꿈 기호 제거 

# 입력받은 문자열 그대로 출력
print(input_data)

## 실전문제 1 부품 찾기
전자 매장에 있는 부품 N개 종류 중 손님이 구매하려는 부품 M개 종류가 있는지 확인하는 프로그램을 만들어라  
순서대로 부품을 확인해 부품이 있으면 yes, 없으면 no 출력

### 이진 탐색으로 구현
- 부품을 찾는 과정에서 시간 복잡도 O(M x logN)
- 부품을 정렬하는 과정에서 시간 복잡도 0(N x logN)
- 따라서 최악의 경우 시간 복잡도 O((M + N) x logN)

In [None]:
# 입력 조건
# 첫째 줄에 정수 N이 주어짐
n = int(input())
# 둘째 줄에 공백으로 구분된 정수 N개가 주어짐
store = list(map(int, input().split()))
# 셋째 줄에 정수 M이 주어짐
m = int(input())
# 넷째 줄에 공백으로 구분된 정수 M개가 주어짐
customer = list(map(int, input().split()))

def binary_search(array, target, start, end):
    while start <= end:
        mid = (start + end) // 2
        if array[mid] == target:
            return mid
        elif array[mid] > target:
            end = mid - 1
        elif:
            start  = mid + 1
    return None

# 이진 탐색을 수행하기 위해 배열 정렬
store.sort()

# 손님이 확인 요청한 부품 번호를 하나씩 확인
for x in customer:
    if binary_search(store, x, 0, n - 1) == None:
        print('no', end=" ")
    else:
        print('yes', end=" ")

### 계수 정렬로 구현

In [None]:
# 가게 부품 입력받기
n = int(input())
# 문제에서 n이 1,000,000이하라고 주어졌으므로 모든 원소의 번호를 포함할 수 있는 크기의 리스트를 만듦
array = [0] * 1000001

# 가게에 있는 전체 부품 번호를 입력받아서 기록
for i in input().split():
    array[int(i)] = 1
    
# 손님이 요청한 부품 입력받기
m = int(input())
x = list(map(int, input(),split()))

# 손님이 요청한 부품이 가게에 있는지 하나씩 확인
for i in x:
    if array[i] == 1:
        print('yes', end=" ")
    else:
        print('no', end=" ")

### 집합 자료형 이용
- 단순히 특정한 수가 한번이라도 등장했는지 검사하면 됨

In [None]:
# 가게 부품 개수 입력받기
n = int(input())
# 가게에 있는 전체 부품 번호를 입력받아서 집합(set) 자료형에 기록
array = set(map(int, input().split()))

# 손님이 요청한 부품 입력받기
m = int(input())
x = list(map(int, input().split()))

# 손님이 요청한 부품이 가게에 있는지 하나씩 확인
for i in x:
    if i in array:
        print('yes', end=" ")
    else:
        print('no', end=" ")

## 실전문제 2 : 떡볶이 떡 만들기
손님이 요청한 떡의 총 길이가 M일 때 적어도 M만큼의 떡을 얻기 위해 절단기에 설정할 수 있는 높이의 최댓값을 구하는 프로그램을 작성하라
- 전형적인 이진 탐색 문제이자, 파라메트릭 서치 유형의 문제
- parametric search : 최적화 문제를 결정 문제로 바꾸어 해결하는 기법
- '원하는 조건을 만족하는 가장 알맞은 값을 찾는 문제에 주로 이용
- 범위 내에서 조건을 만족하는 가장 큰 값을 찾는 최적화 문제 -> 이진 탐색으로 결정 문제를 해결하면서 범위 좁힘
- 적절한 높이를 찾을 때까지 절단기의 높이 H를 반복해서 조정하여 해결

In [None]:
# 입력 조건
# 첫째 줄에 떡의 개수 N과 요청한 떡의 길이 M이 주어짐 (n은 1,000,000이하)
n, m = map(int, input().split())
# 둘째 줄에 떡의 개별 높이가 주어짐 (높이는 10억보다 작거나 같은 양의 정수 또는 0)
array = list(map(int, input().split()))

# 이진 탐색을 위한 시작점과 끝점 설정
start = 0
end = max(array)

# 이진 탐색 수행(반복문으로 구현)
result = 0
while(start <= end):
    total = 0
    mid = (start + end) // 2
    for x in array:
        # 잘랐을 때의 양 계산
        if x > mid: # 떡이 자를 높이보다 긴 경우에만 자른 뒤 남게 된다
            total += x - mid
    
    # 떡의 양이 부족한 경우 더 많이 자르기(왼쪽 부분 탐색)
    if total < m:
        end = mid - 1
    # 떡의 양이 충분한 경우 덜 자르기(오른쪽 부분 탐색)
    else:
        result = mid # 최대한 덜 잘랐을 때가 정답이므로, 여기에서 result에 기록
        start = mid + 1
        
print(result)