# "이진 탐색"
> "이진 탐색 개념"

- toc: false
- branch: master
- badges: true
- comments: true
- categories: [coding, jupyter]

## 1.범위를 반씩 좁혀가는 탐색

### 순차 탐색
\* 순차 탐색 : 리스트 안에 있는 특정한 데이터를 찾기 위해서 **앞에서부터 데이터를 하나씩 차례대로 확인하는 방법**

\* 보통 정렬되지 않은 리스트에서 데이터를 찾아야 할 때 사용

\* 순차 탐색은 데이터 정렬 여부와 상관없이 가장 앞에 있는 원소부터 하나씩 확인해야 함

\* 데이터 개수가 N개일 때 최대 N번의 비교 연산이 필요하므로 순차 탐색의 최악의 경우 시간 복잡도는 O(N)이다.

In [2]:
# 순차 탐색 소스코드
def sequential_search(n, target, array) : 
    for i in range(n) : 
        if array[i] ==target : 
            return i+1

print('생성할 원소의 개수를 입력한 다음 한 칸 띄고 찾을 문자열을 입력하세요')
input_data = input().split()
n = int(input_data[0])
target = input_data[1]

print('앞서 적은 원소 개수만큼 문자열을 입력하세요. 구분은 띄어쓰기 한 칸으로 합니다.')
array = input().split()

print(sequential_search(n, target, array))

생성할 원소의 개수를 입력한 다음 한 칸 띄고 찾을 문자열을 입력하세요
앞서 적은 원소 개수만큼 문자열을 입력하세요. 구분은 띄어쓰기 한 칸으로 합니다.
3


### 이진 탐색 : 반으로 쪼개면서 탐색하기

\* 이진 탐색은 배열 **내부의 데이터가 정렬되어 있어야만 사용**할 수 있는 알고리즘 

\* 탐색 범위를 절반씩 좁혀가며 데이터를 탐색하는 특징이 있다.

\* 이진 탐색은 위치를 나타내는 변수 3개를 사용하는데 탐색하고자 하는 범위의 시작점, 끝점, 그리고 중간점이다. 

\* 찾으려는 데이터와중간점 위치에 있는 데이터를 반복적으로 비교해서 원하는 데이터를 찾음

\* 이진 탐색은 한 번 확인할 때마다 확인하는 원소의 개수가 절반씩 줄어든다는 점에서 **시간 복잡도가 O(logN)**이다. 

In [13]:
# 재귀함수로 구현한 이진 탐색 소스코드

def binary_search(target,array,start,end) : 
    if start > end : 
        return None

    mid = (start+end)//2
    if array[mid] == target : 
        return mid
    elif array[mid] > target : 
        return binary_search(target,array,start,mid-1)
    else :
        return binary_search(target,array,mid+1,end)

n, target = list(map(int,input().split()))
array = list(map(int,input().split()))

result = binary_search(target,array,0,n-1)
if result == None : 
    print('원소가 존재하지 않습니다.')
else : 
    print(result+1)

4


In [15]:
# 반복문으로 구현한 이진 탐색 소스코드
def binary_search(target, array, start, end) : 
    while start <= end : 
        mid = (start+end)//2
        if array[mid] == target : 
            return mid
        elif array[mid] > target: 
            end = mid-1
        else : 
            start = mid+1
    return None

n, target = list(map(int,input().split()))
array = list(map(int,input().split()))

result = binary_search(target,array,0,n-1)

if result == None : 
    print('원소가 존재하지 않습니다.')
else : 
    print(result+1)
        

4


### 코딩 테스트에서의 이진 탐색

/* 이진 탐색은 코딩 테스트에서 단골로 나오는 문제이니 가급적 외우길 권함.

/* 코딩 테스트의 이진 탐색 문제는 탐색 범위가 큰 상황에서의 탐색을 가정하는 문제가 많다. 

/* 따라서 **탐색 범위가 2,000만을 넘어가면 이진 탐색으로 문제에 접근**해보길 권장.

/* 데이터 개수나 값이 1,000만 단위 이상으로 넘어가면 이진 탐색과 같이 O(logN)의 속도를 내야 하는 알고리즘을 떠올려야 문제를 풀 수 있는 경우가 많다는 점을 기억.

### 트리 자료구조

/* 트리 자료구조는 노드와 노드의 연결로 표현하며 여기에서 노드는 정보의 단위로서 어떤한 정보를 가지고 있는 개체.

/* 많은 양의 데이터를 관리하기 위한 목적으로 사용.

/* 트리에서 일부를 떼어내도 트리구조이며 이를 서브트리라 함

/* 트리는 파일 시스템과 같이 계층적이고 정렬된 데이터를 다루기에 적합하다. 

![image](https://gmlwjd9405.github.io/images/data-structure-tree/tree-terms.png)

### 이진 탐색 트리

/* 이진 탐색 트리 특징
- 부모 노드보다 왼쪽 자식 노드가 작다.
- 부모 노드보다 오른쪽 자식 노드가 크다. 

/* 이진 탐색 알고리즘과 같은 방식으로 타겟 값의 위치를 탐색할 수 있음

![image](https://i.imgur.com/SSusVoP.png)

### 빠르게 입력받기

/* 이진 탐색 문제는 입력 데이터가 많거나, 탐색 범위가 매우 넓은 편.

/* 데이터의 개수가 1,000만 개를 넘어가거나 탐색 범위의 크기가 1,000억 이상이라면 이진 탐색 알고리즘 의심

/* 입력 데이터가 많은 문제는 input 함수를 사용하면 동작 속도가 느려서 시간 초과로 오답 판정을 받을 수 있다.

/* 입력 데이터가 많은 문제는 sys 라이브러리의 readline() 함수를 이용하면 시간 초과를 피할 수 있다. 

In [22]:
# 한 줄 입력받아 출력하는 소스 코드
import sys
input_data = sys.stdin.readline().rstrip()

print(input_data)




## 2. 부품 찾기


In [21]:
## 2. 부품 찾기
def binary_search(target,array,start,end) : 
    while start <= end : 
        mid = (start+end)//2
        if array[mid] == target : 
            return mid
        elif array[mid] < target : 
            start = mid +1
        else : 
            end = mid-1
    return None

N = int(input())
N_list = list(map(int,input().split()))

M = int(input())
M_list = list(map(int,input().split()))

N_list.sort()

result=0
for com in M_list : 
    if binary_search(com,N_list,0,N-1) !=None :
        print('yes' , end=' ')
    else : 
        print('no' , end=' ')
    

no yes yes 

In [22]:
N_list

[2, 3, 7, 8, 9]

In [26]:
if 4 in N_list : 
    print('yes')
else : 
    print('no')

no


### 집합 자료형으로 풀기
/* 이 문제는 단순히 특정한 수가 한 번이라도 등장했는지를 검사하면 되므로 집합 자료형을 이용해서 문제를 해결가능.

/* set() 함수는 집합 자료형을 초기화할 때 사용.

/* 이러한 집합 자료형은 단순히 특정한 데이터가 존재하는지 검사할 때에 매우 효과적으로 사용할 수 있다. 

In [19]:
# 집합 자료형으로 풀기

N = int(input())
N_list = set(map(int,input().split()))

M = int(input())
M_list = list(map(int,input().split()))

for com in M_list : 
    if com in N_list : 
        print('yes',end=' ')
    else : 
        print('no',end=' ')



no yes yes 

In [20]:
N_list # set함수를 사용하면 자동으로 오름차순으로 정렬. 

{2, 3, 7, 8, 9}

In [50]:
import numpy as np
N, length = list(map(int,input().split()))
dduk_list = list(map(int,input().split()))

dduk_list.sort()

candidate = [x+1 for x in range(dduk_list[-1])]

def max_length_search(length, candidate , start , end,dduk_list) : 
    while start <= end : 
        mid = (start+end)//2
        
        cut_length = sum(np.array(dduk_list)-candidate[mid])
        if cut_length < length : 
            start = mid +1 
        else : 
            # end = mid -1
            return candidate[end]
    return candidate[end]

max_length = max_length_search(length, candidate , 0 , len(candidate)-1, dduk_list)

print(max_length)


19


In [46]:
[1]*len(dduk_list)

[1, 1, 1, 1]

In [47]:
dduk_list

[10, 15, 17, 19]

In [45]:
dduk_list-[1]*len(dduk_list)

TypeError: unsupported operand type(s) for -: 'list' and 'list'