# 검색 알고리즘

- 검색 알고리즘 : 데이터 집합에서 원하는 값을 가진원소를 찾아내는 알고리즘 (만족하는 데이터 찾기)

- 키 : 데이터의 일부로 검색 조건에서 주목하는 항

## 1. 선형 검색(순차 검색)
선형(직선 모양)으로 늘어선 배열에서 검색할 때,
원하는 키값을 가진 원소를 찾을 때까지 맨 앞부터
스캔하여 순서대로 검색하는 알고리즘



In [None]:
i = 0
while True:
    if i == len(a):
        # 실패
    if a[i] == key:
        # 성공
    i += 1

In [2]:
#  while 사용 알고리즘

%%writefile seq_search.py
from typing import Any, Sequence

def seq_search(a: Sequence, key: Any) -> int:
    i = 0

    while True:
        if i == len(a):
            return -1
        if a[i] == key:
            return i
        i += 1

Writing seq_search.py


In [5]:
from seq_search import seq_search

if __name__ == '__main__':
    num = int(input('원소 수를 입력하세요.: '))
    x = [None] * num

    for i in range(num):
        x[i] = int(input(f'x[{i}]: '))

    ky = int(input('검색할 값을 입력하세요.: '))

    idx = seq_search(x, ky)

    if idx == -1:
        print('검색값을 갖는 원소가 존재하지 않습니다.')
    else:
        print(f'검색값은 x[{idx}]에 있습니다.')

원소 수를 입력하세요.: 7
x[0]: 6
x[1]: 4
x[2]: 3
x[3]: 2
x[4]: 1
x[5]: 2
x[6]: 8
검색할 값을 입력하세요.: 2
검색값은 x[3]에 있습니다.


In [6]:
# for 사용 알고리즘
# while과 비교했을때,
# 현재 인덱스와 배열의 길이를 비교하는 if 문 생략하여 짧고 간결하게 구현
from typing import Any, Sequence

def seq_search(a: Sequence, key: Any) -> int:
    for i in range(len(a)):
        if a[i] == key:
            return i
    return -1


In [7]:
if __name__ == '__main__':
    num = int(input('원소 수를 입력하세요.: '))
    x = [None] * num

    for i in range(num):
        x[i] = int(input(f'x[{i}]: '))

    ky = int(input('검색할 값을 입력하세요.: '))

    idx = seq_search(x, ky)

    if idx == -1:
        print('검색값을 갖는 원소가 존재하지 않습니다.')
    else:
        print(f'검색값은 x[{idx}]에 있습니다.')


원소 수를 입력하세요.: 7
x[0]: 6
x[1]: 4
x[2]: 3
x[3]: 2
x[4]: 1
x[5]: 2
x[6]: 8
검색할 값을 입력하세요.: 2
검색값은 x[3]에 있습니다.


# 다양한 자료형

In [None]:
# 실수 검색하기

In [8]:
from seq_search import seq_search

print('실수를 검색합니다.')
print('주의: "End"를 입력하면 종료합니다. ')

number = 0
x = []

while True:
    s = input(f'x[{number}]: ')
    if s == 'End':
        break
    x.append(float(s))
    number += 1

ky = float(input('검색할 값을 입력하세요.: '))

idx = seq_search(x, ky)
if idx == -1:
    print('검색값을 갖는 원소가 존재하지 않습니다.')
else:
    print(f'검색값은 x[{idx}]에 있습니다.')

실수를 검색합니다.
주의: "End"를 입력하면 종료합니다. 
x[0]: 12.7
x[1]: 3.14
x[2]: 6.4
x[3]: 7.2
x[4]: End
검색할 값을 입력하세요.: 6.4
검색값은 x[2]에 있습니다.


In [None]:
# 인덱스 검색
from seq_search import seq_search

t = (4, 7, 5.6, 2, 3.14, 1)
s = 'string'
a = ['DTS', 'AAC', 'FLAC']

print(f'{t}에서 5.6의 인덱스는 {seq_search(t,5.6)}입니다.')
print(f'{s}에서 5.6의 인덱스는 {seq_search(s,"n")}입니다.')
print(f'{a}에서 5.6의 인덱스는 {seq_search(a,"DTS")}입니다.')

## *선형 검색의 비용
배열에 원하는 값이 없는 경우,

검색 실패 조건을 n+1번, 검색 성공 조건을 n번씩 수행

배열의 크기가 커지면 종료 조건 검사 비용도 커짐


## ==>  보초법 적용
- 보초 : 배열의 맨 끝에 추가한 검색하고자 하는 키 값
- 맨 끝에 도달했는가에 대한 판단은 불필요
- 종료 조건 판단 비용을 반으로 절감

In [10]:
from typing import Any, Sequence
import copy

def seq_search(seq: Sequence, key: Any) -> int:
    a = copy.deepcopy(seq)
    a.append(key)

    i = 0
    while True:
        if a[i]==key:
            break
        i += 1
    return -1 if i == len(seq) else i