# 5.2. Searching

- 5장 초반은 Searching, 후반은 Sorting에 대해 알아볼 예정
- 일반적인 Searching의 결과값은 True(찾음)/False(못찾음) or Index(어디에 위치하고 있는지)
- Python에서는 간단하게 'in' 연산자를 이용해 Search 가능

In [1]:
15 in [1,2,3,4]

False

In [2]:
3 in [1,2,3,4]

True

- 사용법이 어렵지 않지만, 어떻게 동작하는지 알아봐야 함
- Search에는 다양한 방법이 있으며 어떻게 동작하는지, 어떤 차이가 있는지 알아볼것


# Search에 관련된 간단한 동영상

https://www.youtube.com/watch?v=x1d1b6Rb--E


# 5.3. The Sequential Search

- List같은 Collection은 각각의 데이터가 위치(Index)를 갖고 있음
- Index값이 정렬되어 있다면, 순차적으로 접근해 볼 수 있음

<img src="http://interactivepython.org/runestone/static/pythonds/_images/seqsearch.png">

In [4]:
def sequentialSearch(alist, item):
    pos = 0
    found = False
    while pos < len(alist) and not found:
        if alist[pos] == item:
            found = True
        else:
            pos = pos+1

    return found

testlist = [1, 2, 32, 8, 17, 19, 42, 13, 0]
print(sequentialSearch(testlist, 3))
print(sequentialSearch(testlist, 13))

False
True


# 5.3.1. Analysis of Sequential Search

| Case                | Best Case | Worst Case | Average Case |
|---------------------|-----------|------------|--------------|
| item is present     |	1         | n          | n/2          |
| item is not present | n         |	n          |	n         |

Complexity of the sequential search: O(n)

- 탐색에서의 성능비교: 몇 번 비교했는지를 Count
- List의 값들은 정렬되지 않은 상태
- List내에 찾는 값이 있는 경우: 비교횟수 <= n
- List내에 찾는 값이 없는 경우: 비교횟수 == n

[ 정렬된 List의 경우 ]

<img src="http://interactivepython.org/runestone/static/pythonds/_images/seqsearch2.png">

In [5]:
def orderedSequentialSearch(alist, item):
    pos = 0
    found = False
    stop = False
    while pos < len(alist) and not found and not stop:
        if alist[pos] == item:
            found = True
        else:
            if alist[pos] > item:
                stop = True
            else:
                pos = pos+1

    return found
testlist = [0, 1, 2, 8, 13, 17, 19, 32, 42,]
print(orderedSequentialSearch(testlist, 3))
print(orderedSequentialSearch(testlist, 13))

False
True


| Case                | Best Case | Worst Case | Average Case |
|---------------------|-----------|------------|--------------|
| item is present     |	1         | n          | n/2          |
| item is not present | 1         |	n          | n/2          |

- Complexity of the sequential search: O(n). 비정렬된 List와 동일

## Question
 1. [3,5,6,8,11,12,14,15,17,18]의 값을 가진 정렬된 List가 있을때, 13을 찾기 위해서는 몇번 비교해야 하나?
 (A) 10  (B) 5  (C) 7  (D) 6

# 5.4. The Binary Search

- 5.3절에서 나타낸 것 처럼 정렬된 List의 경우 비교횟수를 줄일 수 있었음
- 순차적 접근 대신 중간부터 시작하는 binary search에 대해 알아볼 것
- 찾는 값 > 중간 값(접근한 index의 값) : 중간 값 이하의 List는 버림
- 찾는 값 < 중간 값(접근한 index의 값) : 중간 값 이상의 List는 버림
!!! 중요점: List는 Search하기 전에 정렬되어 있어야 함 !!!

<img src="http://interactivepython.org/runestone/static/pythonds/_images/binsearch.png">

In [6]:
def binarySearch(alist, item):
    first = 0
    last = len(alist)-1
    found = False

    while first<=last and not found:
        midpoint = (first + last)//2
        if alist[midpoint] == item:
            found = True
        else:
            if item < alist[midpoint]:
                last = midpoint-1
            else:
                first = midpoint+1

    return found

testlist = [0, 1, 2, 8, 13, 17, 19, 32, 42,]
print(binarySearch(testlist, 3))
print(binarySearch(testlist, 13))

False
True


- Binary search 알고리즘은 Divide and Conquer Strategy의 좋은 예
- Divide and Conquer(분할 정복): 문제를 최대한 작은 조각으로 만들어 풀고, 그 결과들을 합치는 기법
- 찾는 값 > 중간 값(접근한 index의 값) 
  : 새로운 List(중간 값 초과 index ~ 현재 List의 마지막 index)로 다시 탐색
- 찾는 값 < 중간 값(접근한 index의 값) 
  : 새로운 List(현재 List의 처음 index ~ 중간 값 미만 index)로 다시 탐색
  
- 따라서 4장에서 배운 Recursive를 이용해서 다음과 같이 작성 가능

In [7]:
def binarySearch(alist, item):
    if len(alist) == 0:
        return False
    else:
        midpoint = len(alist)//2
        if alist[midpoint]==item:
          return True
        else:
          if item<alist[midpoint]:
            return binarySearch(alist[:midpoint],item)
          else:
            return binarySearch(alist[midpoint+1:],item)

testlist = [0, 1, 2, 8, 13, 17, 19, 32, 42,]
print(binarySearch(testlist, 3))
print(binarySearch(testlist, 13))

False
True


# 5.4.1. Analysis of Binary Search

| Comparisons         | Approximate Number of Items Left |
|-|-|
| 1 | n/2 |
| 2 | n/4 |
| 3 | n/8 |
|...| ... |
|i  | n/2^i|

- i가 1일 때(남은 item의 갯수가 1개일때), 탐색 완료. n = 2^i, i = logn
- Complexity of the binary search: O(logn).

------------------------------------------------------

- 작은 n(list가 작은 경우)에는 binary search가 별 의미가 없음.. search전에 정렬을 해야 하기 때문
- binary search를 사용할 경우, 단순히 비교에 대한 cost만 따질게 아니라 비교하기 전에 list 정렬을 하는데 사용되는 cost를 따져야 함
- list가 계속 업데이트 될 경우, 업데이트 될 때마다 정렬을 해야하는 단점이 있음
- 단순히 sequential search를 하는게 더 좋은 경우도 있음



## Question

 1. [3,5,6,8,11,12,14,15,17,18]의 값을 가진 정렬된 List가 있을때, 8을 찾는 과정에서 선택되는 값들은 순서대로 나열한 것은? (binary search)
 (A) 11, 5, 6, 8  
 (B) 12, 6, 11, 8
 (C) 3, 5, 6, 8
 (D) 18, 12, 6, 8
 
 2. [3,5,6,8,11,12,14,15,17,18]의 값을 가진 정렬된 List가 있을때, 16을 찾는 과정에서 선택되는 값들은 순서대로 나열한 것은? (binary search)
 (A) 11, 14, 17  
 (B) 18, 17, 15
 (C) 14, 17, 15
 (D) 12, 17, 15