## 搜索算法
搜索算法是在一个项集中查找一个项或者具有指定性质的一组项的方法。

- 这里的集可以是隐式的，比如找一个数的平方根就是一个搜索问题，可以使用穷尽枚举法、二分搜索法、Newton-Raphson法。
- 这里的集也可以是显式的，比如一个学生记录是否在一个被保存的数据集中等

## 搜索算法
- 线性查找
  - 暴力查找；
  - 列表不一定是排好序的；
- 二分查找
  - 列表必须排好序才能找到准确答案；
  - 看两种不同的二分查找实现；

## 对无序列表进行线性查找
- 必须遍历所有的元素来判断它不在那里；
- 整体的复杂度是循环的时间复杂度`O(len(L))*O(1)=O(n)`，其中`n`是`len(L)`，`O(1)`是测试`e==L[i]`的复杂度；

In [3]:
def linear_search(L, e):
    found = False
    for i in range(len(L)):
        if L[i] == e:
            found = True
            break
    return found

L = [5,4,9,8,7]

print(linear_search(L, 6))

print(linear_search(L, 7))

False
True


## 对有序列表进行线性查找

- 必须查看元素直到找到一个比e大的元素。
- 整体的复杂度是循环的时间复杂度`O(len(L))*O(1)=O(n)`，其中`n`是`len(L)`，`O(1)`是测试`e==L[i]`的复杂度。

In [7]:
def search(L, e):
    for i in range(len(L)):
        if L[i] == e:
            return True
        if L[i] > e:
            return False
        
    return False

L = [1,2,3,6]

print(search(L, 5))

print(search(L, 3))

False
True


## 使用二分搜索
1. 选择一个将列表分成两半的索引`i`
2. 测试`L[i]==e`
3. 如果不等，则测试`L[i]`是大于还是小于`e`
4. 取决于第3步测试的结果，在列表的左边一半还是右边一半里查找元素`e`

这是一个新版本的分而治之算法：
- 将原问题分解为更小版本的问题，加上一些简单的操作
- 更小版本的解是原问题的解

In [12]:
def bisect_search2(L, e):
    def bisect_search2_helper(L, e, low, high):
        if high == low:
            return L[low] == e
        
        mid = (low + high)//2
        if L[mid] == e:
            return True
        elif L[mid]>e:
            if low == mid:
                return False
            else:
                return bisect_search2_helper(L,e, 0, mid-1)
        else:
            return bisect_search2_helper(L,e, mid+1, high)
        
    if len(L) == 0:
        return False
    else:
        return bisect_search2_helper(L, e, 0, len(L)-1)
        
L = [1,2,3,6]
print(bisect_search2(L,4))
print(bisect_search2(L,3))

False
True


## 二分查找的复杂度

- 二分查找和它的辅助函数

  `O(log n)`次二分搜索调用，每一步将原问题的大小减少1/2
- 列表和索引作为参数
- 永远不拷贝列表，只是重新作为指针再传递
- 在函数内部的工作量是常数量级

整体的复杂度为`O(log n)`