# 二分搜索 Binary Search

## 定义
* 前提条件：已经**排序**好的序列
* 方法：首先与序列中间的元素进行比较, 如果小于这个元素, 就在当前序列的前半部分继续查找, 如果大于这个元素, 就在当前序列的后半部分继续查找,直到找到相同的元素, 或者所查找的序列范围为空为止.

## 作用
* 面试中如果需要优化O(n)的时间复杂度，一般只能是O(logn)的二分法

## 一维模板

In [2]:
# 模板1
# 有一个Edge的情况就是，L最大可以等于len(array)，R最小可能为-1
def binarySearch(arr, target):    
    l, r = 0, len(arr) - 1
    while l <= r: # l和r互换位置相邻时，返回
        mid = l + (r - l) //2  # 是L，不是1；mid对于偶数，是靠左的，即[1,2]中，mid为1
        if target == arr[mid]:
            return mid
        elif target < arr[mid]:
            r = mid - 1
        elif target > arr[mid]:
            l = mid + 1
    return -1

# 极个别情况下的模板
# 针对的是第一个模板的短板：当要access数组边界的数，如果边界的数在运行中出现更改，可能越界。??
# 虽然这种情况也可以用Edge Case来写，但太过麻烦。这点我们后面具体说来。
def binarySearch(arr, target):
    l, r = 0, len(arr) - 1
    while l + 1 < r:  # r要比l大2，即中间可以隔一个数，[0,2]不返回；l和r相邻时，返回
        mid = l + (r - l) //2
        if target == arr[mid]:  # 不仅mid为结果值
            l = mid
        elif target < arr[mid]:
            r = mid
        elif target > arr[mid]:
            l = mid
    
    if arr[l] == target:
        return l
    if arr[r] == target:
        return r
    return -1
     

## 二维矩阵模板

In [4]:
# 模板1
# 二维矩阵的数是从前往后，从上往下，且i行尾< i+1行头的
# 当作一维array进行二分搜索
def searchMatrix(matrix, target):
    row = len(matrix)
    columns = len(matrix[0])
    
    l, r = 0, row * column - 1
    while l <= r:
        mid = l + (r - l) // 2
        midVal = matrix[mid // column][mid % column]  #行，列
        if target == midVal:
            return True
        if target < midVal:
            r = mid - 1
        else:
            l = mid + 1
    return False

In [None]:
# 模板2
# 二维矩阵的数是从前往后，从上往下，且每行都是独立增长的
# 进行对角线搜索 diagonal search： 从左上到右下遍历i，然后对i的行和列进行二分搜索
class Matrix
    def searchMatrix(self, matrix, target):
        # corner case

        for i in range(min(len(matrix), len(matrix[0]))):
            r = self.binarySearch(i, matrix, target, 1)  # 1 represent search the row
            c = self.binarySearch(i, matrix, target, 0)
            if r or c:
                return True
        return False
    
    def binarySearch(self, i, matrix, target, tag):  # return True if having target
        m = len(matrix)
        n = len(matrix[0])
        
        
        l = i
        if tag == 1:
            r = n - 1  # 别忘记 - 1
        else:
            r = m - 1
        
        
        while l <= r:
            mid  = l + (r - l) // 2
            if tag == 1:
                midVal = matrix[i][mid]
            else:
                midVal = matrix[mid][i]
            if midVal == target:
                return True
            elif midVal < target:
                l = mid + 1
            else:
                r = mid - 1
        return False

## 做题步骤
* 简化问题并判断是否可以用bs
    * 标准：用sorted或部分sorted序列里，找到满足要求T的一个数i, i是output
* 判断类型
    * 给出T，或通过其他方式给出判别，找到T -> 类型1/2
        * 找到：返回Target值的下标或者Bool函数
        * 没找到：
            * r,l分别是target的左右两边的数的序号
            * l是target插入时应该的序号
            * r是小于target的最大的那个数的序号
    * 未给出T，找出具有特点的值 -> 类型3
* 易错点：
    * 当target在nums范围之外时
        * r (target < nums[0]) 会小于0
        * l(target>nums[-1]) 会大于len(nums) - 1
        * 故此时索引nums[l]或nums[r]会报错,故需要提前判断处理一下
    * 判断条件要想清楚再写

## 题目汇总

* Method: binary search + 本binary sort的思想
    1. corner case
    2. binary search
        a.step1
        b.step2
        c....
* 旋转的排序数列
    * 结构特点：两个上升序列并列
    * 核心：在sorted的部分进行二分查找
    * 无重复寻找T  33. Search in Rotated Sorted Array.py 
        * 左右哪一段sorted，判断target是否在该sorted段中,缩小l/r
    * 有重复寻找T  81. Search in Rotated Sorted Array II.py 
        * 左右哪一段sorted及改段是否头尾数相同，若sorted，如无重复情况；若头尾相同，l += 1,继续寻找sorted段
        * time: worst O(N),出现[1,1,1...]情况 
    * 无重复找最小值 **(类型3)**  153. Find Minimum in Rotated Sorted Array.py
        * 按照趋势找最小值，左半段是否有序都无法缩小范围，故用右半段缩小范围，并且目标值可能就在边界上
* 求峰值  **(类型3)**
    * 结构特点：上升序列+下降序列
    * 核心：答案在nums[i]>nums[i+1]处
    * 单峰值找峰值  852. Peak Index in a Mountain Array.py
        * 判断nums[i]>nums[i+1]，移动l/r, 返回nums[l],nums[r]最大的序号
    * 多峰值找峰值  162. Find Peak Element.py
        * 与上题完全相同
* 二维矩阵
    * 单调递增矩阵找T  74. Search a 2D Matrix.py
        * 二维矩阵模板1，当作行来处理
    * 每行递增，每列递增矩阵找T  240. Search a 2D Matrix II.py
        * 二维矩阵模板2，对角线遍历，二分搜索
        * space search reduction tO(m + n)
* 平方与根
    * 判断T是否是完美平方数  367. Valid Perfect Square.py
        * r从half + 1开始
    * 求数T的平方根，若不为整数，取整数部分  69. Sqrt(x).py
        * 法1：r从half + 1开始，若根不存在，返回r
        * 法2：return int(x**(0.5)) 
* 求T的index
    * 求不重复T的index
        * 求T的index，若不存在，返回该插入的index  35. Search Insert Position.py
            * 存在返回mid，不存在返回l
        * 求一个无限大的arr中，求T的index，若不存在返回-1  447 Search in a Big Sorted Array （LintCode）.py
            * 先倍增到比T大的数x，再在[0,x-1]中找T
    * 求重复T的index
        * 求重复数的尾index，若无返回-1  458. Last Position of Target (Lintcode).py
            * 返回r, 后if nums[r] = T,则返回r,否则返回-1
        * 求重复数的首尾index，若无返回-1  34. Find First and Last Position of Element in Sorted Array.py
            * 方法1：判断T是否超范围 + 两个不同的find函数的返回r,l，判断nums[r/l] == T
            * 方法2：两个不同的find函数的返回r,l
                * 对head，先判断l是否超len(nums) - 1(T大于all nums的情况)，再判断nums[r/l] == T(target在nums存在)，-1(不存在，及target大于nums的情况)
                * 对end同理
* 求T附近值
    * 求离T最近的值
        * 求T，若T不存在，求最近且最小的  拉面题
            * 判断T是否超范围 + 类型1 + 若不存在，比较r和l谁离T近
        * 求T index，若T不存在，求最近的index
            * 存在返回index，不存在比较r和l进行返回
    * 求离T最近的K个值的index
        * 改变r为len(arr) - k - 1;
        * 把x看成mid和mid + k的中点，要使得左半边x->arr[mid]比右半边arr[mid+k]->x更小，故进行比较
        * 若arr[mid] + arr[mid + k] < 2x 说明arr[mid]区域在x的左边，要前进左边界，故l = mi + 1
        * 在相等时，继续缩小右边界;最后返回找到的l值，得到arr[l:l + k]
        * Time complexity: O(log(N-K)) binary search + O(K) for res slice
    * 求比T大的最小值,若无，则返回letter初值  744. Find Smallest Letter Greater Than Target.py
        * 若l在范围内，返回l；否则返回letters初值  
* 求arr中和是target的两个数的序号  167. Two Sum II - Input array is sorted.py
    * 遍历arr中的i，在[i+1:]中对差值（T-nums[i]）进行二分搜索
        * time：O(log(n-1) + log(n-2)+...) = log((n-1)!) < nlogn
* 猜数是高还是低
    * 由API[mid]的返回值决定边界的范围
    * 易错点：API的返回的是计算机值与我值比较的大小关系
* 求哪个开始坏了，假设一定有坏的，isBadVersion(mid)作为判断条件  278. First Bad Version.py
    * 返回l
* 每层递增1，求几次可以到达n  441. Arranging Coins.py
    * 设i次后，(1+i)\*i/2(T)到达或超过n
    * 存在返回i，不存在返回r (若不存在，则找到答案是假设是2.5，那么r = 2,l =3,故返回2)