# 数据结构基础  


## List 
### 定义
* Stores data elements based on an sequential, most commonly 0 based, index. 
* Based on tuples from set theory. （元组 + 可变的集合 -> 可变的元组）。
* They are one of the oldest, most commonly used data structures. 

### 重点
* Advantages: indexing  
* Disadvantages: inserting(except append), and deleting(except pop).
* Linear data structures, are the most basic. 最基本结构：线性数组.
    * Stack 栈 
    * Queue 队列 
* Non-linear data structures.非线性数据结构
    * Graphs 图 [[1,2], [3, 4]]
    * Trees  树 中序遍历 [1,[2,4,5],3]

### 增删改查排及时间复杂度
* Append： O(1)
* Insertion: O(N) (l[a:b] = ...) 
* Pop：O(1)
* Delete: O(N) depends on i; O(N) in worst case
* Indexing: O(1)
* Search: traversal list O(N)
* Sort: O(NlogN)



## Linked list
### 定义
* Stores data with nodes that point to other nodes. 用节点储存数据并指向其他节点
    * 节点的描述：Nodes, at its most basic it has one datum and one reference (another node) 在最基础的情况下，节点拥有一个数据和一个参考（其他节点）
    * 链表的描述：A linked list chains nodes together by pointing one node's reference to another. 节点通过指向另一个节点从而使链表连接在一起

### 重点 
* Advantage: Add and deletion 
* Disadvantage: indexing and searching. 
* Doubly linked list has nodes that also references the previous node. 双向链表有两个参考，一个是之前的node，一个是之后的node
* Circularly linked list is simple linked list whose tail, the last node, references the head, the first node. 成环链表是由简单的链表首末相连组成
* 可以实现栈和队列

### 增删改查排及时间复杂度
* Add node: O(1)
* Deletion: O(1)
* indexing: O(N)
* Search: traversal linklist O(N)
* Sort: O(NlogN)

## Stack, Queue and Heap queue(priority queue)

### Stack 栈 
* Last-In-First-Out (LIFO) concept 
* append() / pop() 
* can be made from **list**
* can be made from **linklist**, by having the head be the only place for insertion and removal. 可用链表构成,插入：建立新节点，连接到头节点；移除：移除头节点，返回下一个
    * 参见 <链表实现stack和Queue>

### Queue 队列 
* First-In-First-Out (FIFO) principle 
* Lists are not efficient to implement a queue 列表不能有效的执行队列
    * 故调用容器-双端队列deque(double-end-queue) 
    * from collections import deque d = deque(iterable) ("deck")，If iterable is not specified, the new deque is empty.
    * append(x) / appendleft(x) / pop() / popleft() / extend(iterable) / extendleft(iterable) O(1) 双向append or pop, O(1)
* can be made from **linklist** that only removes from head and adds to tail 也可用链表构成, 从头部移除，从尾部添加
    * 参见 <链表实现stack和Queue>

### Heap queue 堆 
* 最小值在堆顶   

### 基本函数

In [1]:
# stack（list）
A= [1,2,3]
A.append([4])  # [1, 2, 3, [4]]
A.extend([4])  # [1, 2, 3, [4], 4]
print('extend: ', A)
A.insert(1,4)  # 在i处插入value [1, 4, 2, 3, [4], 4]
A.remove(1)  # 除去值为i的数 [4, 2, 3, [4], 4]
x = A.pop(3)  # 除去第i个数 [4, 2, 3, 4]
x = A.index(4)  # 0 返回符合的第一个序号 x = 0
A.reverse()  # 转置
A.sort(reverse = True)  # 排序 + 转置 [5, 3, 1]
from copy import copy, deepcopy
a = copy(A)  # 浅复制
a = deepcopy(A)  # 深复制

extend:  [1, 2, 3, [4], 4]


In [2]:
# Queue (deque) 队列
from collections import deque
B = 'desk'  # iterable
d = deque(B) # 转化B为队列d
d = deque()  # 建立新队列d
d.append('c')
d.appendleft('e')  # 'edeskc'
d.extend(a)
d.extendleft(a)  # 扩展最左边
x = d.pop() # 注意！没有i参数（list有i参数）
d.popleft() #删除最左边的，即先“进”的，无(i)
d.reverse() # 转置
print(d)
d.rotate(1) # 向右循环移动 n 步。 如果 n 是负数，就向左循环。e.g把倒数第1个调换到前面
print(d)

deque([3, 4, 4, 'c', 'e', 4, 4, 3])
deque([3, 3, 4, 4, 'c', 'e', 4, 4])


In [3]:
# Heap queue 堆
from heapq import heapify, heappop, heappush, heappushpop, heapreplace, nlargest, nsmallest
# 创建一个堆，可以使用list来初始化为 []
C = []  # 建立新heapq
# 创建一个堆或者可以通过一个函数 heapify() ，来把一个list转换成堆
C = [2, 3, 4]
heapify(C)  # 转化C为堆，原地，线性时间内
heappush(C, 2)  # 添加2,注意！只能添加值！不能添加list等数据结构，下面的删除也是这样!
x = heappop(C)
heappushpop(C, 2)  # 先添加，再删除顶端的
heapreplace(C, 5)  # 先删除顶端的，再添加
nlargest(2, C)  # nlargest(n, iterable, key=None) 返回前n个符合k条件的最大值（e.g. k = lambda x: x[0]）  = sorted(iterable, key=key, reverse=True)[:n]
nsmallest(2, C)  # nsmallest(n, iterable, key=None) 返回前n个最小值 = sorted(iterable, key=key, reverse= False)[:n]

[3, 4]

### 经典应用

## Hash Table 及 string

### 定义
* 结构：Stores data with **key value pairs**.
* 功能：Hash function accept a key and return an output unique only to that specific key
    * This is known as hashing, which is the concept that an input and an output have **a one-to-one correspondence** to map information.
    * Hash function has **a unique address** in memory for that data.

### 重点
* 优势: 插入，删除，搜索 insertion, deletion, and searching
* Hash collisions(哈希冲突) are when a hash function returns the **same output** for **two distinct inputs**.
    * All hash function have its problem
    * This is often accommodated(解决) for **having the hash table being very large**
* Hashes are important for **dictionary** and **database indexing**.

### 增删改查排及空间复杂度
* Store：O(1) d[k] = v
* Pop: O(1) **d.pop(k)** 删除key对应的pair，并返回value
* Pop item: O(1) **d.popitem()** 删除并返回最后一个pair
* Delete: O(1) del d[k]
* Search: O(1) d[k]

### 应用

#### 总结
* string相关概念
    * subsequence 可以不连续且有序的子序列 / substring 连续但有序的子序列 / the length of the longest palindromes that can be built with those letters 可以不连续，可以无序的子序列

## Binary Tree

### 定义
a tree like data structure where every node has at most two children
    * There is one left and right child node

### 重点
* Designed to optimize searching and sorting
* A **degenerate tree** is an unbalanced tree, which if entirely one-sided is essentially a linked list. 简并树是母节点只有一个子节点的树，如果完全单侧，则就是链表
* They are comparably simple to implement than other data structure.
* Used to make **binary search tree**
    * A binary tree that uses comparable keys to assign which direction a child is. 使用可比较键来指定孩子的方向的二叉树。
    * Left child has a key smaller than its parent node.
    * Right child has a key greater than its parent node.
    * There can be no duplicate node.
    * Because of the above it is more likely to be used as a data stucture than a binary tree.

### 增删改查排及空间复杂度
* Insertion: O(logN)
* Indexing: O(logN)
* Search: O(logN)

# 搜索基础 Search Basics

## 宽度优先搜索 Breadth First Search

### 定义
An algorithm that search a tree (or graph) by searching levels of the tree firs, starting at the root.

### 重点
* Optimal for searching a tree that is **wider than it is deep**.
* Uses a **queque** to store information about the tree while it traverses a tree.
    * Because it uses a queue it is more memory intensive than depth first serarch.
    * The queue uses more memory because it needs to stores pointers.
    
### 复杂度
* Search: O(V + E) under the graph is represented by the adjacency list structure
* Each edege is labeled twice. E is number of edges 边的数量
* Each vertex is labeled twice. V is number of vertices 顶点的数量

## 深度优先搜索 Depth First Search

### 定义
* An algorithm that searches a tree (or graph) by searching depth of the tree first, starting at the root.
    * It traverses left down a tree until it cannot go futher.
    * Once it reaches the end of a branch, it traverses back up trying the right child of nodes on that branch, and if possible left from the right children.
    * When finished examing a branch, it moves to the node right of the root then tries to go left on all its children until it reaches the bottom.
    * The right most node is evaluated last(the node that is right of all its ancestors)

### 重点
* Optimal for searching a tree that is deeper than it is wide
* Uses a stack to push nodes onto:
    * Becase a stack is LIFO, it does not need to keep track of the nodes pointers and is thereforce less memory intensive than breath than BFS.
    * Once it can't go further left it begins evaluating the stack.一旦无法继续前进，它将开始评估堆栈。

### 复杂度
* Search:  O(V + E) under the graph is represented by the adjacency list structure
* Each edege is labeled twice. E is number of edges 边的数量
* Each vertex is labeled twice. V is number of vertices 顶点的数量

### BFS vs DFS
* The simple answer to this question is that it depends on the size and shape of the tree.
    * For wide, shallow tree use BFS 宽而浅
    * For deep, narrow tree use DFS. 深而窄

### Nuances 细微差别:
* Because BFS uses queue to store information about the node and its children, it could use more memory than is available on your computer.
* If using a DFS on a tree that is very deep, you might go unnecessarily deep in the search. 如果在非常深的树上使用DFS，则可能会不必要地深入搜索。
* BFS tends to be a **looping algorithm**.
* DFS tends to be a **recursive algorithm**.


# 高效排序基础 Efficient Sorting Basic
* 基本应用：排序类题目
    * 核心步骤：比较（每个元素）
* 扩展应用：合并类题目（比较过程中，每个元素都遍历到了，故可以实现合并）

##  Merge sort 合并排序法

### 定义 
A comparison based sorting algorithm，流程如下  
  * Divide entire dataset into groups of at most two
  * Compares each number one at a time, moving the smallest number to left of the pair.
  * Once all pairs sorted it, then compares left most elements of the two leftmost pairs to create sorted group of four with the smallest numbers on the left and the largest ones on the right.
  * This process is repeated until there in only one set.
  * 如图 Merge-Sort.png 

### 重点
* This is one of most basic sorting algorithm.
* Know that it divides all the data into small possible sets then compares them.

### 复杂度
* Time
    * Relation: T(n) = 2T(n/2) + O(n)
    * Best Case Sort: O(NlogN)
    * Average Case Sort: O(NlogN)
    * Worst Case Sort: O(NlogN)
    * Prove the NlogN
        * Recurrence Tree method:
            T(n) = 2T(n/2) + O(n) = 2^2T(n/2^2) + 2O(n/2) + O(n) = 2^2T(n/2^2) + 2O(n) = 2^mT(n/2^m) + mO(n);
            又因为n/2^m = 1时，m= log(2)n. 故 T(n) = nT(1) + log(2)n * O(n) = n + nlog(2)n = nlog2(n) = nlogn
        * Master method
            T(n) = 2T(n/2) + O(n)，故为nlogn 
* Space
    * O(N)
* 发挥性能的应用范围
    * data is huge
    * data is stored in external storage 
    * 链表
* 稳定性
    * 稳定

* 原地性 In-place
    * 原地算法定义：（in-place algorithm）基本上不需要 额外辅助的数据结构,然而,允许少量额外的辅助变量来转换数据的算法。当算法运行时，输入的数据通常会被要输出的部分覆盖掉
    * 非原地算法：每次merged list，即新产生的arr，都不是原有的arr了，而是小规模的排序数组，故用到了额外辅助的数据结构，不属于原地算法


### 方法核心
* 把容器元素分拆成小单位，再依次比较、排列、合并 


### 代码模板

In [4]:
'''
Merge Sort temple/basic code
edge case: list is None / only one element 
过程 :
    MergeSort(arr[], l,  r)
    If r > l
    1. Find the middle point to divide the array into two halves:   
         middle m = (l+r)/2
    2. Call mergeSort for first half:   
         Call mergeSort(arr, l, m)
    3. Call mergeSort for second half:
         Call mergeSort(arr, m+1, r)
    4. Merge the two halves sorted in step 2 and 3:
         Call merge(arr, l, m, r)
'''

class SortList:
    # Merge sort
    def mergeSort(self, arr):
        if len(arr) == 0 or len(arr) == 1:
            return
        
        
        if len(arr) >= 2:
            # 普通划分
            mid = len(arr) // 2  # find the mid of the array
            L = arr[:mid]  # divide the array elements
            R = arr[mid:]  # into 2 haves
            
            # 递归划分
            self.mergeSort(L)  # Sorting the first half
            self.mergeSort(R)  # Sorting the second half

            # 合并， input: 两个已排序的list，L，R.过程：对L，R进行合并排序。output：合并完成后的一个list
            i = j = k = 0
            while i < len(L) and j < len(R):  # copy data to temp arrays L and R
                if L[i] < R[j]:
                    arr[k] = L[i]
                    i += 1
                else:
                    arr[k] = R[j]
                    j += 1
                k += 1

#             while i < len(L):  # process left data in L part
#                 arr[k] = L[i]
#                 k += 1
#                 i += 1
            if i < len(L):
                arr[k:] = L[i:]
            
#             while j < len(R):  # process right data in R part
#                 arr[k] = R[j]
#                 k += 1
#                 j += 1
            if j < len(R):
                arr[k:] = R[j:]

        return arr
            
x = SortList() 
x.mergeSort([9,8,7,4, 5, 6, 3, 2, 1])

[1, 2, 3, 4, 5, 6, 7, 8, 9]

  
##  Bottom-up Merge sort  自下而上排序法

### 定义
A comparison based sorting algorithm，
  * first merges pairs of adjacent lists of 1 element
  * Then merge pairs of adjacent lists of 2 elements
  * And next merge pairs of adjacent lists of 4 elements
  * And so on. Until the whole list is merged.  


### 复杂度及属性
* Time
    * Relation: T(n) = 2T(n/2) + O(n)
    * Best Case Sort: O(NlogN)
    * Average Case Sort: O(NlogN)
    * Worst Case Sort: O(NlogN)
    * Prove the NlogN
        * Recurrence Tree method:
            T(n) = 2T(n/2) + O(n) = 2^2T(n/2^2) + 2O(n/2) + O(n) = 2^2T(n/2^2) + 2O(n) = 2^mT(n/2^m) + mO(n);
            又因为n/2^m = 1时，m= log(2)n. 故 T(n) = nT(1) + log(2)n * O(n) = n + nlog(2)n = nlog2(n) = nlogn
        * Master theorem
            T(n) = 2T(n/2) + O(n)，故为nlogn 
* Space
    * O(1) # 随是否新建存储结构而变化
* 稳定性
    * 稳定
* 原地性
    * 原地

### 代码模板

In [5]:
# Bottom-up Merge Sort temple/basic code
# edge case: list is None / only one element 
# 易错点：别忘记while interval < length，subsort求的是段，23.Merge k Sorted list求的是点
class SortList:
    def mergeSort(self, arr):  # Merge sort by bottom-up merge sort
        if len(arr) == 0 or len(arr) == 1:  # edge case
            return arr

        length = len(arr)
        interval = 1
        while interval < length:
            for i in range(0, length, 2 * interval):  # bottom-up merge sort
                arr[i: i + 2 * interval] = self.subsort(arr[i: i + interval], arr[i + interval: i + interval * 2])
            interval = interval * 2
        return arr

    def subsort(self, list1, list2):  # sort two sorted list
        if not list1:
            return list2
        if not list2:
            return list1

        new_list = []
        left_len = len(list1)
        right_len = len(list2)
        i, j = 0, 0
        while i < left_len and j < right_len:
            if list1[i] < list2[j]:
                new_list.append(list1[i])
                i += 1
            else:
                new_list.append(list2[j])
                j += 1

        if i != left_len:
            new_list.extend(list1[i:left_len])
        if j != right_len:
            new_list.extend(list2[j:right_len])
        return new_list

x = SortList() 
x.mergeSort([2,1,0])

[0, 1, 2]

### 应用（合并排序及自上而下排序）

#### 总结
* 链表的排序，包括常数空间，非常数空间
* 需要两两比较的题目。e.g.求转置数数量
* 合并类型题目。e.g.合并k链表/列表
* 外置排序

#### 解决方案模板
* 明确 基本结构与要求
    * 输入 含有数个元素容器
    * 输出 格式！！
        * 原容器输出,即原容器保持维度不变的输出 e.g.list sort  -> 递归时直接 self.sort(L)
        * 新参数输出,即新参数，或者原容器维度改变的输出 e.g. sort linklist, sort list[list] -> 递归时 sub_l = self.sort(L)
    * 要求 合并方式排序元素等
* 明确 题目类型
* 确定 idea （解题算法）
* 思考 不同之处
* 修改 Method
    
#### 排序链表，且不要求space complexity - merge sort
* 为什么用方法？ 
    * 要求排序
    * 相对于快排，合并排序不需要太多的对链表节点的访问(access)。
    （链表储存不是连续分块储存的(continuous block of memory)，不利于节点访问，与list相反）
* 时间/空间复杂度
    * O(NlogN) / O(N)
* 例题： 148. Sort List (linked list).py
    * 递归；递归部分返回头节点；每段的完整切割（要next=None）；先确定R头，再确定L尾
    
#### 排序链表，且using constant space complexity. - bottom-up merge sort
* 为什么用这个方法？ 
    * using constant space complexity.
* 时间/空间复杂度
    * O(NlogN) / O(1)
* 例题： 148. Sort List (linked list).py
    * while interval < length + while head1 迭代；
    * dummy,fake-tail的使用；
    * 独立split函数，input->head,interval ; output -> next head
    * 独立merge函数, input->head1,head2; output -> new head, new tail

#### 计算转置数的数量 Inversion Count Problem
* 为什么用方法？ 
    * 利用 inv_count = inv_count + (len(L) - i) 的性质
* 时间/空间复杂度
    * O(NlogN) / O(N)
* 例题： 
    * 775\. Global and Local Inversions.py
    * 例题：Count Inversions in an array.py
    
#### 合并 K 个排序数组 Merge k sorted arrays

#### 3-way Merge Sort

#### 外置排序 External Sorting

#### 合并链表题 
* 为什么用merge sort？
    * 要求合并，即排序的扩展 
* 23\. Merge k Sorted Lists.py - MergeSort method
    * 基本结构与要求:
        * 输入：含有数个元素为link list的head的容器
        * 要求：合并并排序所有link list
        * 输出：合并后的link list的head
    * 明确题目类型： 大合并+小排序类
    * idea: Merge Sort
    * 不同之处：
        * 合并：链表形式合并，生成新部分链表
        * 输出：新生成的链表头，而不是原容器
    * Method:
        * divide lists into groups of at most two
        * merge and sort linklist in every groups into one linklist
        * merge and sort every two new linklist to create new linklist
        * process is repeated until there in only one linklist
        


## Quick sort 快速排序

### 定义
* A comparision based sorting algorithm （与merge sort相同）
    * Divides entire dataset in half by selecting the middle element and putting all smaller elements to the left of the element and larger ones to the right.
    * It repeats this process on the left side until it is comparing only two elements at which point the left side is sorted.
    * When the left side is finished sorting, it performs the same operation on the right side.  
* Computer architecture favors the quick-sort process.

### 重点
* While it has the same Big O as (or worse in the same cases) many other sorting algorithm, it is often faster in practice than many other sorting algorithms, such as merge sort. 虽然有相同或者更坏的时间复杂度，但是实际中，它要更快，比如比归并快
* Know that it halves the data set by the average continuously until all the information is sorted.

### 复杂度及属性
* Time
    * Best case: O(NlogN)
        * when the partition process always picks the middle element as pivot.
        * equal to T(n) = 2T(n/2) + O(n), can be proved by the Master theorem.
    * Average case: O(NlogN)
        * when partition puts O(n/9) elements in one set and O(9n/10) elements in other set.
        *  T(n) = T(n/9) + T(9n/10) + O(n)
    * Worst case: O(N2)
        *  when the partition process always picks greatest or smallest element as pivot
        * equal to T(n) = T(n-1) + O(n)
    * Relation: T(n) = T(k) + T(n - k - 1) + O(n)
        * T(k), T(n - k - 1) are for recursion calls
        * O(n) is for partition process
        * k is the number of elements which are smaller than pivot
* Space
    * O(N)
* 发挥性能的应用范围
    * most architechtures in most real-world data
    * 数组
    * implemented in different ways by changing the choice of pivot, so that the worst case rarely occurs for a given type of data.
* 稳定性
    * 不稳定
    * 可以加入索引作为比较参数的之一，即既比较值大小，也比较索引，来实现稳定。
* 原地性 In-place
    * 属于原地算法 （直接修改输入数据而不是将输入数据复制一份处理之后再覆盖回去）
    * 即不考虑递归的情况下，使用的空间为O(1)
* 尾递归
    * 为尾递归

### 方法核心
* 把容器元素比较、排列，再进一步在小部分里比较、排列

### 代码模板

In [6]:
# 讨论if i < j 和 i += 1 的作用:
# 仅不满足x < arr[j]时：
#     if一定成立 - 有无都正常
#     要寻找比x大的数，而i += 1存在时，直接跳过arr[i],这个等于arr[j]，且明显小于x的数
#     而i += 1不存在时，重复 i += 1,再进行之后流程
#     故有无 i+= 1都正常
# 仅不满足i<j时，即i=j了，ij重合:
#     if 存在， i += 1存在
#         arr[i] = arr[j] 和 i+=1 都不运行，整个程序运行结束，x赋给arr[i]
#     if 存在， i += 1不存在
#         arr[i] = arr[j] 不运行，整个程序运行结束，x赋给arr[i]
#     if 不存在，i += 1存在
#         arr[j]赋给arr[i],i = j，即arr[i]不变，i + 1，
#         而下面的又进行了arr[j]赋给arr[i]，整个程序结束，x赋给arr[i+1]
#         出错
#     if 不存在，i += 1不存在
#          arr[j]赋给arr[i],i = j，即arr[i]不变， 整个程序结束，x赋给arr[i]
# 
# 
# 故正确的是：
# if 存在，i += 1存在
# if 存在，i += 1不存在
# if 不存在，i += 1不存在

'''
QuickSort 代码模板
思路：挖坑填数,从大规模到小规模排序，参见 https://blog.csdn.net/morewindows/article/details/6684558
方法：
    取一个数作为基准数
    划分区间过程，把数列中大于基准数的数放到左区间，把数列中小于基准数的数放在右区间
    再对左右区间重复第二步，直到左右区间只有一个数
    
    choose one value of nums as the pivot
    put all smaller elem to the left of the pivot and larger ones to the right
    repeat this process on the left and right side until left/right side one has one value 

易错点：
    由于nums有重复数值，故使用pivot < nums[j]，nums[i] <= pivot，其中使用“=”来覆盖所有大小关系，如没有重复数值，=可以去掉
    R = nums[i + 1: r + 1], 因为跳过i，故从i+1开始，而不是i开始
    nums[l:i] = self.quicksort(L)，因为输入的L和输出都是相当于一个与nums无关的值，故要把返回值与nums联系起来
'''
class Sort:
    def quicksort(self, nums):
        if len(nums) == 0 or len(nums) == 1:
            return nums

        l = 0
        r = len(nums) - 1

        i = l
        j = r
        pivot = nums[i]
        while i < j:
            while i < j and pivot <= nums[j]:
                j -= 1
            nums[i] = nums[j]
            while i < j and nums[i] < pivot:
                i += 1
            nums[j] = nums[i]
        nums[i] = pivot
        L = nums[l:i]
        R = nums[i + 1: r + 1]
        nums[l:i] = self.quicksort(L)  # 产生了一部分，就要把这一部分赋值回去，不然不起作用的
        nums[i + 1: r + 1] = self.quicksort(R)
        return nums


x = Sort()
print(x.quicksort([5,1,1,2,0,0]))

[0, 0, 1, 1, 2, 5]


### 应用

#### 总结
* 分两类，并使用常数空间的题目。e.g.奇偶排序，稳定空间正负排序
* 数组的排序

#### 奇偶排序
* 905. Sort Array By Parity / https://www.geeksforgeeks.org/segregate-even-odd-numbers-set-3/


#### 稳定空间，正负排序
* https://www.geeksforgeeks.org/move-negative-numbers-beginning-positive-end-constant-extra-space/

#### 迭代法实现快排
https://www.geeksforgeeks.org/iterative-quick-sort/

#### 3-Way 快排

#### 链表排序


## Bubble sort 气泡排序
### 定义
### 重点
### 时间复杂度




## Heap sort 堆排序

## 插入排序

# 基本算法类型 Basic Types of Algorithm 

## 递归算法 Recursive Algorithms

### 基本概念

#### 定义
* 在其定义中，调用自身的算法。An algorithm that calls itself in its definition.
    * 基本情况时,条件语句用于中断递归 **Base case** a conditional statement that is used to break the recursion.
    * 递归情况时,条件语句用于触发递归 **Recusive case** a conditional statement that is used to trigger the recursion.  

#### 重点
* 堆栈级别太深/堆栈溢出 **Stack level too deep** and **stack overflow**
    * 如果从递归算法中看到这两种情况，那么就搞砸了。
    * 这意味着基本情况永远不会被触发，因为递归有缺陷，或者实例/问题如此之大，以至于耗尽了所有内存
    * 正确是使用递归的必要条件:是否会遇到基本条件
    * 经常在DFS中出现

### 回溯法 Backtracking

#### 概念

* 回溯法又称试探法，当探索到某一步时，发现原先的选择达不到目标，就退回一步重新选择，这种走不通就退回再走的技术为回溯法。

* 回溯法是一种选优搜索法，按选优条件向前搜索，以达到目标。但当探索到某一步时，发现原先选择并不优或达不到目标，就退回一步重新选择，这种走不通就退回再走的技术为回溯法，而满足回溯条件的某个状态的点称为“回溯点”

#### 基本思想

* 在包含问题的所有解的解空间树中，按照深度优先搜索的策略，从根节点出发深度探索解空间树。当探索到某一结点时，要先判断该节点是否包含问题的解，如果包含，就从该结点出发继续探索下去，如果该节点不包含问题的解，则逐层向其祖先节点回溯。（其实回溯法就是对隐式图的深度优先搜索算法）
* 若用回溯法求问题的所有解时，要回溯到根，且根节点的所有可行的子树都要被搜素一遍才结束。
* 若使用回溯法求任一个解时，只要搜索到问题的一个解就可以结束。

#### 基本步骤
1. 针对所给问题，确定问题的解空间：首先应明确定义问题的解空间，问题的解空间至少包含问题的一个最优解
* 确定结点的扩展搜索规则
* 以 深度优先 方式搜索解空间，并在搜索过程中用剪枝函数避免无效搜索。

### 分治法 Divide-conquer algorithm

#### 基本概念
将一个规模为N的问题分解为K个规模较小的子问题，这些子问题相互独立，且与原问题性质相同。求出子问题的解后进行合并，就可以得到原问题的解。

#### 适用情况的特征
1. 该问题的规模缩小到一定的程度就可以容易的解决
 * e.g. 排序规模越小，越容易解决
* 可以分解为若干个规模较小的相同问题，即各子问题具有最优解，就能求出整个问题的最优解
 * 应用分治法的前提，也反映了递归思想的应用
 * e.g.归并排序把整个分成小部分
* 利用该问题分解出的子问题的解可以通过某种固定方式合并为该问题的解
 * 确定使用分治的判断条件，若不成立，则考虑贪心或DP
 * e.g.归并排序，两个有序子序列再次合并
* 该问题分解出的各个子问题是相互独立的，即子问题之间不包含公共的子子问题
 * 涉及到分治法的效率，如果子问题不独立，则分治法需要做许多不必要的工作，重复解公共子问题。
 * 若不满足，则用DP比较好
 * e.g. DP抢劫问题，dp[i] = max(dp[i-2] + arr[i], dp[i-1])，故子问题不独立，用DP比较好

#### 一般步骤
* 分解：将要解决的问题划分成若干规模较小的同类问题
* 求解：当问题划分得足够小时，用较简单的方法解决，否则递归地解各个子问题
* 合并：按原问题的要求，将子问题逐层合并构成原问题的解

#### 经典问题
1. 二分搜索
* 大数整除法
* Strassen矩阵乘法
* 棋盘覆盖
* 归并排序
* 快速排序
* 线性时间选择
* 最接近点对问题
* 汉诺塔

### 回溯法和分治法的区别
* 思想上：
    * 回溯：线性递进思想，一步一步走向更多的实例，比如从list的index=0到index=end
    * 分治：从整体到局部思想。
* 实现上：
    * 回溯：
        * 结束条件-> i = len(s),即遍历到最后一个数
    * 分治：
        * 结束条件-> len(arr) == 0/1, 即划分的部分为1个元素或者无元素
* 应用范围：
    * 回溯：找各种可能性
    * 分治：排序

## 迭代算法

### 定义
* 一种算法，被重复且次数有限的调用，每次都是一次迭代。An algorithm is called repeatedly but for a finite number of times, each time being a single iteraton.
    * 通常用于数据集的增量移动 move incrementally through a data set.

## 贪心算法

### 定义 
* An algorithm that, while excuting, selects only the information that meets a certain criteria.
* The general five components, from Wiki:
    * A candidate set, from which a solution created.
    * A selection funtion, which chooses the best candidate to be added to the solution.
    * A feasibility function(可行性), that is used to determine if a candidate can be used to contribute to a solution.
    * An objective function, which will assign a value to a soluction, or a partial soluction.
    * A soluction fucntion, which will indicate when we have discouvered a complete solution.
* Key

### 基本概念
* 在对问题求解时，总是做出在当前看来最好的选择。即 不从整体上最优加以考虑，它所做出的仅是在某种意义上的局部最优解。  
* 贪心算法只对部分问题才能得到整体最优解，选择的贪心策略必须具备无后效性。
    * 无后效性：状态 受前不受后

### 适用前提
使用局部最优策略能产生全局最优解的问题

### 基本步骤
1. 建立数学模型来描述问题 （找规律？）
* 把求解的问题分成若干个子问题 （减少问题规模，设想只有1个，只有2个的情况）
* 对每一个子问题求解，得到子问题的局部最优解
* 把子问题的局部最优解合成原来解问题的一个解

## 动态规划 dynamic plannig

### 基本概念
将一个问题分解成若干个子问题（阶段），按顺序求解子阶段，前一子问题的解，为后一子问题的求解提供了有用的信息。在求解任一子问题时，列出各种可能的局部解，通过决策保留那些有可能达到最优的局部解，丢弃其他局部解。依次解决各子问题，最后一个子问题就是初始问题的解。

### 与分治法的差别
适合于用动态规划法求解的问题，经分解后得到的子问题往往不是互相独立的（即下一个子阶段的求解是建立在上一个子阶段的解的基础上，进行进一步的求解）。

#### 适用情况的特征
需要满足如下三个特征：
1. 最优化原理：问题的最优解所包含的子问题的解也是最优的（称该问题具有最优子结构）。
 * 贪心，分治也满足
* 无后效性：状态 受前不受后
 * 贪心满足，分治无关
* 有重叠子问题：子问题之间不独立，一个子问题在下个阶段决策中可能被多次使用到。
 * 不是适用的必要条件，但若不具有，则DP不具有优势。
 * 贪心没有子问题，分治法各个子问题独立

### 基本步骤

#### 设计步骤
初始状态 -> 决策1 -> 决策2 -> ... -> 决策n -> 结束状态
1. 划分阶段：按照原问题的时间或空间特征，把原问题分为若干个阶段（子问题）。在划分阶段时，注意划分后的阶段（子问题）一定是要有序的或者是可排序的，否则问题就无法求解。
 * e.g. 原问题为求n阶台阶的所有走法的数量，子问题是求1阶、2阶台阶、...、n-1阶台阶的走法
2. 确定状态和状态变量：将问题发展到各个阶段时所处于的各种客观情况用不同的状态表示出来。当然，状态的选择要满足无后效性。
 * 无后效性：如果在某个阶段上过程的状态已知，则从此阶段以后过程的发展变化仅与此阶段的状态有关，而与过程在此阶段以前的阶段所经历过的状态无关。
 * e.g. 第i个状态即为i阶台阶的所有走法数量。
3. 确定决策并写出状态转移方程：根据相邻两个阶段的状态之间的关系来确定决策方法和状态转移方程。
 * e.g. dp[i] = dp[i-1] + dp[i-2] (i >= 3)
4. 寻找边界条件：给出的状态转移方程是一个递推式，需要一个递推的终止条件或边界条件
 * e.g. 1阶台阶与2阶台阶的走法。1阶台阶有一种走法，2阶台阶有两种走法，即dp[1] = 1,dp[2] = 2

#### 简化步骤
1. 分析最优解的性质，并刻画其结构特征
 * e.g. 抢劫问题，dp[i]的最优解是有两个结构构成的，dp[i-1]和dp[i-2] + arr[i]
* 递归的定义最优解（迭代也行？）
 * e.g. for i in range(len(arr))
* 以自底而上，或自顶而下的记忆化方式，计算出最优值
 * 自底而上,即DP法：建立一个表格，从最小的子问题开始向上求解较大的子问题，把每一个子问题的解全部填入表格中，直到表格中出现原问题的解为止
 * 自顶而下的记忆化方式，即备忘录法：将递归遇到的子问题的解保存在一个表中，以便下一个递归遇到同样的子问题时快速求解。
 *　当一个问题的所有子问题都至少要解一次时，用动态规划比用备忘录方法要好，此时，动态规划算法没有任何多余的计算。当子问题空间中的部分问题可不必求解时，用备忘录方法较有利，因为从其控制结构可以看出，该方法只解那些确实需要求解的子问题。
 * e.g.迭代for完全，求出最优值
* 根据计算最优值时得到的信息，构造问题的最优解
 * e.g. dp[len(arr)-1]的最优值就是问题的最优解？

* 动态规划三要素
 1. 问题的阶段（原问题和子问题）
 * 每个阶段的状态 (第i个状态代表什么)
 * 从前一个阶段到后一个阶段之间的递推关系（转移方程）

* 动态规划三要素
 1. 问题的阶段（原问题和子问题）
 * 每个阶段的状态 (第i个状态代表什么)
 * 从前一个阶段到后一个阶段之间的递推关系（转移方程）

## 分支限界法

### 基本概念
* 分支限界法的求解目标：找出满足约束条件的一个解，或者在满足约束条件的解中找出使某一目标函数值达到极大或极小的解，即在某种意义下的最优解
    回溯法的求解目标：找出T中满足约束条件的所有解

### 分支搜索
* 所谓‘分支’就是采用 广度优先 的策略，依次搜索E-结点的所有分支，也就是所有相邻节点，抛弃不满足约束条件的结点，其余结点加入活节点表。
* 然后从表中选择一个结点作为下一个E-结点，继续搜索