## Sort

### Bubble Sort

```
for i = 1 to N-1:
    for j = 1 to N-i:
        if A[j] < A[j-1]:
            swap(A[j], A[j-1])
```

* 证明正确性：每个j循环之后，A[N-i:N]都变为有序的
* 复杂度：不管什么情况都需要$O(n^2)$次判断，最好情况可以不做交换，平均和最坏需要$O(n^2)$次交换

###  Insertion Sort

```
for i = 2 to N:
    tmp = A[i]
    for j = i downto 2:
        if tmp >= A[j-1]:
            break
        A[j] = A[j-1]
    A[j] = tmp
```

* 证明正确性：每次j循环之后A[1:i]都变为有序的
* 运行时间：$O(n^2)$

### Heap Sort

* 最大堆：一颗二叉树，每个父节点都比自己的子节点大
* 一个最大堆，根节点i被修改了，通过max_heapify可以使得其在$O(\log n)$时间内维护成最大堆

```
def max_heapify(A, i):
    l = left(i)
    r = right(i)
    if l <= heapsize and A[l] > A[i]:
        largest = l
    else:
        largest = i
    if r <= heapsize and A[r] > A[largest]
        largest = r
    if largest != i
        swap(A[i], A[largest])
        max_heapify(A, largest)
```

* 思路：先建立一个堆，由最大堆的性质可以知道，堆的根是最大的元素，把根和最后一个叶子互换，然后把那个叶子从堆中取走，再维护成一个最大堆。如此重复，可以得到排序

```
def build_heap(A):
    headsize(A) = len(A)
    for i = floor(len(A) / 2) downto 1:
        max_heapify(A, i)
```

```
def heap_sort(A)
    build_heap(A)
    for i = N downto 2:
        swap(A[1], A[i])
        heapsize(A) -= 1
        max_heapify(A, 1)
```

## Basic Graph

### BFS

```
def BSF(G, s):
    for each u in G:
        color[u] = WHITE
    color[s] = GRAY
    Q = [s]
    while Q:
        u = Q.pop()
        for each v adj to u:
            if color[v] = WHITE:
                color[v] = GRAY
                Q.append(v)
        color[u] = BLACK
```

### DFS

```
def DFS(G):
    for each u in G:
        color[u] = WHITE
    for each u in G:
        if color[u] == WHITE:
            DFS_visit(u)
            
def DFS_visit(u):
    color[u] = GRAY
    for each v adj to u:
        if color[v] == WHITE:
            DFS_visit(v)
    color[u] = BLACK
```

### Topological Order

* 性质：在有向无环图中，存在一种排序使得每条边都往后指
* 运行DFS，并且按照每个节点被标记为黑色的时间先后顺序排序就是拓扑排序；只有某个节点的后继都标黑了它才可能标黑，所以标黑时间靠后的排在前面。

### Strongly Connected Components

* 定义：一个图中的一个节点集合，任意两个节点都可以互通，就叫做强连通分支；问题是给定一个图，找出其强连通分支的分解
* 图的转置：就是把边都翻过来 $G^T=(V, E^T)$，$E^T = \{(u,v) | (v, u)\in E\}$

```
def strongly_connected_components(G):
    DFS(G) record turn-black time f(u) for all u
    DFS(G^T) in decreasing order of f(u) and record the forest
        each tree in the forest is a strongly connected component
```

## Matching

* 定义：图$G(V,E)$中的一个边集$M\subseteq E$，每个结点都至多出现在M的一条边上。称M为匹配。如果每个结点恰好出现在M的一条边上，成为完全匹配。
    * matching: 不共点的边集M
    * matching number: 不共点边集的边的数量
    * maximum matching: matching number最大的
    * perfect matching: 能够覆盖所有点的
    * M-alternating path: $G=(V, E)$中一条交替出现在$M$和$E\setminus M$中的路径
    * M-augmenting path: 路径中两端没有被覆盖
    
### Hungarian Algorithm

```
start from any matching M
if M is a perfect matching:
    return M
x0 = a exposed vertex in X
A = {x0} 
B = {}
if N(A) == B:
    return NO_PERFECT_MATCHING
    # because |N(A)|=|B|=|A|-1<|A|, violate Hall's theorem
else:
    y1 = a vertex in N(A) but not in B
    if y1 is covered by M:
        B += {y1}
        A += {x1: (y1,x1) in M}
        goto 'if N(A) == B'
    else:
        P = path from x0 to y is an alternating path
        replace M by new M'
        goto 'if M is a perfect matching'
```

### Hall's Theorem

* 动机：如何在不求出最大流的情况下，找出一个证据说某二分图不存在完美匹配，即最大流小于n。根据最大流最小割定理，如果能够找到一个割容量小于n，即可说明。ps. 当然如果直接求出最大流，也能知道是否存在完美匹配。
* 描述：对于一个子集$A\subseteq X$，用$\Gamma(A)\subseteq Y$表示邻接A中节点的集合，如果二部图$(X,Y)$有完美匹配，那么对于所有的$A\subseteq X$，都有$|\Gamma(A)|\ge |A|$。


## Linear Programming

线性规划标准型表示：

$$
\begin{aligned}
& \max\  {\bf C}^T {\bf x} \\
& s.t. {\bf Ax} \le {\bf b} \\
& \quad \quad {\bf x} \ge 0
\end{aligned}
$$

LP都可以转化为标准型。特别地，如果某元素$x_j$不满足$x_j \ge 0$，可令$x'_j,x''_j \ge 0$，代换$x_j = x'_j - x''_j$

线性规划松弛型表示，相关的不等式约束都变成等式约束，只剩下关于单个元素的不等式约束：

$$
\begin{aligned}
& \max\  z = v + \sum_{j\in N}c_j x_j \\
& s.t. x_i = b_i - \sum_{j \in N} a_{ij}x_j, \, \forall i \in B \\
& \quad \quad x_i \ge 0, \, \forall i \in B\cup N
\end{aligned}
$$


### Simplex

* 基本解：考虑松弛型表示，令第一个约束右边变量（非基本变量）都为0，得到的一组解
* 基本可行解：如果基本解也满足第二个约束，则是基本可行解
* 单纯形法思路：先找一个基本可行解，然后每次都考虑变化一个最优化表达式中的非基本变量，使其刚好不违反约束而使得目标最优，然后把这个非基本变量$x_e$代换成一个基本变量$x_l$（pivot），然后重复进行

```
def pivot(N, B, A, b, c, v, l, e):
    b_new[e] = b[l] / a[l,e]
    for each j in N-{e}:
        a_new[e,j] = a[l,j] / a[l,e]
    a_new[e,l] = 1/a[l,e]
    
    for each i in B-{l}:
        b_new[i] = b[i] - a[i,e] * b_new[e]
    for each j in N-{e}:
        a_new[i,j] = a[i,j] - a[i,e] * a_new[e,j]
    a_new[i,l] = - a[i,e] a_new[e,l]
    
    v_new = v + c[e] * b_new[e]
    for each j in N-{e}:
        c_new[j] = c[j] - c[e] * a_new[e,j]
    c_new[l] = - c[e] * a_new[e,l]
    
    N_new = N - {e, l}
    B_new = B - {e, l}
    
    return N_new, B_new, A_new, b_new, c_new, v_new
```

其中需要一个程序initialize_simplex来找到第一个基本可行解。

```
def simplex(A, b, c):
    N, B, A, b, c, v = initialize_simplex(A, b, c)
    while some index e in N that c[e] > 0:
    for each i in B:
        if a[i, e] > 0:
            delta[i] = b[i] / a[i, e]
        else:
            delta[i] = inf
        choose l in B that minimize delta[i]
        if delta[l] == inf:
            return UNBOUNDED
        else:
            N, B, A, b, c, v = pivot(N, B, A, b, c, v, l, e)
            
    for i = 1 to n:
        if i in B:
            x[i] = b[i]
        else:
            x[i] = 0
    return x
```