# 数据结构与算法总结

> 所有的算法描述均使用 Python 3.5 ，因为发现 Python 对算法的描述更直观、更友好。

## 1. 时间和空间复杂度

### 时间频度与时间复杂度

算法消耗的时间，无法理论计算，是运行测试的实践值。$T(n)$表示算法中基本操作重复执行的次数是问题规模$n$的某个函数，换句话说就是一个算法的执行次数（时间频度）。若某个辅助函数$f(n)$使得当$n$趋于无穷大时，$\frac{T(n)}{f(n)}$ 的极限值不等于零的常数，则称 $f(n)$是$T(n)$的同数量级函数。记作$T(n)=O(f(n))$，称 $O(f(n))$为算法的时间复杂度。

## 2. 数组

### 1）[二维数组中的查找](https://www.nowcoder.com/questionTerminal/abc3fe2ce8e146608e868a70efebf62e?orderByHotValue=1&page=1&onlyReference=false)

思路：两个方向分别遍历一遍就好了。其实还有更加优化的方案就是分区域二分。


In [48]:
#!/usr/bin/env python
#-*- coding:utf8 -*-
# Power by Desgard_Duan 

# search function - normal
def search(matrix, num):
    i = 0
    j = len(matrix[0]) - 1
    max_i = len(matrix) - 1
    while i <= max_i and j >= 0:
        if matrix[i][j] == num:
            return (True, i, j)
        elif matrix[i][j] > num:
            j = j - 1
        else:
            i = i + 1
    return False

import numpy as np
import math

# search function - binary search
def search_by_binary(matrix, num):
    i = 0
    j = len(matrix[0]) - 1
    max_i = len(matrix[0]) - 1
    row = np.split(matrix, [1], axis=0)[0][0]
    (index_1, state) = binary_search(row, num)
    if state:
        return (True, 0, index_1)
    if index_1 < 0:
        return False
    col = []
    for i in range(0, len(matrix[0])):
        col.append(matrix[i][index_1])
    (index_2, state) = binary_search(col, num)
    if state:
        return (True, index_1, index_2)
    else:
        return False
    
def binary_search(arr, val):
    l, r = 0, len(arr) - 1
    while l <= r:
        mid = math.floor((l + r) / 2)
        if arr[mid] < val:
            l = mid + 1
        elif val < arr[mid]:
            r = mid - 1
        else:
            return (mid, True)
    return (l - 1, False)

In [50]:
# unit test
mat = [
    [1, 2, 8, 9],
    [2, 4, 9, 12],
    [4, 7, 10, 13],
    [6, 8, 11, 15],
]

# 普通遍历
print(search(mat, 14))
print(search(mat, 10))
print(search(mat, 7))

# 两次二分
search_by_binary(mat, 7)

False
(True, 2, 2)
(True, 2, 1)


(True, 1, 2)

## 字符串

### 1）[最长回文子串 - LPS](https://leetcode.com/problems/longest-palindromic-substring/description/)

如果面试的时候遇到，后缀数组和 Manacher 应该都敲不出来吧，哈哈。dp 来搞吧。下面列出状态转移方程, $dp\{i, j\}$表示子串中 $str[i \dots j]$ 是否是回文串。如果没记错这题还能用扩展 kmp 来做，且复杂度能讲到$O(n)$，思考一下：

$$
\begin{equation}  
\left\{  
    \begin{array}{lr}  
    dp\{i, i\}=true(0\leqslant i\leqslant n-1)\\
    dp\{i, i-1\}=true(1\leqslant i\leqslant n-1)\\
    dp\{i, j\}=(str\{i\}\ is\ str\{j\})\ \land \ (dp\{i+1,j-1\}\ is\ true)
    \end{array}  
\right.  
\end{equation}  
$$


In [18]:
# LPS DP O(n^2)
def lps_dp(s):
    lens = len(s)
    if lens <= 1:
        return s
    dp = [[False for i in range(lens)] for j in range(lens)]
    for i in range(lens):
        dp[i][i] = True
        dp[i][i - 1] = True
    l, r = 0, 0
    for k in range(2, lens + 1):
        for i in range(0, lens - k + 1):
            if s[i] == s[i + k - 1] and dp[i + 1][i + k - 2]:
                dp[i][i + k - 1] = True
                if r - l < k:
                    l = i
                    r = i + k - 1
    return (l, r, s[l:r + 1])
    
print(lps_dp("guaaua"))
print(lps_dp("12125214121612121"))

(1, 4, 'uaau')
(8, 14, '1216121')


### 2）[最长不重复子串](https://leetcode.com/problems/longest-substring-without-repeating-characters/description/)

很入门的一道 dp 题目，可以借助 dp 的思想再加 hash 的运用做到 $O(n)$ 的效果，状态转移：

$$
dp\{i\}=max\{dp\{i-1\},\ i-Last\ Pos)\}
$$

In [40]:
# Longest Substring Without Repeating Characters
# 时间O(n), 空间O(1)
def lswrc_dp(s):
    lens = len(s)
    if lens <= 1:
        return lens
    pos_rec = dict.fromkeys([s[i] for i in range(lens)], -1)
    pre, max_len = 0, 0
    for i in range(lens):
        ch = s[i]
        last_pos = pos_rec[ch]
        pre = max(last_pos + 1, max_len)
        max_len = max(i - pre + 1, max_len)
        pos_rec[ch] = i
    return max_len
        
print(lswrc_dp("hello"))
print(lswrc_dp("desgardduan"))

3
6
