摘要

高级动态规划
字符串算法
课后思考

高级动态规划

“Simplifying a complicated problem by breaking it down into simpler sub-problems”(in a recursive manner)
Divide & Conquer + Optimal substructure
- 分治 + 最优子结构
顺推形式：动态递推

顺推模板

function DP(): 
  // ⼆维情况 
  dp = [][]
  for i = 0 .. M {
    for j = 0 .. N { 
      dp[i][j] = _Function(dp[i’][j’]…) 
    } 
  } 
return dp[M][N];

关键点
- 有无最优的子结构
- 找到重复子问题
- 最优子结构、中途可以淘汰次优解
实例

字符串算法

最长子序列
- 1143. 最长公共子序列
- s1[i-1] == s2[j-1] && dp[i][j] = dp[i-1][j-1] + 1
- s1[i-1] != s2[j-1] && dp[i][j] = Max(dp[i-1][j],dp[i][j-1])
最长子串
- 最长子序列的变体
  - 即子序列必须在原字符串中连续
- s1[i-1] == s2[j-1] && dp[i][j] = dp[i-1][j-1] + 1
- s1[i-1] != s2[j-1] && dp[i][j] = 0
编辑距离
- 72. 编辑距离
  - s1[i-1] == s2[j-1] && dp[i][j] = dp[i-1][j-1]
  - s1[i-1] != s2[j-1] && dp[i][j] = Min(dp[i-1][j],dp[i][j-1],dp[i-1][j-1]+1)
最长回文串
- 5. 最长回文子串
- dp[i][j] = s[i] == s[j] && (j - i < 2 || dp[i+1][j-1])
字符串匹配算法KMP
- 暴力法（brute force） - O(mn)
- Rabin-Karp 算法
- KMP 算法
  - KMP算法（Knuth-Morris-Pratt）的思想就是，当子串与目标字符串不匹配时，
  - 其实你已经知道了前面已经匹配成功那一部分的字符（包括子串与目标字符串）。
  - 以阮一峰的文章为例，当空格与 D 不匹配时，你其实知道前面六个字符是“ABCDAB”。
  - KMP 算法的想法是，设法利用这个已知信息，不要把“搜索位置” 移回已经比较过的位置，继续把它向后移，这样就提高了效率。
- 暴力法
```
public static int forceSearch(String txt, String pat) {
  int M = txt.length();
  int N = pat.length();
  for (int i = 0; i <= M - N; i++) {
    int j;
    for (j = 0; j < N; j++) {
      if (txt.charAt(i + j) != pat.charAt(j))
        break;
    } 
    if (j == N) {
      return i;
    } 
    // 更加聪明？
    // 1. 预先判断– hash(txt.substring(i, M)) == hash(pat)
    // 2. KMP 
  } 
  return -1;
}
```
- 文献
  - 文献A
  - 文献B
- 学习资料
  - Boyer-Moore 算法
    - 在朴素算法中，我们需要挨个比较所有字符，才知道目标字符串中是否包含子串。
    - 那么，是否有别的方法可以用来判断目标字符串是否包含子串呢？
      - 答案是肯定的，确实存在一种更快的方法。为了避免挨个字符对目标字符串和子串进行比较，
      - 我们可以尝试一次性判断两者是否相等。因此，我们需要一个好的哈希函数（hash function）。
      - 通过哈希函数，我们可以算出子串的哈希值，然后将它和目标字符串中的子串的哈希值进行比较。
      - 这个新方法在速度上比暴力法有显著提升。
    - 核心思想
      1. 假设子串的长度为 M (pat)，目标字符串的长度为 N (txt)
      2. 计算子串的 hash 值 has_pat
      3. 计算目标字符串txt中每个长度为 M 的子串的 hash 值（共需要计算 N-M+1次）
      4. 比较 hash 值：如果 hash 值不同，字符串必然不匹配; 如果 hash 值相同，还需要使用朴素算法再次判断
      KMP算法（Knuth-Morris-Pratt）的思想就是，当子串与目标字符串不匹配时，其实你已经知道了前面已经匹配成功那一部分的字符（包括子串与目标字符串）。
      以阮一峰的文章为例，当空格与 D 不匹配时，你其实知道前面六个字符是“ABCDAB”。
      KMP 算法的想法是，设法利用这个已知信息，不要把“搜索位置” 移回已经比较过的位置，继续把它向后移，这样就提高了效率。
    - code
      public final static int D = 256; public final static int Q = 9997; static int RabinKarpSerach(String txt, String pat) { int M = pat.length(); int N = txt.length(); int i, j; int patHash = 0, txtHash = 0; for (i = 0; i < M; i++) { patHash = (D * patHash + pat.charAt(i)) % Q; txtHash = (D * txtHash + txt.charAt(i)) % Q; } int highestPow = 1; // pow(256, M-1) for (i = 0; i < M - 1; i++) highestPow = (highestPow * D) % Q; for (i = 0; i <= N - M; i++) { // 枚举起点 if (patHash == txtHash) { for (j = 0; j < M; j++) { if (txt.charAt(i + j) != pat.charAt(j)) break; } if (j == M) return i; } if (i < N - M) { txtHash = (D * (txtHash - txt.charAt(i) * highestPow) + txt.charAt(i + M)) % Q; if (txtHash < 0) txtHash += Q; } } return -1; }
  - Sunday 算法

课后思考

62. 不同路径
- 状态定义
  - dp[i][j]：来到当前格子的最短路径总数
- 状态转移方程
  - dp[i][j] = dp[i-1][j] + dp[i][j-1]
63. 不同路径 II
- 状态定义
  - dp[i][j] == 0 ，此路不通
  - dp[i][j] != 0 ，最短路径总数
- 状态转移方程
  - obstacleGrid[i][j] != 1 && dp[i][j] = dp[i-1][j] + dp[i][j-1]

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

HighClassDynamicProgramming高级动态规划、字符串算法.md

HighClassDynamicProgramming高级动态规划、字符串算法.md

摘要

高级动态规划

字符串算法

课后思考

Files

HighClassDynamicProgramming高级动态规划、字符串算法.md

Latest commit

History

HighClassDynamicProgramming高级动态规划、字符串算法.md

File metadata and controls

摘要

高级动态规划

字符串算法

课后思考