In [23]:
from typing import List

# 斐波那契问题引申

In [None]:
# 引申出重叠子问题、备忘录、DP table、降低空间复杂度等；

## 最原始的方案

In [1]:
def fib1(n):
    if n == 1 or n == 2:
        return 1
    else:
        return fib1(n-1) + fib1(n-2)

## 重叠子问题和备忘录

In [10]:
# 重叠子问题：上述方案存在重叠子问题，导致大量重复计算，造成了大量计算重复，比如fib(20)=fib(19)+fib(18)，fib(19)=fib(18)+fib(17)，那么fib(18)就被计算了两次；
# 解决办法：备忘录；即带备忘录的递归算法来减少重复计算，直接查询；
def fib2(n):
    memo = [0]*n
    return sub_fib2(memo, n)

def sub_fib2(memo, n):
    print(memo, n)
    if n == 1 or n == 2:
        return 1
    else:
        if memo[n-1] == 0:
            memo[n-1] = sub_fib2(memo, n-1) + sub_fib2(memo, n-2)
        return memo[n-1]


In [12]:
%%html
<img src="../image/img1.png", width=320, heigth=240>

In [11]:
fib2(20)

[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 20
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 19
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 18
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 17
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 16
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 15
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 14
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 13
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 12
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 11
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 10
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 9
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 8
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 7
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0] 6
[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0

6765

In [None]:
# 即将复杂度从O(n^2)降低到了O(n)，减少了大量的重复计算，每个计算只需一次；
# 即当计算得到memo[2]的值为2时，所有需要计算fib2(3)的地方都直接返回memo[2]，而无需重复计算；以此类推，得到memo[3]，...
# 实际剪枝的过程是自低向上的；
# 计算过程如下：
# 计算f(19)+f(18)，先计算f(19)，打印时memo全为0，n为20（第1行）
# 计算f(18)+f(17)，先计算f(18)，打印时memo全为0，n为19（第2行）
# ...
# 计算f(3)+f(2)，先计算f(3)，打印时memo全为0，n为4（第17行）
# 计算f(2)+f(1)，先计算f(2)，再计算f(1)，打印时memo全为0，n为3
# 计算f(2)，值为1，打印时memo全为0，n为2
# 计算f(1)，值为1，打印时memo全为0，n为1
# 计算得到f(3)为2，memo[2]为2，回到第17行；
# 计算f(2)，打印时memo[2]=2，n为2
# 回到第16行，先计算得到f(4)为3（memo[3]=3），然后计算f(3)，直接得到f(3)=memo[2]，此时打印memo时memo[2]为2，memo[3]为3，n为3；
# 回到第15行，先计算得到f(5)为5（memo[4]=5），然后计算f(4)，直接得到f(4)=memo[3]，此时打印memo时memo[2]为2，memo[3]为3，memo[4]为5，n为4；
# ...
# 回到第1行，先计算得到f(19)为4181（memo[18]=4181），然后计算f(18)，直接得到f(18)=memo[17]，此时打印memo时memo[2]为2，memo[3]为3，memo[4]为5，... n为18；
# 然后将f(19)+f(18)得到最终结果；

In [None]:
# 因此实际的计算过程如下图

In [16]:
%%html
<img src="../image/img2.png", width=320, heigth=240>

## dp数组的迭代解法

In [19]:
# 上述方案是自顶而下的(但计算机的计算过程实际上还是自低而上的)，也可以采取自低而上，即迭代；
# 上述备忘录即此时的DP table
def fib_dp(n):
    dp = [0]*n
    dp[0] = 1
    dp[1] = 1
    for i in range(2, n):
        dp[i] = dp[i-1] + dp[i-2]
    print(dp)
    return dp[n-1]

In [20]:
fib_dp(20)

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987, 1597, 2584, 4181, 6765]


6765

In [21]:
# 降低空间复杂度为O(1)
# 只保存两个元素即可
# 这一般是动态规划问题的最后一步优化，如果我们发现每次状态转移只需要 DP table 中的一部分，那么可以尝试缩小 DP table 的大小，只记录必要的数据，从而降低空间复杂度。
def fib_dp_v2(n):
    dp_1 = 1
    dp_2 = 1
    for i in range(2, n):
        print(dp_1, dp_2)
        dp_now = dp_1 + dp_2
        dp_1 = dp_2
        dp_2 = dp_now
    return dp_now
fib_dp_v2(20)


1 1
1 2
2 3
3 5
5 8
8 13
13 21
21 34
34 55
55 89
89 144
144 233
233 377
377 610
610 987
987 1597
1597 2584
2584 4181


6765

# 凑零钱问题

给你 k 种面值的硬币，面值分别为 c1, c2 ... ck，每种硬币的数量无限，再给一个总金额 amount，问你最少需要几枚硬币凑出这个金额，如果不可能凑出，算法返回 -1 。

这个问题是动态规划问题，因为它具有「最优子结构」的。要符合「最优子结构」，子问题间必须互相独立。  
假设你有面值为 1, 2, 5 的硬币，你想求 amount = 11 时的最少硬币数（原问题），如果你知道凑出 amount = 10, 9, 6 的最少硬币数（子问题），你只需要把子问题的答案加一（再选一枚面值为 1, 2, 5 的硬币），求个最小值，就是原问题的答案。因为硬币的数量是没有限制的，所以子问题之间没有相互制，是互相独立的。

In [24]:
def coinChange(coins: List[int], amount: int) -> int:
    pass

## 暴力解法

In [26]:
# 步骤：
# 1、确定 base case，目标金额 amount 为 0 时算法返回 0，不需要任何硬币就已经凑出目标金额了。
# 2、确定「状态」，也就是原问题和子问题中会变化的变量。硬币数无限，面额是题目给定的，只有目标金额会不断地向 base case 靠近，所以唯一的「状态」就是目标金额 amount。
# 3、确定「选择」，也就是导致「状态」产生变化的行为。目标金额为什么变化呢，因为你在选择硬币，你每选择一枚硬币，就相当于减少了目标金额。所以说所有硬币的面值，就是你的「选择」。
# 4、明确 dp 函数/数组的定义。我们这里讲的是自顶向下的解法，所以会有一个递归的 dp 函数，一般来说函数的参数就是状态转移中会变化的量，也就是上面说到的「状态」；
# 函数的返回值就是题目要求我们计算的量。就本题来说，状态只有一个，即「目标金额」，题目要求我们计算凑出目标金额所需的最少硬币数量。

In [None]:
# 即暴力计算所有情况，依次比较，得到最优解

In [35]:
# 实际代码
def coin_dp(coins: List[int], n: int) -> int:
    # 暴力计算法
    if n == 0:
        # base case
        return 0
    if n < 0:
        # 即无法满足情况，如n为4，但只有5元硬币，此时无法满足要求
        return -1
    res = float('inf')
    for coin in coins:
        sub_res = coin_dp(coins, n - coin)
        if sub_res == -1:
            continue
        res = min(res, sub_res + 1)  # 之前最优方案和当前方案对比
    return res if res != float('inf') else -1

In [36]:
coin_dp([1,3,5], 11)

3

In [None]:
# 状态转移方程如下：

In [29]:
%%html
<img src="../image/img3.png", width=320, heigth=240>

In [30]:
%%html
<img src="../image/img4.png", width=320, heigth=240>

复杂度：  
这棵树生长的并不规则，确切算出树上有多少节点是比较困难的。对于这种情况，我们一般的做法是按照最坏的情况估算一个时间复杂度的上界。

假设目标金额为 n，给定的硬币个数为 k，那么递归树最坏情况下高度为 n（全用面额为 1 的硬币），然后再假设这是一棵满 k 叉树，则节点的总数在 k^n 这个数量级。

接下来看每个子问题的复杂度，由于每次递归包含一个 for 循环，复杂度为 O(k)，相乘得到总时间复杂度为 O(k^n)，指数级别。

## 带备忘录的递归
消除子问题

In [48]:
def coin_bp_v2(coins, n):
    memo = [-666] * (n + 1)

    def dp(coins, n):
        if n == 0:
            # base case
            return 0
        if n < 0:
            # 即无法满足情况，如n为4，但只有5元硬币，此时无法满足要求
            return -1
        res = float('inf')
        for coin in coins:
            if memo[n-coin] == -666:
                sub_res = coin_dp(coins, n - coin)
                if sub_res == -1:
                    continue
                memo[n-coin] = sub_res
            res = min(res, memo[n-coin] + 1)  # 之前最优方案和当前方案对比
        
        return res if res != float('inf') else -1

    return dp(coins, n)


In [49]:
coin_bp_v2([1,3,5], 11)

3