# 第1章 算法简介

## 1.1 二分查找

二分查找是一种算法，其输入是一个有序的元素列表。如果要查找的元素在列表中，则返回其位置，负责返回`null`。

一般而言，对于包含`n`个元素的列表，用二分法查找最多需要$log_2n$步，而简单查找需要$n$步。

> 你可能已经忘记什么是对数$log$了，但可能记得什么是幂。
>
> $log_{10}100$ 相当于问“将多少个10相乘的结果为100”。答案是两个：$10^2=100$。因此 $log_{10}100=2$ 。
>
> 在本书中 $log$ 指的都是 $log_2$ 。使用简单查找法查找元素时，在最糟糕的情况下需要查看每个元素，因此对于$n$个元素的列表，最多需要查找$n$次。而使用二分查找法，每次查找会去掉一半的无效元素，考虑最糟糕的情况，我们在最后一次二分中获取了查找的元素。想象这种算法是在折纸，每次纸的面积会缩小一半，考虑最坏的情况，我们最后二分到了，两边只剩一个元素，此时我们就能确定最终结果了。也就是折了多少次纸会让长度为 $n$ 的纸，变成长度为1，答案就是 $log_2n$ 



代码实现：

In [1]:
def binary_search(list,target):
    # 二分法的头儿
    low = 0
    # 二分法的尾
    high = len(list)-1
    
    # 意思是还没有缩小到长度为一
    while low <= high:
        mid = (low + high)//2
        guess = list[mid]
        if guess == target:
            # 返回最终结果
            return mid
        
        # 如果中间的值比目标要小，取二分的右边
        elif guess < target:
            # 把目标范围的最小值换为中间值，-1的意思是mid本来就不是目标值
            low = mid - 1
        
        # 只剩，中间的值比目标要大的情况，取二分的左边
        else:
            # # 把目标范围的最大值换为中间值
            high = mid - 1

    # 如果 缩到长度1了还没有返回值，说明list中没有目标值，返回None        
    return None

## 1.2 运行时间

一般情况下，我们会选择运行效率最高的算法，以减少运行时间或占用内存。

拿1.1为例，未使用算法时，查找时间随着列表的长度增加而增加，这种称为*线性时间*。二分则不同，列表100个，最多需要猜7次；如果有40亿数字，最多需要猜32次。二分查找的运行时间为*对数时间*。



## 1.3 大O表示法

这是用来描绘一种算法有多快的表示形式。例如，假设列表包含 $n$ 个元素，简单查找需要查找每个元素，最坏情况下需要执行 $n$ 次操作。使用大O表示法，这个运行时间为 $O(n)$ 。

注意是没有单位的，大O表示法指的并非以秒为单位的速度，而是表现算法运行的增速和最坏情况下的操作数。显然 $O(n)$ 需要执行 n 次，且是线性增长。



### 1.3.1 常见的大O运行时间

下面按==从快到慢==的顺序列出常见的5中大O运行时间：

- $O(log\,n)$ ，对数时间，eg：二分法
- $O(n)$，线性时间，eg：简单查找
- $O(n*log\,n)$，第四章介绍一种较快的排序
- $O(n^2)$，eg：选择排序
- $O(n!)$， eg：旅行商问题算法



算法的速度并不是指时间，而是操作数的增速。

谈论算法的速度时，讨论的是随着输入的增加，其运行时间以什么样的速度增加。

$O(log\,n)$ 比 $O(n)$ 快，元素越多越明显。



### 1.3.2 旅行商问题

是指，一个人要前往五个城市，同事要确保旅程最短。为此可考虑的前往这些城市的可能的顺序。

对于五个城市，有$5*4*3*2*1$ 种顺序，旅行商需要对每种顺序计算总旅程长度，再挑选最短的。

目前这个问题无解。。。我们能做的只有找出近似答案（第十章）。

# 第2章 选择排序

本章学习一下最基本的数据结构：数组和链表。

学习第一个排序算法：选择排序。二分法只能用于有序序列。

> 选择排序就是最普通的一种排序算法，我们从无序数组，第一遍找最大的弹出，第二遍找第二大的弹出，最后弹出最后一个。

## 2.1 内存原理

当你需要将数据存储到内存时，会请求计算机提供存储空间，计算机给你一个存储地址。需要存储多项数据时，有两种基本方式

- 数组
- 链表



## 2.2 数组

假设编写一个管理待办事项的应用，为此需要将待办事项存储到内存中。

使用数组意味着所有待办事项在内存中都是相连的，假设你需要往数组中追加待办事项，但是原来的位置数组后面已经没有空位置了，这时候计算机会重新申请一块可以容纳全部数组的内存，然后将待办事项都移动到新的地方。新添加元素时，重复如上操作，因此新添元素速度会很慢。

为了避免上述操作，可以在申请内存时，预留位置。但仍然带来了新的问题：

- 额外请求的内存，造成了浪费
- 额外请求的用完了，还是需要重新申请

对于这种业务需求，一般是使用链表解决。正因为在同一个内存中，数组随机访问的效率很高。

数组删除某个元素时，会将后面的元素前移，最坏情况下可得，时间复杂度为$O(n)$

数组插入元素的运行时间同理是$O(n)$，读取的运行时间是$O(1)$。



## 2.3 链表

链表中的元素可以存储在内存的任何地方。链表中的每个元素都存储了下一个元素的地址，从而使一系列随机的内存地址串在一起。

因此链表的优势在于插入。但是假设你要读取链表的最后一个数据，你不能直接读取，因为并不知道其所在的地址，你必须要先访问第一个元素，从中获取第二个元素，以此类推，直到最后一个元素。如果读取所有元素，链表的效率很高，但是如果跳跃或读取某一个，链表的效率很低。

链表插入（删除）元素的运行时间，分两种情况[参考链接](https://blog.csdn.net/gaoxiangnumber1/article/details/44634485)：

- 一个已知头结点的链表（假设足够长），在第index个元素前插入一个元素。

  首先我们需要从头开始向后遍历，直到找到第index-1个结点，这需要$O(n)$时间；找到以后，创建新节点，改变指针的指向，这需要$O(1)$的时间。所以这种情况下，时间复杂度为$O(n)$。

- 一个已知头结点的链表（假设足够长），在某结点后面插入新节点，大小为newdata，且告诉你该结点的地址node，这种情况下时间复杂度为$O(1)$。



## 2.4 选择排序

假设你有一个歌单，要将这个歌单按照播放量排序，那么这个行为的时间复杂度是多少？

为了获取播放量最高的第一首，首先我们需要执行$O(n)$ 次，取出最高的，其次获取第二高的需要$O(n-1)$ 次，直到最后只需要操作$O(1)$ 次，可得下面公式：
$$
n+(n-1)+(n-2)+...+2+1=n+\frac{n-1}{2}*n=\frac{1}{2}n^2+\frac{1}{2}n
$$
但是大O表示法通常省略1/2这样的参数，此处的复杂度为$O(n^2)$（具体讨论在第四章）。

接下来介绍我们的主角：选择排序，它速度不是很快，比如快速排序就比它快运行时间为$

In [5]:
# 返回给定list最小数所在的索引
def find_smallest(arr):
    smallest = arr[0]
    index = 0
    for i in range(1, len(arr)):
        if arr[i] < smallest:
            smallest = arr[i]
            index = i
    return index


def my_sort(arr):
    my_arr = []
    for i in range(len(arr)):
        # 获取源list最小数据的索引
        smallest = find_smallest(arr)
        # 将源list的最小数据删除，并新增至自己的list
        my_arr.append(arr.pop(smallest))
    return my_arr


In [7]:
list_a = [3,5,1,9,4,2]
my_sort(list_a)

[1, 2, 3, 4, 5, 9]

代码很笨，每次循环选出最小数据，弹出至自己维护的list，循环递归。

这种思想是“归约思想”吧，把排序问题化解成取最小值的问题，然后递归。

# 第3章 递归

实现同一个需求，你可以使用循环，也可以使用递归。如果使用循环，程序的性能可能更高；如果使用递归，程序可能更容易理解。（因为递归会往内存栈中不断的入栈函数，层数多了不就爆内存了）

## 3.1 基线条件和递归条件

编写递归函数时，必须告诉它何时停止递归，这个停止条件被称作基线条件。

In [8]:
def foo(i):
    print(i)
    # 基线条件
    if i <i:
        return
    else:
        # 递归条件
        foo(i-1)

## 3.2 栈

栈像是个瓶子，往里放东西，先进后出，总是先弹出后入栈的。

当递归函数调用自身时，就相当于在瓶子里不断地压入函数内存调用，每个函数各自维护自己的变量状态。

为了避免太深层次的递归，有两种解决方案：

- 转而使用循环
- 使用尾递归

# 第4章 快速排序

依据递归思想解决问题的方法被称作“*分而治之*”（D&C）,面对新问题时，可以想想分而治之能解决吗？

## 4.1 分而治之

假设你有一块长方形农田，现在你期望把农田尽可能分割成多的正方形，应该怎么解决呢？

D&C策略的解决思路很简单：

- 找出基线条件，这个条件必须尽可能简单。
- 不断地将问题分解（或缩小规模），直到符合基线条件。

所以这个农田可以这么解决：

1. 先假定我就用长方形农田的宽当作分割条件进行分割
2. 然后将剩下地长方形继续重复步骤1



让我们再举个例子，如何用分而治之来累计一个数组呢？

1. 找出基线条件：最简单的数组是什么？空数组或只有一个元素的数组，计算总和会十分容易。这就是基线条件
2. 每次递归都让数组离空数组更进一步

In [13]:
def foo(arr):
    if len(arr)> 0 :
        return str(arr.pop(0)) + foo(arr)
    else:
        return ""
    
foo([1,2,3,4,5]) 

'12345'

## 4.2 快速排序

快速排序也是应用的D&C思想，思路如下：

1. 如果数组只有一个元素或没有元素，那么排序最快，因为不需要排序
2. 不断按基准线缩小规模，让数组的长度不断缩小

具体实现：

1. 首先从数组中选取一个元素，被称作基准值。

2. 接下来找出比基准值小的元素和比基准值大的元素，

   > 这个动作被称作分区，现在的数组变成了，一个全都小于基准值的数组，基准值，一个全都大于基准值的数组。注意这里只进行了分区，分区后的两个数组仍然无序的。

3. 对分区后的数组继续执行一二步骤，直至分区后的数组只有一个元素，此时将它们累加起来，即完成了排序。

In [24]:
import random

def foo(arr):
    if len(arr) >= 1:
        reference_value = arr.pop(0)
        lower = []
        higher = []
        for i in arr:
            if i >= reference_value:
                higher.append(i)
            else:
                lower.append(i)
        result = foo(lower) + [reference_value] + foo(higher)
        return result
    else:
        return []
    
arr = [random.randint(0, 100) for i in range(10)]
print(arr)
foo(arr)

[3, 8, 82, 49, 46, 24, 1, 54, 93, 50]


[1, 3, 8, 24, 46, 49, 50, 54, 82, 93]

### 4.2.1 归纳证明

让我们反过来思考这个过程。

如果数组长度为一，你能不能进行排序，能。

如果数组长度为二，你能不能进行排序，能。随机选一个元素，判断另一个元素大小，大放右边，小放左边。

如果数组长度为三，你能不能进行排序，能。随机选一个元素，根据基准值将数组切成两份，小的放左边，大的放右边。

如果数组长度为四，你能不能排序，能。根据基准值将数组切成两份，最坏情况，数组会被切分长一个长度为0的数组和一个长度为三的数组；对长度为三的数组执行上面的步骤。一般情况，数组会被切分成一个长度为1和长度

为2。

如果数组长度为五？转化成1和4，按上述规则继续处理。

......



上面的过程，其实就是归纳证明。归纳证明又称归约思想，有这么一个笑话用来形容归纳证明：

> 一个物理学家和一个数学家正坐在教师休息室里。突然间，休息室里的咖啡机着火了。物理学家就拿了一个垃圾桶，把里面的垃圾清空，跑到水池前，给垃圾桶灌满水，随后扑灭了火。由于这个咖啡机着过一次火了，大家都同意把垃圾桶装满水放在这个咖啡机旁边。
> 第二天，同样的两个人又坐在同样的休息室里，咖啡机又一次着火了。这一次，数学家站了起来，把装满水的垃圾桶拿了起来，把里面的水倒掉，又放了一些垃圾在里面，交给了物理学家。这样就把问题归约到了一个之前已经解决过的问题上。



可见归纳证明可以和D&C思想联用，解决一些实际的问题。

## 4.3 再谈大O表示法

上例中的快速排序算法，有一个独特之处，其排序速度和基准值的选择有很大关系，比如说对于一个数组，你恰好选择了一个最小（大）值，那么这次分区其实动作收益是最小的。比如三个数[1,2,3] 选择1，那会分成[] 和1 和 [2,3]还要继续递归 ；如果选择2，则会分成[1] 和2 和[3],已经完成了排序。

所以对于快速排序：最糟糕的情况下运行时间是$O(n^2)$，平均情况下是$O(n*log\,n)$；

### 最好情况

最好情况下，我们快排的数组是个有序数组，且每次的基准值都取中间的值，下面公式的第几层所代表的复杂度，最好情况下快排的层数$ \approx$二分，会递归$O(log\,n)$个栈，又因为二分是有序序列，而快排无序，需要在每一层操作$O(n)$次，共计$O(n*log\,n)$
$$
O(1)= O(\frac{n}{2}) + O(\frac{n}{2})
$$

$$
O(2)= O(\frac{n}{4}) + O(\frac{n}{4})+O(\frac{n}{4}) + O(\frac{n}{4})
$$


$$
O(logn)= O(\frac{n}{n}) + O(\frac{n}{n})+... + O(\frac{n}{n})
$$

### 最坏情况

最坏情况下，我们选的基准值并没有分成两部分，快排会递归$O(n)$个栈，最坏情况下快排的层数$ \approx$选择排序，
$$
O(1)= O(n-1)
$$

$$
O(2)= O(n-2)
$$

$$
O(n-1)= O(2)
$$

$$
O(n)= O(1)
$$



所以运行时间为$\frac{1}{2}n^2+\frac{1}{2}n$，去掉常数为$O(n^2)$



# 第5章 散列表

> 就是对应Python 中的字典，这要求key必须是可散列的。

## 5.1 散列函数

实现原理：

散列函数将输入映射为数字，因为输入都是可散列的保证了唯一，也就保证映射后的数字不重复。假设我们维护一个价格表，将商品应用散列函数后得到一个数字，然后以这个数字为下标，存到数组对应的位置处。这样我们可以只用$O(1)$就可以查到想要的数据。

> 所以python中的字典，value中的数据都存在数组里。

## 5.2 应用场景

- 模拟映射关系
- 防止重复
- 缓存记住数据

## 5.3 冲突

实际上，我们的散列函数几乎不可能永远不重复，假设有两个输入经过散列函数后得到相同的数字，那么就在数字对应的数组位置上维护一个链表，将要存储的值放在链表中；这样，查找链表第一顺位的元素时速度依然$O(1)$，但是后面的会渐渐慢起来。好的散列函数维护的链表不会很长。

> 所以在Python中，如果在遍历字典时，如果还不断的添加值，随着元素的增加可能会重新申请数组，此时key对应的哈希值会改变，导致对应顺序改变，所以遍历就会错乱。



## 5.4 性能

平均情况下，我们散列表的操作时间是$O(1)$，这并不意味着我们查找一个元素立刻返回，而是不管散列表多大，所需的时间都一致。

在平均情况下散列表。插入删除查找的运行时间都是$O(1)$，最坏情况都是$O(n)$。好坏主要取决于：

- 较低的填装因子
- 良好的散列函数



### 5.4.1 填装因子

填装因子=散列表的包含元素数/位置总数

一旦填装因子大于0.7，就会调整散列表的长度。



### 5.4.2 散列函数

良好的散列函数让数组均匀分布，糟糕的使数组扎堆分布。`SHA`函数常用作散列函数



# 第6章 广度优先搜索

广度优先搜索能够找出两样东西之间的最短距离



## 6.1 图简介



如果你要乘公交车去某个地方，但是不能直达，并期望最少换乘的路线；这种问题被称为最短路径问题，解决最短路径问题的算法被称为**广度优先搜索**。



## 6.2 广度优先搜索

二分法是应用于有序序列的查找算法；广度优先搜索是应用于图的查找算法，可帮助回答两类问题：

- 从节点A出发，有前往节点B的路径吗？
- 从节点A出发，前往节点B的哪条路径最短？

上面的最少换乘，是第二类问题，让我们看看第一类问题的真实场景：

假如你经营着一个芒果农场，需要寻找芒果经销商，为此你可以在朋友中查找：

1. 首先创建一个朋友名单
2. 依次查看名单中的每个人，看看他是否是芒果经销商。
3. 假设你没有芒果经销商的朋友，那么就必须在朋友的朋友中查找
4. 将名单中的每个人的朋友都加入名单。
5. 重复步骤3步骤4

### 6.2.1查找最短路径

在上面的“芒果经销商”问题中，在农场主看来，一度关系胜过二度关系，二度关系胜过三度关系，以此类推。因此你应该在一度关系中搜索，确定没有芒果经销商后，再在二度关系中搜索。这与广度优先搜索的行为完全一致。

Q：我们是如何确定哪是一度哪是二度呢？

A：一度关系在二度关系之前加入查找名单，因此你需要按顺序检查，这种结构可用**队列**存储。



### 6.2.2 队列

队列类似于栈，不能随机访问队列中的元素，只支持：入队和出队；队列是先进先出，栈是先进后出。知道队列的工作原理，让我们来实现广度优先搜索



## 6.3 实现图

首先我们需要使用代码来实现图，图由多个节点组成。每个节点都与临近节点相连，类似于“你→Bob”，“你→Join”，如何用代码来画一张图呢？它就是散列表！

```python
my_network = {"my":["Bob","Join"]}
```

如果是更复杂的包含二级的关系网呢？

```python
{"my":["Bob","Join"]}
{"Bob":["Rookie","The Shy"]}
{"Join":["Jacky"]}

{"Rookie":["Xiao Yu", "The Shy"]}
{"The Shy":["Rookie"]}
{"Jacky":["Bao Lan"]}
```

散列表是无序的，同一层级内添加的顺序无关紧要。

对于“图”，分为有向图和无向图，比如上例中：`Rookie` 和`The Shy`互相指向对方，被称作无向图；`Jacky -> Bao Lan` 是有向图。



## 6.4 实现算法

以“芒果经销商”为例，让我们理一下思路：

1. 创建一个队列用于存储要检查的人
2. 从队列中弹出一个人
3. 检查这个人是否是“芒果经销商”
4. “是”任务完成；“不是”：将这个人的邻居加入队列
5. 执行第二步
6. 队列为空，说明你的人际关系网没有芒果经销商



伪代码实现如下：

In [None]:
from collections import deque

search_queue = deque()
# 将我的邻居依次加入
search_queue.extend(my_network['my'])
# 维护一个检查过的人的集合，避免循环调用导致无限循环
searched= set()

while len(search_queue)>0:
    # 取出第一个人
    person = search_queue.popleft()
    searched.add(person)
    if check_is_seller(person):
        print(f"{person}是经销商")
        return person
    else:
        # 将这个人的关系网加入队列,同时不添加重复的人
        search_queue.append(i for i in my_network[person] if add_person not in searched)

else:
    print(f"您的关系网中没有经销商")
    return None

## 6.5运行时间

如果在整个人际网中搜索“芒果经销商”，就意味你以为自己为中心，将网络每条网都走到了底儿，此处的运行时间是$O(网络条数)$（记作V），我们还维护了一个已筛选字典，每添加一个人的时间为$O(1)$，所以时间共计$O(V+E)$，其中V是顶点数，E为边数。

## 6.6 拓扑排序

同样是图结构，拓扑排序是指，key对应的value值是有顺序的，比如：起床后你可以选择①锻炼②刷牙③做午饭

1. 穿衣服→洗澡→锻炼
2. 吃早饭→刷牙
3. 买菜→做午饭



# 第7章 狄克斯特拉算法

对于“广度优先搜索”问题，我们找出了用最少换乘（最少层级），找到目标值的算法；但是如果每条路线有不同的权重呢？即每条路线的耗时不一致，我如何选出最快到达目的地的路线？

要将带负权重的图计算出最短路径，可使用另外一种算法：贝克曼-福德算法。


## 7.1 狄克斯特拉算法

![image-20210629150041687](图片/图解算法/image-20210629150041687.png)

在线路没加权重之前，最少换乘到达终点的路线，很明显是：起点→A→终点，耗时7分钟。现在我们要寻找到达终点耗时最少的线路。

狄克斯特拉算法找耗时最短路径的步骤包括：

1. 找出权重最低的节点，本例为最短时间到达的节点。
2. 查看权重最低节点的子节点，查看到子节点的权重是否低于子节点，如果低，那么更新子节点的权重和父节点
3. 重复这个过程，直到对图中的每个节点都这样做。
4. 计算最终路径。

---

我的理解:

根据DC思想，什么情况下能获取最小耗时的路线？两点之间！

1. 从起点开始，我们保证每次都先获取权重最低的子节点，在不考虑权重为负的情况下，后面不论有多少近路，此节点永远不可能被更新（哪怕是一个环，重新指回来）

2. 我们获取这个min()子节点，如果它有子节点，更新我们维护的一个权重总计表。因为当前节点是最低的节点，这个节点的邻居，只会变得权重更小
3. 从我们维护的权重总计表中，取一个我们未处理的且权重最低的点，重复第二步操作。（已处理的点一定是最低权重，不会再更低）这会使我们标记处理的点是最优得分。



> 因为到达某个节点的得分是累加的，我们每次都先从已知节点中得分最低的节点开始处理，因为没有负权重，这些节点未来一定不会被更新成更低分了（想再指回来就要转圈了，此时得分必增加），每次我们用一个节点A的得分去更新子节点B的得分时，这个父节点A就要标记一下，在不考虑负权重的情况下，即使处理其他节点C的时候，A可能作为C的子节点导致C尝试更新A节点的得分，但那是必然不可能的事。所以我们用一个节点去更新子节点时，会不断降低我们还没处理的子节点的得分，使未处理子节点的得分变成未处理中最低的时候，就需要处理这个子节点了，用这个子节点的得分看看能不能更新子节点的子节点的得分。

在上面的代码中我们需要维护几个散列表：



In [27]:
# 存储图中的所有节点，包括当前节点对应的子节点，以及对应的权重
dict_map = {
    "start":{"a":6, "b":2},
    "a":{"end":1},
    "b":{"a":3, "end":5}
}

# 存储从起点，到每个节点的得分，对于其他所有不和起点直接相连的点，可以先用无穷大表示
dict_cost ={
    "a":6, "b":2, "end": float("inf")
}

# 存储每个节点的父节点
dict_parent = {"a":"start", "b":"start", "end": None}



## 7.2 代码实现

In [28]:
# 用闭包实现每次吐出一个未被处理的,权重最低的节点
def rank_dict():
    list_node = []
    def rank(dict_cost):
        min_wight = None
        min_node = None
        for node, wight in dict_cost.items():
            if node not in list_node:
                if min_wight is None :
                    min_wight = wight
                    min_node = node
                if wight <= min_wight :
                    min_node = node
        list_node.append(min_node)
        return min_node
    return rank


In [31]:
# 将我们的图关系转化成字典
dict_map = {
    "start": {"a": 6, "b": 2},
    "a": {"c": 7},
    "b": {"a": 4, "d": 2},
    "c": {"end":5},
    "d": {"c":4, "end":5}
}
# 根据图维护到每一个点所花费的量,算法会不断的更新维护这个字典,将每个
dict_cost = {"a": 6, "b": 2, "c": float("inf"), "d": float("inf"), "end": float("inf")}

dict_parent = {"a": "start", "b": "start"}

rank = rank_dict()

while True:
    node = rank(dict_cost)
    if node is None:
        break
    if node in dict_map:
        for slave, wight in  dict_map[node].items():
            if dict_cost[node] + wight < dict_cost[slave]:
                dict_cost[slave] = dict_cost[node] + wight
                dict_parent[slave] = node

print(dict_cost)

{'a': 6, 'b': 2, 'c': 8, 'd': 4, 'end': 9}


# 第8章 贪婪算法

## 8.1 教室调度问题

这是一个思想非常简单的算法，就是每一步都选择局部最优解，得到一个效果还不错的答案。比如：

假如有如下课程表，但是都在一个教室安排，你期望在这个教室里上最多的课程，如何选择？

![image-20210703111638702](图片/image-20210703111638702.png)

算法思路：

1. 选出最早结束的一门课，作为教室的第一堂课。
2. 从开始时间在上一门课结束后的课程中，选出结束最早的。



## 8.2 背包问题

假如你是个贪婪的小偷，背着一个可装35磅的背包，在商场盗窃可装入背包的商品。

<img src="图片/image-20210703112212518.png" alt="image-20210703112212518" style="zoom:80%;" />

如果按照贪婪算法，那么我们应该先装一个最贵的“音响”，共计3000美元；但是如果我们装后两个，可是总计达到3500美元。很明显贪婪算法不能获得最优解。有时候如果你只需找一个大致能解决问题的算法，此时贪婪算法正合适，因为实现容易，结果也与最优解相差无几。



## 8.3 集合覆盖问题

假设你办了个广播节目，希望让全中国所有省份都能听到。每个广播台覆盖不同的省份且可能重复覆盖，为此你需要决定在哪些台播出，期望用最少的台覆盖全部省份。如何找出最小广播集合呢？听起来容易，实现起来难。具体方法如下：

1. 列出所有可能的广播台合集，这被称为幂集合，可能的子集共有$2^n$个。

   >  就是原集合中所有的子集（包括全集和空集）构成的集族

2. 在可能的子集中选出覆盖所有省份的最小集合。

可以看出，此时的运行时间为$O(2^n)$，如果你需要计算100个电台，基本就凉了。。。



### 近似算法

“贪婪算法”来救场了！使用贪婪算法可得到非常接近的解：

1. 从未选择的电台中，选择出覆盖了最多未覆盖省份的电台，即使这个电台覆盖了一些已覆盖的省份
2. 重复第一步，直到覆盖所有的省份



## 8.4 NP问题

上面的这种穷举所有可能的想法，让我们想起了第一章的旅行商问题。在这个问题中，旅行商需要前往5个不同的城市，为了找出前往这5个城市的最短路径，必须琼剧所有的可能路线。

### 8.4.1 旅行商问题详解

先从最简单的情况思考，假设只有两个城市A和B，那么可能的路线有：

1. A ✈ B
2. B ✈ A

> 或许你觉得这两条路一样，但是实际情况不一定，比如有些城市有单行道，你去很快，回来则不一定。在数学上表示就是，两条路线的权重不一样。



现在我们把城市增加到3个：

1. C ✈ A ✈ B
2. C ✈ B ✈ A
3. B ✈ A ✈ C
4. B ✈ C ✈ A
5. A ✈ B ✈ C
6. A ✈ C ✈ B

---

我们可以按照DC的思想观察新增时的规律：

有一个节点时，有一条选择；

有两个节点时，我们起点有两个选择，剩下一个节点，只有一种可能，所以$2*1$种选择；

有三个节点时，我们起点有三个选择，剩下的两个节点我们知道有两种可能，所以共$3*2*1$种选择；

有四个节点时，我们起点有四个选择，剩下的三个节点我们知道有$3*2$种可能，所以共$4*3*2*1$种选择；

...

这被称为*阶乘函数*，随着节点的增加，可能数增加的特别快，导致根本无法找出正确解。

旅行商问题和集合覆盖问题都属于**NP**完全问题。

> 那，就上面这个问题，有什么好的解决方法吗？
>
> 我们可以用贪心算法！随机任选一个城市当作起点，然后从所有城市中选择权重最低的作为下一个城市，重复此步骤，会得到一个局部最优解！





### 8.4.2 NP问题有哪些？

> 为什么要识别问题是不是NP问题呢？
>
> 因为NP问题不能在容许时间之内给出所要的解。遇到NP问题我们应该寻求近似解。



NP问题有哪些共同点？

- 涉及“所有组合”的问题
- 不能将问题分成小问题，必须考虑各种可能的情况，可能时NP问题
- 涉及序列（旅行商），可能时NP问题
- 涉及集合覆盖（广播覆盖），可能时NP问题
- 如果问题可转换成集合覆盖或者序列问题，一定是NP问题




## 8.5 代码实现


In [33]:
import random
from random import shuffle


def create_channel(province: set) -> dict:
    """
    根据传进来的省份集合，随机生成几个频道，且频道包含的省份有重复
    :param province:集合类型，包含所有省份
    :return:返回一个包含频道号和覆盖省份的字典，eg：{0:"山东省"}
    """
    copy_province = province.copy()
    channel = {}
    list_province = list(province)
    # 应该生成全覆盖的电台。由两部分组成：一部分不重复的取1-4集合province，一部分增加0-3个任意省份
    while copy_province:
        result = set()
        count = min(len(copy_province), random.randint(1, 4))
        for i in range(0, count):
            result.add(copy_province.pop())

        for i in range(0, random.randint(0, 3)):
            shuffle(list_province)
            result.add(list_province[0])

        channel[len(channel)] = result

    return channel


def greedy():
    province = {"北京市", "河北省", "山西省", "平原省", "绥远省", "察哈尔省", "辽东省", "辽西省", "吉林省", "黑龙江省", "松江省", "热河省", "陕西省", "甘肃省",
                "宁夏省", "青海省", "新疆省", "山东省", "福建省", "浙江省", "台湾省", "河南省", "湖北省", "湖南省", "江西省", "广东省", "广西省", "贵州省", "云南省"}
    dict_channel = create_channel(province)
    # 贪心算法，每次都找一个能够最大限度覆盖我 还没覆盖的省份的一个电台，直至全部覆盖
    my_target = set()
    while len(province) != len(my_target):
        new_province_count = 0
        pick_num = None
        for ch_num, ch in dict_channel.items():
            # 如果这个频道能够给我们额外增加很多省份，就先增加这个频道
            if len(ch - my_target) > new_province_count:
                new_province_count = len(ch - my_target)
                pick_num = ch_num
        if pick_num is not None:
            print("新增频道", pick_num)
            my_target = my_target | dict_channel[pick_num]
    return my_target

greedy()

新增频道 4
新增频道 0
新增频道 1
新增频道 6
新增频道 7
新增频道 3
新增频道 2
新增频道 8
新增频道 9
新增频道 10


{'云南省',
 '北京市',
 '台湾省',
 '吉林省',
 '宁夏省',
 '察哈尔省',
 '山东省',
 '山西省',
 '平原省',
 '广东省',
 '广西省',
 '新疆省',
 '松江省',
 '江西省',
 '河北省',
 '河南省',
 '浙江省',
 '湖北省',
 '湖南省',
 '热河省',
 '甘肃省',
 '福建省',
 '绥远省',
 '贵州省',
 '辽东省',
 '辽西省',
 '陕西省',
 '青海省',
 '黑龙江省'}

# 第9章 动态规划

## 9.1 背包问题

回到第8章的背包问题，假设你是个小偷，可偷窃的商品包括：

PS5 3000￥（4磅）、Switch 2000￥（3磅）、AirPords 1500（1磅），为了让偷窃价值最高，该如何选择？

最简单的算法是：列出三类商品所有的可能，然后排除超重的，取价格最高的。但这种算法的运行时间是$O(2^n)$，稍微一多就挂了，那么如何找到最优解？



## 9.2 动态规划

In [35]:
import collections

Items = collections.namedtuple("Items", ["name", "price", "wight"])


def dynamic_programming(items: list, max_wight) -> list:
    nobody = Items(None, 0, 0)
    # 初始化一个二维list，第一行代表可偷的物品为空，所以背包都是空
    list_result = [[nobody for i in range(max_wight + 1)]]
    # 将二维list的第一列初始化为空，代表背包容量为0；添加这两列对后面写逻辑判断有帮助
    for i in range(len(items)):
        list_result.append([nobody])

    for row, item in enumerate(items):
        row_result = []
        for current_wight in range(1, max_wight + 1):
            # 相同容积下，历史的最佳纪录
            history_choice = list_result[row][current_wight]

            # 新的可偷的东西目前能放进袋子里
            if item.wight <= current_wight:
                # 如果把新的可偷的作为必偷物，然后根据剩余空间，可以轻松的选出最佳组合即 history_second_choice变量
                history_second_choice = list_result[row][current_wight - item.wight]
                if history_second_choice.name is not None:
                    might_choice_name = item.name + ", " + history_second_choice.name
                    might_choice_wight = item.wight + history_second_choice.wight
                    might_choice_price = item.price + history_second_choice.price

                    might_choice = Items(might_choice_name, might_choice_price, might_choice_wight)
                else:
                    might_choice = item
            # 新的可偷的东西目前不能放进袋子里
            else:
                might_choice = history_choice
            # 两种方案选择最棒的方案
            if history_choice.price >= might_choice.price:
                row_result.append(history_choice)
            else:
                row_result.append(might_choice)

        list_result[row + 1].extend(row_result)
    return list_result


In [38]:
# 可偷物品
list_items = [Items("PS5", 3000, 4), Items("Switch", 2200, 2),
              Items("Airpods", 1800, 1), Items("Ipad", 2899, 2),
              Items("Kindle", 899, 1)]
# 背包最大重量
max_wight = 6

dynamic_programming(list_items, max_wight)[-1][-1]

Items(name='Kindle, Ipad, Airpods, Switch', price=7798, wight=6)