# 狄克斯特拉算法

## 本章内容


- 继续图的讨论，介绍加权图——提高或降低某些边的权重。
- 介绍狄克斯特拉算法，让你能够找出加权图中前往X的最短路径。
- 介绍图中的环，它导致狄克斯特拉算法不管用。

#### 前一章使用了广度优先搜索，它找出的是段数最少的路径。如果你要找出最快的路径，该如何办呢？为此，可使用另一种算法——``狄克斯特拉算法（Dijkstra’s algorithm）``。

狄克斯特拉算法包含4个步骤。

- (1) 找出“最便宜”的节点，即可在最短时间内到达的节点。  (目的)
- (2) 更新该节点的邻居的开销，其含义将稍后介绍。       （第一步）
- (3) 重复这个过程，直到对图中的每个节点都这样做了。    （第二步骤）
- (4) 计算最终路径。                         （第三步骤）

## 术语

介绍其他狄克斯特拉算法使用示例前，先来澄清一些术语。

狄克斯特拉算法用于每条边都有关联数字的图，这些数字称为**``权重（weight）``**。

带权重的图称为**``加权图（weighted graph）``**，不带权重的图称为**``非加权图（unweighted graph）``**。

#### 要计算非加权图中的最短路径，可使用广度优先搜索。要计算加权图中的最短路径，可使用狄克斯特拉算法。图还可能有环。无向图意味着两个节点彼此指向对方，其实就是环！在无向图中，每条边都是一个环。狄克斯特拉算法只适用于有向无环图（directed acyclic graph，DAG）。

# Example:换钢琴

1. 这是Rama，想拿一本乐谱换架钢琴。
2. Alex说：“这是我最喜欢的乐队Destroyer的海报，我愿意拿它换你的乐谱。如果你再加5美元，还可拿乐谱换我这张稀有的Rick Astley黑胶唱片。
3. Amy说：“哇，我听说这张黑胶唱片里有首非常好听的歌曲，我愿意拿我的吉他或架子鼓换这张海报或黑胶唱片。”
4. Beethoven惊呼：“我一直想要吉他，我愿意拿我的钢琴换Amy的吉他或架子鼓。”

Q:太好了！只要再花一点点钱，Rama就能拿乐谱换架钢琴。现在他需要确定的是，如何花最少的钱实现这个目标。我们来绘制一个图，列出大家的交换意愿。

<img align="left" src="figures/dijkstra1.png">

动手之前，你需要做些准备工作：创建一个表格，在其中列出每个节点的开销。这里的开销指的是达到节点需要额外支付多少钱。

<img align="left" src="figures/dijkstra2.png"><img align="middle" src="figures/dijkstra3.png">

在执行狄克斯特拉算法的过程中，你将不断更新这个表。为计算最终路径，还需在这个表中
添加表示父节点的列。

这列的作用将稍后介绍。我们开始执行算法吧

- 第一步：找出最便宜的节点。在这里，换海报最便宜，不需要支付额外的费用。还有更便宜的换海报的途径吗？这一点非常重要，你一定要想一想。Rama能够通过一系列交换得到海报，还能额外得到钱吗？想清楚后接着往下读。答案是不能，因为海报是Rama能够到达的最便宜的节点，没法再便宜了.*``这就是狄克斯特拉算法背后的关键理念``*：**```找出图中最便宜的节点，并确保没有到该节点的更便宜的路径！``**



- 第二步：计算前往该节点的各个邻居的开销。现在的表中包含低音吉他和架子鼓的开销。这些开销是用海报交换它们时需要支付的额外费用，因此父节点为海报。这意味着，要到达低音吉他，需要沿从海报出发的边前行，对架子鼓来说亦如此。

<img align="left" src="figures/dijkstra4.png"><img align="middle" src="figures/dijkstra5.png">

- 再次执行第一步：下一个最便宜的节点是黑胶唱片——需要额外支付5美元。再次执行第二步：更新黑胶唱片的各个邻居的开销。

<img align="left" src="figures/dijkstra6.png"><img align="middle" src="figures/dijkstra7.png"><img align="right" src="figures/dijkstra8.png">

- 你更新了架子鼓和吉他的开销！这意味着经“黑胶唱片”前往“架子鼓”和“吉他”的开销更低，因此你将这些乐器的父节点改为黑胶唱片。下一个最便宜的是吉他，因此更新其邻居的开销。

- 你终于计算出了用吉他换钢琴的开销，于是你将其父节点设置为吉他。最后，对最后一个节点——架子鼓，做同样的处理。

- 如果用架子鼓换钢琴，Rama需要额外支付的费用更少。因此，采用最便宜的交换路径时，Rama需要额外支付35美元。

- 现在来兑现前面的承诺，确定最终的路径。当前，我们知道最短路径的开销为35美元，但如何确定这条路径呢？为此，先找出钢琴的父节点。

- 钢琴的父节点为架子鼓，这意味着Rama需要用架子鼓来换钢琴。因此你就沿着这一边。我们来看看需要沿哪些边前行。钢琴的父节点为架子鼓。

- 钢琴的父节点为架子鼓，这意味着Rama需要用架子鼓来换钢琴。因此你就沿着这一边。
- 我们来看看需要沿哪些边前行。钢琴的父节点为`架子鼓`。
- `架子鼓`的父节点为`黑胶唱片`。
- 因此Rama需要用黑胶唱片了换架子鼓。显然，他需要用`乐谱`来换`黑胶唱片`。通过沿父节点回溯，便得到了完整的交换路径。

<img align="left" src="figures/dijkstra9.png"><img align="left" src="figures/dijkstra10.png"><img align="left" src="figures/dijkstra11.png">
<img align="left" src="figures/dijkstra12.png">

<img align="left" src="figures/dijkstra13.png">

下面是Rama需要做的一系列交换。

本章前面使用的都是术语最短路径的字面意思：计算两点或两人之间的最短路径。但希望这
个示例让你明白：**最短路径指的并不一定是物理距离，也可能是让某种度量指标最小**。在这个示
例中，最短路径指的是Rama想要额外支付的费用最少。这都要归功于狄克斯特拉！


#### 如果有负权边，就不能使用狄克斯特拉算法。因为负权边会导致这种算法不管用。


在包含负权边的图中，要找出最短路径，可使用另一种算法——贝尔曼福德算法（Bellman-Fordalgorithm）。

# 实现

下面来看看如何使用代码来实现狄克斯特拉算法，这里以下面的图为例。

<img align="left" src="figures/dijkstra15.png"><img align="middle" src="figures/dijkstra14.png">

随着算法的进行，你将不断更新散列表costs和parents。首先，需要实现这个图，为此使用一个散列表。

In [2]:
graph = {}

graph["start"] = {}
graph["start"]["a"] = 6
graph["start"]["b"] = 2

graph["a"] = {}
graph["a"]["final"] = 1

graph["b"] = {}
graph["b"]["a"] = 3
graph["b"]["final"] = 5

graph["final"] = {}  # 终点没任何邻居

infinity = float("inf")

costs = {}
costs["a"] = 6
costs["b"] = 2
costs["final"] = infinity

parents = {}
parents["a"] = "start"
parents["b"] = "start"
parents["final"] = None

processed = []

In [3]:
print(graph)

{'start': {'a': 6, 'b': 2}, 'a': {'final': 1}, 'b': {'a': 3, 'final': 5}, 'final': {}}


In [9]:
def find_lowest_cost_node(costs):
    lowest_cost = float("inf")
    lowest_cost_node = None
    for node in costs:
        cost = costs[node]
        if cost < lowest_cost and node not in processed:
            lowest_cost = cost
            lowest_cost_node = node
        return lowest_cost_node
    
node = find_lowest_cost_node(costs)

while node is not None:
    cost = costs[node]
    neighbors = graph[node]
    for n in neighbors.keys():
        new_cost = cost + neighbors[n]
        if (costs[n] > new_cost):
            costs[n] = new_cost
            parents[n] = node
    
    processed.append(node)
    node = find_lowest_cost_node(costs)

In [10]:
print(node)

None


## 小结

- 广度优先搜索用于在非加权图中查找最短路径。
- 狄克斯特拉算法用于在加权图中查找最短路径。
- 仅当权重为正时狄克斯特拉算法才管用。
- 如果图中包含负权边，请使用贝尔曼福德算法。

## 对狄克斯特拉算法的理解

狄克斯特拉算法是一种实现了在有障碍物的两个地点之间找出一条最短路径的高效算法，解决了机器人学中的一个十分关键的问题，即运动路径规划问题，至今仍被广泛应用。是“贪婪算法（greedy method）”的一个成功范例。

### 使用狄克斯特拉算法

<img align="left" src="figures/狄克斯特拉0.png">

找出从起点到终点耗时最短的路径。其中，每个数字表示的都是时间，单位分钟。**线路使用有方向的箭头线路表示，表示只有一个方向可以使用，统称有向图。**

### 常规思路

为了找到从起点到终点耗时最短的路径，我们通常需要找出从起点到终点所有的路径，然后进行一一对比。

<img align="left" src="figures/狄克斯特拉1.png"><img align="left" src="figures/狄克斯特拉2.png">

<img align="left" src="figures/狄克斯特拉3.png">

- 路径一是从起点出发，经过 A 节点，到达终点，共计用时 $6 + 1 = 7$ 分钟


- 路径二是从起点出发，经过 B 节点，到达终点，共计用时 $2 + 5 = 7$ 分钟


- 路径三从起点出发，经过 B 节点，再经过 A 节点，到达终点，共计用时 $2 + 3 + 1 = 6$ 分钟



综上，我们已经穷举完了所有可能的路径，不可能再找出另外的路径了。同时，对比一下三种路径，你会发现路径三用时最短，只需要 6 分钟。呵呵，so easy，妈妈再也不用担心我的学习了。既然，人可以做出结果，那么计算机利用此种方法，也就是所谓的穷举法，当然也能找到最优路径。


不过，别得意，你的妈妈还得担心你的学习。如果路途中，不止 A、B 两个节点，而是接近无穷多个节点，记住是接近无穷多个节点，......懵逼从天空飘过。


**此时，肯定有同学会跳出来反对，无穷多个节点，这就是无限。无限，也就是无界，就是死循环的问题了，肯定无法得到答案，此题出得有问题。**

这个问题提得好，*`必须有界才能有答案`*，该问题是接近无限多，也就是个很大很大的边界，是超出了人力范围的边界。......懵逼继续从天空飘过。 但是，计算机肯定是能够计算出有界的问题的，利用穷举法当然可以算出，不过这里又产生一个问题，穷举法是检索每条可能的路径，这肯定会消耗很大的计算机运算能力，那么有没有更优的方法，至少不用穷举出所有路径的方法呢？当然，有那么多的牛人供我们致敬，答案是肯定的

## 狄克斯特拉算法思路

步骤或思路如下：

1. 找出最便宜的节点，即可在最短时间内前往的节点。
2. 对于该节点的所有邻居，检查是否有前往它们的更短路径，如果有，就更新其开销。
3. 处理过的节点，进行标记，以后将不再处理。
4. 重复以上过程，直到对图中的每个节点都这样做了。
5. 计算出最终路径。

**第一步**：找出最便宜的节点。你站在起点，不知道该前往节点 A 还是节点 B ，茫然无措ing........。此时，`散列表`可以派上用场了。

前往节点 A 需要6 分钟，而前往节点 B 需要 2 分钟。至于前往其它节点，你还不知道需要多长时间。那么散列表如下：

| 父节点 |节点   |耗时   |
|------------|---------------|---------------|
|起点|A|$6$|
|起点|B|$2$|
|起点|终点|$\infty$|

**第二步**：由于从起到到节点 B 的路径耗时少，先计算经节点 B 前往其各个邻居所需的时间。

| 父节点 |节点   |耗时   |
|------------|---------------|---------------|
|B|A|$5$ 更新耗时|
|-|B|$2$|
|B|终点|$7$ 更新耗时|

这一步，找到了一条前往节点 A 的更短路径！直接前往节点 A 需要 6 分钟。但是经过节点 B 前往节点 A 只需要 5 分钟。

对于节点 B 的邻居，如果找到前往它的更短路径，就更新其开销。

- 前往节点 A 的更短路径，时间从 6 分钟缩短到 5 分钟。
- 前往终点的更短路径，时间从无穷大缩短到 7 分钟。

**第三步**：对节点 B 已进行处理，所以要对节点 B 进行标记，以后将不再处理节点 B。

**第四部**： 重复！
- *重复第一步*：找出可在最短时间内前往的节点。除节点 B 之外，可以在最短时间内前往的节点是节点 A 
- *重复第二步*：更新节点 A 的所有邻居的开销。

| 父节点 |节点   |耗时   |
|------------|---------------|---------------|
|-|A|$5$   已经是最小耗时，无需更新|
|-|B|$2$|
|A|终点|$6$ 更新耗时|

现在对每个节点都运行了狄克斯特拉算法（无需对终点这样做）。现在，你知道：
- 前往节点 B 需要 2 分钟；
- 前往节点A 需要 5 分钟；
- 前往终点需要 6 分钟。

#### 所以你会发现，前往终点的时间为 6 分钟！！！

## Python代码实现

In [17]:
# 实现一个能够找出开销最低节点的函数
def find_lowest_cost_node(costs):
    lowest_cost = float("inf")     # 设置初始开销为无穷大，因为你现在很茫然
    lowest_cost_node = None       # 设置初始最低开销节点为 None
    for node in costs:            # 遍历所有的节点
        cost = costs[node]
        if cost < lowest_cost and node not in processed:
            lowest_cost = cost
            lowest_cost_node = node
    return lowest_cost_node
        


# 创建用于存储所有节点及其前往邻居开销的散列表代码

graph = {}

graph["start"] = {}
graph["start"]["a"] = 6
graph["start"]["b"] = 2

graph["a"] = {}
graph["a"]["final"] = 1

graph["b"] = {}
graph["b"]["a"] = 3
graph["b"]["final"] = 5

graph["final"] = {} # 终点没有任何邻居

表示整个图的散列表类似下面这样。

|parents|	node|	time(s)|
|---|---|---|
|start|	A	|6|
|start|	B	|2|
|A	|final	|1|
|B	|A	|3|
|B	|final|	5|
|start|final|	-|


In [18]:
# 创建从起点开始的开销表代码如下：
infinity = float("inf")
costs = {}
costs["a"] = 6
costs["b"] = 2
costs["final"] = infinity

# 创建存储父节点的hashtable如下：
parents = {}
parents["a"] = "start"
parents["b"] = "start"
parents["final"] = None

# 创建一个数组，用于记录处理过的节点，对于同一个节点，不用多次处理

processed = []

In [19]:
# 按照算法列出代码

node = find_lowest_cost_node(costs)   # 在未处理的节点中找出开销最小的节点

while node is None:                   # 这个 while 循环在所有节点都被处理过后结束
    cost = costs[node]
    neighbers = graph[node]
    for n in neighbors.keys():         # 遍历当前节点的所有邻居
        new_cost = cost + neighbors[n]
        if cost[n] > new_cost:          # 如果经当前节点前往该邻居最近，
            costs[n] = new_cost         # 就更新该邻居的开销
            parents[n] = node           # 同时将该邻居的父节点设置为当前节
    processed.append(node)              # 将当前节点标记为已处理
    node = find_lowest_cost_node(costs) # 找出接下来要处理的节点，并循环


In [33]:
%run dijkstra_algorithm

到达终点的最快到达的时间是6分钟
