# 第7章 狄克斯特拉算法（Dijkstra’s algorithm）

## 7.1 使用狄克斯特拉算法

狄克斯特拉算法包含4个步骤。
- (1) 找出“最便宜”的节点，即可在最短时间内到达的节点。
- (2) 对于该节点的邻居，检查是否有前往它们的更短路径，如果有，就更新其开销。
- (3) 重复这个过程，直到对图中的每个节点都这样做了。
- (4) 计算最终路径。

## 7.2 术语

狄克斯特拉算法用于每条边都有关联数字的图，这些数字称为权重（weight）。

带权重的图称为加权图（weighted graph），不带权重的图称为非加权图（unweighted graph）。

![](https://i.loli.net/2019/08/10/8yNcKRSelznPmki.png)

要计算非加权图中的最短路径，可使用**广度优先搜索**。要计算加权图中的最短路径，可使用**狄克斯特拉算法**。图还可能有环，意味着你可从一个节点出发，走一圈后又回到这个节点。每绕环一次，总权重都增加。因此，绕环的路径不可能是最短的路径。

无向图意味着两个节点彼此指向对方，其实就是环！

在无向图中，每条边都是一个环。狄克斯特拉算法只适用于**有向无环图（directed acyclicgraph，DAG）**。


## 7.3 换钢琴

这个图中的节点是大家愿意拿出来交换的东西，边的权重是交换时需要额外加多少钱。拿海报换吉他需要额外加30美元，拿黑胶唱片换吉他需要额外加15美元。Rama需要确定采用哪种路径将乐谱换成钢琴时需要支付的额外费用最少。

![](https://i.loli.net/2019/08/10/eT9ov3yuagpKfBP.png)

动手之前，你需要做些准备工作：创建一个表格，在其中列出每个节点的开销。这里的开销指的是达到节点需要额外支付多少钱。

![](https://i.loli.net/2019/08/10/bZ8eSDQVpxs7IC5.png)

在执行狄克斯特拉算法的过程中，你将不断更新这个表。为计算最终路径，还需在这个表中添加表示父节点的列。

![](https://i.loli.net/2019/08/10/vBx1zX52gJdIqRs.png)

**第一步：找出最便宜的节点。**在这里，换海报最便宜，不需要支付额外的费用。还有更便宜的换海报的途径吗？这一点非常重要，你一定要想一想。Rama能够通过一系列交换得到海报，还能额外得到钱吗？想清楚后接着往下读。答案是不能，因为海报是Rama能够到达的最便宜的节点，没法再便宜了。

狄克斯特拉算法背后的关键理念：找出图中最便宜的节点，并确保没有到该节点的便宜的路径！

**第二步：计算前往该节点的各个邻居的开销。**

![](https://i.loli.net/2019/08/10/z7dQjI29fLxctMa.png)

**再次执行第一步**：下一个最便宜的节点是黑胶唱片——需要额外支付5美元。

**再次执行第二步**：更新黑胶唱片的各个邻居的开销。

![](https://i.loli.net/2019/08/10/nT17dwOJ2GFvLqu.png)

你更新了架子鼓和吉他的开销！这意味着经“黑胶唱片”前往“架子鼓”和“吉他”的开销更低，因此你将这些乐器的父节点改为黑胶唱片。

下一个最便宜的是吉他，因此更新其邻居的开销。

![](https://i.loli.net/2019/08/10/VNE4nP31kqGFz6K.png)

最后，对最后一个节点——架子鼓，做同样的处理。

![](https://i.loli.net/2019/08/10/QLaB4k57TVxAweK.png)

如果用架子鼓换钢琴，Rama需要额外支付的费用更少。因此，采用最便宜的交换路径时，Rama需要额外支付35美元。

**确定最终的路径:**

钢琴的父节点为架子鼓、架子鼓的父节点为黑胶唱片、黑胶唱片的父节点为乐谱（即起点）。

最终路径如下：

![](https://i.loli.net/2019/08/10/QKYAtLu4ijvIVkn.png)

本章前面使用的都是术语最短路径的字面意思：计算两点或两人之间的最短路径。但希望这个示例让你明白：最短路径指的并不一定是物理距离，也可能是让某种度量指标最小。在这个示例中，最短路径指的是Rama想要额外支付的费用最少。这都要归功于狄克斯特拉！

## 7.4 负权边

![](https://i.loli.net/2019/08/10/LEinclohOPkba3C.png)

第二种方式的开销少2美元，他应采取这种方式。然而，如果你对这个图运行狄克斯特拉算法，Rama将选择错误的路径——更长的那条路径。如果有负权边，就不能使用狄克斯特拉算法。因为负权边会导致这种算法不管用。

换得架子鼓的开销为35美元。你知道有一种交换方式只需33美元，但狄克斯特拉算法没有找到。

这是因为狄克斯特拉算法这样假设：**对于处理过的海报节点，没有前往该节点的更短路径**。这种假设仅在没有负权边时才成立。因此，**不能将狄克斯特拉算法用于包含负权边的图**。

在包含负权边的图中，要找出最短路径，可使用另一种算法——**贝尔曼-福德算法（Bellman-Fordalgorithm）**。本书不介绍这种算法，你可以在网上找到其详尽的说明。

## 7.5 实现

![](https://i.loli.net/2019/08/10/69h3YwnzCNI1AmO.png)

要编写解决这个问题的代码，需要三个散列表。

![](https://i.loli.net/2019/08/10/SdBOYWMT1FUKc7l.png)

随着算法的进行，你将不断更新散列表costs和parents。首先，需要实现这个图，为此可像第6章那样使用一个散列表。

但这里需要同时存储邻居和前往邻居的开销。例如，起点有两个邻居——A和B。使用另一个散列表表示权重：

In [1]:
graph = {}
graph["start"] = {}
graph["start"]["a"] = 6
graph["start"]["b"] = 2

因此 graph["start"] 是一个散列表。要获取起点的所有邻居，可像下面这样做。

In [2]:
print(graph["start"].keys())

dict_keys(['a', 'b'])


获取边的权重：

In [3]:
print(graph["start"]["a"])
print(graph["start"]["b"])

6
2


添加其他节点及其邻居

In [5]:
graph["a"] = {}
graph["a"]["fin"] = 1

graph["b"] = {}
graph["b"]["a"] = 3
graph["b"]["fin"] = 5

graph["fin"] = {} #终点没有任何邻居

In [6]:
graph

{'a': {'fin': 1},
 'b': {'a': 3, 'fin': 5},
 'fin': {},
 'start': {'a': 6, 'b': 2}}

**创建散列表来存储每个节点的开销**，节点的开销指的是从起点出发前往该节点需要多长时间。

你知道的，从起点到节点B需要2分钟，从起点到节点A需要6分钟（但你可能会找到所需时间更短的路径）。你不知道到终点需要多长时间。对于还不知道的开销，你将其设置为无穷大。在Python中能够表示无穷大吗？你可以这样做：

In [9]:
infinity = float("inf")

costs = {}
costs["a"] = 6
costs["b"] = 2
costs["fin"] = infinity

**存储父节点的散列表**

In [10]:
parents = {}
parents["a"] = "start"
parents["b"] = "start"
parents["fin"] = None

最后，你需要一个数组，用于记录处理过的节点，因为对于同一个节点，你不用处理多次。

In [11]:
processed = []

准备工作做好了，下面来看看算法:

![](https://i.loli.net/2019/08/10/I8BFtcYuAoExC6S.png)

In [13]:
def find_lowest_cost_node(costs,processed):
    lowest_cost = float("inf")
    lowest_cost_node = None
    for node in costs:
        cost = costs[node]
        if cost < lowest_cost and node not in processed:
            lowest_cost = cost
            lowest_cost_node = node
    return lowest_cost_node

node = find_lowest_cost_node(costs,processed) #在未处理的节点中找出开销最小的节点
while node is not None: #这个 while 循环在所有节点都被处理过后结束
    cost = costs[node]
    neighbors = graph[node]
    for n in neighbors.keys(): #遍历当前节点的所有邻居
        new_cost = cost + neighbors[n]
        if costs[n] > new_cost: #如果经当前节点前往该邻居更近，
            costs[n] = new_cost #就更新该邻居的开销
            parents[n] = node #同时将该邻居的父节点设置为当前节点
    processed.append(node) #将当前节点标记为处理过
    node = find_lowest_cost_node(costs,processed) #找出接下来要处理的节点，并循环

最短路径值与最短路径：

In [19]:
costs["fin"]

6

In [24]:
a = "fin"
while a != "start":
    print(a)
    a = parents[a]
print("start")

fin
a
b
start


In [27]:
print(parents)
print(costs)

{'a': 'b', 'b': 'start', 'fin': 'a'}
{'a': 5, 'b': 2, 'fin': 6}


### 整合代码

In [15]:
# 构建图散列表graph，一共四个节点：start a b fin
graph = {}
graph["start"] = {}
graph["start"]["a"] = 6
graph["start"]["b"] = 2
graph["a"] = {}
graph["a"]["fin"] = 1
graph["b"] = {}
graph["b"]["a"] = 3
graph["b"]["fin"] = 5
graph["fin"] = {} #终点没有任何邻居

# 构建节点开销散列表costs
infinity = float("inf")
costs = {}
costs["a"] = 6
costs["b"] = 2
costs["fin"] = infinity

#构建父节点散列表parents
parents = {}
parents["a"] = "start"
parents["b"] = "start"
parents["fin"] = None

In [15]:
#在未处理的节点中找出开销最小的节点
def find_lowest_cost_node(costs,processed):
    lowest_cost = float("inf")
    lowest_cost_node = None
    for node in costs:
        cost = costs[node]
        if cost < lowest_cost and node not in processed:
            lowest_cost = cost
            lowest_cost_node = node
    return lowest_cost_node

def dijkstra_algo(graph,costs,parents):
    
    #用于保存处理过的节点
    processed = []
    
    node = find_lowest_cost_node(costs,processed) 
    while node is not None: #这个 while 循环在所有节点都被处理过后结束
        cost = costs[node]
        neighbors = graph[node]
        for n in neighbors.keys(): #遍历当前节点的所有邻居
            new_cost = cost + neighbors[n]
            if costs[n] > new_cost: #如果经当前节点前往该邻居更近，
                costs[n] = new_cost #就更新该邻居的开销
                parents[n] = node #同时将该邻居的父节点设置为当前节点
        processed.append(node) #将当前节点标记为处理过
        node = find_lowest_cost_node(costs,processed) #找出接下来要处理的节点，并循环
    return costs,parents

# 输出最短路径值和路径
def print_shortest_path(costs,parents,start_node,final_node):
    print("最短路径：",costs[final_node])
    print("最短路径为：")
    curr_node = final_node
    while curr_node != start_node:
        print(curr_node)
        curr_node = parents[curr_node]
    print(start_node)

costs,parents = dijkstra_algo(graph,costs,parents)
print_shortest_path(costs,parents,'start','fin')

最短路径 6
最短路径为：
fin
a
b
start


## 7.6 小结

- 广度优先搜索用于在非加权图中查找最短路径。
- 狄克斯特拉算法用于在加权图中查找最短路径。
- 仅当权重为正时狄克斯特拉算法才管用。
- 如果图中包含负权边，请使用贝尔曼-福德算法。

**练习**

在下面的各个图中，从起点到终点的最短路径的总权重分别是多少？

![](https://i.loli.net/2019/08/10/DawKcm1xYPek64N.png)

**A题:** 记中间四个节点为a,b,c,d

![](https://i.loli.net/2019/08/11/C9sBfWXPD4E8Sto.png)

In [17]:
graph = {}
graph['start']  = {}
graph['start']['a'] = 5
graph['start']['b'] = 2
graph['a'] = {}
graph['a']['c'] = 4
graph['a']['d'] = 2
graph['b'] = {}
graph['b']['a'] = 8
graph['b']['d'] = 7
graph['c'] = {}
graph['c']['d'] = 6
graph['c']['fin'] = 3
graph['d'] = {}
graph['d']['fin'] = 1
graph['fin'] = {}

In [10]:
graph

{'a': {'c': 4, 'd': 2},
 'b': {'a': 8, 'd': 7},
 'c': {'d': 6, 'fin': 3},
 'd': {'fin': 1},
 'fin': {},
 'start': {'a': 5, 'b': 2}}

In [18]:
infinity = float("inf")
costs = {}
costs['a'] = 5
costs['b'] = 2
costs['c'] = infinity
costs['d'] = infinity
costs['fin'] = infinity

In [19]:
parents = {}
parents['a'] = 'start'
parents['b'] = 'start'
parents['c'] = None
parents['d'] = None
parents['fin'] = None

In [20]:
costs,parents = dijkstra_algo(graph,costs,parents)
print_shortest_path(costs,parents,'start','fin')

最短路径 8
最短路径为：
fin
d
a
start
