# 狄克斯特拉算法
## 狄克斯特拉算法和广度优先算法的区别
* 广度优先算法
    + 图：由node（节点）和边（edge）组成
    + BFS从距离搜索起始点最近的几个node开始搜索。如果不符合条件，则删除该node并append其相邻node在队列末尾；如果符合条件，则停止退出。
    + 这样可以保证搜索到的结果是花费最少步数实现的
        - 假设图是N个同心圆，先搜索一圈层，如果没找到则在一圈层连接的最近圈层，二圈层里找……直至所有圈层搜索完毕
* 狄克斯特拉算法
    + 与BFS最大的区别是，BFS每一步是等权重的，而狄克斯特拉每一步的权重不同
    + 狄克斯特拉要寻找的是到达目标花费总权重最小的路线
## 加权图（weighted graph）, 有向无环图（directed acyclic graph, DAG）
* BFS适用于无加权图，即搜索的每一步等权；狄克斯特拉适用于加权图，即每一步权重不相同
* 狄克斯特拉算法只适用于有向无环图（directed acyclic graph, DAG）
## 狄克斯特拉算法的四个步骤
### 说明
* 以下四步法中的说明：
    + 字母表示node节点名称，数字表示距离初始点的步数
        - 如：A1表示距离起始点只有一步的A节点，C2表示距离起始点有2步的C节点
    + weight()表示两点之间的边（edge）的权重
        - 如：weight（A1）=2，表示起始点距离A1权重为2；weight（B1, D2）=5，表示两点之间权重为5
### 第一步
* 找出“最便宜”的节点，即可在最短时间内到达的节点。
    + weight(A1)=2, weight(B1)=4
        - 距离起始点最近的为A1点，权重为2
### 第二步
* 更新该节点的邻居的开销，其含义将稍后介绍。
    + weight(A1,C2)=4, weight(A1,D2)=5
        - 更新从父节点A1到二圈层两个点C2, D2的距离加总，分别为
            * 到C2权重合计：2+4=6
            * 到D2权重合计：2+7=7
        - 得到总权重，并记录其最优父节点
            * 目前已知的C2、D2的最优父节点均为A1
### 第三步
* 重复这个过程，直到对图中的每个节点都这样做了。
    + 对一圈层的B1节点重复上述第一步、第二部过程
        - 更新得到从父节点B1到二圈层两个点C2, D2的距离加总，分别为
            * 到C2权重合计：4+1=5
            * 到D2权重合计：4+5=9
        - 得到总权重，并记录其最优父节点
            * 到C2的最优父节点均为B1，总权重为5
            * 到D2的最优父节点均为A1，总权重为7
### 第四步
* 计算最终路径。
## 不能将狄克斯特拉算法用于包含负权边的图。
* 在包含负权边的图中，要找出最短路径，可使用另一种算法——贝尔曼-福德算法（Bellman-Ford algorithm）

In [1]:
# 相连两点之间的距离
graph = {}
graph['start'] = {}
graph['start']['a'] = 6  # 起点到a距离为6
graph['start']['b'] = 2
print(graph['start'].keys())

dict_keys(['a', 'b'])


In [8]:
graph['a'] = {}
graph['a']['fin'] = 1

graph['b'] = {}
graph['b']['a'] = 3
graph['b']['fin'] = 5

graph['fin'] = {}

graph

{'start': {'a': 6, 'b': 2},
 'a': {'fin': 1},
 'b': {'a': 3, 'fin': 5},
 'fin': {}}

In [9]:
# 存储每个节点的开销
costs = {}
costs['a'] = 6
costs['b'] = 2
costs['fin'] = float("inf")
costs

{'a': 6, 'b': 2, 'fin': inf}

In [10]:
# 每个节点的父节点
parents = {}
parents['a'] = 'start'
parents['b'] = 'start'
parents['fin'] = None
processed = []
parents

{'a': 'start', 'b': 'start', 'fin': None}

In [5]:
def find_lowest_cost_node(costs):
    lowest_cost = float("inf")  # 前往终点的最低开销先默认为无限大
    lowest_cost_node = None
    processed = []
    for node in costs:  # 遍历所有节点
        cost = costs[node]
        # 如果当前节点的开销更低且未处理过
        if cost < lowest_cost and node not in processed:
            lowest_cost = cost  # 就将其视为开销最低的点
            low_cost_node = node
    return lowest_cost_node

In [6]:
# 在未处理的节点中找出开销最小的节点
node=find_lowest_cost_node(costs)
print(node)

None


In [7]:
while node is not None:  # 这个while循环在所有节点都被处理过后结束
    cost = costs[node]
    neighbors = graph[node]
    for n in neighbors.keys():  # 遍历当前节点的所有邻居
        new_cost = neighbors[n] + cost
        if costs[n] > new_cost:  # 如果经当前节点前往前往该邻居更近
            costs[n] = new_cost  # 就更新该邻居的开销
            parents[n] = node  # 同时将该邻居的父节点设置为当前节点
    processed.append(node)  # 将当前节点标记为处理过
    node = find_lowest_cost_node(costs)  # 找出接下来要处理的节点，并循环
print(costs)

{'a': 6, 'b': 2, 'fin': inf}
