# 图与图的遍历算法_Graph_and_Graph_Algorithms

### 有向图的表示

![](../Readmefile/digraph.png)

### 邻接矩阵

![](../Readmefile/adjMat-1553007345454.png)

对于n个点，构造一个n * n 的矩阵，如果有从i到j的边，就将矩阵的位置matrix[i][j]置为1或权重值。适合在边的数量非常大时存储图。

优点：简单易理解，很容易找到邻接的顶点。

缺点：存储稀疏数据时空间的利用率低下。

### 邻接表

![](../Readmefile/adjlist.png)

将图中的点放到一个线性表中，对于每一个点将它的邻居放到一个链接到点对象本身的链表里。

体重使用字典代替了链表。存放点对象的线性表也使用字典实现。

用邻接表可以紧凑的表示稀疏数据，同时很容易的找到所有的与特定顶点直接相连的点。

## 使用邻接表实现图的ADT
创建`Graph`类表示存放顶点的主表，创建`Vertex`类表示图中的每一个顶点。

### 实现Vertex类
每个Vertex对象使用一个字典`connectedTo`来保存与之连接的其他节点（名称），以及每条边的权重。

在类的构造方法中，直接初始化id（key字符串）以及邻接字典。

`addNeighbor` 方法用来向顶点添加一个邻接的顶点。`getConnections`方法返回顶点的邻接字典中的所有对象（通过`connectedTo`来表示）`getWeight`返回本顶点与作为参数传入的另一个顶点之间边的权重值。

代码实现：

In [None]:
class Vertex:
    """图中点类定义"""
    def __init__(self, key):
        """
        在类的构造方法中，直接初始化id（key字符串）以及邻接字典。
        """
        self.id = key
        self.connectedTo = {}

    def addNeighbor(self, nbr, weight=0):
        """
        添加邻接顶点，将邻接顶点对象以及相连边的权重作为参数传入
        """
        self.connectedTo[nbr] = weight

    def __str__(self):
        '''默认的输出方法'''
        return str(self.id) + ' connectedTo: ' + str([x.id for x in self.connectedTo])

    def getConnections(self):
        """
        返回顶点的所有邻接顶点（的key），注意此返回结果为生成器
        """
        return self.connectedTo.keys()

    def getId(self):
        '''获取id（就是key字符串）'''
        return self.id

    def getWight(self, nbr):
        """
        通过邻接顶点对象在邻接字典中获取权重值
        """
        return self.connectedTo[nbr]

### 实现Graph类
`Graph`类包含一个字典用来映射顶点名称与顶点对象，还提供了`添加顶点`以及`连接两个顶点`的方法。在构造方法中初始化字典以及表示顶点个数的属性。

`getVertices` 方法返回字典中所有的顶点的名称。__iter__方法遍历字典中的所有顶点对象。

In [None]:
class Graph:
    def __init__(self):
        """
        在构造方法中初始化字典以及表示顶点个数的属性。
        """
        self.vertList = {}
        self.numVertics = 0

    def addVertex(self, key):
        """
        构造并添加顶点到图中
        """
        self.numVertics += 1
        newVertex = Vertex(key)
        self.vertList[key] = newVertex
        return newVertex

    def getVertex(self, key):
        """
        通过顶点key获取顶点对象，不存在返回None
        """
        if key in self.vertList:
            return self.vertList[key]
        else:
            return None

    def __contains__(self, key):
        return key in self.vertList

    def addEdge(self, start, end, wight=0):
        """
        添加从start顶点到end顶点的边并设置权重，若顶点在图中不存在则创建顶点并加入图中
        """
        if start not in self.vertList:
            nv = self.addVertex(start)
        if end not in self.vertList:
            nv = self.addVertex(end)
        self.vertList[start].addNeighbor(self.vertList[end], wight)

    def getVertices(self):
        '''方法返回字典中所有的顶点的名称。'''
        return self.vertList.keys()

    def __iter__(self):
        '''遍历字典中的所有顶点对象。'''
        return iter(self.vertList.values())

##  使用邻接表实现图的ADT以及测试方法

In [None]:
class Vertex:
    def __init__(self, key):
        """在类的构造方法中，直接初始化id（key字符串）以及邻接字典。"""
        self.id = key
        self.connectedTo = {}

    def addNeighbor(self, nbr, weight=0):
        """添加邻接顶点，将邻接顶点对象以及相连边的权重作为参数传入"""
        self.connectedTo[nbr] = weight

    def __str__(self):
        return str(self.id) + ' connectedTo: ' + str([x.id for x in self.connectedTo])

    def getConnections(self):
        """返回顶点的所有邻接顶点（的key），注意此返回结果为生成器"""
        return self.connectedTo.keys()

    def getId(self):
        return self.id

    def getWight(self, nbr):
        """通过邻接顶点对象在邻接字典中获取权重值"""
        return self.connectedTo[nbr]


class Graph:
    def __init__(self):
        """在构造方法中初始化字典以及表示顶点个数的属性。"""
        self.vertList = {}
        self.numVertics = 0

    def addVertex(self, key):
        """构造并添加顶点到图中"""
        self.numVertics += 1
        newVertex = Vertex(key)
        self.vertList[key] = newVertex
        return newVertex

    def getVertex(self, key):
        """通过顶点key获取顶点对象，不存在返回None"""
        if key in self.vertList:
            return self.vertList[key]
        else:
            return None

    def __contains__(self, key):
        return key in self.vertList

    def addEdge(self, start, end, wight=0):
        """添加从start顶点到end顶点的边并设置权重，若顶点在图中不存在则创建顶点并加入图中"""
        if start not in self.vertList:
            nv = self.addVertex(start)
        if end not in self.vertList:
            nv = self.addVertex(end)
        self.vertList[start].addNeighbor(self.vertList[end], wight)

    def getVertices(self):
        return self.vertList.keys()

    def __iter__(self):
        return iter(self.vertList.values())


def test_graph():
    g = Graph()
    for i in range(6):
        g.addVertex(i)

    assert len(g.vertList) == 6
    g.addEdge(0, 1, 5)
    g.addEdge(0, 5, 2)
    g.addEdge(1, 2, 4)
    g.addEdge(2, 3, 9)
    g.addEdge(3, 4, 7)
    g.addEdge(3, 5, 3)
    g.addEdge(4, 0, 1)
    g.addEdge(5, 4, 8)
    g.addEdge(5, 2, 1)

    for v in g:
        for w in v.getConnections():
            print("( %s , %s )" % (v.getId(), w.getId()))

## 2、图的遍历

### 2.1 图的广度优先搜索（BFS）
在无权图中搜索两点之间的最短路径（即途径的边数最少）。

算法思路：
- 1、构建队列，从将第一个节点的key放入到队列，创建一个空集合来保存访问过的节点。
- 2、从队列中pop节点，检查节点是否在集合中。
- 3、如果节点不在集合中，访问该节点并将其加入到已访问的集合中，并依次将该节点的邻居节点push入队列。
- 4、重复2-3步，直到队列为空。

代码实现：

In [None]:
from collections import deque


class Queue(object):
    def __init__(self):
        self._deque = deque()

    def __len__(self):
        return len(self._deque)

    def push(self, value):
        return self._deque.append(value)

    def pop(self):
        return self._deque.popleft()


graph = {
    'A': ['B', 'F'],
    'B': ['C', 'I', 'G'],
    'C': ['B', 'I', 'D'],
    'D': ['C', 'I', 'G', 'H', 'E'],
    'E': ['D', 'H', 'F'],
    'F': ['A', 'G', 'E'],
    'G': ['B', 'F', 'H', 'D'],
    'H': ['G', 'D', 'E'],
    'I': ['B', 'C', 'D'],
}


def BFS(graph, start):
    search_queue = Queue()
    searched = set()
    search_queue.push(start)
    while search_queue:
        cur_node = search_queue.pop()
        if cur_node not in searched:
            print(cur_node)  # or yield cur_node
            searched.add(cur_node)
            for node in graph[cur_node]:
                search_queue.push(node)


BFS(graph, 'A')

### 2.1 图的深度优先搜索（DFS）
每遇到一个节点，如果没有被访问过，就直接去访问它的邻居节点，不断加深。

下面是递归实现：DFS_recursive和堆栈实现（思路类似于使用队列实现BFS）:DFS

In [None]:
from collections import deque


class Stack:
    def __init__(self):
        self._deque = deque()

    def push(self, value):
        return self._deque.append(value)

    def pop(self):
        return self._deque.pop()

    def __len__(self):
        return len(self._deque)

    def is_empty(self):
        return len(self._deque) == 0


graph = {
    'A': ['B', 'F'],
    'B': ['C', 'I', 'G'],
    'C': ['B', 'I', 'D'],
    'D': ['C', 'I', 'G', 'H', 'E'],
    'E': ['D', 'H', 'F'],
    'F': ['A', 'G', 'E'],
    'G': ['B', 'F', 'H', 'D'],
    'H': ['G', 'D', 'E'],
    'I': ['B', 'C', 'D'],
}


DFS_searched = set()


def DFS_recursive(graph, start):
    if start not in DFS_searched:
        print(start)
        DFS_searched.add(start)
    for node in graph[start]:
        if node not in DFS_searched:
            DFS_recursive(graph, node)


print('dfs recursive:')
DFS_recursive(graph, 'A')


def DFS(graph, start):
    s = Stack()
    s.push(start)
    searched = set()
    while not s.is_empty():
        cur_node = s.pop()
        if cur_node not in searched:
            print(cur_node)
            searched.add(cur_node)
            for node in reversed(graph[cur_node]):  # 注意入栈出栈的顺序
                s.push(node)


print('dfs use stack:')
DFS(graph, 'A')

**对于不连通的图如何实现DFS：** 对所有的顶点调用DFS(),并在调用前检查未被搜索过才执行。

## 3、图的拓扑排序（topological_sorting.py）

定义：将**有向无环图（DAG）** 中的顶点以线性的方式进行排序。对于任何连接自顶点u到顶点v的有向边uv，在最后的排序结果中，顶点u总是在顶点v的前面。

一个图的拓扑排序可以看成是图中所有顶点沿着水平线排序而成的一个序列,使得所有的有向边均从左指向右边。拓扑排序不同于通常意义上的排序。

### 实际问题
拓扑排序通常用来“排序”具有依赖关系的任务。

比如，如果使用一个DAG图来表示一个工程，其中每个顶点表示工程的一个任务，用有向边表示在做任务之前必须先完成任务A。故在这个工程中，任意的两个任务要么具有确定的先后关系，要么是没有关系，绝对不存在相互矛盾的关系（即环路）。

#### **算法思想**：

借助深度优先遍历来实现拓扑排序。这个时候需要使用到栈结构来记录拓扑排序的结果。

执行过程中需要考虑图中含有不连通的顶点，因此应当尝试对所有的顶点进行深度优先遍历（但是在执行前检查是否被搜索过）。
>```python
L ← Empty list that will contain the sorted nodes
S ← Set of all nodes with no outgoing edges
for each node n in S do
    visit(n) 
function visit(node n)
    if n has not been visited yet then
        mark n as visited
        for each node m with an edgefrom m to ndo
            visit(m)
        add n to L
```

时间复杂度同DFS一致，为O（E+V）。

代码实现：

In [None]:
s = Stack()
searched = set()
for node in graph: # 考虑图中含有不连通的顶点
    topologicalSort(graph, node)
def topologicalSort(graph, start):
    if start not in searched:
        searched.add(start)
    for node in graph[start]:
        if node not in searched:
            DFS_recursive(graph, node)
        s.push(node)

添加顶点到堆栈中的时机就是在dfs方法即将推出之时，而dfs方法本身是个递归的方法，只要当前的顶点还存在边指向其他任何顶点，它就会调用dfs方法，而不会退出。因此，退出dfs()方法，意味着当前顶点没有指向其他的顶点的边了，即当前顶点是一条路径上的最后一个顶点。

最后逐个弹出堆栈中的顶点，即可得到线性排序的结果。

### 实现和测试代码：

In [None]:
# Python program to print topological sorting of a DAG
from collections import defaultdict


# Class to represent a graph
class Graph:
    def __init__(self, vertices):
        self.graph = defaultdict(list)  # dictionary containing adjacency List
        self.V = vertices  # No. of vertices

    # function to add an edge to graph
    def addEdge(self, u, v):
        self.graph[u].append(v)

    # A recursive function used by topologicalSort
    def topologicalSortUtil(self, v, visited, stack):

        # Mark the current node as visited.
        visited[v] = True

        # Recur for all the vertices adjacent to this vertex
        for i in self.graph[v]:
            if visited[i] == False:
                self.topologicalSortUtil(i, visited, stack)

        # Push current vertex to stack which stores result
        stack.insert(0, v)

    # The function to do Topological Sort. It uses recursive
    # topologicalSortUtil()
    def topologicalSort(self):
        # Mark all the vertices as not visited
        visited = [False] * self.V
        stack = []

        # Call the recursive helper function to store Topological
        # Sort starting from all vertices one by one
        for i in range(self.V):
            if visited[i] == False:
                self.topologicalSortUtil(i, visited, stack)

        # Print contents of the stack
        print(stack)


g = Graph(6)
g.addEdge(5, 2)
g.addEdge(5, 0)
g.addEdge(4, 0)
g.addEdge(4, 1)
g.addEdge(2, 3)
g.addEdge(3, 1)

print("Following is a Topological Sort of the given graph")
g.topologicalSort()
# This code is contributed by Neelam Yadav

## 4、最短路径问题与 Dijkstra 算法

### 4.1 Dijkstra算法的理解：（Dijkstra's_bad.py）

### 单源最短路径

![](../Readmefile/routeGraph.png)

显示问题：在网络的不同的路由节点中，寻找传输最快的路径。

抽象为在图中寻找权重值weight之和最小的路径，当所有的边的权重值相等时即为无权图，应使用广度优先搜索最近的顶点。

#### Dijkstra算法
“Dijkstra”算法是一种迭代算法，用来提供从一个确定的开始节点到所有的图中的其他节点的最短路径，这与广度优先搜索的结果很类似。

关键理念是找出图中最便宜的节点，并确定没有到该节点的更便宜的路径。

##### 适用范围
Dijkstra算法只适用于有向无环图。加权的有向图和无向图都可以适用Dijkstra算法。

但是如果有负权边，不能使用Dijkstra算法。

##### 主要思路
- 1、找出最便宜的节点，即可在最短的时间内前往的节点。
- 2、对于该节点的邻居，检查是否有前往他们的更短路径，如果有，更新其开销。
- 3、重复这个过程，直达对图中的每个节点都这样做了。
- 4、计算最终的路径。

##### 基础理解
找出最便宜的节点：
- 1、首先将最小开销设置为无穷大，将最小开销节点设置为None。
- 2、遍历开销表中的所有几点，如果该节点未被处理过且开销小于最小开销，就将其视为开销最低的节点，从而找出开销表未处理的节点中开销最小的节点。
- 3、返回开销最小的节点。

算法所需要的数据结构：
- 使用一个散列表保存所有的节点以及邻居的节点。
- 使用一个散列表保存每个节点的开销，即从起始点出发到该节点的权重值之和，初始值为无限大。
- 使用一个散列表保存每个节点的父节点。
- 使用一个集合来记录处理过的节点，每个节点只需要处理以此。

##### 进阶理解
- 将图中所有的顶点分成两个集合，一个位已确定的最短路径的顶点集合U（初始为出发顶点），一个为未确定最短路径的顶点集合S（与出发顶点有直接边相连的最短路径为相连边的权重值，其余顶点的最短路径为无穷大）
- 从S中取出在集合中当前最短路径长度最小的顶点，求出其邻居节点的最短路径（当前节点最短路径+相邻边的权重值），若该最短路径小于邻居节点当前的最短路径，则在集合S中进行更新。
- 将此节点加入到集合U中，集合U的节点的最短路径长度必为最终的最短路径（即最短），因此不会再被更新。继续从集合S中取出节点重复此步骤，直到所有的顶点都包含在集合U中。

考虑的因素：节点Node，是否已确认最短的路径Known，最短路径长度Cost（确认之后不再变化），父节点Parent（用来计算最终路径）

使用最小堆实现优先级队列来保存未确认最短路径的顶点。

###  4.2 下面是基础理解实现和进阶理解简单实现的代码

In [3]:
"""
本解法只适用于有向无环图（针对算法的理解）
仅用于理解算法思想，时间复杂度和空间复杂度都很辣鸡
"""

graph = {
    'A': {'B': 6, 'C': 2},
    'B': {'D': 1},
    'C': {'B': 3, 'D': 5},
    'D': {},
}

costs = {
    'B': 6,
    'C': 2,
    'D': float('inf')
}

parents = {
    'B': 'A',
    'C': 'A',
    'D': None
}

processed = set()


def find_lowest_cost_node(costs):
    """
    遍历所有节点，找出未处理过的节点中开销最小的节点
    :param costs:
    :return:
    """
    lowest_cost = float('inf')
    lowest_cost_node = None
    for node in costs:  # 遍历所有节点
        cost = costs[node]
        if cost < lowest_cost and node not in processed:  # 比较开销，找出最小开销节点
            lowest_cost = cost
            lowest_cost_node = node
    return lowest_cost_node

node = find_lowest_cost_node(costs)  # 在未处理的节点中找到开销最小的节点
while node is not None:
    cost = costs[node]
    neighbors = graph[node]
    for n in neighbors.keys():  # 遍历当前节点的所有邻居
        new_cost = cost + neighbors[n]
        if new_cost < costs[n]: # 如果经当前节点前往该邻居更近
            costs[n] = new_cost  # 更新该邻居的开销
            parents[n] = node  # 同时更新该邻居的父亲节点为当前节点
    processed.add(node)  # 将当前节点标记为处理过
    node = find_lowest_cost_node(costs)  # 找出接下来要处理的节点，并循环

print(parents.items())

dict_items([('B', 'C'), ('C', 'A'), ('D', 'B')])


###  简单实现（Dijkstra_dict.py）

使用快排或遍历等方法获取未确定最短路径顶点中当前距离最小的顶点。

In [1]:
graph = {
    'B': {'A': 5, 'D': 1, 'G': 2},
    'A': {'B': 5, 'D': 3, 'E': 12, 'F' :5},
    'D': {'B': 1, 'G': 1, 'E': 1, 'A': 3},
    'G': {'B': 2, 'D': 1, 'C': 2},
    'C': {'G': 2, 'E': 1, 'F': 16},
    'E': {'A': 12, 'D': 1, 'C': 1, 'F': 2},
    'F': {'A': 5, 'E': 2, 'C': 16}}

def dijkstra(graph, start):
    unvisted = {node:float('inf') for node in graph}
    visited = {}
    current = start
    currentDistance = 0
    unvisted[current] = currentDistance

    while True:
        for neighbor, weight in graph[current].items():
            if neighbor not in unvisted:
                continue
            newDistance = currentDistance + weight
            if newDistance < unvisted[neighbor]:
                unvisted[neighbor] = newDistance
        # 将当前节点及确定的最短距离加入已确定最短距离集合，并从原集合中删除
        visited[current] = currentDistance
        del unvisted[current]
        if not unvisted:
            break
        # 若未遍历的节点集合未空，从中选出当前距离最小的节点
        candidates = [node for node in unvisted.items()]
        current, currentDistance = sorted(candidates, key=lambda x: x[1])[0]
    return visited

visited = dijkstra(graph, 'A')
print(visited)

{'A': 0, 'D': 3, 'B': 4, 'G': 4, 'E': 4, 'C': 5, 'F': 5}


时间复杂度为O(n^2^).

### 4.3  进阶实现（Dijkstra_dict.py）
(dijkstra)

使用优先级队列作为未确定最短距离的顶点的集合，以降低算法的时间复杂度。

In [1]:
import heapq
import itertools


class PriorityQueue(object):
    REMOVED = '<removed-task>'  # 被删除任务的占位字符

    def __init__(self):
        self.pq = []  # 初始化heapq所使用的list
        self.entry_finder = {}  # 任务到优先级条目的映射
        self.counter = itertools.count()  # 唯一计数器

    def add_task(self, task, priority=0):
        """添加一个新任务或者更新一个已存在任务的优先级"""
        if task in self.entry_finder:
            self.remove_task(task)
        count = next(self.counter)
        entry = [priority, count, task]
        self.entry_finder[task] = entry
        heapq.heappush(self.pq, entry)

    def remove_task(self, task):
        """将一个已存在的任务标记为REMOVED，若未找到Raise KeyError。"""
        entry = self.entry_finder.pop(task)
        entry[-1] = PriorityQueue.REMOVED

    def pop_task(self):
        """删除并返回最小优先级任务，如果队列已空Raise KeyError"""
        while self.pq:  # 循环直到弹出值不为REMOVED的task才返回
            priority, count, task = heapq.heappop(self.pq)
            if task is not PriorityQueue.REMOVED:
                del self.entry_finder[task]
                return task
        raise KeyError('pop from an empty priority queue')

    def is_empty(self):
        return len(self.entry_finder) == 0


class Vertex:
    def __init__(self, key, distance=float('inf')):
        """
        在类的构造方法中，直接初始化id（key字符串）以及邻接字典。
        """
        self.id = key
        self.connectedTo = {}
        self.distance = distance
        self.predecessor = None

    def addNeighbor(self, nbr, weight=0):
        """
        添加邻接顶点，将邻接顶点对象以及相连边的权重作为参数传入
        """
        self.connectedTo[nbr] = weight

    def __str__(self):
        return str(self.id) + ' connectedTo: ' + str([x.id for x in self.connectedTo])

    def __lt__(self, other):
        pass

    def getConnections(self):
        """
        返回顶点的所有邻接顶点（的key），注意此返回结果为生成器
        """
        return self.connectedTo.keys()

    def getId(self):
        return self.id

    def getWeight(self, nbr):
        """
        通过邻接顶点对象在邻接字典中获取权重值
        """
        return self.connectedTo[nbr]

    def getDistance(self):
        return self.distance

    def setDistance(self, value):
        self.distance = value

    def getPred(self):
        return self.predecessor

    def setPred(self, value):
        self.predecessor = value


class Graph:
    def __init__(self):
        """
        在构造方法中初始化字典以及表示顶点个数的属性。
        """
        self.vertList = {}
        self.numVertics = 0

    def addVertex(self, key):
        """
        构造并添加顶点到图中
        """
        self.numVertics += 1
        newVertex = Vertex(key)
        self.vertList[key] = newVertex
        return newVertex

    def getVertex(self, key):
        """
        通过顶点key获取顶点对象，不存在返回None
        """
        if key in self.vertList:
            return self.vertList[key]
        else:
            return None

    def __contains__(self, key):
        return key in self.vertList

    def addEdge(self, start, end, wight=0):
        """
        添加从start顶点到end顶点的边并设置权重，若顶点在图中不存在则创建顶点并加入图中
        """
        if start not in self.vertList:
            nv = self.addVertex(start)
        if end not in self.vertList:
            nv = self.addVertex(end)
        self.vertList[start].addNeighbor(self.vertList[end], wight)

    def getVertices(self):
        return self.vertList.keys()

    def __iter__(self):
        return iter(self.vertList.values())


def dijkstra(graph, start):
    # 用图中的节点构建优先级队列
    pq = PriorityQueue()
    start.setDistance(0)
    pq_list = [(v, v.getDistance()) for v in graph]
    for v, priority in pq_list:
        pq.add_task(v, priority)
    # 从队列中取出路径长度最小的顶点，更新其邻居节点的距离
    while not pq.is_empty():
        currentVert = pq.pop_task()
        for nextVert in currentVert.getConnections():
            newDist = currentVert.getDistance() + currentVert.getWeight(nextVert)
            if newDist < nextVert.getDistance():
                nextVert.setDistance(newDist)
                nextVert.setPred(currentVert)
                pq.add_task(nextVert, newDist)  # 通过此方法更新队列中任务的优先级


def create_graph():
    g = Graph()
    for i in range(6):
        g.addVertex(i)

    g.addEdge(0, 1, 5)
    g.addEdge(0, 5, 2)
    g.addEdge(1, 2, 4)
    g.addEdge(2, 3, 9)
    g.addEdge(3, 4, 7)
    g.addEdge(3, 5, 3)
    g.addEdge(4, 0, 1)
    g.addEdge(5, 4, 8)
    g.addEdge(5, 2, 1)
    return g


graph = create_graph()
start = graph.getVertex(1)
dijkstra(graph, start)
for v in graph:
    print("( %s , %s )" % (v.getId(), v.getPred()))

( 0 , 4 connectedTo: [0] )
( 1 , None )
( 2 , 1 connectedTo: [2] )
( 3 , 2 connectedTo: [3] )
( 4 , 3 connectedTo: [4, 5] )
( 5 , 3 connectedTo: [4, 5] )


需要额外实现的方法：`pq.add_task()`更新队列总已有的任务的优先级。我们使用的实现是将现有的任务标记为REMOVE然后添加一个修改过的优先级的新任务。

时间复杂度为O(n*logn),准确来说是O((V+E)log(V)),V为顶点的个数，E为边的个数。

## 5、最小生成树问题与 Prim 算法（Prim’s_Spanning_Tree.py）

### 最小生成树
给定一个相连的正加权图G，找到链接所有的顶点且权重之和最小的边的集合。

该问题是很多应用的基础问题：如打电话，通信以及交通网络的设计，连接所有的几点且损耗最小。

### 算法
属于贪心算法的一种。

#### 算法思想
开始假设有一个空的生成树，将图中的所有的顶点分为两个集合。一个包含已经在最小生成树MST中的顶点，一个包含未在最小生成树中的顶点。在每一步，考虑连接以上的连个集合（即连接的顶点分别是属于不同的集合）的所有边，并从中选出权重值最小的边，然后将边的另外一端点，即未在最小生成树中的顶点，加入到包含最小生成树的集合。

背后的思想：一个生成树意味着所有的顶点都会相连，所以上述的两个集合中的顶点必须相连才能构成生成树，而且他们必须通过权重值最小的边相连，才能使得生成树成为最小生成树。

#### 步骤
- 1、创建一个集合mstSet记录已经在最小生成树中的顶点。
- 2、对输入的图中的所有顶点赋予一个关键值key，key的初始值为无穷大（float（‘inf’）），将起始顶点的key值设置为0.
- 3、当前最小生成树没有包含所有顶点时：
    - 选出一个没在mstSet中且拥有最小key值得顶点u。
    - 将u加入到mstSet。
    - 更新u的所有邻接节点的key值。对于每一个邻接顶点v，如果相邻的边u-v的权重值小于v原来的key值，则将key值更新为u-v的权重值。
    
**代码实现：**

In [4]:
import heapq
import itertools


class PriorityQueue(object):
    REMOVED = '<removed-task>'  # 被删除任务的占位字符

    def __init__(self):
        self.pq = []  # 初始化heapq所使用的list
        self.entry_finder = {}  # 任务到优先级条目的映射,用来快速的在队列中找到任务对应优先级条目
        self.counter = itertools.count()  # 唯一计数器

    def add_task(self, task, priority=0):
        """添加一个新任务或者更新一个已存在任务的优先级"""
        if task in self.entry_finder:
            self.remove_task(task)
        count = next(self.counter)
        entry = [priority, count, task]
        self.entry_finder[task] = entry
        heapq.heappush(self.pq, entry)

    def remove_task(self, task):
        """将一个已存在的任务标记为REMOVED，若未找到Raise KeyError。"""
        entry = self.entry_finder.pop(task)
        entry[-1] = PriorityQueue.REMOVED

    def pop_task(self):
        """删除并返回最小优先级任务，如果队列已空Raise KeyError"""
        while self.pq:  # 循环直到弹出值不为REMOVED的task才返回
            priority, count, task = heapq.heappop(self.pq)
            if task is not PriorityQueue.REMOVED:
                del self.entry_finder[task]
                return task
        raise KeyError('pop from an empty priority queue')

    def is_empty(self):
        return len(self.entry_finder) == 0

    def __contains__(self, item):
        return item in self.entry_finder


class Vertex:
    def __init__(self, key, distance=float('inf')):
        """
        在类的构造方法中，直接初始化id（key字符串）以及邻接字典。
        """
        self.id = key
        self.connectedTo = {}
        self.distance = distance
        self.predecessor = None

    def addNeighbor(self, nbr, weight=0):
        """
        添加邻接顶点，将邻接顶点对象以及相连边的权重作为参数传入
        """
        self.connectedTo[nbr] = weight

    def __str__(self):
        return str(self.id) + ' connectedTo: ' + str([x.id for x in self.connectedTo])

    def __lt__(self, other):
        pass

    def getConnections(self):
        """
        返回顶点的所有邻接顶点（的key），注意此返回结果为生成器
        """
        return self.connectedTo.keys()

    def getId(self):
        return self.id

    def getWeight(self, nbr):
        """
        通过邻接顶点对象在邻接字典中获取权重值
        """
        return self.connectedTo[nbr]

    def getDistance(self):
        return self.distance

    def setDistance(self, value):
        self.distance = value

    def getPred(self):
        return self.predecessor

    def setPred(self, value):
        self.predecessor = value


class Graph:
    def __init__(self):
        """
        在构造方法中初始化字典以及表示顶点个数的属性。
        """
        self.vertList = {}
        self.numVertics = 0

    def addVertex(self, key):
        """
        构造并添加顶点到图中
        """
        self.numVertics += 1
        newVertex = Vertex(key)
        self.vertList[key] = newVertex
        return newVertex

    def getVertex(self, key):
        """
        通过顶点key获取顶点对象，不存在返回None
        """
        if key in self.vertList:
            return self.vertList[key]
        else:
            return None

    def __contains__(self, key):
        return key in self.vertList

    def addEdge(self, start, end, wight=0):
        """
        添加从start顶点到end顶点的边并设置权重，若顶点在图中不存在则创建顶点并加入图中
        """
        if start not in self.vertList:
            nv = self.addVertex(start)
        if end not in self.vertList:
            nv = self.addVertex(end)
        self.vertList[start].addNeighbor(self.vertList[end], wight)

    def getVertices(self):
        return self.vertList.keys()

    def __iter__(self):
        return iter(self.vertList.values())


def prim(graph, start):
    # 构造优先级队列
    pq = PriorityQueue()
    start.setDistance(0)
    pq_list = [(v, v.getDistance()) for v in graph]
    for v, priority in pq_list:
        pq.add_task(v, priority)
    # 从队列中取出当前距离最小的顶点，更新其邻居节点的距离
    while not pq.is_empty():
        currentVert = pq.pop_task()
        for nextVert in currentVert.getConnections():
            newDist = currentVert.getWeight(nextVert)
            if nextVert in pq and newDist < nextVert.getDistance():
                # 更新队列中节点的距离和父节点
                nextVert.setDistance(newDist)
                nextVert.setPred(currentVert)
                pq.add_task(nextVert, newDist)

def create_graph():
    g = Graph()
    for i in range(6):
        g.addVertex(i)

    g.addEdge(0, 1, 5)
    g.addEdge(0, 5, 2)
    g.addEdge(1, 2, 4)
    g.addEdge(2, 3, 9)
    g.addEdge(3, 4, 7)
    g.addEdge(3, 5, 3)
    g.addEdge(4, 0, 1)
    g.addEdge(5, 4, 8)
    g.addEdge(5, 2, 1)
    return g


graph = create_graph()
start = graph.getVertex(1)
prim(graph, start)
for v in graph:
    print("( %s , %s )" % (v.getId(), v.getPred()))

( 0 , 4 connectedTo: [0] )
( 1 , None )
( 2 , 1 connectedTo: [2] )
( 3 , 2 connectedTo: [3] )
( 4 , 3 connectedTo: [4, 5] )
( 5 , 3 connectedTo: [4, 5] )


## Python的常用的内置算法和数据结构

|数据结构/算法|内置语言|内置库|
|--|--|--|
|线性结构|list（列表）/tuple（元组）|array（数组，不常用）/collections.namedtuple|
|链式结构||collections.deque(双端队列)|
|字典结构|dict（字典）|collections.Counter(计数器)/OrderedDict(有序字典)/defaultdict|
|集合结构|set（集合）/frozenset(不可变集合)||
|排序算法|sorted||
|二分算法||bisect模块|
|堆算法||heapq模块（最小堆）|
|缓存算法||functools.lru_cache(Least Recent Used, python3)|