## 本章内容

-  学习使用新的数据结构图来建立网络模型。
-  学习广度优先搜索，你可对图使用这种算法回答诸如“到X的最短路径是什么”等问题。
-  学习有向图和无向图。
-  学习拓扑排序，这种排序算法指出了节点之间的依赖关系


- You learn how to model a network using a new, abstract data structure: graphs.
- You learn breadth-first search, an algorithm you can run on graphs to answer questions like,“What’s the shortest path to go to X?”
- You learn about directed versus undirected graphs.
- You learn topological sort, a diferent kind of sorting algorithm that exposes dependencies between nodes.

首先，我将说说什么是图（它们不涉及X轴和Y轴），再介绍第一种图算法——广度优先搜索（breadth-first search，BFS）:

广度优先搜索让你能够找出两样东西之间的最短距离，不过最短距离的含义有很多！使用广度优先搜索可以：

- 编写国际跳棋AI，计算最少走多少步就可获胜；
- 编写拼写检查器，计算最少编辑多少个地方就可将错拼的单词改成正确的单词，如将READED改为READER需要编辑一个地方；
- 根据你的人际关系网络找到关系最近的医生。

*图算法应该是最有用的。*

### 最短路径问题（shorterst-path problem）。
你经常要找出最短路径，这可能是前往朋友家的最短路径，也可能是国际象棋中把对方将死的最少步数。解决最短路径问题的算法被称为广度优先搜索。

需要两个步骤。

- (1) 使用图来建立问题模型。
- (2) 使用广度优先搜索解决问题。

## 图是什么

**图模拟一组连接**. 图由节点（node）和边（edge）组成。

就这么简单！图由节点和边组成。一个节点可能与众多节点直接相连，这些节点被称为邻居。

图用于模拟不同的东西是如何相连的。



## 广度优先搜索

广度优先搜索是一种用于图的查找算法，**可帮助回答两类问题**。

- (1):第一类问题：从节点A出发，有前往节点B的路径吗？
- (2):第二类问题：从节点A出发，前往节点B的哪条路径最短？

### 查找最短路径

在广度优先搜索的执行过程中，搜索范围从起点开始逐渐向外延伸，即先检查一度关系，再检查二度关系。**广度优先搜索不仅查找从A到B的路径，而且找到的是最短的路径。**

注意，只有按添加顺序查找时，才能实现这样的目的。因此，你需要按添加顺序进行检查。有一个可实现这种目的的数据结构，那就是``队列（queue）``。

### 队列

队列的工作原理与现实生活中的队列完全相同。假设你与朋友一起在公交车站排队，如果你排在他前面，你将先上车。队列的工作原理与此相同。``队列类似于栈，你不能随机地访问队列中的元素``。队列只支持两种操作：``入队和出队``。

如果你将两个元素加入队列，先加入的元素将在后加入的元素之前出队。因此，你可使用队列来表示查找名单！这样，*先加入的人将先出队并先被检查*。

*队列是一种先进先出（First In First Out，FIFO）的数据结构，而栈是一种后进先出（Last InFirst Out，LIFO）的数据结构。*

### 实现图

首先，需要使用代码来实现图。图由多个节点组成。

每个节点都与邻近节点相连, 好在你知道的一种结构让你能够表示这种关系，它就是`散列表`！记住，**散列表让你能够将键映射到值**。
```python
# 在python中，可用下述代码表述一个图
graph = {}
graph["you"] = ["alice", "bob", "claire"]
```

如果用python代码表述一个更大的图，如下：

<img align = "left" src="figures/graph1.png">

```python
# 它的python代码如下：
graph = {}
graph["you"] = ["alice", "bob", "claire"]
graph["bob"] = ["anuj", "peggy"]
graph["alice"] = ["peggy"]
graph["claire"] = ["jonny", "thom"]
graph["anuj"] = []
graph["peggy"] = []
graph["jonny"] = []
graph["thom"] = []
```

Anuj、Peggy、Thom和Jonny都没有邻居，这是因为虽然有指向他们的箭头，但没有从他们出发指向其他人的箭头。这被称为**有向图（directed graph），其中的关系是单向的**。因此，Anuj是Bob的邻居，但Bob不是Anuj的邻居。**无向图（undirected graph）没有箭头，直接相连的节点互为邻居**。

##### 以下两个图等价：
<img align="right" src="figures/graph2.png">

## 实现算法

在Python中，可使用函数deque来创建一个双端队列。

In [1]:
graph = {}
graph["you"] = ["alice", "bob", "claire"]
graph["bob"] = ["anuj", "peggy"]
graph["alice"] = ["peggy"]
graph["claire"] = ["jonny", "thom"]
graph["anuj"] = []
graph["peggy"] = []
graph["jonny"] = []
graph["thom"] = []

In [2]:
def person_is_seller(name):
    # 这个函数检查人的姓名是否以m结尾：如果是，他就是芒果销售商
    return name[-1] ==  'm'

In [3]:
from collections import deque
def search(name):
    search_queue = deque()
    search_queue += graph[name]
    searched = []
    while search_queue:
        person = search_queue.popleft()
        if ~(person in searched):
            if person_is_seller(person):
                print(person + "is a mongo seller!")
                return True
            else:
                search_queue += graph[person]
                searched.append(person)
    return False

In [4]:
search("you")

thomis a mongo seller!


True

## 运行时间

如果你在你的整个人际关系网中搜索芒果销售商，就意味着你将沿每条边前行（记住，边是从一个人到另一个人的箭头或连接），因此运行时间至少为O(边数)。

你还使用了一个队列，其中包含要检查的每个人。将一个人添加到队列需要的时间是固定的，即为$O(1)$，因此对每个人都这样做需要的总时间为$O$(人数)。所以，广度优先搜索的运行时间为$O$(人数 + 边数)，这通常写作$O(V + E)$，其中$V$为顶点（vertice）数，E为边数。

### Excercise:


In [6]:
routine = {}
routine["up"] = ["excercise", "brush_teeth", "pack_lunch"]
routine["excercise"] = ["shower"]
routine["brush_teeth"] = ["eat_breakfast"]
routine["pack_lunch"] = []
routine["eat_breakfast"] = []
routine["shower"] = ["get_dressed"]
routine["get_dressed"] = []

**从某种程度上说，这种列表是有序的。如果任务A依赖于任务B，在列表中任务A就必须在任
务B后面。这被称为``拓扑排序``，使用它可根据图创建一个有序列表。**

这种图被称为树。树是一种特殊的图，其中没有往后指的边。**`This is called a tree. A tree is a special type of graph, where no edges ever point back.`**

## 小结

- 广度优先搜索指出是否有从A到B的路径。
- 如果有，广度优先搜索将找出最短路径。
- 面临类似于寻找最短路径的问题时，可尝试使用图来建立模型，再使用广度优先搜索来解决问题。
- 有向图中的边为箭头，箭头的方向指定了关系的方向，例如，rama→adit表示rama欠adit钱。
- 无向图中的边不带箭头，其中的关系是双向的，例如，ross - rachel表示“ross与rachel约会，而rachel也与ross约会”。
- 队列是先进先出（FIFO）的。
- 栈是后进先出（LIFO）的。
- 你需要按加入顺序检查搜索列表中的人，否则找到的就不是最短路径，因此搜索列表必须是队列。
- 对于检查过的人，务必不要再去检查，否则可能导致无限循环。


- Breadth-first search tells you if there’s a path from A to B.
- If there’s a path, breadth-irst search will find the shortest path.
- If you have a problem like “ind the shortest X,” try modeling your problem as a graph, and use breadth-irst search to solve.
- A directed graph has arrows, and the relationship follows the direction of the arrow (rama -> adit means “rama owes adit money”).
- Undirected graphs don’t have arrows, and the relationship goes both ways (ross - rachel means “ross dated rachel and rachel dated ross”).
- Queues are FIFO (First In, First Out).
- Stacks are LIFO (Last In, First Out).
- You need to check people in the order they were added to the search list, so the search list needs to be a queue. Otherwise, you won’t get the shortest path.
- Once you check someone, make sure you don’t check them again.
- Otherwise, you might end up in an inifinite loop.