# 第六章 广度优先搜索

## 一、算法描述

假设你经营着一家芒果农场，需要寻找芒果销售商，以便将芒果卖给他。为此，我们可以通过广度优先搜索算法，在朋友中查找出符合条件的芒果销售商。

广度优先搜索是一种用于图的查找算法，可帮助我们回答两类问题：
- 第一类问题：从节点A出发，有前往节点B的路径吗？（在你的人际关系网中，有芒果销售商吗？）
- 第二类问题：从节点A出发，前往节点B的哪条路径最短？（哪个芒果销售商与你的关系最近？）

在广度优先搜索的执行过程中，搜索范围从起点开始逐渐向外延伸，即先检查一度关系，再检查二度关系。

- 广度优先搜索使用的数据结构： 队列（FIFO）

注：栈（FILO）,数列和栈都不支持随机访问，只支持两种操作：队列（入队和出队），栈（压入和弹出）

## 二、广度优先算法代码实现
- 找出与你的**关系最近**的芒果销售商
- 利用双向队列deque数据结构

In [1]:
graph = {}      # 定义散列表映射关系
# 定义you的一度关系， 散列表graph+数组
graph['you'] = ['Bob','Alice','Claire']
# 定义you的二度关系，即['Bob','Alice','Claire']的一度关系
graph['Bob'] = ['Anuj','Peggy']
graph['Alice'] = ['Bob','Peggy']
graph['Claire'] = ['Thom','Jonny']
# 定义you的三度关系
graph['Anuj'] = []
graph['Peggy'] = []
graph['Thom'] = []
graph['Jonny'] = []

In [2]:
graph     # 散列表是无序的，添加键值对的顺序无关紧要

{'Alice': ['Bob', 'Peggy'],
 'Anuj': [],
 'Bob': ['Anuj', 'Peggy'],
 'Claire': ['Thom', 'Jonny'],
 'Jonny': [],
 'Peggy': [],
 'Thom': [],
 'you': ['Bob', 'Alice', 'Claire']}

In [3]:
# 导入deque双向队列的模块
from collections import deque

#### 算法原理：
- 创建一个双向队列的朋友名单search_deque和一个用于记录检查过的人名单的数组searched
- 依次检查双向队列search_deque中的每一个名单，看是否满足要求
- 不满足则必须在朋友的朋友中继续查找，并将该名单列入searched中；满足则直接返回True,程序结束

In [4]:
# 定义一个人是seller的函数,返回ture：
def seller(name):
    return name[-1] == 'm'   # 如果name的最后一个字母是y,则name[-1]=='y'为True,即返回True,否则返回False

In [5]:
def search(name):
    search_deque = deque()
    search_deque += graph[name]  # 将graph关系谱散列表的值（名单）加入到双向队列中
    searched = []                # 存储已经检查过的名单的列表

    # 循环：直至search_deque中的名单全部被检查过
    while search_deque:
        print(search_deque)
        person = search_deque.popleft()     # Remove and return the leftmost element.（无放回取出，注意popleft的作用）
        # 如果person没有检查过，则执行以下代码
        if person not in searched:
            if seller(person):
                # 如果person的最后一个字母是‘y’,则该person是seller，成功找到关系最近的，返回True,程序结束
                print('{} is a mango seller!'.format(person))
                return True
            else:
                # 否则，将person的朋友添加到双向队列的队尾，同时标记person为searched
                search_deque += graph[person]
                # search_deque.append(graph[person])   # deque.append(): Add an element to the right side of the deque.
                searched.append(person)
    # 如果search_deque中的左右名单都搜索过也没找到芒果商，则在while循环结束后返回False（队列中没有芒果商）
    return False

In [6]:
search('you')

deque(['Bob', 'Alice', 'Claire'])
deque(['Alice', 'Claire', 'Anuj', 'Peggy'])
deque(['Claire', 'Anuj', 'Peggy', 'Bob', 'Peggy'])
deque(['Anuj', 'Peggy', 'Bob', 'Peggy', 'Thom', 'Jonny'])
deque(['Peggy', 'Bob', 'Peggy', 'Thom', 'Jonny'])
deque(['Bob', 'Peggy', 'Thom', 'Jonny'])
deque(['Peggy', 'Thom', 'Jonny'])
deque(['Thom', 'Jonny'])
Thom is a mango seller!


True

#### 注意：
- **search_deque += graph[person]** 不能替换为 **search_deque.append(graph[person])**

两者区别如下代码：

In [7]:
a = [1, 2, 5, 4]
b = [1, 2, 5, 4]

In [8]:
a += [7, 8]
a

[1, 2, 5, 4, 7, 8]

In [9]:
b.append([7, 8])
b

[1, 2, 5, 4, [7, 8]]

- 很明显，b.append(list) 是将list整体作为一个元素加入到b中，b新增元素个数为1
- a += [list]， 是将list中的每个元素单独作为一个元素加入到a中，a新增元素个数为len(list)

#### 运行时间

- 在整个人际关系网中搜索，意味着将沿着每一条边前行（边是一个人到另一个人的连接或箭头），因此运行时间至少为O(边数)
- 使用了一个队列，包含要检查的每一个人，每一个人添加到队列的时间是固定的O(1), 则所有的人总时间是O(人数)
- 故：广度优先搜索的运行时间为 **O(边数+人数)**， 即O(E + V)。E： edge边数； V:vertice 顶点数

## 三、小结

- 广度优先搜索指出是否有从A到B的路径。
- 如果有，广度优先搜索将找出最短路径。
- 面临类似于寻找最短路径的问题，可尝试使用图来建立模型，再使用广度优先搜索来解决问题。
- 有向图和无向图区别注意。
- 队列： FIFO.
- 栈：FILO
- 你需要**按加入顺序检查**搜索列表中的人，否则找到的就不是**最短路径**，因此**搜索列表必须是队列**。
- 对于检查过的人，务必不要再去检查，否则可能导致无限循环。