# 第7章 图
图是一种抽象的数学结构,研究抽象对象之间的一类二元关系及其拓扑性质.数学领域里有一种称为"图论"的研究分支,专门研究这种拓扑结构.

在计算机的数据结构领域和课程里,图被看作一类复杂数据结构,可以用于表示具有各种复杂联系的数据集合.图结构在实际中应用非常广泛.

## 7.1 概念,性质和实现
### 7.1.1 定义和图示
一个图是一个二元组$G=(V,E)$,其中:
- V是非空有穷的顶点集合(也可以有空图的概念,但实际意义不大)
- E是顶点偶对(称为边)的集合,$E\subset{V*V}$
- V中的顶点也称为图G的顶点,E中的边也称为图G的边

顶点是图中的基本个体,可以表示任何讨论中需要关心的实体.

图分为有向图和无向图两类.有向图中的边有方向,是顶点的有序对;无向图中的边没有方向,是顶点的无序对.

有向图里的有向边将用尖括号形式表示,例如$<v_i,v_j>$表示从顶点的$v_i$到顶点$v_j$的有向边,其中$v_i$称为这条边的始点,$v_j$是该边的终点.无向图中的无向边用圆括号表示.

如果在图G中有边$<v_i,v_j> \in E$(对于无向图,有$(v_i,v_j) \in E$),则称顶点$v_i$为$v_j$的邻接顶点或邻接点(无向图里的邻接关系是双向的),也称这条边为与顶点$v_i$象关联的边,或者$v_i$的邻接边.边集合E表示顶点之间的邻接关系.

在下面讨论中,对于所关注的图有两个限制:①这里不考虑顶点到自身的边,也就是说,若$<v_i,v_j>$或$(v_i,v_j)$是图G的边,则要求$v_i \ne v_j$;②同一对顶点之间没有重复出现的边,若$<v_i,v_j>$或$(v_i,v_j)$是图G的边,那么它就是这两个顶点之间唯一的边.

### 7.1.3 图的一些概念和性质
一些基本概念和性质

**完全图**:任意两个顶点之间都有边的图(有向图或无向图)称为__完全图__.显然:
- n个顶点的无向完全图有$n\times{(n-1)/2}$条边
- n个顶点的有向完全图有$n\times{(n-1)}$条边

应该注意一个重要事实:$|E|\le |V|_2$,即$|E|=O(|V|_2)$.也就是说,对于不同的图,其中边的条数可能达到顶点个数的平方,但也可能很少.这个事实在考虑与图相关的算法的时间和空间复杂度时经常用到.

**度**(顶点的度):一个顶点的度就是与它邻接的边的条数.对于有向图,顶点的度还分为__入度__和**出度**,分别表示以该定点为始点或终点的边的条数.

__性质 7.1__ (顶点数,变数和顶点度数的关系)无论对于有向图还是无向图,顶点数n,边数e和顶点度数满足下面关系:$$e = \frac{1}{2}\sum_i{D(v_i)}$$其中$D(v_i)$表示顶点$v_i$的度数,这里要求对所有顶点的度数求和.
#### 路径和相关性质
下面时一些与路径相关的概念:
- 路径的**长度**就是该路径上边的条数.
- 回路(环)指起点和终点相同的路径.
- 如果一个环路除起点和终点外的其他顶点均不相同,则称为__简单回路__.
- 简单路径是内部不包含回路的路径.也就是说,该路径上的顶点除起点和终点可能相同外,其他顶点均不相同.因此,简单回路也是简单路径.

注意,从一个顶点到另一个顶点可能存在路径,也可能不存在路径.如果存在路径,则可能有一条或多条路径,不同的路径的长度也可能不同.特别的,如果从$v_i$到$v_j$存在非简单的路径(既包含环路的路径),那么从$v_i$到$v_j$就有无穷多条不同的路径,其中一些路径之间的不同就在于在环路上绕圈的次数不同.

**有根图**:如果在有向图G里存在一个顶点v,从顶点v到图G中其他每个顶点均有路径,则称G为有根图,称顶点v为图G的一个根.

#### 连通图
连通:如果在无向图G中存在从$v_i$到$v_j$的路径,则说从$v_i$到$v_j$连通,或者说从$v_i$可达$v_j$.为简化讨论,下面将始终默认任一顶点与其自身连通,可达其自身.对有向图,连通性也可以类似定义,但这里的连通性可以不是双向的.

连通无向图:如果无向图中任意两个顶点之间都连通,则称为连通无向图.

强连通有向图:如果对有向图中任意两个顶点$v_i$和$v_j$,从$v_i$到$v_j$连通并且从$v_j$到$v_i$也连通,则称为强连通有向图.

显然,完全无向图都是连通图,完全有向图都是强连通有向图.但是反过来不对,存在非完全的连通无向图和强连通有向图.

__性质 7.2__(最小连通无向图的边数)包含n个顶点的最小连通无向图G恰有n-1条边.

**最小连通图**,即其为连通图,但去掉其中任意一条边将不再是连通图.

__性质7.3__(最小有根图的边数) 包含n个顶点的最小有根图(即去掉任一条边将不再是有根图)恰好包含n-1条边.
#### 子图,连通子图
子图,连通子图(强连通子图),极大连通子图(连通分量)

无向图G的所有连通分量形成了图G的一个划分,每个连通分量包含图G的一集顶点和它们之间的所有边,不同连通分量的顶点集合互不相交,而这些顶点集和边集的并就是原来的G.

有向图G的一个极大强连通子图称为它的一个强连通分量.但请注意,图G的强连通分量只形成其顶点的一个划分,所有强连通分量的并未必等于图G,可能少一些连接不同连通分量的有向边.

#### 带权图和网络
如果图G中的每条边都被赋予一个权值,则称G为一个带权图(可以是带权有向图或者带权无向图).边的权值可用于实际应用中与顶点之间的关联有关的某些信息.带权的连通无向图也称为网络.
### 7.1.3 图抽象数据类型
|ADT Graph|# 一个图抽象数据类型|
|---|---|
|Graph(self)|# 图构造操作,创建一个新图|
|is_empty(self)|# 判断是否为一个空图|
|vertex_num(self)|# 获得这个图中的顶点个数|
|edge_num(self)|# 获得这个图中边的条数|
|vertices(self)|# 获得这个图中的顶点集合|
|edges(self)|# 获得这个图中的边集合|
|add_vertex(self, vertex)|# 将顶点vertex加入这个图|
|add_edge(self, v1, v2)|# 将从v1到v2的边加入这个图|
|get_edge(self, v1, v2)|# 获得v1到v2边的有关信息,没有时返回特殊值|
|out_edges(self,v)|# 取得从v出发的所有边|
|degree(self, v)|# 检查v的度|
创建图可以是创建一个空的图,或是基于有关图中顶点的一批数据,创建一个只包含这些顶点但是没有边的图,或者基于顶点和边的数据创建一个新图.可以根据具体情况考虑,为图的构造函数引进其他必要的参数.

上面的抽象数据类型只是作为例子,在实际中要根据应用的需求考虑操作集合.定义操作时还需考虑是无向图还是有向图.例如,对有向图,顶点的度应该分为出度和入度,邻接边也需要区分是出边还是入边.实际中一般只是用出度和出边.

除了上面的操作外,还需考虑遍历图中所有顶点或者所有边的操作.这里的遍历与树的遍历有许多差异,最重要有两点:
- 图中可能有回路,到同一顶点可能有多条路径(树结构里没有这些情况).因此,在遍历中需要避免再次进入已经遍历过的部分.
- 图有可能不连通,或者这个图不是有根图,即使是有根图,算法也可能没有从图中的根开始遍历.因此,要完成对一个图中所有顶点(或者边)的遍历,遍历完途中可达的那部分(在无向图里是一个连通分量,在有向图里是一个或几个强连通分量),并不一定是整个图遍历的结束,还需要考虑从初始顶点不可达的部分.

### 7.1.4 图的表示和实现
图的结构比较复杂,在其表示中需要表示顶点及顶点间的边.一个图可能有任意多个顶点(但有穷),图中任一两个顶点之间都可能存在边.顶点就是一个集合,每个顶点可能保存一些由实际应用确定的信息,在这里不是重点.在抽象的讨论中,主要关注的是边与顶点的邻接关系和顶点间的邻接关系,这些是图表示的关键.

#### 邻接矩阵
图的最基本表示方法是邻接矩阵表示法,邻接矩阵是表示图中顶点间邻接关系的方阵.对于n个顶点的图G=(V,E),其邻接矩阵是一个$n\times n$方阵,图中每个顶点(按顺序)对应于矩阵里的一行和一列,矩阵元素表示图中的邻接关系.

易见,无向图的邻接矩阵都是对称矩阵,因为其邻接关系是对称的.有向图就不一定是这样.另外,由于没考虑顶点到自身的边,上面矩阵的对角线元素都是0.如果希望用矩阵表示图中的连通关系,就应该令矩阵的对角线元素为1,因为默认各顶点到自身连通.此外,邻接矩阵中的标号i的一行和一列都对应与顶点i,行对应于它的出边,列对应于它的入边,行/列中非零元的个数对应于顶点i的出度/入度.

用邻接矩阵表示带权图时,出现了两个新问题:首先是无边情况的表示,可以根据情况选择0或$\infty$;还要就是对角线元素的表示问题,也可以根据情况选择0或者$\infty$,其选择可以与无边情况相同或者不同.如果图中的权表示从顶点到顶点的一种代价,无边时的代价无穷大,而顶点到自身的代价时0.

为符合Python语言的习惯,在下面讨论中,矩阵的行列下标从0开始编号.
#### 邻接矩阵表示法的缺点
图的邻接矩阵经常是比较稀疏的,其中有信息的元素比例不大,大量元素是表示无边的值.对实际应用中很大的图,这种情况更加明显.在实际应用中,很多图都是这种情况,其中的边数与顶点数乘线性关系,而不是平方关系.为了降低图表示的空间代价(在一些情况下也提高计算的效率),人们提出了许多其他技术,它们都可看作邻接矩阵的压缩版,如:
- 邻接表表示法;
- 邻接多重表表示法;
- 图的十字链表表示法;等等.

#### 图的邻接表表示法
所谓邻接表,就是为图中每个顶点关联一个边表,其中记录这个顶点的所有邻接边.这样,一个顶点的表,其中每个顶点又关联一个边表,就构成了图的一种表示.具体实现可以采用链接表或者连续表.采用某种具体形式的顶点表和边表,就形成了一种特殊的邻接表表示