# 1. 图的存储结构

图的存储可以通过「顺序存储结构」和「链式存储结构」来实现。其中顺序存储结构包括邻接矩阵和边集数组。链式存储结构包括邻接表、链式前向星、十字链表和邻接多重表。

> 约定用$n$代表定点数目，$m$代表边数目，$TD(v_i)$表示顶点$v_i$的度。

## 1.1 邻接矩阵

### 1.1.1 原理

> 使用一个二维数组$adjmatrix$来存储顶点之间的邻接关系。
> - 对于无权图来说，如果$adjmatrix[i][j]$为1，则说明顶点$v_i$和$v_j$之间存在边，如果$adjmatrix[i][j]$为0，则说明顶点$v_i$和$v_j$之间不存在边。
> - 对于带权图来说，如果$adjmatrix[i][j]$为$w$，且$w\neq\infty$（即`w != float('inf)`）则说明顶点$v_i$和$v_j$之间的权值为$w$，如果$adjmatrix[i][j]$为$\infty$（即`float('inf)`），则说明顶点$v_i$和$v_j$之间不存在边。

在下面的示意图中，左侧是一个无向图，右侧则是该无向图对应的邻接矩阵结构。

![邻接矩阵](../../image/邻接矩阵.png)

邻接矩阵的特点：
- 优点：实现简单，可以直接查询顶点$v_i$和$v_j$之间是否存在边，还可以直接查询边的权值。
- 缺点：初始化效率和遍历效率较低，空间开销大，空间利用率低，并且不能存储重复边，也不便于增删节点。如果当顶点数目过大（比如当$n>10^5$）时，使用邻接矩阵建立一个$n×n$的二维数组不太现实。

### 1.1.2 代码实现

In [1]:
class Graph:
    # 图的初始化操作，ver_count 为顶点个数
    def __init__(self, ver_count):
        self.ver_count = ver_count
        self.adj_matrix = [[None for _ in range(ver_count)] for i in range(ver_count)]

    # 判断顶点是否存在
    def __valid(self, v):
        return 0 <= v < self.ver_count

    # 创建图，edges为边信息
    def createGraph(self, edges):
        for vi, vj, val in edges:
            self.addEdge(vi, vj, val)
            
    # 添加边 vi - vj,权值为val
    def addEdge(self, vi, vj, val):
        if not self.__valid(vi) or not self.__valid(vj):
            raise ValueError(str(vi) + ' or ' + str(vj) + " is not a valid vertex.")
        
        self.adj_matrix[vi][vj] = val

    # 获取边vi - vj的权值
    def getEdge(self, vi, vj):
        if not self.__valid(vi) or not self.__valid(vj):
            raise ValueError(str(vi) + ' or ' + str(vj) + " is not a valid vertex.")
        
        return self.adj_matrix[vi][vj]
    
    # 根据邻接矩阵打印图的边
    def printGraph(self):
        for vi in range(self.ver_count):
            for vj in range(self.ver_count):
                val = self.adj_matrix[vi][vj]
                if val:
                    print(str(vi) + ' - ' + str(vj) + ' : ' + str(val))

graph = Graph(5)
edges = [[1, 2, 5],[2, 1, 5],[1, 3, 30],[3, 1, 30],[2, 3, 14],[3, 2, 14],[2, 4, 26], [4, 2, 26]]
graph.createGraph(edges)
print(graph.getEdge(3, 4))
graph.printGraph()

None
1 - 2 : 5
1 - 3 : 30
2 - 1 : 5
2 - 3 : 14
2 - 4 : 26
3 - 1 : 30
3 - 2 : 14
4 - 2 : 26


### 1.1.3 算法分析

- 时间复杂度
    - 初始化操作：$O(n^2)$;
    - 查询、添加或删除边操作：$O(1)$;
    - 获取某个点的所有边操作：$O(n)$;
    - 图的遍历操作：$O(n^2)$。
- 空间复杂度：$O(n^2)$。

## 1.2 边集数组

### 1.2.1 原理

> 使用一个数组来存储顶点的邻接关系。数组中的每个元素都包括一条边的起点v_i、终点v_j和边的权重val。

在下面的示意图中，左侧是一个有向图，右侧则是该有向图对应的边集数组结构。

![边集数组](../../image/边集数组.png)

### 1.2.2 代码实现

In [3]:
# 边信息类
class EdgeNode:
    def __init__(self, vi, vj, val) -> None:
        self.vi = vi    # 边的起点
        self.vj = vj    # 边的终点
        self.val = val  # 边的权值

class Graph:
    def __init__(self):
        self.edges = [] # 边数组
    
    # 创建图，edges为边信息
    def createGraph(self, edges):
        for vi, vj, val in edges:
            self.addEdge(vi, vj, val)
    
    # 向图的边数组中添加边：vi - vj，权值为 val
    def addEdge(self, vi, vj, val):
        edge = EdgeNode(vi, vj, val)
        self.edges.append(edge)
        
    # 获取边vi - vj的权值
    def getEdge(self, vi, vj):
        for edge in self.edges:
            if edge.vi == vi and edge.vj == vj:
                return edge.val
        return None
    
    # 打印图
    def printGraph(self):
        for edge in self.edges:
            print(str(edge.vi) + ' - ' + str(edge.vj) + ' : ' + str(edge.val))
            
graph = Graph()
edges = [[1, 2, 5],[1, 5, 6],[2, 4, 7],[4, 3, 9],[3, 1, 2],[5, 6, 8],[6, 4, 3]]
graph.createGraph(edges)
print(graph.getEdge(3, 4))
graph.printGraph()

None
1 - 2 : 5
1 - 5 : 6
2 - 4 : 7
4 - 3 : 9
3 - 1 : 2
5 - 6 : 8
6 - 4 : 3


### 1.2.3 算法分析

- 时间复杂度
    - 图的初始化和创建操作：$O(m)$;
    - 查询是否存在某条边：$O(m)$;
    - 遍历某个点的所有边：$O(m)$;
    - 遍历整张图：$O(nm)$。
- 空间复杂度：$O(m)$。

采用边集数组计算节点的度或者查找某条边时，需要遍历整个边集数组，时间复杂度为$O(m)$，m是边的数量。除非特殊必要，很少用使用边集数组来存储图。

一般来说，边集数组适合那些对边依次进行处理的运算，不适合对顶点的运算和对任何一条边的运算。

## 1.3 邻接表

### 1.3.1 原理 

> 使用顺序存储和链式存储相结合的存储结构来存储图的顶点和边。用数组来存储顶点，数组的下标即顶点在图中的位置；用以顶点为表头节点的链表存储边。

在下面的示意图中，左侧是一个有向图，右侧则是该有向图对应的邻接表结构。

![邻接表](../../image/邻接表.png)

### 1.3.2 代码实现

In [3]:
class EdegeNode:
    def __init__(self, vj, val) -> None:
        self.vj = vj
        self.val = val
        self.next = None
class VertexNode:
    def __init__(self, vi) -> None:
        self.vi = vi
        self.head = None
        
class Graph:
    def __init__(self, ver_count) -> None:
        self.ver_count = ver_count
        self.vetices = []
        for vi in range(ver_count):
            vertex = VertexNode(vi)
            self.vetices.append(vertex)
    
    # 判断顶点v是否有效
    def __valid(self, v):
        return 0 <= v < self.ver_count
    
    # 图的创建操作，edges为边的信息
    def createGraph(self, edges):
        for edge in edges:
            vi, vj, val = edge
            if not self.__valid(vi) or not self.__valid(vj):
                raise ValueError(str(vi) + ' or ' + str(vj) + " is not a valid vertex.")
            self.addEdge(vi, vj, val)
    
    # 向图的邻接表中添加边：vi - vj，权值为 val 
    def addEdge(self, vi, vj, val):
        if not self.__valid(vi) or not self.__valid(vj):
            raise ValueError(str(vi) + ' or ' + str(vj) + " is not a valid vertex.")
        
        edge = EdegeNode(vj, val)
        vertex = self.vetices[vi]
        edge.next = vertex.head
        vertex.head = edge
        
    # 获取Vi - vj 边的权值
    def getEdge(self, vi, vj):
        if not self.__valid(vi) or not self.__valid(vj):
            raise ValueError(str(vi) + ' or ' + str(vj) + " is not a valid vertex.")
        
        vertex = self.vetices[vi]
        edge = vertex.head
        while edge:
            if edge.vj == vj:
                return edge.val
            edge = edge.next
        return None
    
    # 根据邻接表打印图的边
    def printGraph(self):
        for vertex in self.vetices:
            edge = vertex.head
            while edge:
                print(str(vertex.vi) + ' - ' + str(edge.vj) + ' : ' + str(edge.val))
                edge = edge.next

graph = Graph(7)
edges = [[1, 2, 5],[1, 5, 6],[2, 4, 7],[4, 3, 9],[3, 1, 2],[5, 6, 8],[6, 4, 3]]
graph.createGraph(edges)
print(graph.getEdge(3, 4))
graph.printGraph()

None
1 - 5 : 6
1 - 2 : 5
2 - 4 : 7
3 - 1 : 2
4 - 3 : 9
5 - 6 : 8
6 - 4 : 3


### 1.3.3 算法分析

- 时间复杂度
    - 图的初始化和创建操作：$O(n+m)$;
    - 查询是否存在$v_i$到$v_j$的边：$O(TD(v_i))$;
    - 遍历某个点的所有边：$O(TD(v_i))$;
    - 遍历整张图：$O(n+m)$。
- 空间复杂度：$O(n+m)$。

## 1.4 链式前向星

### 1.4.1 原理

> 将边集数组和邻接表相结合，实现使用静态链表实现的邻接表，可以快速访问一个节点所有的邻接点，并且使用很少的额外空间。<font color='red'>是目前建图和遍历效率最高的存储方式。</font>

有两种数据结构组成：
- **特殊的边集数组`edges`**：其中`edges[i]`表示图的第`i`条边。`edges[i].vj`表示第`i`条边的终点，`edge[i]s.val`表示第`i`条边的权值，`edge[i]s.next`表示与第`i`条边同起点的下一条边的下标。
- **头节点数组`head`**：其中`head[i]`存储以`i`为起点的第1条边在`edges`中的下标。

链式前向星其实并没有改变边集数组原来的存储数学，只是利用`head`数组构成静态链表，建立了顶点$v_i$和顶点$v_i$所连第1条边的关系。

在下面的示意图中，左侧是一个有向图，右侧则是该有向图对应的链式前向星结构。

如果需要在该图中遍历顶点$v_1$的所有边，则步骤如下：
1. 找到以顶点$v_1$为起点的第1条边在数组`edges`的下标，即`index=head[1]=1`。则在`edges`数组中找到与顶点$v_1$相连的第一条边为`edges[1]`，即$<v_1,v_5>$,$val=6$。
2. 查找以$v_1$为顶点的下一条边，即`index=edges[1].next=0`，则在`edges`数组中找到与顶点$v_1$相连的第2条边`edges[0]`，即$<v_1,v_2>$，$val=5$。
3. 继续查找`index=edges[0].next=-1`则不存在其余边，查找结束。

![链式前向星](../../image/链式前向星.png)

### 1.4.2 代码实现

In [3]:
class EdgeNode:
    def __init__(self,vj, val) -> None:
        self.next = None
        self.vj = vj
        self.val = val
        
class Graph:
    def __init__(self, ver_count, edge_count) -> None:
        self.ver_count = ver_count
        self.edge_count = edge_count
        self.heads = [-1 for _ in range(ver_count)]
        self.edges = []
        
    # 判断顶点v是否有效
    def __valid(self, v):
        return 0 <= v < self.ver_count
    
    # 图的创建操作，edges为边的信息
    def createGraph(self, edges=[]):
        for i in range(len(edges)):
            vi, vj, val = edges[i]
            self.addEdge(i, vi, vj, val)
            
    # 向图的邻接表中添加边：vi - vj，权值为 val
    def addEdge(self, index, vi, vj, val):
        if not self.__valid(vi) or not self.__valid(vj):
            raise ValueError(str(vi) + ' or ' + str(vj) + " is not a valid vertex.")
        
        edge = EdgeNode(vj, val)   # 构造边结点
        edge.next = self.heads[vi]  # 边节点的next指向vi顶点的原来的首指针
        self.edges.append(edge)     # 将边节点添加到边集数组中
        self.heads[vi] = index      # vi顶点的首指针指向新加边在边集数组的下标
        
    # 获取Vi - vj 边的权值
    def getEdge(self, vi, vj):
        if not self.__valid(vi) or not self.__valid(vj):
            raise ValueError(str(vi) + ' or ' + str(vj) + " is not a valid vertex.")
        
        index = self.heads[vi]
        while index != -1:
            edge = self.edges[index]
            if edge.vj == vj:
                return edge.val
            index = edge.next
        return None
    
    # 打印图
    def printGraph(self):
        for vi in range(self.ver_count):
            index = self.heads[vi]
            while index != -1:
                edge = self.edges[index]
                print(str(vi) + ' - ' + str(edge.vj) + ' : ' + str(edge.val))
                index = edge.next
                
                
graph = Graph(7, 7)
edges = [[1, 2, 5],[1, 5, 6],[2, 4, 7],[4, 3, 9],[3, 1, 2],[5, 6, 8],[6, 4, 3]]
graph.createGraph(edges)    
print(graph.getEdge(4, 3))
print(graph.getEdge(4, 5))
graph.printGraph()

9
None
1 - 5 : 6
1 - 2 : 5
2 - 4 : 7
3 - 1 : 2
4 - 3 : 9
5 - 6 : 8
6 - 4 : 3


### 1.4.3 算法分析

- 时间复杂度
    - 图的初始化和创建操作：$O(n+m)$;
    - 查询是否存在$v_i$到$v_j$的边：$O(TD(v_i))$;
    - 遍历某个点的所有边：$O(TD(v_i))$;
    - 遍历整张图：$O(n+m)$。
- 空间复杂度：$O(n+m)$。

## 1.5 哈希表实现邻接表

### 1.5.1 原理

> 哈希表实现邻接表包含两个哈希表：第一个哈希表主要用来存放顶点的数据信息，哈希表的键是顶点，值是该点所有邻接边构成的另一个哈希表。另一个哈希表用来存放顶点相连的边信息，哈希表的键是边的终点，值是边的权重。

### 1.5.2 代码实现

In [4]:
class VertexNode:
    def __init__(self, vi) -> None:
        self.vi = vi
        self.adj_edges = dict()
        
class Graph:
    def __init__(self) -> None:
        self.vertices = dict()
        
    # 图的创建操作，edges为边的信息
    def createGraph(self, edges):
        for vi, vj, val in edges:
            self.addEdge(vi, vj, val)
            
    # 向图中添加节点
    def addVertex(self, vi):
        vertex = VertexNode(vi)
        self.vertices[vi] = vertex
        
    # 向图的邻接表中添加边：vi - vj，权值为 val
    def addEdge(self, vi, vj, val):
        if vi not in self.vertices:
            self.addVertex(vi)
        if vj not in self.vertices:
            self.addVertex(vj)
        
        self.vertices[vi].adj_edges[vj] = val
        
    # 获取Vi - vj 边的权值
    def getEdge(self, vi, vj):
        if vi in self.vertices and vj in self.vertices[vi].adj_edges:
            return self.vertices[vi].adj_edges[vj]
        return None
    
    # 打印图
    def printGraph(self):
        for vi in self.vertices:
            for vj in self.vertices[vi].adj_edges:
                print(str(vi) + ' - ' + str(vj) + ' : ' + str(self.vertices[vi].adj_edges[vj]))
                
graph = Graph()
edges = [[1, 2, 5],[1, 5, 6],[2, 4, 7],[4, 3, 9],[3, 1, 2],[5, 6, 8],[6, 4, 3]]
graph.createGraph(edges)
print(graph.getEdge(3, 4))
graph.printGraph()
            

None
1 - 2 : 5
1 - 5 : 6
2 - 4 : 7
5 - 6 : 8
4 - 3 : 9
3 - 1 : 2
6 - 4 : 3


### 1.5.3 算法分析

- 时间复杂度
    - 图的初始化和创建操作：$O(n+m)$;
    - 查询是否存在$v_i$到$v_j$的边：$O(1)$;
    - 遍历某个点的所有边：$O(TD(v_i))$;
    - 遍历整张图：$O(n+m)$。
- 空间复杂度：$O(n+m)$。

# 图论问题应用

## 2.1 图的遍历问题

> 图的遍历：与树的遍历类似，图的遍历指的是从图的某一个顶点出发，按照某种搜索方式对图中的所有节点都仅访问一次。

图的遍历是求解图的连通性问题、拓扑排序和求关键路径等算法的基础。

根据搜索方式的不同，可以将图的遍历分为「深度优先搜索」和「广度优先搜索」。

- **深度优先搜索**：从某一顶点出发，沿着⼀条路径⼀直搜索下去，在⽆法搜索时，回退到刚刚访问过的节点。
- **广度优先搜索**：从某个顶点出发，⼀次性访问所有未被访问的邻接点，再依次从这些已访问过的邻接点出发，⼀层⼀层地访问。

## 2.2图的连通性问题

在无向图中，图的连通性问题主要包括：**求无向图的连通分量、求点双连通分量（找割点）、求边双连通分量（找桥）、全局最小割问题**等等。

在有向图中，图的连通性问题主要包括：**求有向图的强连通分量、最小点基、最小权点基、2-SAT 问题**等等。

## 2.3 图的生成树问题

> **图的生成树（Spanning Tree）**：如果连通图 G 的一个子图是一棵包含图 G 所有顶点的树，则称该子图为 G 的生成树。生成树是连通图的包含图中的所有顶点的极小连通子图。图的生成树不惟一。从不同的顶点出发进行遍历，可以得到不同的生成树。

图的生成树问题主要包括：**最小生成树问题、次小生成树问题 和 有向图的最小树形图问题** 等等。
- **无向图的最小生成树**：如果连通图$G$是一个带权无向图，则生成树的边也带权，则称该带权图中所有带权生成树中权值总和最小的生成树为最小生成树（也称为最小代价生成树）。
- **无向图的次小生成树**：如果连通图$G$是一个带权无向图，生成树$T$是图$G$的一个最小生成树，如果有另一棵生成树$T_1$，$T_1 \ne T$，满足不存在树$T'$，$T' \ne T$，且$w(T')<w(T_1)$，则称$T_1$是图$G$的次小生成树。
- **有向图的最小树形图**：如果连通图$G$是一个带权有向图，以顶点$v_i$为根节点的生成树$T$中，顶点$v_i$到任意非$v_i$顶点的路径存在且唯一，并且生成树$T$中权值总和最小，则该生成树被称为有向图$G$的最小树形图。