## algorithm design and anlysis-2025 spring  homework 4
**Deadline**：2025.5.14

**name**:


note：
---
1. 带有\*的题目，申请免上课的同学，必须完成，其他同学选作；
2. 请独立完成，如求助了他人或者大模型，请著明，并且不可省略算法分析部分；
4. 如若作答有雷同，全部取消成绩；
3. 需要书面作答的题目，可以通过引用图片的形式添加，但是注意上传项目时包含所引用的图片的源文件；
4. $log_n$ 默认表示$log_2{n}$;

## 问题 1 
**最小生成树（Minimum Spanning Tree）**

设  **G**  为一个带权重的连通无向图，且所有边的权重均不相等。令$e_i$ 为权重第 $i$ 小的边。最小生成树（MST）是否必须包含 $e_1$ ? 同理，是否必须包含 $e_2$ 和 $e_3$ ? 若必须包含，请给出证明；否则，请构造反例。需从基本原理论证，不能依赖割引理(cut lemma) 或 Prim/Kruskal算法的正确性。


answer:
![h4_p1.png](./fig/h4_p1.png)

## 问题 2 
**瓶颈生成树（Bottleneck Spanning Tree）**

带有权重的无向图 $G(V,E,w)$ 的瓶颈生成树，表现为：在所有生成树中，最大权重边的权重值最小。即，BST $T$ 最小化瓶颈损失 $c(T)=max_{e \in T}{w(e)}$。

1. 证明 $G$ 的每一个最小生成树（MST）都是瓶颈生成树（BST）
2. 设计一个线性时间复杂度的算法：， 对于一个图 $G(V,E,w)$ 和一个整数 $b$，判断图 $ G$ 是否存在一个瓶颈生成树，其最大权重边的权重不超过 $b$，分析算法设计思路，并基于python编程实现。
3. 设计一个线性时间复杂度的算法：对于给定的图 $G(V,E,w)$，找到其瓶颈生成树，分析算法设计思路，并基于python编程实现。

answer:
![h4_p2.png](./fig/h4_p2.png)

idea：（借助了大模型）首先过滤边创建子图G'：遍历图G中的所有边；只保留权重≤b的边，构建子图G'。然后检查连通性：对子图G'执行深度优先搜索(DFS)或广度优先搜索(BFS)；从任意顶点开始搜索，检查是否能访问所有顶点。最后判断结果：如果G'是连通的(所有顶点都被访问)，返回True；否则返回False。

In [21]:
# add your code here
# algorithm of the liear time complexity :O(V+E)
from collections import defaultdict, deque


def has_bottleneck_spanning_tree(graph, b):

    # 步骤1: 创建子图G'，只包含权重不超过b的边
    filtered_graph = defaultdict(dict)

    # 收集所有的顶点
    vertices = set()
    for u in graph:
        vertices.add(u)
        for v in graph[u]:
            vertices.add(v)

    # 添加权重不超过b的边
    for u in graph:
        for v, weight in graph[u].items():
            if weight <= b:
                filtered_graph[u][v] = weight
                filtered_graph[v][u] = weight  # 确保无向图的对称性

    # 步骤2: 使用BFS检查子图G'的连通性
    if not vertices:
        return True  # 空图视为连通

    # 从任意顶点开始BFS
    start_vertex = next(iter(vertices))
    visited = {start_vertex}
    queue = deque([start_vertex])

    while queue:
        node = queue.popleft()
        for neighbor in filtered_graph[node]:
            if neighbor not in visited:
                visited.add(neighbor)
                queue.append(neighbor)

    # 步骤3: 判断是否所有顶点都被访问到
    return len(visited) == len(vertices)


# 测试用例
if __name__ == "__main__":
    # 例图:
    # 1 -- (1) -- 2
    # | \         |
    # |  \        |
    # (4)  (3)    (2)
    # |      \    |
    # |       \   |
    # 3 -- (5) -- 4

    graph = {
        1: {2: 1, 3: 4, 4: 3},
        2: {1: 1, 4: 2},
        3: {1: 4, 4: 5},
        4: {1: 3, 2: 2, 3: 5}
    }

    # 测试不同的b值
    for test_b in range(1, 6):
        result = has_bottleneck_spanning_tree(graph, test_b)
        print(f"b = {test_b}: {'存在' if result else '不存在'}瓶颈生成树")

b = 1: 不存在瓶颈生成树
b = 2: 不存在瓶颈生成树
b = 3: 不存在瓶颈生成树
b = 4: 存在瓶颈生成树
b = 5: 存在瓶颈生成树


idea：（借助了大模型）使用桶排序将图中的边按权重从小到大排序；使用贪心策略按权重递增顺序考虑边，优先选择权重小的边加入生成树，这保证了最终生成树的最大权重边是可能的最小值；使用并查集数据结构高效地检查连通性，确保不形成环；利用基数排序实现线性总时间复杂度。

In [23]:
# add your code here
# algorithm of the liear time complexity :O(V+E)
def find_bottleneck_spanning_tree(graph):
    
    # 收集所有边并按权重排序（使用桶排序实现线性时间）
    edges = []
    vertices = set()

    # 收集边和顶点
    for u in graph:
        vertices.add(u)
        for v, weight in graph[u].items():
            if u < v:  # 避免重复添加无向边
                edges.append((u, v, weight))
                vertices.add(v)

    # 找出权重的最大值，为桶排序做准备
    if not edges:
        return []  # 空图情况

    max_weight = max(edge[2] for edge in edges)

    # 执行桶排序
    buckets = [[] for _ in range(max_weight + 1)]
    for edge in edges:
        buckets[edge[2]].append(edge)

    sorted_edges = []
    for bucket in buckets:
        sorted_edges.extend(bucket)

    # 使用并查集实现Kruskal算法
    # 初始化并查集
    parent = {v: v for v in vertices}
    rank = {v: 0 for v in vertices}

    def find(x):
        """查找x的根节点（带路径压缩）"""
        if parent[x] != x:
            parent[x] = find(parent[x])
        return parent[x]

    def union(x, y):
        """合并x和y所在的集合（按秩合并）"""
        root_x = find(x)
        root_y = find(y)

        if root_x == root_y:
            return

        if rank[root_x] < rank[root_y]:
            parent[root_x] = root_y
        else:
            parent[root_y] = root_x
            if rank[root_x] == rank[root_y]:
                rank[root_x] += 1

    # 构建瓶颈生成树
    mst_edges = []
    for u, v, weight in sorted_edges:
        if find(u) != find(v):  # 检查是否会形成环
            union(u, v)
            mst_edges.append((u, v, weight))

            # 当生成树有|V|-1条边时停止
            if len(mst_edges) == len(vertices) - 1:
                break

    return mst_edges


# 测试用例
if __name__ == "__main__":
    # 例图:
    # 1 -- (1) -- 2
    # | \         |
    # |  \        |
    # (4)  (3)    (2)
    # |      \    |
    # |       \   |
    # 3 -- (5) -- 4

    example_graph = {
        1: {2: 1, 3: 4, 4: 3},
        2: {1: 1, 4: 2},
        3: {1: 4, 4: 5},
        4: {1: 3, 2: 2, 3: 5}
    }

    bst = find_bottleneck_spanning_tree(example_graph)
    print("瓶颈生成树的边:")
    for u, v, weight in bst:
        print(f"{u} -- {weight} -- {v}")

    # 计算瓶颈值
    bottleneck_value = max(weight for _, _, weight in bst) if bst else 0
    print(f"瓶颈值: {bottleneck_value}")

瓶颈生成树的边:
1 -- 1 -- 2
2 -- 2 -- 4
1 -- 4 -- 3
瓶颈值: 4


## 问题 3

**道路网（Road Network）**

假设有一个以图 $ G(V, E, l) $ 表示的道路网络，连接了一组城市 $ V $。我们假设该网络是有向的，并且每条道路 $(u, v) \in E$ 都有一个非负的长度 $ l(u, v) $。一条新的道路即将被建造，因此有一个列表 $ E' $ 包含它可以连接的城市对。每对 $(u, v) \in E'$ 都有一个对应的长度 $ l'(u, v) $。我们希望选择一对城市，使得两个城市 $ s, t \in V $ 之间的距离减少最大。请为此问题编写一个高效的算法，并详细解释算法的正确性和复杂度。


idea:
（借助大模型）算法设计思路：
1、计算原始最短路径： 首先，使用 Floyd-Warshall 算法计算图中所有城市对 (s, t) 之间的最短路径距离，记为 dist[s][t]。
2、遍历候选道路： 遍历候选道路集合 E' 中的每一条道路 (u, v)。
3、更新最短路径： 对于每条候选道路 (u, v)，将其添加到图 G 中，并再次使用 Floyd-Warshall 算法更新所有城市对 (s, t) 之间的最短路径距离，记为 new_dist[s][t]。
4、计算距离减少量： 计算添加道路 (u, v) 后，所有城市对最短路径距离减少的最大值，即 max(dist[s][t] - new_dist[s][t])，记为 reduction(u, v)。
5、选择最优道路： 选择使 reduction(u, v) 最大的道路 (u, v) 作为最终结果。

idea:
算法的正确性:

1、Floyd-Warshall 算法能够正确计算图中所有城市对之间的最短路径。

2、通过遍历所有候选道路，并计算添加每条道路后最短路径距离减少的最大值，可以保证找到最优的道路。

idea:
时间复杂度计算:
1、Floyd-Warshall 算法的时间复杂度为 O(V^3)。
2、算法需要遍历 E' 中的每条道路，对于每条道路，需要运行一次 Floyd-Warshall 算法，并计算所有城市对之间的距离减少量，因此总的时间复杂度为 O(|E'| * V^3)。

In [39]:
# add your code here
# algorithm of the time complexity :O(|E'| * V^3)
def floyd_warshall(graph):
   
    dist = {}
    nodes = graph.keys()

    # 初始化距离矩阵
    for node in nodes:
        dist[node] = {}
        for other_node in nodes:
            if node == other_node:
                dist[node][other_node] = 0
            elif other_node in graph[node]:
                dist[node][other_node] = graph[node][other_node]
            else:
                dist[node][other_node] = float('inf')

    # 动态规划更新距离
    for k in nodes:
        for i in nodes:
            for j in nodes:
                dist[i][j] = min(dist[i][j], dist[i][k] + dist[k][j])

    return dist


def find_optimal_road(graph, candidate_roads):
    
    original_dist = floyd_warshall(graph)
    max_reduction = float('-inf')
    optimal_road = None

    for (u, v), length in candidate_roads.items():
        # 创建新图，包含候选道路
        new_graph = {node: graph[node].copy() for node in graph}
        new_graph.setdefault(u, {})[v] = length

        # 计算新图的最短路径
        new_dist = floyd_warshall(new_graph)

        # 计算距离减少量
        reduction = 0
        for start_node in graph:
            for end_node in graph:
                reduction = max(reduction, original_dist[start_node][end_node] - new_dist[start_node][end_node])

        # 更新最优道路
        if reduction > max_reduction:
            max_reduction = reduction
            optimal_road = (u, v)

    return optimal_road, max_reduction


# 示例
if __name__ == "__main__":
    # 示例图
    graph = {
        'A': {'B': 10, 'C': 3},
        'B': {'C': 5},
        'C': {'D': 7},
        'D': {}
    }

    # 候选道路
    candidate_roads = {
        ('A', 'D'): 2,
        ('B', 'D'): 1
    }

    # 寻找最优道路
    optimal_road, max_reduction = find_optimal_road(graph, candidate_roads)

    print("最优道路:", optimal_road)
    print("最大距离减少量:", max_reduction)

最优道路: ('B', 'D')
最大距离减少量: 11


## 问题 4

**逃离问题**

一个 $ n \times n $ 的网格是一个无向图，由 $ n $ 行和 $ n $ 列的顶点组成，如下图所示。我们用 $(i,j)$ 表示第 $ i $ 行和第 $ j $ 列的顶点。除了边界顶点，网格中的所有顶点都有四个邻居，即满足 $ i = 1, i = n, j = 1 $ 或 $ j = n $ 的点 $(i,j)$。

给定网格中的 $ m \leq n^2 $ 个起点 $(x_1, y_1), (x_2, y_2), \cdots , (x_m, y_m)$，逃离问题是确定是否存在 $ m $ 条顶点不相交的路径（即路径之间不相交），从这些起点到边界上的任意 $ m $ 个不同点。例如，图1中的网格存在逃离。

(1) 该问题可以看作是一个最大流问题。考虑一个流网络，其中顶点和边都有容量。也就是说，进入任何给定顶点的总正流量受到容量限制。证明在具有边和顶点容量的网络中确定最大流可以简化为在具有可比大小的普通流网络上的最大流问题。更准确地说，你需要将一个具有顶点和边容量的网络 $ G = (V,E) $ 转换为另一个仅具有边容量的网络 $ G' = (V', E') $，使得两个网络上的最大流相同，并且你构建的新网络具有 $ V' = O(V) $ 个顶点和 $ E' = O(E) $ 条边。你可以假设网络是连通的。

(2) 描述一个解决逃离问题的高效算法，并分析其运行时间。


<div align="center"> <img alt="图片" src="./fig/escepe-p.png"> </div>
<center> 图2. 逃脱问题网格，起始顶点为黑色，其他网格顶点为白色</center>

idea：
![h4_p4.png](./fig/h4_p4.png)

idea：
算法设计

图建模：
1. **每个格点**拆成两个点 $u_{in}$ 和$u_{out}$，中间连一条容量为 1 的边，表示该顶点最多只能被经过一次（顶点容量 = 1）；
2. 如果两个点是邻居，例如 $(i, j)$ 和 $(i+1, j)$，则添加边：  
   $u_{out(i,j)} → v_{in(i+1,j)}$，容量为 1；
3. 引入**超级源点** S，连接所有起点的 $u_{in}$，容量为 1；
4. 引入**超级汇点** T，连接所有边界点的 $u_{out}$，容量为 1；
5. 求最大流。如果最大流值等于起点个数 m ，说明所有人都能逃脱且路径互不交。

运行时间分析：

- 总共有 $ n^2 $ 个格点，每个拆成 2 个点，所以点数是 $ O(n^2) $
- 每个格点与最多 4 个邻居连接边，拆点后边数是 $ O(n^2) $
- 起点与源、边界点与汇连接也是 $ O(n^2) $
- 使用 **Dinic 算法**：
  - 时间复杂度：
    - Dinic: $ O(E \sqrt{V}) = O(n^2 \cdot \sqrt{n^2}) = O(n^3) $

因此，总时间复杂度为$ O(n^3) $