## algorithm design and anlysis-2025 spring  homework 4
**Deadline**：2025.5.14

**name**:


note：
---
1. 带有\*的题目，申请免上课的同学，必须完成，其他同学选作；
2. 请独立完成，如求助了他人或者大模型，请著明，并且不可省略算法分析部分；
4. 如若作答有雷同，全部取消成绩；
3. 需要书面作答的题目，可以通过引用图片的形式添加，但是注意上传项目时包含所引用的图片的源文件；
4. $log_n$ 默认表示$log_2{n}$;

## 问题 1 
**最小生成树（Minimum Spanning Tree）**

设  **G**  为一个带权重的连通无向图，且所有边的权重均不相等。令$e_i$ 为权重第 $i$ 小的边。最小生成树（MST）是否必须包含 $e_1$ ? 同理，是否必须包含 $e_2$ 和 $e_3$ ? 若必须包含，请给出证明；否则，请构造反例。需从基本原理论证，不能依赖割引理(cut lemma) 或 Prim/Kruskal算法的正确性。


answer:

**结论**
- \( e_1 \) 和 \( e_2 \) 必须被包含：任何MST不包含它们会导致更优解存在，矛盾。  
- \( e_3 \) 不一定被包含：存在反例（如环形结构中选择更优边组合），使得MST可不含 \( e_3 \)。

**证明**

 1. \( e_1 \) 必须被包含
证明：  
假设存在一个MST不包含 \( e_1 \)。将 \( e_1 \) 加入该MST，会形成一个环。由于所有边权重唯一且 \( e_1 \) 是全局最小边，环中至少存在一条边 \( e' \) 满足 \( w(e') > w(e_1) \)。删除 \( e' \) 并保留 \( e_1 \)，可以得到总权重更小的生成树，与原始MST的假设矛盾。因此，所有MST必须包含 \( e_1 \)。


2. \( e_2 \) 必须被包含
证明：  
假设存在一个MST不包含 \( e_2 \)。将 \( e_2 \) 加入该MST，会形成一个环。由于所有边权重唯一且 \( e_2 \) 是第二小边，环中至少存在一条边 \( e' \) 满足 \( w(e') > w(e_2) \)。删除 \( e' \) 并保留 \( e_2 \)，可以得到更优的生成树，矛盾。因此，所有MST必须包含 \( e_2 \)。


3. \( e_3 \) 不一定被包含
反例：  
考虑图如下：  
- 顶点：\( A, B, C, D \)  
- 边：  
  - \( e_1 = AB (1) )  
  - \( e_2 = BC (2) )  
  - \( e_3 = CA (3) )  
  - \( e_4 = AD (4) )  


## 问题 2 
**瓶颈生成树（Bottleneck Spanning Tree）**

带有权重的无向图 $G(V,E,w)$ 的瓶颈生成树，表现为：在所有生成树中，最大权重边的权重值最小。即，BST $T$ 最小化瓶颈损失 $c(T)=max_{e \in T}{w(e)}$。

1. 证明 $G$ 的每一个最小生成树（MST）都是瓶颈生成树（BST）
2. 设计一个线性时间复杂度的算法：， 对于一个图 $G(V,E,w)$ 和一个整数 $b$，判断图 $ G$ 是否存在一个瓶颈生成树，其最大权重边的权重不超过 $b$，分析算法设计思路，并基于python编程实现。
3. 设计一个线性时间复杂度的算法：对于给定的图 $G(V,E,w)$，找到其瓶颈生成树，分析算法设计思路，并基于python编程实现。

证明：假设存在一个生成树 \( T' \)，其最大边权 \( d < c \)（其中 \( c \) 是某MST的最大边权）。将 \( T' \) 的所有边加入后，这些边的权重均 \( <= d \)。由于在构造MST时，必须选择权重为 \( c \) 的边才能连通整个图，说明权重 \( <=d \) 的边不足以连接所有顶点，矛盾。因此，\( T' \) 不存在，MST的最大边权 \( c \) 是所有生成树中可能的最小值，故MST是BST。

idea：首先过滤边：保留所有权重 \(<= b \) 的边，构成子图 \( G' \)。然后进行连通性检查：使用BFS/DFS或并查集判断 \( G' \) 是否连通。若连通，则存在这样的BST；否则不存在。

In [2]:
# add your code here
from collections import deque

def has_bottleneck_tree(vertices, edges, b):
    adj = {v: [] for v in vertices}
    for (u, v, w) in edges:
        if w <= b:
            adj[u].append(v)
            adj[v].append(u)
    
    if not vertices:
        return True
    visited = set()
    start = next(iter(vertices))
    queue = deque([start])
    visited.add(start)
    while queue:
        u = queue.popleft()
        for v in adj[u]:
            if v not in visited:
                visited.add(v)
                queue.append(v)
    return len(visited) == len(vertices)

# algorithm of the liear time complexity  O(V + E)

idea：首先找到最小可能的 \( b \)：即MST的最大边权。由于MST的构造依赖排序，需优化为线性时间。然后构造生成树：在边权 \( \leq b \) 的子图中，通过BFS/DFS生成树。

In [8]:
# add your code here
def find_bottleneck_tree(vertices, edges):
    edge_weights = [w for (u, v, w) in edges]
    if not edge_weights:
        return []

    def is_valid(b):
        return has_bottleneck_tree(vertices, edges, b)

    left = min(edge_weights)
    right = max(edge_weights)
    answer = right 
    
    while left <= right:
        mid = (left + right) // 2
        if is_valid(mid):
            answer = mid
            right = mid - 1
        else:
            left = mid + 1

    filtered_edges = [(u, v, w) for (u, v, w) in edges if w <= answer]
    adj = {v: [] for v in vertices}
    for (u, v, w) in filtered_edges:
        adj[u].append(v)
        adj[v].append(u)

    parent = {}
    start = next(iter(vertices))
    queue = deque([start])
    visited = {start}
    for v in vertices:
        if v not in visited:
            queue = deque([v])
            visited.add(v)
        while queue:
            u = queue.popleft()
            for neighbor in adj[u]:
                if neighbor not in visited:
                    visited.add(neighbor)
                    parent[neighbor] = u
                    queue.append(neighbor)

    tree_edges = []
    for v in vertices:
        if v != start and v in parent:
            tree_edges.append((parent[v], v, next(w for (u, v2, w) in edges if (u == parent[v] and v2 == v) or (u == v and v2 == parent[v]))))
    
    return tree_edges

# algorithm of the liear time complexity  O((V + E)

## 问题 3

**道路网（Road Network）**

假设有一个以图 $ G(V, E, l) $ 表示的道路网络，连接了一组城市 $ V $。我们假设该网络是有向的，并且每条道路 $(u, v) \in E$ 都有一个非负的长度 $ l(u, v) $。一条新的道路即将被建造，因此有一个列表 $ E' $ 包含它可以连接的城市对。每对 $(u, v) \in E'$ 都有一个对应的长度 $ l'(u, v) $。我们希望选择一对城市，使得两个城市 $ s, t \in V $ 之间的距离减少最大。请为此问题编写一个高效的算法，并详细解释算法的正确性和复杂度。


idea：该算法通过两次预处理（正向计算起点s到所有节点的最短距离、反向计算所有节点到终点t的最短距离），结合候选边的路径优化潜力，找到使s到t距离减少最大的新边。具体步骤为首先预处理最短路径：使用Dijkstra算法计算原图中s到所有节点的最短距离d_s，以及反向图中所有节点到t的最短距离d_t（通过构建反向边实现）。然后评估候选边：对每条候选边(u, v)，其潜在优化路径为s→u→v→t，新路径长度为d_s[u] + l'(u, v) + d_t[v]，若此值小于原最短距离，则减少量为二者差值。最后选择最优解：遍历所有候选边，比较减少量，保留减少量最大的边

In [6]:
# add your code here
import heapq
from collections import defaultdict

def find_optimal_new_road(V, E, E_prime, s, t):
    graph = defaultdict(list)
    reverse_graph = defaultdict(list)
    for u, v, l in E:
        graph[u].append((v, l))
        reverse_graph[v].append((u, l))

    def dijkstra(start, g):
        dist = {node: float('inf') for node in V}
        dist[start] = 0
        heap = [(0, start)]
        visited = set()
        while heap:
            d, u = heapq.heappop(heap)
            if u in visited:
                continue
            visited.add(u)
            for v, w in g[u]:
                if dist[v] > d + w:
                    dist[v] = d + w
                    heapq.heappush(heap, (dist[v], v))
        return dist

    d_s = dijkstra(s, graph)          
    d_t = dijkstra(t, reverse_graph)  

    original_dist = d_s.get(t, float('inf'))
    max_reduction = 0
    best_edge = None

    for u, v, l_prime in E_prime:
        du = d_s.get(u, float('inf'))
        dv = d_t.get(v, float('inf'))
        candidate_length = du + l_prime + dv

        if candidate_length < original_dist:
            reduction = original_dist - candidate_length
        else:
            reduction = 0

        if reduction > max_reduction:
            max_reduction = reduction
            best_edge = (u, v)

    return best_edge, max_reduction

# algorithm of the liear time complexity  O((V + E) \log V + K)


Can reach t from s with length <= L: False


正确性证明：新路径唯一性：加入单条边 $(u, v)$ 后，唯一可能缩短的路径是 $s \to u \to v \to t$。最优性保证：Dijkstra 算法确保 $d_s$ 和 $d_t$ 是全局最短距离，因此候选路径长度是理论最小值。

时间复杂度

Dijkstra 算法：两次运行，时间复杂度为 $O((V + E) \log V)$。  候选边遍历：$O(K)$，其中 $K$ 是候选边数量。  
总复杂度：$O((V + E) \log V + K)$，满足高效要求。


## 问题 4

**逃离问题**

一个 $ n \times n $ 的网格是一个无向图，由 $ n $ 行和 $ n $ 列的顶点组成，如下图所示。我们用 $(i,j)$ 表示第 $ i $ 行和第 $ j $ 列的顶点。除了边界顶点，网格中的所有顶点都有四个邻居，即满足 $ i = 1, i = n, j = 1 $ 或 $ j = n $ 的点 $(i,j)$。

给定网格中的 $ m \leq n^2 $ 个起点 $(x_1, y_1), (x_2, y_2), \cdots , (x_m, y_m)$，逃离问题是确定是否存在 $ m $ 条顶点不相交的路径（即路径之间不相交），从这些起点到边界上的任意 $ m $ 个不同点。例如，图1中的网格存在逃离。

(1) 该问题可以看作是一个最大流问题。考虑一个流网络，其中顶点和边都有容量。也就是说，进入任何给定顶点的总正流量受到容量限制。证明在具有边和顶点容量的网络中确定最大流可以简化为在具有可比大小的普通流网络上的最大流问题。更准确地说，你需要将一个具有顶点和边容量的网络 $ G = (V,E) $ 转换为另一个仅具有边容量的网络 $ G' = (V', E') $，使得两个网络上的最大流相同，并且你构建的新网络具有 $ V' = O(V) $ 个顶点和 $ E' = O(E) $ 条边。你可以假设网络是连通的。

(2) 描述一个解决逃离问题的高效算法，并分析其运行时间。


<div align="center"> <img alt="图片" src="./fig/escepe-p.png"> </div>
<center> 图2. 逃脱问题网格，起始顶点为黑色，其他网格顶点为白色</center>

idea：

1.从带顶点容量的网络到仅带边容量的网络

对每个原图顶点 $v\in V$（容量为 $c_v$），我们“拆分”成两个顶点 $v_{\rm in}$ 和 $v_{\rm out}$，并在它们之间加一条有向边 $(v_{\rm in}\to v_{\rm out})$，容量设为 $c_v$。原来所有指向 $v$ 的边 $(u\!-\!v)$ 改为从 $u_{\rm out}\to v_{\rm in}$，容量不变；而所有从 $v$ 出发的边 $(v\!-\!w)$ 改为从 $v_{\rm out}\to w_{\rm in}$。这样，每次流经“$v_{\rm in}\to v_{\rm out}$”都受到原顶点容量 $c_v$ 的限制；其余边仅保留它们原有的容量约束。新网络顶点数和边数均为原来的 $O(V)$ 和 $O(E)$，且最大流值恰与原网络相同。



2.逃离问题的算法设计  

算法步骤：  
1. 构建流网络：  
   - 将网格中每个顶点 $(i,j)$ 拆分为 $(i,j)_{\text{in}}$ 和 $(i,j)_{\text{out}}$，边 $(i,j)_{\text{in}} \to (i,j)_{\text{out}}$ 容量为 1。  
   - 对网格中每条无向边 $(u, v)$，添加两条有向边 $u_{\text{out}} \to v_{\text{in}}$ 和 $v_{\text{out}} \to u_{\text{in}}$，容量均为 1。  
   - 源点 $S$ 连接所有起点 $(x_k, y_k)_{\text{in}}$，边容量为 1。  
   - 所有边界顶点 $(i,j)_{\text{out}}$ 连接到汇点 $T$，边容量为 1。  

2. 计算最大流：使用 Dinic 算法或 ISAP 算法计算 $S$ 到 $T$ 的最大流。  

3. 判定条件：若最大流等于 $m$，则存在 $m$ 条顶点不相交的逃离路径；否则不存在。  

时间复杂度：  
- 网络顶点数 $O(n^2)$，边数 $O(n^2)$。  
- Dinic 算法在单位容量网络中的复杂度为 $O(E \sqrt{V}) = O(n^3)$，满足高效性要求。  