# Search Algorithms

#### INCLUDES:
1. [回溯搜索（Backtracking Search）](#1.-回溯搜索（Backtracking-Search）)
2. [深度优先搜索（DFS）](#2.-深度优先搜索（DFS）)
3. [带有迭代加深的深度优先搜索（DFS with Iterative Deepening）](#带有迭代加深的深度优先搜索（DFS-with-Iterative-Deepening）)
4. [广度优先搜索（BFS）](#3.-广度优先搜索（BFS）)
5. [一致代价搜索（Uniform Cost Search）](#4.-一致代价搜索（Uniform-Cost-Search）)
6. [启发式搜索（Informed Search）](#5.-启发式搜索（Informed-Search）)
7. [贪心搜索（Greedy Search）](#贪心搜索（Greedy-Search）)
8. [Relaxation](#Relaxation)

搜索算法是一种用于搜索问题解决方案的算法。搜索问题是指在给定的问题域中找到一个解决方案。搜索问题的例子包括寻找图中的最短路径，寻找图中的最小生成树，寻找图中的最大流等。搜索算法的例子包括深度优先搜索，广度优先搜索，A*搜索等。

### Complexity
在描述搜索算法的复杂性时，常常会用到三个主要的量：分支因子（b）、最浅目标节点的深度（d）以及状态空间中任何路径的最大长度（D）。这些量帮助我们理解算法的效率，特别是在时间和空间需求方面。

### 分支因子 (b)

分支因子是指在状态空间树中，任何节点的最大后继节点数。简而言之，它表示从任一给定状态出发，你有多少种选择来进行下一步。在一个图形游戏中，比如象棋，分支因子可能是指你每次可以走的步数。分支因子越大，状态空间树就越宽，这意味着每一层都有更多的节点需要探索。

### 最浅目标节点的深度 (d)

最浅目标节点的深度是指从根节点（初始状态）到最近的目标状态的最短路径上的步数或边数。这个度量告诉我们在最佳情况下，算法至少需要多少步才能找到解决方案。深度d对于理解算法在找到第一个解决方案方面的效率至关重要，尤其是在使用如深度优先搜索或广度优先搜索这类算法时。

### 状态空间中任何路径的最大长度 (D)

最大路径长度D是指在状态空间树中可能的最长路径的长度，从根节点到最远的叶节点。这个度量反映了搜索空间的最大潜在深度，即算法可能需要探索的最大步数。在最坏的情况下，一个搜索算法可能需要遍历整个状态空间以找到目标状态，这意味着它的时间或空间复杂度至少与D成正比。

### 复杂性的影响

- **时间复杂性**：搜索算法的时间复杂性通常与生成和检查状态空间中的节点数量有关。在最坏的情况下，可能需要探索状态空间中的每个节点，其数量与分支因子的深度次幂成正比（即\(O(b^D)\)）。在最佳情况下，算法可能在深度d时就找到目标，此时的时间复杂性为\(O(b^d)\)。

- **空间复杂性**：空间复杂性与算法必须存储的节点数量有关。对于需要存储所有扩展节点的算法（如广度优先搜索），空间复杂性也与\(O(b^D)\)成正比。对于那些只需要存储沿路径节点的算法（如深度优先搜索），空间复杂性与最大深度D成正比（即\(O(D)\)）。

这些参数有助于在理论上分析和比较不同搜索算法的性能，尽管在实际应用中，算法的效率还会受到许多其他因素的影响，如启发式函数的选择、算法的实现细节以及问题特定的约束条件。

根据搜索空间的特性，搜索算法可以分为两类：树搜索（Tree Search）和图搜索（Graph Search）。
大多数基本搜索策略都可以采用这两种形式之一。关键的区别在于算法是否记录已经访问过的状态，以避免重复探索。以下是一些常见搜索策略的树搜索和图搜索的应用：

### 树搜索（Tree Search）

树搜索算法在搜索过程中将状态空间视为一棵树，每个节点代表一个可能的状态。树的根节点代表初始状态，每个子节点代表从当前状态通过某个操作达到的后继状态。树搜索算法不直接记录每个状态是否已被访问，因此同一个状态可能在树的不同位置被重复创建和探索。

**特点**：
- 树搜索在搜索过程中不检查一个状态是否被重复访问。
- 可能会重复探索相同的状态，导致效率降低。
- 适用于状态空间较小或不存在太多重复状态的问题。

### 图搜索（Graph Search）

图搜索算法在搜索过程中将状态空间视为图，图中的节点同样代表可能的状态，但每个状态在搜索过程中只被创建一次。如果算法遇到一个已经探索过的状态，它将重用之前创建的节点而不是创建一个新的，从而避免了重复探索相同的状态。

**特点**：
- 图搜索通过维护一个已访问状态的集合来避免重复访问同一状态。
- 更加高效，特别是在有大量重复状态或环的大型状态空间中。
- 需要额外的内存来存储已访问状态的信息。

### 树搜索与图搜索的选择

选择树搜索还是图搜索通常取决于特定问题的状态空间特性及其大小。对于不存在或很少有重复状态的问题，树搜索可能是一个简单且有效的解决方案。然而，对于那些具有大量重复状态或环的问题，图搜索更为合适，因为它可以显著减少不必要的计算，提高搜索效率。

在实现上，图搜索算法相较于树搜索算法而言，需要更多的内存来存储已经访问过的状态集合，但这通常是值得的，因为它减少了重复工作，特别是在复杂或大型问题中。

## 1. 回溯搜索（Backtracking Search）

回溯搜索是一种通过试错来寻找解决方案的算法，它会在每一步尝试所有可能的选项，并在发现当前选择不会导致解决方案时，取消上一步或几步的计算，然后通过其他可能的选项继续尝试。回溯法通常用于解决约束满足问题，如数独、八皇后问题等。

#### 复杂度
- 时间复杂度：O(b^D)，其中b是分支因子，D是最大路径长度。
- 空间复杂度：O(D)。

#### Python 示例：八皇后问题

In [7]:
def is_safe(board, row, col):
    for i in range(col):
        if board[row][i] == 1:
            return False

    for i, j in zip(range(row, -1, -1), range(col, -1, -1)):
        if board[i][j] == 1:
            return False

    for i, j in zip(range(row, len(board), 1), range(col, -1, -1)):
        if board[i][j] == 1:
            return False

    return True

def solve_n_queens(board, col):
    if col >= len(board):
        return True

    for i in range(len(board)):
        if is_safe(board, i, col):
            board[i][col] = 1

            if solve_n_queens(board, col + 1):
                return True

            board[i][col] = 0

    return False

def n_queens(n):
    board = [[0] * n for _ in range(n)]
    if solve_n_queens(board, 0):
        for row in board:
            print(row)
    else:
        print("No solution")

n_queens(8)

[1, 0, 0, 0, 0, 0, 0, 0]
[0, 0, 0, 0, 0, 0, 1, 0]
[0, 0, 0, 0, 1, 0, 0, 0]
[0, 0, 0, 0, 0, 0, 0, 1]
[0, 1, 0, 0, 0, 0, 0, 0]
[0, 0, 0, 1, 0, 0, 0, 0]
[0, 0, 0, 0, 0, 1, 0, 0]
[0, 0, 1, 0, 0, 0, 0, 0]


## 2. 深度优先搜索（DFS）

深度优先搜索是一种用于遍历或搜索树或图的边界的算法。该算法沿着树的深度遍历树的节点，尽可能深地搜索树的分支，当节点v的所在边都已被探寻过，搜索将回溯到发现节点v的那条边的起始节点。

<img src="./images/img_12.png">

#### 复杂度
- 时间复杂度：O(b^D)，其中b是分支因子，D是最大路径长度。
- 空间复杂度：O(D)，其中D是状态空间中任何路径的最大长度。
#### Python 示例：

In [1]:
# 定义一个图, 用字典表示A: ['B', 'C']表示A节点的邻接节点是B和C
graph = {
    'A': ['B', 'C'],
    'B': ['D', 'E'],
    'C': ['F'],
    'D': [],
    'E': ['F'],
    'F': []
}

visited = set()

def dfs(visited, graph, node):
    # 当前节点不在已访问的节点集合中，再访问，保证不重复访问
    if node not in visited:
        print(node)
        visited.add(node)
        for neighbour in graph[node]:
            dfs(visited, graph, neighbour)

dfs(visited, graph, 'A') # 打印一个图的深度优先遍历结果，即最终访问的节点顺序

A
B
D
E
F
C


In [13]:
# 树的深度优先遍历
# 与图搜索不同，此时我们不需要跟踪已访问的节点
# 图搜索中visited用set，树搜索中visited用list，目的是
def dfs_tree(graph, node, visited=None):
    # 当已访问节点集合为空时，初始化为空列表
    if visited is None:
        visited = []  # 注意，这里不是集合，因为我们不跟踪已访问节点
    print(node)
    visited.append(node)
    for neighbour in graph[node]:
        if neighbour not in visited:
            dfs_tree(graph, neighbour, visited)

dfs_tree(graph, 'A')


A
B
D
E
F
C


## 带有迭代加深的深度优先搜索（DFS with Iterative Deepening）

迭代加深深度优先搜索（IDDFS）是一种结合了深度优先搜索的空间效率和广度优先搜索最优解的策略。它按照深度优先进行搜索，但是有一个设定的深度限制，而且这个限制会逐步增加。

<img src="./images/img_14.png">

#### 复杂度
- 时间复杂度：O(b^d)，其中b是分支因子，d是最浅目标节点的深度。
- 空间复杂度：O(d)，其中d是解的深度。

#### Python 示例：图搜索

In [5]:
def dls(node, goal, depth):
    if depth == 0 and node == goal:
        return True
    if depth > 0:
        for child in graph[node]:
            if dls(child, goal, depth-1):
                return True
    return False

def iddfs(node, goal, max_depth):
    for depth in range(max_depth):
        if dls(node, goal, depth):
            return True
    return False

graph = {'A': ['B', 'C', 'E'],
         'B': ['D', 'F'],
         'C': ['G'],
         'D': [],
         'E': ['F'],
         'F': ['H'],
         'G': [],
         'H': []}

iddfs('A', 'H', 4)  # True if found, False otherwise
# 打印一个图的深度优先遍历结果，即最终访问的节点顺序


True


## 3. 广度优先搜索（BFS）

广度优先搜索是从根节点开始，沿着树的宽度遍历树的节点。如果所有节点均被访问，则算法中止。

<img src="./images/img_13.png">

#### 复杂度
- 时间复杂度：O(b^d)，最坏情况下。
- 空间复杂度：O(b^d)

#### Python 示例：

In [6]:
from collections import deque

graph = {
    'A': ['B', 'C'],
    'B': ['D', 'E'],
    'C': ['F'],
    'D': [],
    'E': ['F'],
    'F': []
}

def bfs(graph, start_node):
    visited = set()
    queue = deque([start_node])

    while queue:
        node = queue.popleft()
        if node not in visited:
            print(node)
            visited.add(node)
            queue.extend([n for n in graph[node] if n not in visited])

bfs(graph, 'A')

A
B
C
D
E
F


## 4. 一致代价搜索（Uniform Cost Search）

#### 算法原理
一致代价搜索是一种用于在加权图中找到从初始节点到目标节点最小代价路径的算法。它扩展了最少累积代价的节点，而不是最先找到的节点。一致代价搜索使用优先队列来保持最小路径代价的节点在队列前面。

#### 优缺点
- **优点**：总是找到最小代价路径，即使步骤代价不相等。
- **缺点**：时间和空间复杂度高，因为它需要存储和排序所有扩展的节点。

#### 复杂度
- 时间复杂度： 最坏情况下的时间复杂度为O(b^d)，其中b是分支因子，d是解的深度。
- 空间复杂度：O(b^d)

UCS的完成度是guranateed的，因为它会扩展所有的节点，直到找到目标节点。当cost一致，UCF与BFS相同。但是，当cost不一致时，UCS会找到最小代价路径，而BFS不会。

#### Python 示例
<img src="./images/img_16.png">

In [20]:
import heapq

graph = {
    'S': {'A': 1, 'G': 12},
    'A': {'B': 3, 'C': 1},
    'B': {'D': 3},
    'C': {'D': 1, 'G': 2},
    'D': {'G': 3},
    'G': {}
}

graph2={
    'A': {'B': 1, 'C': 3},
    'B': {'D': 1, 'E': 1},
    'D': {'F': 1},
    'E': {},
    'F': {'K': 2, 'L': 2},
    'K': {},
    'L': {},
    'C': {'G': 1, 'H': 2},
    'G': {},
    'H': {'I': 1, 'J': 1},
    'I': {},
    'J': {},
}

def uniform_cost_search(graph, start, goal):
    visited = set()
    queue = [(0, start, [])]  # (cost, vertex, path)
    heapq.heapify(queue)

    while queue:
        (cost, vertex, path) = heapq.heappop(queue)
        if vertex not in visited:
            visited.add(vertex)
            path = path + [vertex]

            if vertex == goal:
                return (cost, path)

            for next_vertex, weight in graph[vertex].items():
                if next_vertex not in visited:
                    heapq.heappush(queue, (cost + weight, next_vertex, path))

    return float("inf"), []

print(uniform_cost_search(graph2, 'A', 'G'))  # 输出最小代价和路径

(4, ['A', 'C', 'G'])


## 5. 启发式搜索（Informed Search）

#### 算法原理
启发式搜索算法使用启发式函数来估计从当前节点到目标节点的最佳路径的代价。A*搜索是最著名的启发式搜索算法，它结合了一致代价搜索的确保最小代价路径和贪心搜索的启发式信息。

#### 优缺点
- **优点**：更高效，因为启发式函数帮助减少搜索范围。
- **缺点**：启发式函数的质量直接影响算法的效率和正确性。

#### 时间复杂度
- 时间复杂度取决于启发式函数的准确性，理想情况下是O(b^m)，其中m是解的深度。

#### A*搜索
完备性：如果存在解，'A*'搜索保证找到解。
最优性：在启发式函数h(n)满足一定条件（如一致性或单调性）时，'A*'搜索保证找到最优解。
效率：相对于其他图搜索算法，'A*'搜索在找到最短路径时通常需要较少的步骤，但这取决于启发式函数的质量。

在A*搜索算法中，f成本和g成本是核心概念，用于评估和比较路径的优劣，从而决定搜索过程中的节点扩展顺序。

1. **g成本（G-Cost）**：
   - **定义**：g成本是从起始节点到当前节点的实际成本。它表示了达到当前节点已经花费的路径长度或成本，不考虑剩余到目标节点的距离。
   - **计算公式**：对于当前节点，g成本是父节点的g成本加上从父节点到当前节点的成本。如果当前节点是起始节点，其g成本为0。
     $$\[
     g(\text{当前节点}) = g(\text{父节点}) + \text{从父节点到当前节点的成本}
     \]$$

2. **f成本（F-Cost）**：
   - **定义**：f成本是节点的总成本估计，用于在A*搜索中比较节点。它是g成本和h成本的总和。f成本越低的节点，会被优先考虑进行扩展。
   - **计算公式**：f成本是当前节点的g成本和h成本之和。h成本（H-Cost）是启发式估计，表示从当前节点到目标节点的估计成本。这个估计应该是非负的，并且不会过高地估计实际成本，以保证A*搜索的有效性和最优性。
     $$\[
     f(\text{当前节点}) = g(\text{当前节点}) + h(\text{当前节点})
     \]$$

这样，通过综合考虑已经花费的成本（g成本）和剩余估计成本（h成本），A*搜索算法能够有效地找到从起始节点到目标节点的最低成本路径。h成本的准确性和合理性对于算法的效率和结果至关重要。

实际成本：g（n）是从起始节点到节点n的实际成本。一般在图中由边的权重表示。
启发式成本：h（n）是从节点n到目标节点的估计成本。这是一个启发式函数，用于估计从节点n到目标节点的最低成本。

#### Admissibility
如果启发式函数h(n)满足以下条件，则称其为“可接受的”（admissible）：
- 对于所有节点n，h(n) <= h*(n)，其中h*(n)是从节点n到目标节点的实际最低成本。

#### Consistency
如果启发式函数h(n)满足以下条件，则称其为“一致的”（consistent）：
- 对于所有节点n和n的后继节点m，h(n) <= c(n, m) + h(m)，其中c(n, m)是从节点n到节点m的实际成本。

#### Python 示例

In [21]:
import heapq

def a_star_search(graph, start, goal, h):
    visited = set()
    queue = [(h(start), 0, start, [])]  # (estimated_cost, cost_so_far, vertex, path)
    heapq.heapify(queue) # 将列表转换为堆，实现最小堆

    while queue:
        (estimated_cost, cost_so_far, vertex, path) = heapq.heappop(queue)
        if vertex not in visited:
            visited.add(vertex)
            path = path + [vertex]

            if vertex == goal:
                return (cost_so_far, path)

            for next_vertex, weight in graph[vertex].items():
                if next_vertex not in visited:
                    next_cost = cost_so_far + weight
                    heapq.heappush(queue, (next_cost + h(next_vertex), next_cost, next_vertex, path))

    return float("inf"), []

# 示例启发式函数，返回启发评估值，heuristic estimate
def heuristic(node, goal):
    # 这里应该是根据具体问题定义的启发式函数
    return abs(ord(node) - ord(goal))

# 示例图, 用字典表示A: {'B': 1, 'C': 3}表示A节点的邻接节点是B和C, 代价分别是1和3
graph = {
    'A': {'B': 1, 'C': 3},
    'B': {'A': 1, 'D': 3, 'E': 1},
    'C': {'A': 3, 'F': 5},
    'D': {'B': 3},
    'E': {'B': 1, 'F': 8},
    'F': {'C': 5, 'E': 8}
}

print(a_star_search(graph, 'A', 'F', lambda x: heuristic(x, 'F')))  # 输出最小代价和路径

(8, ['A', 'C', 'F'])


### Python示例2--A*搜索
<img src="./images/img_19.png">

Admissibility：启发式函数h(n)是可接受的，当h(n) <= h*(n)时，其中h*(n)是从节点n到目标节点的实际最低成本。
- h(C) = 6 <= h*(C) = 20
- h(B) = 12 <= h*(B) = 12
- h(E) = 11 <= h*(E) = 2

Consistency：启发式函数h(n)是一致的，当h(n) <= c(n, m) + h(m)时，其中c(n, m)是从节点n到节点m的实际成本。
- h(C) = 6，对于一致性，我们需要检查对于节点C的每个子节点m，是否有h(C) ≤ c(C, m) + h(m)。在这个例子中，C只有一个子节点G，c(C, G) = 20，h(G) = 0，所以h(C) = 6 ≤ 20 + 0 = 20，这符合一致性。

- h(B) = 12，我们需要检查对于节点B的每个子节点，是否有h(B) ≤ c(B, m) + h(m)。节点B到节点E的成本是10，h(E) = 1，所以应该是h(B) ≤ c(B, E) + h(E)，即12 ≤ 10 + 1，这不符合一致性条件，因为12不小于等于11。


In [27]:
# A--B: (2, 12)表示A到B的代价是2，B的启发式函数值是12
graph = {
    'A': {'B': (2, 12), 'C': (6, 6), 'D': (10, 1)},
    'B': {'E': (10, 1)},
    'C': {'G': (20, 0)},
    'D': {'F': (2, 1)},
    'E': {'G': (2, 0)},
    'F': {'G': (20, 0)}
}

# Heuristics for each node to the goal 'G'
heuristics = {
    'A': 10,
    'B': 12,
    'C': 6,
    'D': 1,
    'E': 1,
    'F': 1,
    'G': 0
}

# Implementation of A* algorithm
from queue import PriorityQueue

def a_star_search(graph, start, goal):
    # Priority queue for maintaining nodes to visit
    frontier = PriorityQueue()
    frontier.put((0, start, []))  # (priority, node, path)， put()方法将元组放入队列
    visited = {}  # Stores nodes and their lowest-cost to reach
    
    while not frontier.empty():
        # Select the node with the lowest f(n) value
        cost, current, path = frontier.get() # get()方法从队列中取出元组
        # cost为当前节点的代价，current为当前节点，path为到当前节点的路径
        
        # If the node is the goal, return the cost and path
        if current == goal:
            return cost, path + [current]
        
        # If the node was visited and the new cost is higher, skip it
        if current in visited and visited[current] <= cost:
            continue
        
        # Mark the node as visited
        visited[current] = cost
        
        # Add neighbors to the priority queue with updated costs
        for neighbor, (edge_cost, _) in graph.get(current, {}).items():
            # Calculate the cost to reach the neighbor and the heuristic
            new_cost = cost + edge_cost
            heuristic = heuristics[neighbor]
            frontier.put((new_cost + heuristic, neighbor, path + [current]))
    
    return float('inf'), []  # If the goal was not reached

# Perform A* search from 'A' to 'G'
a_star_cost, a_star_path = a_star_search(graph, 'A', 'G')
a_star_cost, a_star_path


(27, ['A', 'B', 'E', 'G'])

### Relaxation
在算法和数学优化领域，松弛（Relaxation）指的是简化约束或目标函数的过程，以便找到问题的近似解或下界。这种方法常用于解决复杂的优化问题，其中原始问题可能难以直接求解。

例如，在图的最短路径问题中，松弛可能涉及忽略某些边的权重，以简化问题并快速找到近似解。在整数规划问题中，将整数约束放宽为连续约束是一种常见的松弛方式，这样可以使用线性规划方法求解。

## 贪心搜索（Greedy Search）

#### 算法原理
贪心搜索算法在每一步都采取局部最优解，即选择当前看起来最好的选项。它不保证找到最优解，因为它不考虑之前的选择和未来的后果。

#### 优缺点
- **优点**：实现简单，空间和时间效率较高。
- **缺点**：不保证找到最优解，容易陷入局部最优。

#### 时间复杂度
- 时间复杂度取决于问题的特性，但一般来说，它比完全搜索要快。

#### 代码示例

In [26]:
# 输入参数：图、起始节点、目标节点、启发式函数
def greedy_search(graph, start, goal, h):
    visited = set()
    queue = [(h(start), start, [])]  # 【启发式函数值，节点，路径】
    while queue:
        (heuristic, vertex, path) = queue.pop(0)  # 从队列前端取出
        if vertex not in visited:
            visited.add(vertex)
            path = path + [vertex]

            if vertex == goal:
                return path

            # 按启发式函数的值排序邻居
            neighbors = [(h(child), child) for child in graph[vertex] if child not in visited]
            neighbors.sort()
            for _, next_vertex in neighbors:
                queue.append((h(next_vertex), next_vertex, path))

    return []

graph = {
    'A': ['B', 'C'],
    'B': ['D', 'E'],
    'C': ['F'],
    'D': [],
    'E': ['F'],
    'F': []
}

# 示例启发式函数
# 这里定义为目标节点的ASCII码减去当前节点的ASCII码
def heuristic(node):
    # 这里应该是根据具体问题定义的启发式函数
    return ord('F') - ord(node)

print(greedy_search(graph, 'A', 'F', heuristic))  # 输出路径

['A', 'C', 'F']


### Python示例2
<img src="./images/img_18.png">

In [24]:
# 这里graph中的数字表示的是定义好的启发式函数值，可以当作cost来看
# 由于已经定义了启发式函数值，所以不需要再定义启发式函数
graph = {
    'S': {'A': 2, 'B': 3},
    'A': {'D': 4, 'C': 1},
    'B': {'G': 0, 'D': 4},
    'C': {},
    'D': {'G': 0},
    'G': {}
}

# We also need a function for the greedy best-first search.
def greedy_best_first_search(graph, start, goal):
    # This is the frontier queue which is initialized with the start node.
    frontier = [start]
    # This dictionary keeps track of the path.
    came_from = {start: None}
    
    while frontier:
        # The current node is the one with the lowest heuristic value in the frontier.
        current = min(frontier, key=lambda node: graph[node][goal] if goal in graph[node] else float('inf'))
        
        # If the current node is the goal, then we reconstruct the path and return it.
        if current == goal:
            path = []
            while current:
                path.append(current)
                current = came_from[current]
            return path[::-1]  # Return reversed path.
        
        # If the current node is not the goal, remove it from the frontier and add its children.
        frontier.remove(current)
        for next in graph[current]:
            if next not in came_from:  # Ignore the parent nodes.
                frontier.append(next)
                came_from[next] = current

# Now let's call the search function with our graph, starting from 'S' and aiming to reach 'G'.
path = greedy_best_first_search(graph, 'S', 'G')
path


['S', 'B', 'G']