**Table of contents**<a id='toc0_'></a>    
- [Algorithm 算法](#toc1_)    
  - [参考](#toc1_1_)    
  - [复杂度](#toc1_2_)    
    - [时间复杂度](#toc1_2_1_)    
    - [空间复杂度](#toc1_2_2_)    
  - [递归](#toc1_3_)    
    - [定义](#toc1_3_1_)    
    - [递归的核心思想：](#toc1_3_2_)    
    - [递归的栈开销（Stack Overhead）](#toc1_3_3_)    
    - [示例](#toc1_3_4_)    
      - [计算阶乘：计算$n!=n×(n−1)!$](#toc1_3_4_1_)    
      - [求指定位置的斐波那契数列数值](#toc1_3_4_2_)    
  - [迭代](#toc1_4_)    
    - [迭代（Iteration）的定义](#toc1_4_1_)    
    - [迭代的特点](#toc1_4_2_)    
    - [示例](#toc1_4_3_)    
      - [计算阶乘：计算$n!=n×(n−1)!$](#toc1_4_3_1_)    
      - [斐波那契数列](#toc1_4_3_2_)    
      - [使用 while 迭代查找最大公约数（欧几里得算法）](#toc1_4_3_3_)    
  - [递归和迭代比较](#toc1_5_)    
  - [回溯（Backtracking）](#toc1_6_)    
    - [定义](#toc1_6_1_)    
    - [伪代码](#toc1_6_2_)    
    - [示例](#toc1_6_3_)    
      - [求数组的所有子集](#toc1_6_3_1_)    
- [数据结构](#toc2_)    
  - [链表](#toc2_1_)    
      - [单向链表](#toc2_1_1_1_)    
      - [双向链表](#toc2_1_1_2_)    
  - [栈](#toc2_2_)    
  - [队列（Queue）](#toc2_3_)    
  - [哈希表](#toc2_4_)    
  - [堆（Heap）](#toc2_5_)    
    - [应用场景](#toc2_5_1_)    
    - [最小堆](#toc2_5_2_)    
    - [最大堆](#toc2_5_3_)    
    - [手写堆（最大堆实现）](#toc2_5_4_)    
  - [几种数据结构总结](#toc2_6_)    

<!-- vscode-jupyter-toc-config
	numbering=false
	anchor=true
	flat=false
	minLevel=1
	maxLevel=6
	/vscode-jupyter-toc-config -->
<!-- THIS CELL WILL BE REPLACED ON TOC UPDATE. DO NOT WRITE YOUR TEXT IN THIS CELL -->

# <a id='toc1_'></a>[Algorithm 算法](#toc0_)


## <a id='toc1_1_'></a>[参考](#toc0_)

1. [Problem Solving with Algorithms and Data Structures using Python, 通过python解决算法和数据结构问题, 中文版](https://hellowac.github.io/pythonds-zh-cn/)
2. 参考 hello-aglo 。
3. 就把这100题搞清楚：[LeetCode 热题 HOT 100](https://leetcode.cn/problem-list/2cktkvj/)

## <a id='toc1_2_'></a>[复杂度](#toc0_)

参考：[时间和空间复杂度](./AlgorithmComplexity.md)

### <a id='toc1_2_1_'></a>[时间复杂度](#toc0_)

最主要的假设：多次循环中的不同层次的次数在无限的情况下，可以认为都是$n$；从而达到简化公式表达的目的。

事实上，对于一个算法（或者一段程序）来说，其最简频度往往就是最深层次的循环结构中某一条语句的执行次数。例如2n+1最简为n，实际上就是a++ 语句的执行次数；同样 $2n^2+2n+1$简化为$n^2$，实际上就是最内层循环中num++语句的执行次数。

实际上就是函数的变化率。谁的变化率大，最后就保留谁。

### <a id='toc1_2_2_'></a>[空间复杂度](#toc0_)

和时间复杂度类似，一个算法的空间复杂度，也常用大$O$记法表示。

要知道每一个算法所编写的程序，运行过程中都需要占用大小不等的存储空间，例如：
- 程序代码本身所占用的存储空间；
- 程序中如果需要输入输出数据，也会占用一定的存储空间；
- 程序在运行过程中，可能还需要临时申请更多的存储空间。

首先，程序自身所占用的存储空间取决于其包含的代码量，如果要压缩这部分存储空间，就要求我们在实现功能的同时，尽可能编写足够短的代码。

程序运行过程中输入输出的数据，往往由要解决的问题而定，即便所用算法不同，程序输入输出所占用的存储空间也是相近的。

事实上，对算法的空间复杂度影响最大的，往往是程序运行过程中所申请的临时存储空间。不同的算法所编写出的程序，其运行时申请的临时存储空间通常会有较大不同。

example 1:
```C
int n;
scanf("%d", &n);
int a[10];
```

通过分析不难看出，这段程序在运行时所申请的临时空间，并不随 n 的值而变化。而如果将第 3 行代码改为：

example 2:
```C
int a[n];
```
此时，程序运行所申请的临时空间，和$n$值有直接的关联。

所以，如果程序所占用的存储空间和输入值无关，则该程序的空间复杂度就为$O(1)$；反之，如果有关，则需要进一步判断它们之间的关系：
- 如果随着输入值 $n$ 的增大，程序申请的临时空间成线性增长，则程序的空间复杂度用 $O(n)$ 表示;
- 如果随着输入值 $n$ 的增大，程序申请的临时空间成 $n^2$ 关系增长，则程序的空间复杂度用 $O(n^2)$ 表示；
- 如果随着输入值 $n$ 的增大，程序申请的临时空间成 $n^3$ 关系增长，则程序的空间复杂度用 $O(n^3)$ 表示；
等等。

## <a id='toc1_3_'></a>[递归](#toc0_)

### <a id='toc1_3_1_'></a>[定义](#toc0_)
递归是一种函数调用自身的编程技巧。通常用于分解问题，直到问题变得足够简单，然后逐层返回结果。

**递归：适用于分治问题，如阶乘、斐波那契、二分搜索。**

### <a id='toc1_3_2_'></a>[递归的核心思想：](#toc0_)
- **基准情况（Base Case）： 递归的终止条件，确保不会无限递归**。
- 递归公式（Recurrence Relation）： 如何将当前问题拆解为子问题。
- 递归调用（Recursive Call）： 在问题拆解后，调用自身解决子问题。

注意：一定需要定义基准情况来终止递归。

### <a id='toc1_3_3_'></a>[递归的栈开销（Stack Overhead）](#toc0_)

在递归过程中，每次函数调用都会创建新的栈帧（Stack Frame），存储函数的局部变量、返回地址和参数，直到递归返回时才释放。这种额外的内存消耗就是递归的栈开销。

栈的工作方式
计算机的**调用栈（Call Stack）是后进先出（LIFO）**结构，每次递归调用时：
1. 创建新栈帧（存储参数、局部变量、返回地址）。
2. 压入栈中，等待当前函数执行完毕。
3. 递归返回后，弹出栈帧，恢复上一层状态。
如果递归深度过大，会导致栈空间耗尽，最终引发 RecursionError: maximum recursion depth exceeded（Python 默认递归深度为 1000）。python的最大递归深度是2000，

默认最大递归深度：
```python
import sys
print(sys.getrecursionlimit())  # 默认 1000
```

可以手动增大：
```python
sys.setrecursionlimit(2000)  # 设置更大的递归深度
```
但这只是缓解问题，不能从根本上解决，因为递归深度过大最终还是会溢出。


### <a id='toc1_3_4_'></a>[示例](#toc0_)

#### <a id='toc1_3_4_1_'></a>[计算阶乘：计算$n!=n×(n−1)!$](#toc0_)

In [None]:
def calculate(n: int) -> int:
    # 设置基准条件。
    # 0的阶乘为1。
    # 如果不设置基准条件就会导致python崩溃。
    if n == 0:
        return 1
    # 递归调用自身。
    return n * calculate(n - 1)

print(calculate(5))  # 120
    

120


#### <a id='toc1_3_4_2_'></a>[求指定位置的斐波那契数列数值](#toc0_)

$F(n)=F(n−1)+F(n−2)$

In [None]:
def fibonacci(n: int) -> int:
    # 如何这里设置为2，那么就会导致python崩溃。
    # 原因是：递归调用时：如果n=3, 那么会计算fibonacci(2) + fibonacci(1)。
    # 但是fibonacci(1)是没有定义的，所以会导致python崩溃。
    # 对于两个的递归，需要定义两个基准条件。
    # if n == 2:
    #     return 1
    
    # 注意递归使用位置下标是从0开始。
    # 第10个位置，实际上是第11个数。
    # 一定要注意题干下标从0开始还是从1开始。
    # 使用递归时，如果要求的下标位置从1开始，那么只能在外层封装减1，不能在递归中减1。
    if n == 0 or n == 1:
        return n
    
    return fibonacci(n - 1) + fibonacci(n - 2)

# 也就是从0开始，第10个数是34。
print(fibonacci(10))  # 34

34


时间复杂度：
$𝑂(2^𝑁)$（存在大量重复计算，可以优化为动态规划）

## <a id='toc1_4_'></a>[迭代](#toc0_)

### <a id='toc1_4_1_'></a>[迭代（Iteration）的定义](#toc0_)
迭代是一种重复执行某段代码的过程，通常使用 循环（for/while） 来实现。

**与递归不同，迭代不会使用函数调用自身，而是通过显式的循环结构不断更新变量的值，直到满足终止条件。**

**注意不是更新下标！是更新值本身！**

### <a id='toc1_4_2_'></a>[迭代的特点](#toc0_)
- 显式循环：依靠 for 或 while 语句来控制循环次数。
- 低栈空间消耗：不需要递归调用，通常比递归更节省内存。
- 适用于线性结构：数组、列表、字符串等适合用迭代处理。

### <a id='toc1_4_3_'></a>[示例](#toc0_)

#### <a id='toc1_4_3_1_'></a>[计算阶乘：计算$n!=n×(n−1)!$](#toc0_)
- 时间复杂度：$𝑂(𝑁)$，只需要 N 次乘法操作。
- 空间复杂度：$𝑂(1)$，只用了 result 和 i 两个变量，不占用额外栈空间。

In [8]:
def calculate(n: int) -> int:
    result = 1
    for i in range(1, n+1):
        # print(i)
        result *= i
    return result

print(calculate(5))  # 120

120


#### <a id='toc1_4_3_2_'></a>[斐波那契数列](#toc0_)

$F(n)=F(n−1)+F(n−2)$

- 时间复杂度：$𝑂(𝑁)$
- 空间复杂度：𝑂(1)（只用了 a, b 变量）

In [5]:
def fibonacci(n: int) -> int:
    # 注意迭代可以在函数中减1来修改不同开始下标对应的题目。而递归不行。
    # n = n - 1
    if n == 0 or n == 1:
        return n
    a, b = 0, 1
    for i in range(2, n+1):
        a, b = b, a + b
    return b

print(fibonacci(10))

55


#### <a id='toc1_4_3_3_'></a>[使用 while 迭代查找最大公约数（欧几里得算法）](#toc0_)

In [12]:
def gcd(a:int, b:int)->int:
    while b:
        print('b :{}.'.format(b))
        if a % b == 0:
            return b
        b = b - 1
    return b

print(gcd(12, 8))  

b :8.
b :7.
b :6.
6


In [13]:
def gcd(a, b):
    while b:  # 直到 b 变为 0
        a, b = b, a % b  # 不断更新 a, b
    return a

print(gcd(48, 18)) 

6


## <a id='toc1_5_'></a>[递归和迭代比较](#toc0_)

||递归（Recursion）	|迭代（Iteration）|
|---|---|---|
|核心思想	|通过函数调用自身来解决问题	|通过循环控制重复执行|
|终止条件	|基准条件（Base Case）	|for 或 while 条件|
|栈空间	|需要额外栈空间（可能栈溢出）	|不占用额外栈|
|执行速度	|可能慢（函数调用开销大）	|通常更快（无额外函数调用）|
|适用场景	|树、分治、搜索（如 DFS）	|数组、列表、数学计算|

何时用迭代 vs 递归？
1. 优先使用迭代
   1. 线性数据结构（数组、列表、字符串等）。
   2. 数学计算（阶乘、斐波那契、最大公约数）。
   3. 需要高效解决问题，避免栈溢出。
2. 适用递归
   1. 适用于树结构（如二叉树遍历）。
   2. 需要回溯搜索（如 N 皇后、全排列）。
   3. 适用于分治（如归并排序、快速排序）。

总结
- 迭代使用显式循环（for/while），适用于线性结构和数学计算。
- 递归使用函数调用自身，适用于树结构、分治、回溯搜索。
- 一般来说，能用迭代解决的问题，优先使用迭代，避免递归的栈开销。

## <a id='toc1_6_'></a>[回溯（Backtracking）](#toc0_)

**回溯实际上是利用了代码的一个特点，执行完当前函数之后范围执行函数时的位置**。这样就可以不用记录查找的位置而遍历所有的情况。

**回溯实际上也是用使用的递归的方式，只不过在逻辑上是完成某个完整的多步动作之后，返回从后往前返回之前的一步。**

这样就可以达到一种效果，保持某种之前条件（condition）不变的情况下，搜寻之后的所有情况，而不需要额外的开销来记录某种之前条件（condition）所处的位置。从而可以极大的简化代码。

### <a id='toc1_6_1_'></a>[定义](#toc0_)

回溯是一种试探+回退的搜索算法，适用于组合、排列、子集等问题。

它在搜索过程中尝试不同的选择，如果发现不符合条件，就回退到上一步，换一个选择继续探索。

### <a id='toc1_6_2_'></a>[伪代码](#toc0_)

```python

def backtrack(状态, 选择列表):
    if 终止条件:
        记录结果
        return
    for 选择 in 选择列表:
        做出选择
        递归进入下一层
        撤销选择（回溯）

```

### <a id='toc1_6_3_'></a>[示例](#toc0_)

#### <a id='toc1_6_3_1_'></a>[求数组的所有子集](#toc0_)

In [None]:
# 滑动窗口的方式求解。

def SlideWindow(input, start, windowLength):
    length = len(input)
    reuslt = []
    if start + windowLength > length :
        return None
    
    for i in range(start, length):
        if i + windowLength > length:
            break
        element = input[i:i+windowLength]
        reuslt.append(element)
    
    return reuslt

numbers = [1,2,3,4,5,6,7,8,9]

for position in range(1, len(numbers)):
    print(SlideWindow(numbers, position, 3))

In [7]:
def subsets(nums):
    res = []
    def backtrack(start, path):
        res.append(path[:])  # 记录当前子集
        for i in range(start, len(nums)):
            path.append(nums[i])  # 做选择
            backtrack(i + 1, path)  # 递归进入下一层
            path.pop()  # 撤销选择（回溯）
    
    backtrack(0, [])
    return res

# 测试
print(subsets([1, 2, 3]))


[[], [1], [1, 2], [1, 2, 3], [1, 3], [2], [2, 3], [3]]


In [5]:
for position in range(0, 4):
    print(position)

0
1
2
3


# 常用算法


## 常见算法复杂度总结表

| **算法类型** | **示例算法** | **时间复杂度** |
|-------------|-------------|---------------|
| **常数时间** | 访问数组元素 | $ O(1) $ |
| **对数时间** | 二分查找 | $ O(\log n) $ |
| **线性时间** | 线性搜索、BFS | $ O(n) $ |
| **线性对数时间** | 归并排序、快速排序 | $ O(n \log n) $ |
| **平方时间** | 冒泡排序、矩阵乘法 | $ O(n^2) $ |
| **立方时间** | Floyd-Warshall | $ O(n^3) $ |
| **指数时间** | 回溯（子集、全排列） | $ O(2^n) $ |
| **阶乘时间** | 旅行商问题（TSP） | $ O(n!) $ |


## 重点理解
- 对数算法$ O(logn)$ 比线性算法快得多（如二分查找 vs 线性搜索）。
- 排序算法 最优可以做到 $O(nlogn)$。
- 回溯算法（如全排列）通常是指数级复杂度。
- 动态规划 可以优化某些指数级问题，使其降至 多项式级（如 Floyd-Warshall 从 $O(n!)$ 降到 $O(n^3)$）。

## 常见排序算法的时间复杂度

| **排序算法**   | **平均时间复杂度** | **最优时间复杂度** | **最坏时间复杂度** | **空间复杂度** | **稳定性** |复杂性|
|---------------|------------------|------------------|------------------|----------------|-----------|---|
| **冒泡排序**  | $ O(n^2) $      | $ O(n) $       | $ O(n^2) $      | $ O(1) $     | ✅ 稳定   |简单|
| **选择排序**  | $ O(n^2) $      | $ O(n^2) $     | $ O(n^2) $      | $ O(1) $     | ❌ 不稳定 |简单|
| **插入排序**  | $ O(n^2) $      | $ O(n) $       | $ O(n^2) $      | $ O(1) $     | ✅ 稳定   |简单|
| **归并排序**  | $ O(n \log n) $ | $ O(n \log n) $ | $ O(n \log n) $ | $ O(n) $     | ✅ 稳定   |较复杂|
| **快速排序**  | $ O(n \log n) $ | $ O(n \log n) $ | $ O(n^2) $      | $ O(\log n) $ (递归栈) | ❌ 不稳定 |较复杂|
| **堆排序**    | $ O(n \log n) $ | $ O(n \log n) $ | $ O(n \log n) $ | $ O(1) $     | ❌ 不稳定 |较复杂|
| **计数排序**  | $ O(n + k) $    | $ O(n + k) $   | $ O(n + k) $    | $ O(k) $     | ✅ 稳定   ||
| **基数排序**  | $ O(nk) $       | $ O(nk) $      | $ O(nk) $       | $ O(n + k) $ | ✅ 稳定   |较复杂|
| **桶排序**    | $ O(n + k) $    | $ O(n) $       | $ O(n^2) $      | $ O(n + k) $ | ✅ 稳定   ||

**说明：**  
- $ n $ 是数组长度，$ k $ 是数据范围大小。  
- **稳定性**：若相等元素的相对顺序不变，则称该排序算法**稳定**。  


## 二分查找

二分查找的时间复杂度是 $O(log_2 N)$。

由于二分查找每次查询都是从数组中间切开查询，所以每次查询，剩余的查询数为上一次的一半，从下表可以清晰的看出查询次数与剩余元素数量对应关系

|第几次查询	|剩余待查询元素数量|
|---|---|
|1	|$\frac{N}{2}$ |
|2	|$\frac{\frac{N}{2}}{2} = \frac{N}{2^2}$|
|3	|$\frac{N}{2^3}$|
|...	|...|
|K	|$\frac{N}{2^K}$|


从上表可以看出$\frac{N}{2^K}$肯定是大于等于1。因为被查收链表中元素的数量是有限的，**“剩余待查询元素数量”**肯定是一个大于等于1的数值。因为查到剩余元素等于1的时候也就是查到最后一个值了，也就是说查到了。

因此也就是$\frac{N}{2^K} >= 1$，我们计算时间复杂度是按照最坏的情况进行计算，也就是是查到剩余最后一个数才查到我们想要的数据，也就是$\frac{N}{2^K} = 1 \Rightarrow N=2^K \Rightarrow K=log_2 N$。

所以二分查找的时间复杂度为$O(log_2 N)$。

In [2]:
import random
[random.randint(1, 100) for _ in range(10)]

[55, 73, 11, 42, 66, 81, 90, 29, 25, 87]

In [None]:
# import random
# inputlist = [1,2,3,4,5,6,7,8,9]
# [random.randint(1, 100) for _ in range(20)]
inputlist = [3, 12, 16, 17, 17, 19, 20, 21, 33, 34, 38, 39, 43, 48, 54, 55, 68, 82, 87, 88]

inputlist.sort()
print(inputlist)
count = 0

def binary_search(inputlist, target):
    """_summary_
    target 一定要存在于inputlist中，不然会崩溃。
    Args:
        inputlist (_type_): _description_
        target (_type_): _description_

    Returns:
        _type_: _description_
    """
    global count
    length = len(inputlist)
    # print(length)

    midposition = length // 2
    midvalue = inputlist[midposition]
    print('mid value {}.'.format(midvalue))
    count += 1
    if midvalue == target:
        print('result {}'.format(midvalue))
        return midvalue
    else:
        if midvalue < target:
            print('<')
            return binary_search(inputlist[midposition:], target)
        else:
            print('>')
            return binary_search(inputlist[:midposition], target)
    
result = binary_search(inputlist, 17)
print(result, count)


[3, 12, 16, 17, 17, 19, 20, 21, 33, 34, 38, 39, 43, 48, 54, 55, 68, 82, 87, 88]
mid value 38.
>
mid value 19.
>
mid value 16.
<
mid value 17.
result 17
17 4


## 深度优先

## 广度优先

# <a id='toc2_'></a>[数据结构](#toc0_)

## <a id='toc2_1_'></a>[链表](#toc0_)

#### <a id='toc2_1_1_1_'></a>[单向链表](#toc0_)

每个节点包含数据和指向下一个节点的指针。

In [None]:
class ListNode:
    def __init__(self, val=0, next=None):
        self.val = val
        self.next = next

class LinkedList:
    def __init__(self):
        self.head = None

    # 在链表末尾添加节点
    def append(self, val):
        # 创建一个新节点。
        new_node = ListNode(val)
        # 如果头节点不存在。
        if not self.head:
            # 那么头结点就等于新节点。
            self.head = new_node
            return
        # 如果头结点存在。
        # 设置一个临时变量为指向当前节点。
        cur = self.head
        # 那么就找到最后一个节点，然后将最后一个节点的next指向新节点。
        # 向后找每一个节点的next，直到某个节点的next为none时终止。此时cur指向的是最后一个节点。
        while cur.next:
            cur = cur.next
        cur.next = new_node

    # 打印链表
    def print_list(self):
        cur = self.head
        while cur:
            print(cur.val, end=" -> ")
            cur = cur.next
        print("None")

# 测试
ll = LinkedList()
ll.append(1)
ll.append(2)
ll.append(3)
ll.print_list()  # 输出: 1 -> 2 -> 3 -> None


1 -> 2 -> 3 -> None


#### <a id='toc2_1_1_2_'></a>[双向链表](#toc0_)

双向链表的特点：
- 每个节点有两个指针：一个指向前驱 prev，一个指向后继 next。
- 可以从头到尾，也可以从尾到头遍历。
- 插入和删除更灵活，但比单链表多占用一点内存。

In [None]:
class ListNode:
    """双向链表的节点"""
    def __init__(self, val=0):
        self.val = val
        self.prev = None  # 指向前一个节点
        self.next = None  # 指向后一个节点

class DoublyLinkedList:
    """双向链表"""
    def __init__(self):
        # 注意初始化定义的是头和尾两个节点。
        self.head = None  # 头节点
        self.tail = None  # 尾节点

    def append(self, val):
        """尾部插入新节点"""
        new_node = ListNode(val)
        # 如果链表为空，也就是头节点为空。
        # 那么头节点和尾节点都指向新节点。
        if not self.head:
            self.head = self.tail = new_node
        else:
            # 如果头节点存在。
            # 那么尾节点的next指向新节点。
            self.tail.next = new_node
            # 新节点的prev指向尾节点。
            new_node.prev = self.tail
            self.tail = new_node  # 更新尾节点

    def delete(self, val):
        """删除值为 val 的节点"""
        cur = self.head
        while cur:
            if cur.val == val:
                if cur.prev:
                    cur.prev.next = cur.next
                else:  # 删除头节点
                    self.head = cur.next
                if cur.next:
                    cur.next.prev = cur.prev
                else:  # 删除尾节点
                    self.tail = cur.prev
                return True  # 删除成功
            cur = cur.next
        return False  # 未找到

    def traverse_forward(self):
        """正向遍历链表"""
        cur = self.head
        while cur:
            print(cur.val, end=" ⇄ ")
            cur = cur.next
        print("None")

    def traverse_backward(self):
        """反向遍历链表"""
        cur = self.tail
        while cur:
            print(cur.val, end=" ⇄ ")
            cur = cur.prev
        print("None")

# 测试
dll = DoublyLinkedList()
dll.append(1)
dll.append(2)
dll.append(3)
print("正向遍历:")
dll.traverse_forward()  # 1 ⇄ 2 ⇄ 3 ⇄ None
print("反向遍历:")
dll.traverse_backward()  # 3 ⇄ 2 ⇄ 1 ⇄ None

print("删除节点 2")
dll.delete(2)
dll.traverse_forward()  # 1 ⇄ 3 ⇄ None


正向遍历:
1 ⇄ 2 ⇄ 3 ⇄ None
反向遍历:
3 ⇄ 2 ⇄ 1 ⇄ None
删除节点 2
1 ⇄ 3 ⇄ None


## <a id='toc2_2_'></a>[栈](#toc0_)

栈是一种**后进先出（LIFO）**的数据结构，可以用 Python 列表 或 自定义链表 实现。

In [None]:
class Stack:
    def __init__(self):
        self.stack = []

    def push(self, val):
        # 进栈。
        self.stack.append(val)

    def pop(self):
        # 从栈顶删除元素。也就是出栈。
        # list.pop() 的默认值是删除最后一个元素。
        if not self.is_empty():
            return self.stack.pop()
        return None

    def peek(self):
        # 看最后一个元素是什么元素。
        if not self.is_empty():
            return self.stack[-1]
        return None

    def is_empty(self):
        return len(self.stack) == 0

# 测试
s = Stack()
s.push(1)
s.push(2)
s.push(3)
print(s.pop())  # 输出: 3
print(s.peek())  # 输出: 2
print(s.peek())

3
2
2


## <a id='toc2_3_'></a>[队列（Queue）](#toc0_)

队列是一种**先进先出（FIFO）**的数据结构。

使用 collections.deque（推荐）方法实现。

In [None]:
from collections import deque

class Queue:
    def __init__(self):
        self.queue = deque()

    def enqueue(self, val):
        # 进入队列。
        self.queue.append(val)

    def dequeue(self):
        # 出队列。
        if not self.is_empty():
            return self.queue.popleft()
        return None

    def is_empty(self):
        return len(self.queue) == 0

# 测试
q = Queue()
q.enqueue(1)
q.enqueue(2)
q.enqueue(3)
print(q.dequeue())  # 输出: 1
print(q.dequeue())  # 输出: 2


1
2


## <a id='toc2_4_'></a>[哈希表](#toc0_)

Python 内置 dict 就是哈希表。

- 时间复杂度：插入/查找/删除 平均 O(1)，最坏情况 O(N)（哈希冲突）。

In [1]:
class HashMap:
    def __init__(self, size=100):
        self.size = size
        self.table = [[] for _ in range(size)]  # 解决冲突：链地址法

    def _hash(self, key):
        return hash(key) % self.size

    def put(self, key, value):
        index = self._hash(key)
        for pair in self.table[index]:
            if pair[0] == key:
                pair[1] = value  # 更新值
                return
        self.table[index].append([key, value])

    def get(self, key):
        index = self._hash(key)
        for pair in self.table[index]:
            if pair[0] == key:
                return pair[1]
        return None

    def remove(self, key):
        index = self._hash(key)
        self.table[index] = [pair for pair in self.table[index] if pair[0] != key]

# 测试
hm = HashMap()
hm.put("apple", 10)
hm.put("banana", 20)
print(hm.get("apple"))  # 输出: 10
hm.remove("apple")
print(hm.get("apple"))  # 输出: None


10
None


## <a id='toc2_5_'></a>[堆（Heap）](#toc0_)

堆是一种完全二叉树（Complete Binary Tree），满足堆属性：

- 最小堆（Min Heap）：父节点的值 ≤ 子节点的值（根是最小值）。
- 最大堆（Max Heap）：父节点的值 ≥ 子节点的值（根是最大值）。

Python 内置 heapq 模块 提供最小堆，如果需要最大堆，可以用负数存储模拟。

### <a id='toc2_5_1_'></a>[应用场景](#toc0_)
- 最小/最大值动态维护：
  - 优先队列（Priority Queue）：任务调度、Dijkstra 最短路径。
  - Top-K 统计（如前 K 大元素）。
  - 中位数维护（双堆算法）。

### <a id='toc2_5_2_'></a>[最小堆](#toc0_)

特点：
- heappush(heap, val)：插入元素，保持堆性质 $O(logN)$。
- heappop(heap)：弹出最小值，调整堆 $O(logN)$。
- heap[0]：获取最小元素$O(1)$（但不删除）。

In [2]:
import heapq

# 创建一个最小堆
min_heap = []
heapq.heappush(min_heap, 3)
heapq.heappush(min_heap, 1)
heapq.heappush(min_heap, 4)
heapq.heappush(min_heap, 2)

print(min_heap)  # 输出: [1, 2, 4, 3]（最小堆结构）

# 取出最小元素
print(heapq.heappop(min_heap))  # 输出: 1
print(heapq.heappop(min_heap))  # 输出: 2


[1, 2, 4, 3]
1
2


### <a id='toc2_5_3_'></a>[最大堆](#toc0_)

heapq 只支持最小堆，可以存储负数来模拟最大堆：

原理：
- val 入堆，Python 按最小堆维护 绝对值最大 的数。
- heapq.heappop(heap) 取反还原最大值。

In [3]:
import heapq

max_heap = []
heapq.heappush(max_heap, -3)  # 存储负数
heapq.heappush(max_heap, -1)
heapq.heappush(max_heap, -4)
heapq.heappush(max_heap, -2)

print(-heapq.heappop(max_heap))  # 输出: 4（最大值）
print(-heapq.heappop(max_heap))  # 输出: 3


4
3


### <a id='toc2_5_4_'></a>[手写堆（最大堆实现）](#toc0_)
heapq 适用于大多数情况，但可以手写 二叉堆 进行完整控制。

- 时间复杂度：
  - 插入：O(logN)（上浮 sift_up）。
  - 删除最大值：O(logN)（下沉 sift_down）。
  - 获取最大值：O(1)（heap[0]）。

In [4]:
class MaxHeap:
    def __init__(self):
        self.heap = []

    def push(self, val):
        """插入元素"""
        self.heap.append(val)
        self._sift_up(len(self.heap) - 1)

    def pop(self):
        """弹出最大值"""
        if len(self.heap) == 1:
            return self.heap.pop()
        max_val = self.heap[0]
        self.heap[0] = self.heap.pop()
        self._sift_down(0)
        return max_val

    def _sift_up(self, index):
        """上浮操作"""
        parent = (index - 1) // 2
        while index > 0 and self.heap[parent] < self.heap[index]:
            self.heap[parent], self.heap[index] = self.heap[index], self.heap[parent]
            index = parent
            parent = (index - 1) // 2

    def _sift_down(self, index):
        """下沉操作"""
        size = len(self.heap)
        while index * 2 + 1 < size:
            left = index * 2 + 1
            right = index * 2 + 2
            largest = left
            if right < size and self.heap[right] > self.heap[left]:
                largest = right
            if self.heap[index] >= self.heap[largest]:
                break
            self.heap[index], self.heap[largest] = self.heap[largest], self.heap[index]
            index = largest

# 测试
max_heap = MaxHeap()
max_heap.push(3)
max_heap.push(1)
max_heap.push(4)
max_heap.push(2)

print(max_heap.pop())  # 输出: 4
print(max_heap.pop())  # 输出: 3


4
3


## <a id='toc2_6_'></a>[几种数据结构总结](#toc0_)


|数据结构	|Python 实现|	适用场景|
|---|---|---|
|链表	|class ListNode	|需要动态增删元素|
|栈	|list.append()/pop()	|后进先出（LIFO）|
|队列	|collections.deque()	|先进先出（FIFO）|
|哈希表	|dict	|快速查找，键值存储|
|堆 heap|heapq能实现最小堆|实际上就是完全二叉树|

## 二叉树

构造二叉树：
       1
      / \
     2   3
    / \   \
   4   5   6

### 二叉树的三种深度优先遍历
#### 递归写法

In [1]:
class TreeNode:
    def __init__(self, val=0, left=None, right=None):
        self.val = val
        self.left = left
        self.right = right

def preorder_dfs(node):  # 先序遍历
    if not node:
        return
    print(node.val, end=" ")  # 访问当前节点
    preorder_dfs(node.left)   # 递归遍历左子树
    preorder_dfs(node.right)  # 递归遍历右子树

def inorder_dfs(node):  # 中序遍历
    if not node:
        return
    inorder_dfs(node.left)
    print(node.val, end=" ")  # 访问当前节点
    inorder_dfs(node.right)

def postorder_dfs(node):  # 后序遍历
    if not node:
        return
    postorder_dfs(node.left)
    postorder_dfs(node.right)
    print(node.val, end=" ")  # 访问当前节点

# 构造二叉树：
#        1
#       / \
#      2   3
#     / \   \
#    4   5   6
root = TreeNode(1, TreeNode(2, TreeNode(4), TreeNode(5)), TreeNode(3, None, TreeNode(6)))

print("DFS - 先序遍历: ", end="")
preorder_dfs(root)
print("\nDFS - 中序遍历: ", end="")
inorder_dfs(root)
print("\nDFS - 后序遍历: ", end="")
postorder_dfs(root)


DFS - 先序遍历: 1 2 4 5 3 6 
DFS - 中序遍历: 4 2 5 1 3 6 
DFS - 后序遍历: 4 5 2 6 3 1 

In [2]:
root = TreeNode(1, TreeNode(2, TreeNode(4), TreeNode(5, TreeNode(8), TreeNode(9))), TreeNode(3, TreeNode(6, TreeNode(10), None), TreeNode(7, None, TreeNode(11))))

print("DFS - 先序遍历: ", end="")
preorder_dfs(root)

DFS - 先序遍历: 1 2 4 5 8 9 3 6 10 7 11 

#### 非递归写法

In [1]:
class TreeNode:
    def __init__(self, val=0, left=None, right=None):
        self.val = val
        self.left = left
        self.right = right

def preorder_dfs(root):
    if not root:
        return
    stack = [root]  # 栈初始化，存入根节点
    while stack:
        node = stack.pop()  # 取出栈顶节点
        print(node.val, end=" ")
        if node.right:
            stack.append(node.right)  # 右子节点入栈
        if node.left:
            stack.append(node.left)  # 左子节点入栈（保证先访问左子树）

# 构造二叉树
#        1
#       / \
#      2   3
#     / \   \
#    4   5   6
root = TreeNode(1, TreeNode(2, TreeNode(4), TreeNode(5)), TreeNode(3, None, TreeNode(6)))

print("DFS - 先序遍历: ", end="")
preorder_dfs(root)


DFS - 先序遍历: 1 2 4 5 3 6 

In [2]:
def inorder_dfs(root):
    stack = []
    node = root
    while stack or node:
        while node:  # 先一直深入左子树
            stack.append(node)
            node = node.left
        node = stack.pop()  # 访问当前节点
        print(node.val, end=" ")
        node = node.right  # 进入右子树

print("\nDFS - 中序遍历: ", end="")
inorder_dfs(root)



DFS - 中序遍历: 4 2 5 1 3 6 

In [3]:
def postorder_dfs(root):
    if not root:
        return
    stack, result = [root], []
    while stack:
        node = stack.pop()
        result.append(node.val)  # 先加入根
        if node.left:
            stack.append(node.left)  # 先加入左
        if node.right:
            stack.append(node.right)  # 再加入右
    print(" ".join(map(str, result[::-1])))  # 反转结果

print("DFS - 后序遍历: ", end="")
postorder_dfs(root)


DFS - 后序遍历: 4 5 2 6 3 1


### 二叉树广度优先遍历

In [3]:
class TreeNode:
    def __init__(self, val=0, left=None, right=None):
        self.val = val
        self.left = left
        self.right = right

def bfs_level_order(root):
    if not root:
        return
    queue = [root]  # 使用列表模拟队列
    while queue:
        node = queue.pop(0)  # 取出队列头部元素
        print(node.val, end=" ")
        if node.left:
            queue.append(node.left)   # 左子节点入队
        if node.right:
            queue.append(node.right)  # 右子节点入队

# 构造二叉树：
#        1
#       / \
#      2   3
#     / \   \
#    4   5   6
root = TreeNode(1, TreeNode(2, TreeNode(4), TreeNode(5)), TreeNode(3, None, TreeNode(6)))

print("BFS - 层序遍历: ", end="")
bfs_level_order(root)


BFS - 层序遍历: 1 2 3 4 5 6 