# 效率对比 

# 数据结构分类

线性数据结构：数组、链表、栈、队列、哈希表，元素之间是一对一的顺序关系。

非线性数据结构：树、堆、图、哈希表

    非线性数据结构可以进一步划分为树形结构和网状结构。

    树形结构：树、堆、哈希表，元素之间是一对多的关系。

    网状结构：图，元素之间是多对多的关系。


# 数组 Array
# 链表 Linked list

# 栈 Stack

- 浏览器中的后退与前进；软件中的撤销与反撤销：每当我们打开新的网页，浏览器就会对上一个网页执行入栈，这样我们就可以通过后退操作回到上一个网页。后退操作实际上是在执行出栈。如果要同时支持后退和前进，那么需要两个栈来配合实现。

- 程序内存管理：每次调用函数时，系统都会在栈顶添加一个栈帧，用于记录函数的上下文信息。在递归函数中，向下递推阶段会不断执行入栈操作，而向上回溯阶段则会不断执行出栈操作。

### 撤销（undo）和反撤销（redo）具体是如何实现的？

使用两个栈，栈 A 用于撤销，栈 B 用于反撤销。

每当用户执行一个操作，将这个操作压入栈 A ，并清空栈 B 。
当用户执行“撤销”时，从栈 A 中弹出最近的操作，并将其压入栈 B 。
当用户执行“反撤销”时，从栈 B 中弹出最近的操作，并将其压入栈 A

In [8]:
# 初始化栈
stack: list[int] = []
    # Python 没有内置的栈类，可以把 list 当作栈来使用 

# 元素入栈
stack.append(1)
stack.append(3)
stack.append(2)
stack.append(5)
stack.append(4)
print(stack)
# 访问栈顶元素
peek: int = stack[-1]

# 元素出栈
pop: int = stack.pop()

# 获取栈的长度
size: int = len(stack)

# 判断是否为空
is_empty: bool = len(stack) == 0

[1, 3, 2, 5, 4]


# 队列 Queue

- 淘宝订单：购物者下单后，订单将加入队列中，系统随后会根据顺序处理队列中的订单。在双十一期间，短时间内会产生海量订单，高并发成为工程师们需要重点攻克的问题。

- 各类待办事项：任何需要实现“先来后到”功能的场景，例如打印机的任务队列、餐厅的出餐队列等，队列在这些场景中可以有效地维护处理顺序

### 一般更常用双向队列

双向队列就像是栈和队列的组合或两个栈拼在了一起。它表现的是栈 + 队列的逻辑，因此可以实现栈与队列的所有应用，并且更加灵活

我们知道，软件的“撤销”功能通常使用栈来实现：系统将每次更改操作 push 到栈中，然后通过 pop 实现撤销。然而，考虑到系统资源的限制，软件通常会限制撤销的步数（例如仅允许保存50步）。当栈的长度超过50时，软件需要在栈底（队首）执行删除操作。
但栈无法实现该功能，此时就需要使用双向队列来替代栈。请注意，“撤销”的核心逻辑仍然遵循栈的先入后出原则，只是双向队列能够更加灵活地实现一些额外逻辑。

In [11]:
from collections import deque

# 初始化双向队列
deque = deque()  

# 元素入队
deque.append(2)      # 添加至队尾
deque.append(5)
deque.append(4)
deque.appendleft(3)  # 添加至队首
deque.appendleft(1)

print(deque)

# 访问元素
front: int = deque[0]  # 队首元素
rear: int = deque[-1]  # 队尾元素

# 元素出队
pop_front: int = deque.popleft()  # 队首元素出队
pop_rear: int = deque.pop()       # 队尾元素出队

# 获取双向队列的长度
size: int = len(deque)

# 判断双向队列是否为空
is_empty: bool = len(deque) == 0

deque([1, 3, 2, 5, 4])


# 哈希表 hash table

In [4]:
# 初始化哈希表
hmap: dict = {}

# 添加操作
# 在哈希表中添加键值对 (key, value)
hmap[12836] = "小哈"
hmap[15937] = "小啰"
hmap[16750] = "小算"
hmap[13276] = "小法"
hmap[10583] = "小鸭"

# 查询操作
# 向哈希表中输入键 key ，得到值 value
name: str = hmap[15937]
print(name)

# 删除操作
# 在哈希表中删除键值对 (key, value)
hmap.pop(10583)
print(hmap)

# 遍历哈希表
# 遍历键值对 key->value
for key, value in hmap.items():
    print(key, "->", value)
# 单独遍历键 key
for key in hmap.keys():
    print(key)
# 单独遍历值 value
for value in hmap.values():
    print(value)

小啰
{12836: '小哈', 15937: '小啰', 16750: '小算', 13276: '小法'}
12836 -> 小哈
15937 -> 小啰
16750 -> 小算
13276 -> 小法
12836
15937
16750
13276
小哈
小啰
小算
小法


## 哈希冲突

### 定义
通常情况下哈希函数的输入空间远大于输出空间，因此理论上哈希冲突是不可避免的

我们将这种多个输入对应同一输出的情况称为「哈希冲突 hash collision」

### 解决方案

哈希表容量越大，多个 key 被分配到同一个桶中的概率就越低，冲突就越少

1.我们可以通过扩容哈希表来减少哈希冲突直至冲突消失为止

2.改良哈希表数据结构（Python 采用开放寻址。字典 dict 使用伪随机数进行探测），使得哈希表可以在出现哈希冲突时正常工作

3.仅在必要时，即当哈希冲突比较严重时，才执行扩容操作

# 树 Tree

## 二叉树 binary tree

In [6]:
# Optional 主要用于指示一个变量的值可以是某种类型，或者可以是 None
from typing import Optional 

# 定义二叉树节点类
class TreeNode:
    def __init__(self, value=0, left=None, right=None):
        self.value = value  # 节点的值
        self.left = left    # 指向左子节点的引用
        self.right = right  # 指向右子节点的引用

# 定义树相关的判断问题类
class Solution:
    def checkTree(self, root: Optional[TreeNode]) -> bool:
        return root.value == root.left.value + root.right.value

# 创建节点
n1 = TreeNode(10) # 根节点
n2 = TreeNode(4) # 创建左子节点并连接
n3 = TreeNode(6) # 创建右子节点并连接
n1.left = n2
n1.right = n3

# 插入与删除节点
p = TreeNode(0)
# 在 n1 -> n2 中间插入节点 P
n1.left = p
p.left = n2
# 删除节点 P
n1.left = n2


# 创建Solution的实例
solution = Solution()

# 调用方法（调用类的方式时，需要先创建实例）
# solution 实例会自动作为第一个参数（self）传递给 checkTree 方法
result = solution.checkTree(n1) # 传递根节点作为参数
print(result)

True


### 类型

#### 完美二叉树 perfect binary tree

#### 完全二叉树 complete binary tree

#### 完满二叉树 full binary tree

#### 平衡二叉树 balanced binary tree

#### 二叉树理想结构与退化结构

完美二叉树是理想情况，可以充分发挥二叉树“分治”的优势

链表则是另一个极端，各项操作都变为线性操作，时间复杂度退化至O(n)


### 遍历

#### 层序遍历 level-order traversal

In [7]:
def level_order(root: TreeNode | None) -> list[int]:
    """层序遍历"""
    # 初始化队列，加入根节点
    queue: deque[TreeNode] = deque()
    queue.append(root)
    # 初始化一个列表，用于保存遍历序列
    res = []
    while queue:
        node: TreeNode = queue.popleft()  # 队列出队
        res.append(node.val)  # 保存节点值
        if node.left is not None:
            queue.append(node.left)  # 左子节点入队
        if node.right is not None:
            queue.append(node.right)  # 右子节点入队
    return res

#### 前序、中序、后序遍历

In [8]:
def pre_order(root: TreeNode | None):
    """前序遍历"""
    if root is None:
        return
    # 访问优先级：根节点 -> 左子树 -> 右子树
    res.append(root.val)
    pre_order(root=root.left)
    pre_order(root=root.right)

def in_order(root: TreeNode | None):
    """中序遍历"""
    if root is None:
        return
    # 访问优先级：左子树 -> 根节点 -> 右子树
    in_order(root=root.left)
    res.append(root.val)
    in_order(root=root.right)

def post_order(root: TreeNode | None):
    """后序遍历"""
    if root is None:
        return
    # 访问优先级：左子树 -> 右子树 -> 根节点
    post_order(root=root.left)
    post_order(root=root.right)
    res.append(root.val)

### 二叉搜索树

## AVL 树
AVL 树既是二叉搜索树，也是平衡二叉树，同时满足这两类二叉树的所有性质，

因此是一种「平衡二叉搜索树 balanced binary search tree」。

# 堆 heap

## Top-k 问题

获取最大的k个元素：例如选择热度前 10 的新闻作为微博热搜，选取销量前 10 的商品等

给定一个长度为n的无序数组 nums ，请返回数组中最大的k个元素

### 思路1：遍历

第一轮：找到第1大的元素

第二轮：找到第2大的元素

第三轮：找到第3大的元素

第k轮：找到第k大的元素

### 思路2：排序

我们可以先对数组 nums 进行排序，再返回最右边的k个元素

### 思路3：堆

1.初始化一个小顶堆，其堆顶元素最小。

2.先将数组的前k个元素依次入堆。

3.从第k+1个元素开始，若当前元素大于堆顶元素，则将堆顶元素出堆，并将当前元素入堆。

遍历完成后，堆中保存的就是最大的k个元素。

In [10]:
def top_k_heap(nums: list[int], k: int) -> list[int]:
    """基于堆查找数组中最大的 k 个元素"""
    # 初始化小顶堆
    heap = []
    # 将数组的前 k 个元素入堆
    for i in range(k):
        heapq.heappush(heap, nums[i])
    # 从第 k+1 个元素开始，保持堆的长度为 k
    for i in range(k, len(nums)):
        # 若当前元素大于堆顶元素，则将堆顶元素出堆、当前元素入堆
        if nums[i] > heap[0]:
            heapq.heappop(heap)
            heapq.heappush(heap, nums[i])
    return heap

# 图 graph

### 图的常见应用

# 搜索

## 二分查找 binary search

# 排序

# 分治

# 回溯

# 动态规划

# 贪心