`bisect` 是 Python 的一个标准库，它实现了二分查找（也称折半查找）算法。这个模块的核心作用是帮助你在一个 **已排序** 的序列中，高效地进行查找和插入操作。由于它使用了二分查找算法，其时间复杂度为 `O(logn)`，在处理大型有序列表时，性能远超于传统的 `O(n)` 查找和插入方法。

---
`bisect` 库的核心功能
`bisect` 模块主要提供了两个核心功能：

查找 (Find): 确定一个元素应该被插入到有序序列的哪个位置，以维持序列的有序性。

插入 (Insert): 在不破坏序列顺序的前提下，将一个新元素插入到合适的位置。

这个库里的所有函数都要求操作的列表是提前排好序的。

In [1]:
import bisect

# 主要函数详解

bisect 模块中最常用的函数有四个：`bisect_left`、`bisect_right`、`insort_left` 和 `insort_right`。

## `bisect.bisect_left(a, x, lo=0, hi=len(a))`

这个函数会查找元素 `x` 在有序列表 `a` 中应该插入的位置，并返回该位置的索引。如果 `x` 已经在 `a` 中存在，它会返回现有元素 **左边** 的插入点。

参数说明:
- `a`: 已排序的列表。
- `x`: 要查找或插入的元素。
- `lo`, `hi` (可选): 指定在列表的哪个子片段中进行搜索。

In [3]:
a = [1, 2, 4, 4, 6, 8]

In [4]:
# 查找 4 应该插入的位置
index = bisect.bisect_left(a, 4)
print(f"bisect_left(a, 4) 的返回值: {index}") # 输出: 2 (返回第一个 4 的索引)

bisect_left(a, 4) 的返回值: 2


In [5]:
# 查找 5 应该插入的位置
index = bisect.bisect_left(a, 5)
print(f"bisect_left(a, 5) 的返回值: {index}") # 输出: 4 (在两个 4 和 6 之间)

bisect_left(a, 5) 的返回值: 4


## `bisect.bisect_right(a, x, lo=0, hi=len(a))`

这个函数与 `bisect_left` 非常相似，但如果 `x` 已经在 `a` 中存在，它会返回现有元素 **右边** 的插入点。这个函数是 `bisect.bisect` 的别名。

参数说明:
- `a`: 已排序的列表。
- `x`: 要查找或插入的元素。
- `lo`, `hi` (可选): 指定在列表的哪个子片段中进行搜索。

In [6]:
a = [1, 2, 4, 4, 6, 8]

In [7]:
# 查找 4 应该插入的位置
index = bisect.bisect_right(a, 4)
print(f"bisect_right(a, 4) 的返回值: {index}") # 输出: 4 (返回最后一个 4 右边的索引)

bisect_right(a, 4) 的返回值: 4


In [8]:
# 查找 5 应该插入的位置
index = bisect.bisect_right(a, 5)
print(f"bisect_right(a, 5) 的返回值: {index}") # 输出: 4 (和 bisect_left 结果一样，因为 5 不存在)

bisect_right(a, 5) 的返回值: 4


## `bisect.insort_left(a, x, lo=0, hi=len(a))`

这个函数将元素 `x` 插入到列表 `a` 中，并保持 `a` 的有序性。它使用 `bisect_left` 来确定插入位置。

参数说明:
- `a`: 已排序的列表。
- `x`: 要查找或插入的元素。
- `lo`, `hi` (可选): 指定在列表的哪个子片段中进行搜索。

In [9]:
a = [1, 2, 4, 4, 6, 8]

# 插入 4
bisect.insort_left(a, 4)
print(f"insort_left(a, 4) 后的列表: {a}") # 输出: [1, 2, 4, 4, 4, 6, 8] (新 4 被插入在现有 4 的左边)

insort_left(a, 4) 后的列表: [1, 2, 4, 4, 4, 6, 8]


In [10]:
# 插入 5
b = [1, 2, 4, 4, 6, 8]
bisect.insort_left(b, 5)
print(f"insort_left(b, 5) 后的列表: {b}") # 输出: [1, 2, 4, 4, 5, 6, 8]

insort_left(b, 5) 后的列表: [1, 2, 4, 4, 5, 6, 8]


## `bisect.insort_right(a, x, lo=0, hi=len(a))`

与 `insort_left` 类似，但它使用 `bisect_right` 来确定插入位置。`bisect.insort` 是这个函数的别名。

参数说明:
- `a`: 已排序的列表。
- `x`: 要查找或插入的元素。
- `lo`, `hi` (可选): 指定在列表的哪个子片段中进行搜索。

In [11]:
a = [1, 2, 4, 4, 6, 8]

# 插入 4
bisect.insort_right(a, 4)
print(f"insort_right(a, 4) 后的列表: {a}") # 输出: [1, 2, 4, 4, 4, 6, 8] (新 4 被插入在现有 4 的右边)

insort_right(a, 4) 后的列表: [1, 2, 4, 4, 4, 6, 8]


# 实际应用场景

`bisect` 库非常适合用于需要频繁在大型有序列表中插入和查找的场景，例如：

数值范围判断: 比如根据分数将成绩评定为“优、良、中、差”。

In [12]:
def grade(score, breakpoints=[60, 70, 80, 90], grades='FDCBA'):
    # bisect_left 返回的索引正好对应 grades 里的等级
    i = bisect.bisect_left(breakpoints, score)
    return grades[i]

In [None]:
print(f"59分是: {grade(59)}")   # 输出: F
print(f"60分是: {grade(60)}")   # 输出: D
print(f"85分是: {grade(85)}")   # 输出: B
print(f"100分是: {grade(100)}") # 输出: A

59分是: F
60分是: F
85分是: B
100分是: A


维护一个有序列表: 当你有一个需要动态添加元素并始终保持排序的列表时，使用 `insort` 系列函数比 `list.append()` 后再 `list.sort()` 要高效得多。
`list.append()` 是 `O(1)`，但 `list.sort()` 是 `O(nlogn)`。而 `insort` 操作是 `O(n)`（因为插入操作本身是线性的），但其查找部分是 `O(logn)`。对于频繁插入的场景，这通常更优。

# 拓展

## 排序其它类型

不仅仅是数字: `bisect` 不仅可以用于数字列表，它适用于任何支持比较操作的元素类型，比如字符串、元组等。只要列表是有序的，就可以使用。

In [15]:
sorted_strings = ['apple', 'banana', 'cherry', 'date']
index = bisect.bisect_left(sorted_strings, 'blueberry')
print(index) # 输出: 2

2


## 自定义对象的排序

如果你有一个自定义对象的列表，只要该对象实现了 `__lt__` (小于) 等比较方法，`bisect` 同样可以正常工作。或者，在 Python 3.10 及以上版本中，`bisect` 的所有函数都增加了一个 `key` 参数，就像 `list.sort()` 一样，允许你指定一个函数来从元素中提取用于比较的键。

In [16]:
data = [{'name': 'A', 'value': 10}, {'name': 'C', 'value': 30}]
new_item = {'name': 'B', 'value': 20}

# 使用 key 函数告诉 bisect 按字典的 'value' 键进行比较
index = bisect.bisect_left(data, new_item['value'], key=lambda item: item['value'])
data.insert(index, new_item)

print(data)
# 输出: [{'name': 'A', 'value': 10}, {'name': 'B', 'value': 20}, {'name': 'C', 'value': 30}]

[{'name': 'A', 'value': 10}, {'name': 'B', 'value': 20}, {'name': 'C', 'value': 30}]


In [18]:
data = [{'name': 'A', 'value': 10}, {'name': 'C', 'value': 30}]
new_item = {'name': 'B', 'value': 20}

# 使用 key 函数告诉 bisect 按字典的 'value' 键进行比较
bisect.insort_left(data, new_item, key=lambda item: item['value'])

print(data)
# 输出: [{'name': 'A', 'value': 10}, {'name': 'B', 'value': 20}, {'name': 'C', 'value': 30}]

[{'name': 'A', 'value': 10}, {'name': 'B', 'value': 20}, {'name': 'C', 'value': 30}]


## 性能陷阱

虽然 `bisect` 的查找速度非常快 `(O(logn))`，但 `insort` 系列函数的整体性能瓶颈在于列表的插入操作 (`list.insert`)，它需要移动插入点之后的所有元素，这是一个 `O(n)` 的操作。

因此，在需要极高频率插入操作的场景下（比如每秒数百万次），使用专门为此设计的数据结构，如 B-树 或跳表（`skiplist`）可能会是更好的选择。Python 中没有内置的跳表，但有一些第三方库实现了它。