虽然我们在本书中花了相当多的篇幅讨论效率，但目标不是让您成为设计高效程序的专家。有许多大部头的书专门讨论这个问题。

在第9章中，我们介绍了**复杂度分析**的一些基本概念。

在本章中，我们将使用这些概念来研究一些经典算法的复杂性。本章的目的是帮助你建立一些关于如何处理效率问题的一般直觉。当你读完这一章的时候，你应该明白为什么有些程序在眨眼之间就完成了，为什么有些程序需要在一夜之间运行，为什么有些程序在你的一生中都不会完成。

我们在本书中看到的第一个算法是基于强力穷举枚举的。我们讨论：**现代计算机速度如此之快，使用聪明的算法往往是浪费时间。编写简单且明显正确的代码通常是正确的做法**。

然后我们看了一些问题，比如，寻找多项式根的近似值。在这些问题中，搜索空间太大，无法使用蛮力。这促使我们考虑更有效的算法，比如二分法搜索和牛顿-拉夫森。主要的观点是，**效率的关键是一个好的算法，而不是聪明的编码技巧**。

在科学领域，比如物理、生活和社会等领域，程序员通常首先快速编写一个简单的算法来测试关于数据集的假设的可信性，然后在少量数据上运行它。如果这样做产生了令人鼓舞的结果，那么产生一个可以在大型数据集上运行(可能是反复运行)的实现的艰苦工作就开始了。这样的实现需要基于有效的算法。

高效的算法很难发明。如果幸运的话，成功的专业计算机科学家可能会在整个职业生涯中发明一种算法。我们大多数人从未发明过新的算法。

**我们所做的是学会将我们面临的问题中最复杂的方面简化为以前解决过的问题**。

具体地说，就是
- 理解问题的内在复杂度，
- 考虑如何将这个问题分解成子问题，
- 将这些子问题与已经存在有效算法的其他问题关联起来。

本章包含一些例子，目的是让你对算法设计有一些直觉。书中还出现了许多其他算法。

请记住，**最有效的算法并不总是选择的算法**。一个以最有效的方式完成所有事情的程序，通常是不必要地难于理解。

这通常是一个很好的策略：**以最直接的方式开始解决手边的问题，利用它来找到任何计算瓶颈，然后寻找方法来改进那些导致瓶颈的程序部分的计算复杂度**。

## 10.1 搜索算法
搜索算法是一种在项集合中查找具有特定属性的一个项或一组项的方法。我们将项的集合称为**搜索空间**。搜索空间可能是一些具体的东西，比如一组电子医疗记录，也可能是一些抽象的东西，比如所有整数的集合。

实践中出现的许多问题可以表述为搜索问题。

本书前面介绍的许多算法可以看作是搜索算法。在第三章中，我们将寻找多项式根的近似值表述为一个搜索问题，并研究了三种搜索可能答案空间的算法：穷尽枚举法、二分搜索法和牛顿-拉弗逊法。

在本节中，我们将研究搜索一个列表的两种算法。每个都符合下面的规范：
```
def search(L, e):
    """
    假设L是一个列表
    如果e在L中，则返回True；否则，返回False
    """
```

### 10.1 线性搜索和使用间接方式访问元素

Python使用下面的算法来判断一个元素是否在一个列表里：

In [1]:
def search(L, e):
    """
    假设L是一个列表
    如果e在L中，则返回True；否则，返回False
    """
    for i in range(len(L)):
        if L[i] == e:
            return True
    return False

分析：如果一个元素e不在列表中，则该算法将执行`O(len(L))`次测试，即复杂度是最好线性于L的长度的。为什么是最好线性？只有当在循环里的每个操作都在常数时间内完成，整体的复杂度才是线性的。这就提出了一个问题：Python是否能在常数时间内检索出一个列表的第i个元素。因为我们的模型假设：获取一个地址的内容是一个常数时间的操作，那么问题就变成了：我们是否能在常数时间内计算出一个列表中第i个元素的地址。

让我们先考虑最简单的情形，即列表中的每个元素都是一个整数。这意味着列表中的每个元素都有相同的大小，比如4个字节等。假设列表的元素是被连续存储的，那么第i个元素的地址就是`start+4*i`，其中`start`是列表的开始的地址。因此，我们可以假设Python能在常数时间内计算出整数列表中第i个元素的地址。

当然，我们知道Python的列表中可以包含非`int`的对象类型，同一个列表可包含许多具有不同大小和类型的对象。你可能认为这会导致一个问题，但是却没有。

在Python中，一个列表可表示为一个长度(在列表中对象的数量)以及一个由固定大小的对象指针组成的序列。图10.1举例说明了这些指针的使用。
![%E6%88%AA%E5%B1%8F2021-09-18%2007.21.09.png](attachment:%E6%88%AA%E5%B1%8F2021-09-18%2007.21.09.png)
灰色区域表示包含了4个元素的列表。
最左边的灰色方格包含了一个表明列表长度的整数对象指针。其他的每个灰色方格包含了一个在列表中的对象指针。


如果长度字段占据4个单位的内存，每个指针占据4个单位的内存，则列表中第i个元素的地址被存储在地址`start+4+4*i`处。这个地址可在常数时间内被找到，然后存储在那个地址的值可被用来访问第i个元素。因此，对列表中第i个元素的访问是一个常数时间的操作。

这个例子解释了在计算中最重要的实现技术之一：间接。一般来说，间接是通过先访问别的包含有被寻找对象的引用来访问对象的。这就是每次我们使用一个变量来引用一个绑定到这个变量的对象时发生的事情。当我们使用一个变量来访问一个列表时，然后使用存在在那个列表里的一个引用来访问另一个对象，我们经历了两层间接。

### 10.1.2 二分查找和利用假设
回到`search(L,e)`的实现问题，它的最好情形复杂度是O(len(L))吗？是的，如果我们不知道列表内部元素之间的关系以及它们被存储的顺序等信息的话。在最坏情形里，我们不得不查看每个元素来决定L中是否包含e。

但是如果我们知道一些关于元素存储顺序的信息，比如我们知道一个整数列表是按照升序排列的等。我们就可以修改实现以便当它达到一个大于当前正在搜索的数时就停止。比如：

In [2]:
def search(L, e):
    """
    假设L是一个列表，它的元素按照升序排列。
    如果e在L中，则返回True，否则，返回False
    """
    for i in range(len(L)):
        if L[i] == e:
            return True
        if L[i] > e:
            return False
    return False

这会改进平均运行时间。但是，不会改变最坏情形运行时间，因为最坏情形时，L的每个元素都会被检查。

然而，通过使用二分搜索，我们可以在最坏情形复杂度方面得到相当大的改进。二分搜索算法类似于第3章中用于寻找浮点数近似平方根的二分搜索算法。在第3章，我们假设在浮点数上有一个内在的**全序**。在这里，我们假定**列表是有序的**。

思路很简单：
1. 选择一个索引i，它将列表L分成两半；
2. 检查`L(i)==e`；
3. 如果否，则检查`L[i]`比e大还是小；
4. 取决于第3步的结果，是对L的左边一半还是右边一半继续进行搜索。

基于这个算法的结构，二分搜索的大部分直接实现使用了递归，如图10.3所示：

In [3]:
def search(L, e):
    """
    假设L是一个列表，它的元素按照升序排列。
    如果e在L中，则返回True，否则，返回False
    """
    def bSearch(L,e, low, high):
        if low == high:
            return L[low] == e
        mid = (low+high)//2
        if L[mid] == e:
            return True
        elif L[mid] > e:
            if low == mid:
                return False
            else:
                return bSearch(L,e,low,mid-1)
        else:
            return bSearch(L,e,mid+1,high)
    
    if len(L) == 0:
        return False
    else:
        return bSearch(L,e,0,len(L)-1)

图10.3中的外部函数`search(L, e)`与图10.2中定义的函数具有相同的参数和规范。规范说实现可能假设`L`按升序排序。确保这个假设得到满足是搜索的调用者的责任。 如果不满足假设，则实现没有义务表现良好。 它可以工作，但也可能崩溃或返回错误答案。 是否应该修改搜索以检查假设是否满足？ 这可能会消除错误的来源，但它会破坏使用二分搜索的目的，因为检查假设本身需要`O(len(L))`时间。

像`search`这样的函数通常被称为包装函数。该函数为客户端代码提供了一个很好的接口，但本质上是一个不进行实际计算的传递函数。相反，它使用适当的参数调用辅助函数`bSearch`。这就提出了一个问题:为什么不消除`search`，让客户直接调用`bSearch`?原因是参数`low`和`high`与在列表中搜索元素的抽象没有任何关系。它们是应该对那些编写调用`search`的程序的人隐藏的实现细节。

现在让我们分析`bSearch`的复杂性。我们在上一节中展示了列表访问需要常数的时间。因此，我们可以看到，排除递归调用，`bSearch`的每个实例都是 `O(1)`。 因此，`bSearch`的复杂度仅取决于递归调用的次数。

如果这是一本关于算法的书，我们现在将使用**递推关系**进行仔细分析。 但既然不是，我们将采用一种不太正式的方法：从“**我们如何知道程序终止？**”这个问题开始。 

回想一下，在第3章中，我们问了关于`while`循环的相同问题。

我们通过为循环提供递减函数来回答这个问题。我们在这里做同样的事情。 在这种情况下，递减函数具有以下属性：
- 它将形式参数绑定到的值映射到非负整数。
- 当其值为0时，递归终止。
- 对于每次递归调用，递减函数的值小于进入调用函数实例时递减函数的值。

对于`bSearch`来说，递减函数是`high-low`。
- 性质1：将形式参数被绑定的值映射为一个非负数；

  `search`的`if`语句保证了第一次调用`bSearch`时，`high-low`至少是0。
- 性质2：当其值为0时，递归终止；

  当进入`bSearch`时，如果`high-low`为0，则函数就不做递归调用了，简单地返回`L[i]==e`的值。
- 性质3：对每个递归调用来说，递减函数的值小于在递减函数入口处做递归调用的函数实例的对应的递减函数的值；

  函数`bSearch`包含两个递归调用。一个调用使用覆盖`mid`左侧所有元素的参数，另一个调用使用覆盖`mid`右侧所有元素的参数。在任何一种情况下，`high-low`的值都会减半。

我们现在明白为什么递归终止了。

下一个问题：在`high-low == 0`之前，`high-low`的值可以减半多少次？

分析：回想一下，$\log_y(x)$是y必须乘以自身才能达到x的次数。相反，如果y被x除以$\log_y(x)$次，则结果为1。这意味着在达到0之前，可以使用整数除法将高低减为最多$\log_2(high-low)$次。

最后一个问题：二分查找的算法复杂度是多少？

分析：由于搜索调用`bSearch`时，high-low的值等于`len(L)-1`，因此搜索的复杂度为`O(log(len(L)))`.

## 10.2 排序算法
我们已看到：如果我们碰巧知道一个列表已排序，则我们可利用这份信息来极大地减少搜索一个列表所需的时间。这是否意味着：**当要求搜索一个列表时，一个人应该首先对其排序，后执行搜索？**

假设对一个列表排序的复杂度为`O(sortComplexity(L))`，已知搜索一个列表的复杂度为`O(len(L))`，问题“是否应该先对列表排序后搜索”可归结为问题“`sortComplexity(L)+log(len(L))<len(L)`”吗？答案是NO。如果查看列表中的每个元素至少一次，则就不可能对一个列表排序，所以对一个列表排序的时间复杂度不能是次线性时间。

难道这意味着：二分搜索是一个没有实际意义的求知欲的产物？答案是NO。假设一个人期望搜索一个列表多次。支付一次对列表排序的开销，然后将排序的成本分摊到多次查询上可能就很有意义。如果我们期望搜索一个列表k次，则相关的问题就变成了问题“`sortComplexity(L)+k*log(len(L))<k*len(L)`”？

随着k变大，排序列表需要的时间就变得越不相关。k需要多大取决于排序一个列表花费的时间。比如，如果排序是关于列表大小的指数级的，那么k就必须非常大。

幸运的是，排序可被相当高效地完成。比如，在Python的大部分实现里，排序的标准实现的运行时间大约为`O(n*log(n))`，其中n是列表的长度。在实践中，极少需要你实现自己的排序函数。在大多数情况里，正确的做法是或者使用Python的内置`sort`方法(`L.sort()`)或者内置函数`sorted(L)`来返回一个跟L有相同元素的列表，但没有对L进行修改。

我们在这里呈现排序算法的主要目的是提供关于算法设计和复杂度分析等方面的一些实践。

我们从选择排序(一个简单但低效的算法)开始。

如图10.4所示，选择排序的一个实现：

In [4]:
def selSort(L):
    """
    假设L是一个可使用>来比较其元素的列表，
    将L按照升序排列
    """
    suffixStart = 0
    while suffixStart != len(L):
        #查看在后缀中的每个元素
        for i in range(suffixStart, len(L)):
            if L[i] < L[suffixStart]:
                L[suffixStart],L[i] = L[i], L[suffixStart]
        suffixStart += 1
        
L = [1,5,12,18,19,20]

selSort(L)

print(L)

[1, 5, 12, 18, 19, 20]


选择排序通过维护一个**循环不变量**来工作。这里的循环不变量是：将列表划分为前缀`L[0:i]`和后缀`L[i+1:len(L)]`，其中前缀已排好序，在前缀中没有元素大于后缀中的最小元素。

我们使用归纳法来对循环不变量进行推理。
- 基情形

  在第一次迭代的开始，前缀是空的，即后缀是整个列表，显然循环不变量为真。
- 归纳步骤

  在算法的每一步，我们从后缀中移动一个元素到前缀中。我们通过追加后缀中的最小的元素到前缀的末端来做到这一点。因为在我们移动元素前不变性是成立的，所以我们知道在添加元素后，前缀仍然是有序的。我们也知道：因为我们从后缀中移除的是最小的元素，所以在前缀中没有任何元素大于后缀中的最小元素。
- 终止

  当循环退出时，前缀包含了整个列表，后缀是空的。因此，整个列表现在是按照升序排列的。
  
很难想出一个更简单或者更明显正确的排序算法。不幸的是，它非常低效。

因为内部循环的复杂度是O(len(L))，外部循环的复杂度是`O(len(L))`，所以整个函数的复杂度是O($(len(L))^2$)，即它是L的长度的二次方函数。

### 10.2.1 归并排序
幸运的是，我们使用分而治之算法可以比平方时间复杂度做的更好。基本思路是整合比原问题更简单的实例的解。

一般来说，一个分而治之算法有如下特点：
- 对输入大小有一个阈值，低于这个阈值，问题将不再划分；
- 一个实例被划分成子实例；
- 用来整个子实例解的算法；

解释：

- 阈值有时候成为递归基。
- 对于第二条，通常考虑原问题跟子实例问题的大小比例。大部分情况下，比例是2。

归并排序是一个典型的分而治之算法。它是由冯·诺依曼在1945年发明的，至今仍在使用。

使用递归来描述分而治之算法：
1. 如果列表的长度为0或者1，说明它已排好序；
2. 如果列表的元素个数大于1，就将它分为两个列表，使用归并排序来对每个列表来排序；
3. 合并结果

由冯·诺依曼做出的核心观察是：两个排好序的列表可有效地合并成单个排好序的列表。思路是：查看每个列表的第一个元素，将两者的较小元素添加到结果列表的尾部。当其中一个列表变空时，将另一个列表的剩余项拷贝到结果列表中。

比如：合并列表`[1,15,12,18,19,20]`和列表`[2,3,4,17]`的过程如下：
![%E6%88%AA%E5%B1%8F2021-09-21%2015.17.44.png](attachment:%E6%88%AA%E5%B1%8F2021-09-21%2015.17.44.png)

问题：合并过程的复杂度是多少？

答：线性于列表的长度。

分析：它包含两个常数时间的操作，一个是比较元素的值，另一个是从一个列表拷贝元素到另一个列表。元素的比较次数是O(len(L))，其中L是较长的列表中较长的那一个。拷贝操作的次数是O(len(L1)+len(L2))，因为每个元素当前仅当被拷贝一次。因此，合并两个排好序的列表的时间复杂度是线性于列表的长度的。

图10.5包含了归并排序算法的实现。

In [5]:
def mergeSort(L, compare = lambda x,y: x<y):
    """
    假设L是一个列表，compare定义了L中元素的一个顺序。
    返回跟L有相同元素的新的排好序的列表。
    """
    if len(L)<2:
        return L[:]
    else:
        middle = len(L)//2
        left = mergeSort(L[:middle], compare)
        right = mergeSort(L[middle:], compare)
        return merge(left, right, compare)
    
def merge(left, right, compare):
    """
    假设left和right是排好序的列表，compare定义了元素的一个顺序。
    返回跟(left+right)同样元素的新的排好序的列表
    """
    result = []
    i,j = 0,0
    while i<len(left) and j<len(right):
        if compare(left[i], right[j]):
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1
    
    while(i<len(left)):
        result.append(left[i])
        i += 1
        
    while(j<len(right)):
        result.append(right[j])
        j += 1
        
    return result
        
L = [2,1,4,5,3]
print(mergeSort(L))
print(mergeSort(L, lambda x,y:x>y))

[1, 2, 3, 4, 5]
[5, 4, 3, 2, 1]


下面分析`mergeSort`的复杂度。

已知`merge`的复杂度是O(len(L))。在每层递归上，待合并的元素的总次数是O(len(L))。

因此，`mergeSort`的时间复杂度为O(len(L))乘以递归的层数。

因为`mergeSort`每次是一分为二，所以递归的层数为O(log(len(L)))。

所以，**`mergeSort`的复杂度是`O(n*log(n))`**。

这是一个比选择排序$O(len(L)^2)$好太多的复杂度。比如，如果L有1万个元素，那么$len(L)^2$是10亿，$O(len(L))*\log_2{len(L)}$大约是13万。

**归并排序的时间复杂度改进是有代价的**。选择排序是一种**原地排序算法**。因为它通过交换列表中元素的位置来实现的，所以它仅使用了常数量的额外存储。作为比较，归并排序算法包含有列表的拷贝。这意味着它的空间复杂度是`O(len(L))`。注意：**这对大型列表来说是个问题**。

### 10.2.2 利用函数作为参数
假设我们要对形式为`firstName lastName`的名字列表排序，

In [6]:
def lastNameFirstName(name1, name2):
    arg1 = name1.split(' ')
    arg2 = name2.split(' ')
    
    if arg1[1] != arg2[1]:
        return arg1[1] < arg2[1]
    else:
        return arg1[0] < arg2[0]
    
def firstNameLastName(name1, name2):
    arg1 = name1.split(' ')
    arg2 = name2.split(' ')
    
    if arg1[0] != arg2[0]:
        return arg1[0] < arg2[0]
    else:
        return arg1[1] < arg2[1]

L = ['Tom Brady', 'Eric Grimson', 'Gisele Bundchen']
newL = mergeSort(L, lastNameFirstName)
print('Sorted by last ame =', newL)

newL = mergeSort(L, firstNameLastName)
print('Sorted by first name =', newL)

Sorted by last ame = ['Tom Brady', 'Gisele Bundchen', 'Eric Grimson']
Sorted by first name = ['Eric Grimson', 'Gisele Bundchen', 'Tom Brady']


### 10.2.3 在Python中的排序
在大部分Python的实现中使用的排序算法是`timsort`。关键的思路是利用“在许多数据集中，数据是部分有序的”这一事实。

**`timsort`的最坏情形性能跟归并排序是一样的，但是平均意义上的性能要好的多**。

Python中的方法`list.sort`取列表作为第一个参数，并修改这个列表。

Python的函数`sorted`取一个可迭代对象作为第一个参数，返回一个新的排好序的列表。

In [7]:
L = [3,5,2]
D = {'a':12,'c':5, 'b':'dog'}

print(sorted(L))
print(L)

L.sort()
print(L)

print(sorted(D))
D.sort()
print(D)

[2, 3, 5]
[3, 5, 2]
[2, 3, 5]
['a', 'b', 'c']


AttributeError: 'dict' object has no attribute 'sort'

注意：当对一个字典使用`sorted`函数时，它返回的是这个字典的所有keys的排好序的列表。作为比较，当对一个字典使用`sort`方法时，它会引发一个异常，因为没有`dic.sort`。

`list.sort`方法和`sorted`函数都有两个额外参数。`key`参数通常跟我们对归并排序的实现里的`compare`扮演相同的角色，即提供一个要使用的比较函数。`reverse`参数指定列表相对于比较函数是升序还是降序。

In [8]:
L = [[1,2,3],(3,2,1,0),'abc']
print(sorted(L, key=len, reverse = True))

[(3, 2, 1, 0), [1, 2, 3], 'abc']


`list.sort`方法和`sorted`函数提供的都是**稳定排序**。这意味着：如果两个元素对于`sort`中使用的比较函数来说是相等的，那么它们在原列表中的相对顺序在最后列表中是被保留的。

## 10.3 哈希表
如果把归并排序和二分查找放一起，就得到了一种很好的搜索列表的方式。我们使用归并排序在`O(n*log(n))`时间内完成对列表的预处理，然后使用二分查找在`O(log(n))`时间内测试元素是否在列表中。如果我们查找某个列表k次，那么整体的时间复杂度为`O(n*log(n)+k*log(n))`。

这非常好，但我们还可以问：当我们愿意做预处理时，对数复杂度是我们能做的最好吗？

当在第5章介绍类型`dict`时，我们说字典使用哈希技术来在几乎独立于字典大小的时间内完成查询。

在哈希表背后的思路很简单：**我们将键key转换成整数，使用那个整数作为列表的索引**。

从理论上讲，所有类型的值可被轻易地转换成整数。已知每个对象是用位序列来进行内部表示的。任何一个位序列可被当作是一个整数的表示。比如，字符串abc的内部表示为011000010110001001100011，表示的十进制数为6,382,179。显然，如果使用字符串的内部表示来作为列表的索引，则列表必须非常长。

对于哪些键keys已是整数的情形，该怎么处理？

比如，我们要实现一个字典，它的键是美国人的社保号，由9位数组成。如果我们使用有$10^9个$元素的列表，以及社保号来索引这个列表，则我们可以在常数时间内完成查询。但是，如果这个字典仅包含了10万个条目，则存在巨大的空间浪费。

这就需要**哈希函数**了。一个哈希函数将非常大的输入空间映射到较小的输出空间上，比如将所有自然数映射到0到5000之间的自然数。可以使用哈希函数来将大型的键keys空间转换成小型的整数索引空间。因为可能输出的空间小于可能输入的空间，所以一个哈希函数是一个多对一函数，即多个不同的输入可能被映射到相同的输出。当两个输入被映射到相同的输出时，就出现了冲突。一个好的哈希函数的输出满足**一致分布**，即在范围内的每个输出是等概率出现的，这样可以最小化冲突的概率。

In [10]:
class intDict(object):
    """
    一个key为整数的字典
    """
    def __init__(self, numBuckets):
        """
        创建一个空字典
        """
        pass
    
    def addEntry(self, key, dicVal):
        """
        假设key是一个int。
        添加一个条目
        """
        pass
    
    def getValue(self, key):
        """
        假设key是一个int。
        返回key关联的值。
        """
        pass
    
    def __str__(self):
        pass

图10.7使用一个简单的哈希函数实现了一个键为整数的字典。

基本的思路是通过一个哈希桶列表来表示一个`intDict`实例，每个哈希桶是由用元组实现的键/值对组成的列表。将每个桶看成一个列表，我们通过把映射到同一个桶的所有值保存到对应的列表里的方式来处理哈希冲突。

图中哈希表的工作机制如下：
- 将实例变量`buckets`初始化为一个由`numBuckets`个空列表组成的列表。
- 为了保存或者查询键为`dictKey`的条目，我们使用`%`作为哈希函数来将`dictKey`转换为一个整数，使用那个整数作为`buckets`的索引来键为`dictKey`的哈希桶。
- 如果要做查询，且存在键key对应的条目，那么简单地返回具有那个键key的值。如果不存在键对应的条目，则返回None。
- 如果要存储一个值，我们首先检查在哈希桶里是否已存在键对应的条目。如果有，则用一个新的元组来替换一个条目，否则我们向这个桶里添加一个新的条目。


存在许多其他的方式来处理冲突，有些可能比使用列表效率更高。但是，这可能是最简单的机制。如果哈希表相对于存储在它里面的元素个数足够大，且哈希函数提供了对某个一致分布足够好的近似，则用列表实现的哈希表就工作良好。

注意：`__str__`方法输出了字典的一个表示，这种跟元素被添加的顺序无关，而是根据键被哈希后的值有序排列。这点解释了为什么不能预测在一个`dict`类型对象里键的顺序。

当我们违背抽象屏障，查看一下`intDict`的表示时，有些哈希桶是空的，其他的桶包含1个、2个或者3个条目，取决于冲突发生的次数。

问题：`getValue`方法的复杂度是多少？

分析：

- 如果不存在冲突，则是`O(1)`，因为每个桶的长度为0或者1。
- 如果存在冲突，且所有键都被映射到同一个桶，则是`O(n)`，其中n是字典中条目的数量，因为代码将对那个桶执行线性搜索。
- 通过将哈希表变得足够大，我们可以有效地降低冲突的数量，允许复杂度为`O(1)`。这是用空间换时间。这里要如何取舍？需要概率论知识来解决这个问题，看第15章。