- 度量算法的增长阶；
- 大O记号；
- 复杂度类；

因为计算机变得越来越快，所以程序就不用关心效率了吗？不是的，因为数据集可以非常大，比如，在2014年，Google服务了`30,000,000,000,000`个网页，大约有`100,000,000`GB。如果使用暴力搜索，那么不知道查到什么时候了。

因此，简单的解可能不会以一种可接受的方式进行拓展。

我们如何判断哪个程序是最有效率的？

要区分程序的**时间复杂度**和**空间复杂度**；
要在两者之间做权衡：
- 有时需要存储一些提前计算的结果，然后使用查询来检索，比如Fibonacci的存储；
- 我们将集中在时间复杂度；

理解一个可计算问题的解的效率时有哪些挑战？
- 一个程序会有许多不同的实现；
- 你可以仅使用一小部分不同的算法来解决一个问题；
- 将实现的选择跟抽象算法的选择分离开；

如何评估一个程序的效率？
- 方法一：使用计时器；
- 方法二：对操作进行计数；
- 方法三：抽象的增长阶概念；

方法一：对程序进行计时

使用`time`模块

将`time`模块导入你的文件

开始定时器

调用函数

停止定时器

In [11]:
import time

def c_to_f(c):
    return c*9/5+32

t0 = time.perf_counter()
c_to_f(100000)
t1 = time.perf_counter()-t0

print("t=", t1, "s")

t= 2.7499999760038918e-05 s


对程序计时存在不一致：

目标：评估不同的算法
运行时间在算法间变化；
运行时间在实现间变化；
运行时间在计算机间变化；
基于小输入的运行时间是不可预测的；

时间对于不同的输入是变化的，但是不能实际地表示输入与时间之间的关系。

方法二：对操作计数

假设所有操作都花费常数时间，包括：
- 数学运算；
- 比较；
- 赋值；
- 访问在内存中的对象

然后，把要执行的操作次数看做是输入大小的函数。

In [12]:
def c_to_f(c):
    return c*9.0/5+32

def mysum(x):
    total = 0
    for i in range(x+1):
        total += i
    return total

我们的目标是评估不同的算法

对操作计数更好，但是：

操作计数依赖于算法；

操作计数依赖于实现；

操作计数依赖于计算机；

没有清晰地定义要对哪些操作计数；

操作计数随着不同的输入而变化，可提出输入和计数之间的关系。

还是需要一种更好的方式。

计时和计数评估的是实现。

计时评估的是机器，

想评估算法；

想评估可伸缩性；

想通过输入大小来评估；

还是需要一种更好的方式：

集中在**对算法中操作计数这种思路上，但是不担心实现的小差别**，比如在一个循环里是要执行3次还是4次操作。

集中在当问题规模变得无穷大时，算法是如何执行的。

想把通过这种方式测量的完成一个计算需要的时间跟问题的输入大小相关联。

考虑到实际的步数可能依赖于具体的情况，我们需要决定测量什么。

我们想**用输入大小来表示效率**，所以我们需要判断你的输入是什么，比如可以是整数，可以是列表，由你来决定一个函数何时有多个参数。

## 不同的输入会改变程序的运行方式

In [2]:
def search_for_elmt(L, e):
    for i in L:
        if i == e:
            return True
    return False

- 当e是列表的第一个元素时，这是最好的情形
- 当e不在列表中，这是最差情形。
- 当遍历列表中将近一半的元素时，这是平均情形。


**我们想用一种通用的方式来测量程序的行为**。

假设给定一个长度为len(L)的列表L。

最好的情形：在给定大小的所有可能输入中的最小运行时间

平均情形：给定大小的所有可能输入的平均运行时间

最坏情形：给定大小的所有可能输入的最大运行时间

方法三：增长阶

目标：
- 当输入非常大时，评估一个程序的效率；
- 用输入大小的增长来表示程序运行时间的增长；
- 对增长设置一个尽可能紧的上界；
- 不需要很精确，关注的是阶，而不是精确的增长；

我们将关注运行时的最大因素，即程序花费最长时间来运行的部分。

因此，一般来说，我们想要的是：最坏情形下运行时间增长的紧上界是输入大小的函数。

## 大O记号

测量增长阶，或者测量渐近增长的上界。

大O记号用来描述最坏情形。

最坏情形经常发生，是一个程序运行时的瓶颈。

用输入大小来表示程序的增长速率

**大O评估的是算法，而不是是实现或者机器**。




示例1：迭代版本计算阶乘

In [3]:
def fact_iter(n):
    answer = 1
    while n>1:
        answer*=n
        n -= 1
    return answer

分析：

精准步数：总步数为5n+1

最坏情形的渐近复杂度为O(n)
- 忽略了加法常数
- 忽略了乘法常数

问题：O(n)测量的是什么？

因为我们感兴趣的是描述随着问题规模的增长所需的时间量如何变化，所以给定一个计算某个算法所需操作数量的表达式，我们想知道随着问题规模的变大的渐近行为。因此，我么将重点关注在求和项中增长最快的项。

因为我们想知道随着输入的增加，所需时间是如何快速增加的，所以我们将忽略乘法常数。



## 简化示例
思路：
- 丢掉常数项和乘数因子
- 关注占优项

$n^2+2n+2$简化为$O(n^2)$

$n^2+100000n+3^{1000}$简化为$O(n^2)$

$\log(n)+n+4$化简为$O(n)$

$0.0001*n*\log(n)+300n$化简为$O(n\log n)$

$O2n^{30}+3^n$化简为$3^n$

## 增长阶类型
![%E6%88%AA%E5%B1%8F2021-09-23%2022.58.44.png](attachment:%E6%88%AA%E5%B1%8F2021-09-23%2022.58.44.png)