## Big O and Scalability

我们可以记录一下Python程序的运行时间：

In [3]:
import datetime

start_time = datetime.datetime.now()

for _ in range(10000):
    for _ in range(10000):
        pass

end_time = datetime.datetime.now()

print(end_time - start_time)

0:00:01.281577


我们可以再运行一次上述代码：

In [4]:
import datetime

start_time = datetime.datetime.now()

for _ in range(10000):
    for _ in range(10000):
        pass

end_time = datetime.datetime.now()

print(end_time - start_time)

0:00:01.286468


可以发现这段代码的运行速度非常的快，只需要1.28秒左右，但是我们也可以发现统一段代码两次的运行时间是不一样的。

这会给我们带来一个问题：同样的代码在相同的环境之下运行的时间存在着差异，在不同的环境之下更是会存在着差异，那么我们如何去评估一段代码的运行呢？

方法其实很简单：分析代码的运行次数。

我们会使用Big O来进行表示，O()。

这是几种常见的Big O的可视化结果：

![image.png](attachment:5b6cd5a4-fc12-42b6-9ecc-7659fd40e041.png)

## O(n)

我们可以看一下这样的一段代码：

In [6]:
n = 10

for i in range(n):
    print(i+1, "次循环")

1 次循环
2 次循环
3 次循环
4 次循环
5 次循环
6 次循环
7 次循环
8 次循环
9 次循环
10 次循环


可以发现循环的次数为10。

接着我们将n的值进行修改，为原先的2倍，也就是20：

In [7]:
n = 20

for i in range(n):
    print(i+1, "次循环")

1 次循环
2 次循环
3 次循环
4 次循环
5 次循环
6 次循环
7 次循环
8 次循环
9 次循环
10 次循环
11 次循环
12 次循环
13 次循环
14 次循环
15 次循环
16 次循环
17 次循环
18 次循环
19 次循环
20 次循环


可以发现循环的次数从10次变成了20次。

对于这一段代码而言，n的值发生了什么样的改变，循环的次数也就发生了什么样的改变。

如果n的值增加5,那么循环的次数也会增加5；如果n的值为原先的2倍，把么循环的次数也会增加2倍。

![image.png](attachment:b0fbc104-2e08-4bf6-8351-9adb1c940c1b.png)

## O(1)

我们可以将上面的代码进行修改：

In [9]:
n = 10

for i in range(5):
    print(n)

10
10
10
10
10


我们来试着修改一下n的值：

In [10]:
n = 20

for i in range(5):
    print(n)

20
20
20
20
20


可以发现，n的值的改变并不会改变代码的运行次数。

当n为10的时候，代码运行了5次；当m为20的时候，代码还是运行了5次。无论n的值如何发生改变，代码的运行次数都不会发生任何的改变。

![image.png](attachment:2775451a-0a41-4178-b4ca-7be7ea944cab.png)

## O(n^2)

我们可以将前面的代码修改一下：

In [16]:
n = 5
cout = 1

for i in range(n):
    for j in range(n):
        print(cout, "次循环")
        cout += 1

1 次循环
2 次循环
3 次循环
4 次循环
5 次循环
6 次循环
7 次循环
8 次循环
9 次循环
10 次循环
11 次循环
12 次循环
13 次循环
14 次循环
15 次循环
16 次循环
17 次循环
18 次循环
19 次循环
20 次循环
21 次循环
22 次循环
23 次循环
24 次循环
25 次循环


我们接着修改一下n的值：

In [17]:
n = 10
cout = 1

for i in range(n):
    for j in range(n):
        print(cout, "次循环")
        cout += 1

1 次循环
2 次循环
3 次循环
4 次循环
5 次循环
6 次循环
7 次循环
8 次循环
9 次循环
10 次循环
11 次循环
12 次循环
13 次循环
14 次循环
15 次循环
16 次循环
17 次循环
18 次循环
19 次循环
20 次循环
21 次循环
22 次循环
23 次循环
24 次循环
25 次循环
26 次循环
27 次循环
28 次循环
29 次循环
30 次循环
31 次循环
32 次循环
33 次循环
34 次循环
35 次循环
36 次循环
37 次循环
38 次循环
39 次循环
40 次循环
41 次循环
42 次循环
43 次循环
44 次循环
45 次循环
46 次循环
47 次循环
48 次循环
49 次循环
50 次循环
51 次循环
52 次循环
53 次循环
54 次循环
55 次循环
56 次循环
57 次循环
58 次循环
59 次循环
60 次循环
61 次循环
62 次循环
63 次循环
64 次循环
65 次循环
66 次循环
67 次循环
68 次循环
69 次循环
70 次循环
71 次循环
72 次循环
73 次循环
74 次循环
75 次循环
76 次循环
77 次循环
78 次循环
79 次循环
80 次循环
81 次循环
82 次循环
83 次循环
84 次循环
85 次循环
86 次循环
87 次循环
88 次循环
89 次循环
90 次循环
91 次循环
92 次循环
93 次循环
94 次循环
95 次循环
96 次循环
97 次循环
98 次循环
99 次循环
100 次循环


可以发现n的值增加了2倍，代码运行的次数也就增加了2^2倍。

这并不难理解，因为这只不过是一个循环嵌套了另一个循环而以。

## Simplifying Big O

一段程序的Big O可能会非常的复杂，所以我们可以基于一下的几个原则来进行简化：

1. 最糟糕的情况
2. 移除常数
3. different terms of inputs
4. 将不占据优势的项去除

哪一项更加的占据优势可以参考以下图片：

![image.png](attachment:2cabde60-5a14-492e-b56a-0dd40ca03857.png)

这是对常用的数据结构的不同算法的总结：

![image.png](attachment:8eae9060-0295-4fd6-894e-60ab613af986.png)

## O(n!)

如果出现了这种情况，那么应该是程序编写的时候出现了什么问题，因为n的值将会大幅度的影响Big O。

## Tips

如何编写好的代码：
1. readable  可阅读性
2. scalable  可拓展性  （Speed + Memory）