In [1]:
import time

In [18]:
def sum_of_n_2(n):
    start = time.time()
    the_sum = 0
    for i in range(1,n+1):
        the_sum = the_sum + i
    end = time.time()
    time_used = end - start
    
    return the_sum, time_used

for i in range(5):
    print("Sum is %d required %10.7f seconds"% sum_of_n_2(1000000))

Sum is 500000500000 required  0.0402777 seconds
Sum is 500000500000 required  0.0344000 seconds
Sum is 500000500000 required  0.0341873 seconds
Sum is 500000500000 required  0.0339375 seconds
Sum is 500000500000 required  0.0348842 seconds


为了找到一个合适的标准来比较函数的运行时间，并且排除不同电脑的性能之间的差距，采用大O表示法。

在程序中，有些操作不费事，而有些操作则会对运行时间产生较大影响
> 计算机科学家对这种算法分析技术进行了更为深远的思考。有限的操作次数对于 T(n)函数的影响,并
不如某些占据主要地位的操作部分重要。换言之,当问题规模越来越大时,T(n)函数中的一部分几乎
掩盖了其他部分对于函数的影响。最终,这种起主导作用的部分用来对函数进行比较。数量级函数
用来描述当规模 n 增加时,T(n)函数中增长最快的部分。这种数量级函数一般被称为大“O”表示
法,记作 O(f(n))。它提供了计算过程中实际步数的近似值。函数 f(n)是原始函数 T(n)中主导部分的简
化表示。

>我们还是注意到有时算法的运行时间还取决于具体数据
而不仅仅是问题规模。对于这种算法,我们把它们的执行情况分为最好的情况,最坏的情况和平均
情况。某个特定的数据集会使算法程序执行情况极差,这就是最坏的情况。然而另一个不同的数据
集却能使这个算法程序执行情况极佳。不过,大多数情况下,算法程序的执行情况都介于这两种极
端情况之间,也就是平均情况。因此要理解不同情况之间的差别,不被某些特殊情况所误导。

为了实验几种不同的算法，使用变位词检测实验：
> 经典的字符串变位词检测问题是比较不同数量级函数算法的一个典型例子。如果一个字符串是
另一个字符串的重新排列组合,那么这两个字符串互为变位词。比如,”heart”与”earth”互为变位
词,”python”与”typhon”也互为变位词。为了简化问题,我们设定问题中的字符串长度相同,都是由
26 个小写字母组成。我们需要编写一个接受两个字符串,返回真假,代表是否是一对变位词的布尔
函数。

## 解法一


通过对每一个位置上的字符进行比较，执行循环；当检索出相同的字符后，删除该字符再进行后续的检索可以节省时间
<script type="text/javascript" src="http://cdn.mathjax.org/mathjax/latest/MathJax.js?config=default"></script>
复杂度计算为$\sum_{i=1}^n = \frac{n(n+1)}{2}$，所以复杂度为O($n^2$)

In [15]:
def anagram_solution1(s1,s2):
    a_list = list(s2)
    pos1 = 0
    still_ok = True
    while pos1 <len(s1) and still_ok:
        pos2 = 0
        found = False
        while pos2 <len(a_list) and not found:
            if s1[pos1] == a_list[pos2]:
                found = True
            else:
                pos2 = pos2 + 1
        if found:
            a_list[pos2] = None
        else:
            still_ok = False
        pos1 =pos1 + 1
        
    return still_ok


print(anagram_solution1('abcd','dcba'))


True


## 解法二
使用python内建的sort函数，先将两个需要比较的字符串排序后看是否相等

In [21]:
def anagram_solution2(s1,s2):
    a_list1=list(s1)
    a_list2=list(s2)
    a_list1.sort()
    a_list2.sort()
    pos=0
    matches=True
    while pos < len(s1) and matches:
        if a_list1[pos] == a_list2[pos]:
            Pos=pos + 1
        else:
            Matches=False
        
    return matches

print(anagram_solution2('abcde','edcba'))


KeyboardInterrupt: 

这个方法看上去是O(n)，但是如果考虑进sort中的排序过程的话，复杂度仍然为O($n^2$)。经证明，排序方法复杂度一般都是O($n^2$)或者O($n\log n$)

## 解法三
解决变位词问题的最后一个方法利用了任何变位词都有相同数量的 a,相同数量的 b,相同数量
的 c 等等。为判断两个字符串是否为变位词,我们首先计算每一个字符在字符串中出现的次数。由于
共有 26 个可能的字符,我们可以利用有 26 个计数器的列表,每个计数器对应一个字符。每当我们
看到一个字符,就在相对应的计数器上加一。最终,如果这两个计数器列表相同,则这两个字符串
是变位词。下面展示了这种方法:

In [22]:
def anagram_solution4(s1,s2):
    c1 = [0] * 26
    c2 = [0] * 26
    
    for i in range(len(s1)):
        pos = ord(s1[i]) - ord('a')
        c1[pos] = c1[pos] + 1
        
    for i in range(len(s2)):
        pos = ord(s2[i]) - ord('a')
        c2[pos] = c2[pos] + 1
    
    j = 0
    still_ok = True
    while j < 26 and still_ok:
        if c1[j] == c2[j]:
            j = j+1
        else:
            still_ok=False
    return still_ok

print(anagram_solution4('apple','pleap'))


True


本办法的复杂度为O(n),时间复杂度确实很低，但是由于使用了计数器，这就对内存提出了要求，所以有着较大的空间占用。时间和空间占用就是需要权衡的方面。
![list O](imgs/list_O.png)
![dict O](imgs/dict_O.png)