## 2.2 What is Algorithm Analysis?

In [5]:
import time

In [6]:
def sumofN(n) :
    thesum = 0
    for i in range(1, n + 1) :
        thesum = thesum + i
    return thesum

In [7]:
print(sumofN(10))

55


In [8]:
def foo(tom):
    fred = 0
    for bill in range(1,tom + 1):
       barney = bill
       fred = fred + barney

    return fred

In [9]:
print(foo(10))

55


##### 두 코드가 같은 기능을 하는 코드이지만, 변수명을 직관적으로 사용하느냐에 따라 로직을 이해하는 데에 큰 차이가 있다.

In [14]:
def sumofN2(n) :
    start_time = time.time()
    thesum = 0
    for i in range(1, n + 1) :
        thesum = thesum + i
    
    end_time = time.time()
    return thesum, end_time - start_time

In [23]:
for i in range(5) :
    print('Sum is %d required %10.7f seconds.'%sumofN2(10000))

Sum is 50005000 required  0.0015535 seconds.
Sum is 50005000 required  0.0015044 seconds.
Sum is 50005000 required  0.0016358 seconds.
Sum is 50005000 required  0.0015507 seconds.
Sum is 50005000 required  0.0015283 seconds.


In [24]:
for i in range(5) :
    print('Sum is %d required %10.7f seconds'%sumofN2(100000))

Sum is 5000050000 required  0.0064886 seconds
Sum is 5000050000 required  0.0085077 seconds
Sum is 5000050000 required  0.0070615 seconds
Sum is 5000050000 required  0.0040743 seconds
Sum is 5000050000 required  0.0040865 seconds


In [25]:
for i in range(5) :
    print('Sum is %d required %10.7f seconds'%sumofN2(1000000))

Sum is 500000500000 required  0.0584178 seconds
Sum is 500000500000 required  0.0333118 seconds
Sum is 500000500000 required  0.0336051 seconds
Sum is 500000500000 required  0.0323486 seconds
Sum is 500000500000 required  0.0334461 seconds


##### sumofN2 함수는
\\(\sum_{i=1}^{n}i = \frac{(n)(n + 1)}{2}\\)
의 시간복잡도를 갖는다.

In [35]:
def sumofN3(n) :
    start_time = time.time()
    thesum = (n * (n + 1)) / 2
    end_time = time.time()
    return thesum, end_time - start_time

In [38]:
for i in range(4, 7) :
    print('Sum is %d required %10.7f seconds'%sumofN3(10 ** i))

Sum is 50005000 required  0.0000026 seconds
Sum is 5000050000 required  0.0000024 seconds
Sum is 500000500000 required  0.0000012 seconds


##### sumofN3 함수는 n에 상관없이 항상 동일한 적은 시간이 소요된다.
##### 우리는 이러한 알고리즘의 복잡도를 언어, 컴퓨터 성능 등과 무관하게 표현할 필요가 있다.

### 2.3 Big-O Notation

In [40]:
def listing2(n) :
    a = 5
    b = 6
    c = 10
    for i in range(n) :
        for j in range(n) :
            x = i * i
            y = j * j
            z = i * j
    for k in range(n) :
        w = a * k + 45
        v = b * b
    d = 33

##### 이 함수의 시간복잡도는 얼마일까?
세 개의 상수 할당 (3), 이중 for문에서 $n^2$의 복잡도인 변수 세 개 ($3n^2$), 두 번째 for문에서 $n$의 복잡도인 변수 두 개 ($2n$), 마지막 상수 할당 (1)  
즉, $3 + 3n^2 + 2n + 1 = 3n^2 + 2n + 4$이고, 이를 Big-O Notation으로 표현하면,  
$O(n^2)$이다.

### 2.4 An Anagram Detection Example

Anagram이란 단어의 알파벳을 재조합해서 새로운 다른 단어로 바꾸는 일종의 말장난이다.  
예) 'heart' <-> 'earth', 'python' <-> 'typhon'

In [56]:
def anagramsolver1(word1, word2) :
    alist = list(word2)
    pos1 = 0
    stillOK = True

    while pos1 < len(word1) and stillOK :
        pos2 = 0
        found = False
        while pos2 < len(alist) and not found:
            if word1[pos1] == alist[pos2] :
                found = True
            else:
                pos2 = pos2 + 1

        if found :
            alist[pos2] = None
        else :
            stillOK = False

        pos1 = pos1 + 1

    return stillOK

In [52]:
anagramsolver1('abcd', 'dcba')

True

이 코드는 두 단어의 이중 loop를 통해 한 알파벳씩 비교하고, 단어 1에 존재하는 알파벳이 단어 2에 존재하지 않으면 False를 반환하는 기초적인 알고리즘으로 짜여져 있다.  
즉, 이 알고리즘의 시간복잡도는,  
$\sum_{i = 1}^ni = \frac{n(n + 1)}{2} = \frac{1}{2}n^2 + \frac{1}{2}n$이고, Big-O Notation으로는 $O{n^2}$로 표현할 수 있다.

### 2.4.2 Solution 2 : Sort and Compare

Anagram을 두 단어를 구성하는 알파벳은 동일하므로 알파벳 순으로 sort하면 같은 string이 반환되어야 한다.  
이를 이용한 sort and compare 방법으로 solver를 만들어보자.

In [61]:
def anagramsolver2(word1, word2) :
    alist1 = list(word1)
    alist2 = list(word2)

    alist1.sort()
    alist2.sort()
    
    pos = 0
    matches = True

    while pos < len(word1) and matches :
        if alist1[pos] == alist2[pos] :
            pos = pos + 1
        else :
            matches = False
            
    return matches

In [62]:
anagramsolver2('abcde', 'edcba')

True

언뜻 보기에 이 알고리즘의 시간복잡도는 $O(n)$인 것처럼 보이지만, python의 sort 메소드를 두 번 사용했기 때문에, 그렇지 않다.  
일반적으로 sort 알고리즘의 시간복잡도는 $O(n^2)$이거나, $O(n\log{n})$이므로, 이 알고리즘의 시간복잡도도 그와 같을 것이다.

### 2.4.3 Brute Force

Brute Force는 모든 가능한 경우를 다 검토하는 방법이다. Anagram을 확인하는 문제에서는, 두 단어의 알파벳들로 만들 수 있는 모든 문자열을 만들어볼 것이다.  
첫 번째 단어 word1에 n개의 알파벳이 있다고 하면, $n!$개의 가능한 문자열을 만들 수 있다.  
만약 첫 번째 단어 word1이 길이가 20이라면, 총 $20! = 2,432,902,008,176,640,000$의 경우의 수가 생기며, 만약 1초에 하나씩 연산할 수 있다고 한다면, 총 77,146,816,596년이 걸린다. 이 방법은 좋은 방법이 되지 않을 것이므로 건너뛰도록 한다.

### 2.4.4 Count and Compare

두 단어가 Anagram이라면, 두 단어는 같은 수의 알파벳을 갖고 있을 것이다. 즉, 같은 수의 a, 같은 수의 b, ..., 같은 수의 z를 갖고 있을 것이다.  
알파벳은 총 26개이므로, 26개의 count 리스트를 작성하면 된다. 각 단어의 iteration을 돌며 count 리스트를 갱신한 후, 두 단어의 count 리스트를 비교하면 된다.

In [67]:
def anagramsolver3(word1, word2):
    c1 = [0]*26
    c2 = [0]*26

    for i in range(len(word1)):
        pos = ord(word1[i]) - ord('a')     # 문자열의 ord는 유니코드 번호를 반환하는 python 내장 함수
        c1[pos] = c1[pos] + 1

    for i in range(len(word2)):
        pos = ord(word2[i]) - ord('a')
        c2[pos] = c2[pos] + 1

    j = 0
    stillOK = True
    while j < 26 and stillOK:
        if c1[j] == c2[j]:
            j = j + 1
        else:
            stillOK = False

    return stillOK

In [68]:
anagramsolver3('apple', 'pleap')

True

이 방법으로는 이중 loop가 존재하지 않고, 복잡도 n인 loop 두 개와, 복잡도 26인 loop 하나로 이루어져 있으므로,  
$2n + 26$의 복잡도를 가지고 있다. 즉, Big-O로 표현하면 $O(n)$의 시간복잡도를 가지고 있는 알고리즘이다.

또, 이전 두 알고리즘과는 달리 단어 1에 사용된 알파벳이 모두 단어 2에 사용되었더라도 단어의 길이가 다르면 False를 반환한다.

In [72]:
print(anagramsolver1('abcd', 'abcde'), anagramsolver2('abcd', 'abcde'), anagramsolver3('abcd', 'abcde'))

True True False


### 2.5 Performance of Python Data Structures

이제 파이썬의 기본 자료구조가 얼마나 효율적으로 작동하는지 알아보도록 한다. (list와 dictionary)

### 2.6 Lists

리스트 자료구조를 만드는 데에 가장 흔히 사용되는 두 가지 방법 중 하나는