# 3.1 Experimental Studies

별 거 없음...

# 3.2 The Seven Functions Used in This Book

역시나 별 거 없음...

# 3.3 Asymptotic Analysis

Let $f(n)$ and $g(n)$ be functions mapping positive integers to positive real numbers. 

1. We say that $f(n)$ is $O(g(n))$ if there is a real constant $c >0$ and an integer constant $n_o \ge 1$ such that 
$$ f(n) \le cg(n)\quad \text{for }~ n\ge n_o.$$

1. We say that $f(n)$ is $\Omega(g(n))$ if $g(n)$ is $O(f(n))$.

1. We say that $f(n)$ is $\Theta(g(n))$ if $f(n)$ is $O(g(n))$ and $f(n)$ is $\Omega(g(n))$.

## 3.3.3 Examples of Algorithm Analysis

for a list `data`,

* `len(data)` is $O(1)$.
* `data[j]` is $O(1)$.
* `max(data)` is $O(n)$ ($n$ = len(data)).

### Further Analysis of the Maximum-Finding Algorithm

주어진 데이터가 랜덤으로 섞여있을 경우를 생각해보자. 이때 $j$번째 원소가 처음 $j$개의 원소 중 가장 클 확률은 $1/j$ 이다. 따라서 가장 큰 원소를 업데이트할 확률은 $H_n = \sum_j 1/j$, 즉 조화수이다. 그리고 $H_n = O(\log n)$ 임은 자명하다.

### Prefix Averages

길이가 $n$인 수열 $S$가 주어져있을 때, 수열 $A$를 다음과 같이 정의하자.
$$A[j] = \frac{\sum_{i=0}^j S[i]}{j+1}.$$
이 수열을 구하는 알고리즘을 다음 세 방법을 통해 해결해보자.

In [1]:
def method1(S):
    n = len(S)
    A = [0] * n
    for j in range(n):
        total = 0
        for i in range(j+1):
            total += S[i]
        A[j] = total/(j+1)
    return A

이렇게 정의한 함수는 당연히 $O(n^2)$ 이다.

In [5]:
def method2(S):
    n = len(S)
    A = [0] * n
    for j in range(n):
        A[j] = sum(S[0:j+1])/(j+1)
    return A

얘는 좀 나아보이지만, 사실은 `sum(S[0:j+1])` 또한 $O(j+1)$이므로 똑같은 $O(n^2)$ 다.

In [6]:
def method3(S):
    n = len(S)
    A = [0] * n
    total = 0
    for j in range(n):
        total += S[j]
        A[j] = total / (j+1)
    return A

얘는 `total`을 매번 갱신하는 아이디어로 인해 $O(n)$이다!

과연 실제로 그런지 검증해보자.

In [23]:
import numpy as np
S = np.random.randn(1000)
L = np.random.randn(10000)

In [24]:
S_ans1 = method1(S)
S_ans2 = method2(S)
S_ans3 = method3(S)
L_ans1 = method1(L)
L_ans2 = method2(L)
L_ans3 = method3(L)

In [25]:
print(S_ans1[:5],S_ans2[:5],S_ans3[:5])

[1.3057662724795343, 0.8283140080554918, 0.8470612155332277, 0.38127409033466303, 0.5116712477276042] [1.3057662724795343, 0.8283140080554918, 0.8470612155332277, 0.38127409033466303, 0.5116712477276042] [1.3057662724795343, 0.8283140080554918, 0.8470612155332277, 0.38127409033466303, 0.5116712477276042]


In [26]:
print(L_ans1[:5],L_ans2[:5],L_ans3[:5])

[-1.3222271689929312, -0.1293145535776078, -0.41347548462417755, -0.45989177994297115, -0.6153953340969261] [-1.3222271689929312, -0.1293145535776078, -0.41347548462417755, -0.45989177994297115, -0.6153953340969261] [-1.3222271689929312, -0.1293145535776078, -0.41347548462417755, -0.45989177994297115, -0.6153953340969261]


In [27]:
%%timeit
method1(S)

71.1 ms ± 107 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [28]:
%%timeit
method2(S)

51.8 ms ± 58.4 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [29]:
%%timeit
method3(S)

348 µs ± 315 ns per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [30]:
%%timeit
method1(L)

7.1 s ± 5.02 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [31]:
%%timeit
method2(L)

5.05 s ± 4.61 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [32]:
%%timeit
method3(L)

3.54 ms ± 7.35 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [34]:
10**(-3)

0.001

In [36]:
res = np.array([[71.1*(10**(-3)), 51.8*(10**(-3)), 348*(10**(-6))],
                [7.1, 5.05, 3.54*(10**(-3))]])

In [39]:
res[1]/res[0]

array([99.85935302, 97.49034749, 10.17241379])

대략 1, 2번이 3번에 비해 제곱 정도로 걸리는 것을 알 수 있다!

### Three-Way Set Disjointness