# https://github.com/wesm/pydata-book/

책의 모든 코드가 주피터 파일로 공개되어 있음

# https://colab.research.google.com

구글에서 제공, 설치 없이 클라우드에서 실행되는 무료 주피터 환경



colab의 텍스트 셀 역시 수식을 지원 ($\LaTeX$  문법)

단순히 $ \int f(x)dx $ 텍스트 속에 넣거나,

$$ \int f(x)dx $$ 별도의 줄에 가운데 정렬하여 강조할 수 있음

# Numpy ndarray에 대해 

ndarray란 n-dimensional array(다차원 배열)의 줄임말.

Array(배열)이란?

* C를 비롯해 대부분의 프로그래밍 언어에서 사용할 수 있는 가장 기본적인 자료구조.
* (고정된 크기를 가진) 같은 자료형의 자료들을 메모리 상에 연속적으로 늘어놓은 것. 
(eg. Array of bools, int8, ascii characters, float32, etc...)
* $k$번째 자료형의 상대적 위치가 어디인지 바로 알 수 있다($k \times $자료형의 크기).
* 상술했듯이, 서로 다른 자료형을 가진 원소를 동시에 담을 수는 없다.

Python List와의 비교

* List는 Array of Pointers로 구현되어 있다.
* 이는 서로 다른 크기와 종류의 자료형들을 자유롭게 담기 위함.
* 따라서 List의 원소들에 Access하기 위해서는 List의 위치, 원소의 위치, 총 두 번의 Pointer를 참조해야 하며(indirect reference$\rightarrow$ slow), 서로 가까운 주소의 값들을 참조할 때 생기는 속도의 하드웨어적 이점을 잃는다(Locality of Reference)
* 메모리 사용량 역시 다르다. List는 포인터들을 저장하기 위한 메모리와, 개별 원소를 '온전한 Python 객체로 저장하기 위한' 메모리가 추가로 필요하다. 
* 위 차이는 List로 다차원 텐서를 구현할 경우 더욱 벌어진다: 가령 $m \times n$ 행렬의 경우 $List[x][y]$를 참조하기 위해 3개의 주소를 이동해야 하지만, 배열로 구현할 경우 Array of Arrays를 만들 필요 없이 $nx+y$번째 주소로 바로 이동하면 된다.



# 계산복잡도(Computational Complexity)

* 어떤 알고리즘의 (계산)복잡도란 input의 크기에 따라 필요한 자원의 양을 의미한다.
* 주로 시간복잡도와 공간복잡도를 다루며 이 중에서도 시간복잡도가 보통 주 관심사가 된다.
* 다소 마이너하게 산술복잡도와 같은 개념도 있다. 모든 사칙연산에 상수 시간이 걸린다고 가정하면 이는 시간복잡도와 차이가 없다.


# Big O notation

* 두 함수 $f(x), g(x)$에 대해, 적당한 상수 $M, x_0$가 있어서 $$|f(x)| \le Mg(x) \text{ for all } x \ge x_0$$
이면 $f(x) = O(g(x))$ 라고 쓰고 함수 $f$가 $O(g(x))$ 라고 말한다.


# (Time) Complexity의 몇 가지 예시

자연수 n, m, ...에 대해 다음을 생각해 보자.

* $(-1)^n$을 계산하는 데 드는 시간복잡도는 $O(1)$이다.
* 물론 $n$이 2진법 또는 10진법으로 주어졌을 때의 이야기이다. 홀수 진법으로 주어진 경우 2로 나눈 나머지를 판별하는 데는 $O(\log n)$의 시간이 필요할 것이다. 별 말이 없다면 항상 이진법을 생각하자.
* 두 $n$자리 수의 덧셈은 $O(n)$이 필요하다.
* 두 $n$자리 수를 곱하는 데 걸리는 시간은 $O(n^2)$이다. (정말 최선일까?)
* 길이 $n$의 리스트를 정렬하는 데 걸리는 시간은 $O(n \log n)$이다.
* 길이 $n$의 정렬된 리스트에 새 원소를 집어넣는(정렬성을 유지하면서) 데 걸리는 시간은 $O(\log n)$이다. 


여러분의 과제 코드 등에서 발췌한, 동일한 동작을 할 듯한 몇 가지 코드 블록입니다.  Time complexity를 예측해 보고, 실제로 테스트해 봅시다.
(%timeit을 사용해 본 결과 캐싱 등으로 인해 정상적인 시간 측정이 안 될 수 있습니다. )




# 단순 반복문

In [2]:
def iter1(n):
    j = 0
    for i in range(n):
        pass # do-something: O(1) action
    return 
%timeit iter1(10**5)
%timeit iter1(10**6)
%timeit iter1(10**7)

2.93 ms ± 195 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
26.7 ms ± 2.07 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
280 ms ± 29.6 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [3]:
def iter2(n):
    i = 0
    while i in range(n):
        # do-something
        i += 1
    return 

%timeit iter2(10**3)
%timeit iter2(10**4)
%timeit iter2(10**5)
%timeit iter2(10**6)

522 µs ± 32.7 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
5.11 ms ± 149 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
50.9 ms ± 2.09 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
499 ms ± 16.3 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [5]:
def iter3(n):
    j = 0
    it = [i for i in range(n)]
    while len(it) > 0:
        i = it[0]
        # do-something
        del it[0]
    return 
%time iter3(10**3)
%time iter3(10**4)
%time iter3(10**5)
# %time iter3(10**6)

Wall time: 998 µs


# 문자열 여럿 합치기

In [0]:
n = 400000
s = list(range(20))*(n//20) # 길이 n에 가까운 적당한 문자열


In [82]:
def concatenate1(s):
    return ''.join(str(i) for i in s)
%timeit concatenate1(s)

In [83]:
def concatenate2(s):
    k = ''
    for i in s:
        k += str(i)
    return k
%timeit concatenate2(s)

In [86]:
t = reversed(s)
def concatenate3(s):
    k = ''
    for i in s:
        k = str(i) + k
    return 
%time concatenate3(t)

...확인할 수 있듯이, 각 경우에서 1과 2는 큰 차이가 없지만, 마지막 예시는 큰 overhead가 발생합니다. 

1과 2는 $O(n)$인 반면, 3은 $O(n^2)$이 됩니다. 

첫 번째 문제의 경우 list x에서 원소 하나를 지우는 행위가 $O(len(x))$이기 때문에 발생합니다. 제거할 위치 이후의 원소의 위치를 한 칸씩 당겨야 하기 때문에 걸리는 시간입니다.

두 번째의 경우 (중간 결과를 저장하는) 문자열 k를 매번 새로 생성했거나, 긴 길이의 문자열 전체를 뒤로 몇 칸씩 보내는 작업을 반복했기 때문이라고 추측해볼 수 있습니다. 어느 쪽이었든 $O(n)$의 시간이 걸리는 작업을 $n$번 반복했기 때문에 전체 시간은 $O(n^2)$이 됩니다.


# 예시: 카라추바 알고리즘(Karatsuba algorithm)
시간복잡도에 관한 선입견을 깨기 위해 자주 소개되는 유명한 알고리즘으로, 두 수(또는 다항식)의 곱셈을 $O(n^2)$보다 빠르게 수행할 수 있다.


두 $2n$ 자리수 $X, Y$를 다음과 같이 쓰자.

$X = aN + b$,
$Y = cN + d$. 단, $N = 10^n, a, \cdots, d$는 $n$자리 수

그러면 두 수 $X,Y$의 곱셈은 다음과 같이 할 수 있다.

$$XY = (aN + b)(cN + d) = ac N^2 + (ad + bc)N + bd$$
여기서 $ad + bc$는 다음과 같이 계산할 수 있다:
$$ad + bc = (a + b)(c + d) - ac - bd$$
따라서 두 $2n$자리 수의 곱셈을 (대략) $n$자리 수의 곱셈 3번과 몇 번의 덧셈으로 계산할 수 있다.
이를 통해 시간복잡도가 $O(n^{\log_{2}{3}}) \approx O(n^{1.58})$임을 짐작할 수 있다.






In [0]:
# 카라추바 알고리즘을 다항식에 대해 구현하세요. 다항식의 길이를 바꾸어 가며 시간복잡도를 확인해 보세요.
# Review: 길이(차수)가 같은 두 다항식 a , b의 일반적인 곱셈은 np.convolve(a, b), 덧셈은 a + b를 통해 가능했습니다.
import numpy as np

def karatsuba(a, b): # assumes len(a) == len(b)
    if len(a) < 16:
        return np.convolve(a, b) # 길이가 너무 작을 경우 그냥 일반 곱셈으로
    # fill it yourself

#예시: 합병 정렬

길이 $n$의 리스트를 $O(n\log n)$ 시간에 정렬하는 수많은 알고리즘 중의 하나이다. 방법은 다음과 같다.

1. 리스트 X를 절반 길이의 두 리스트 A와 B로 분할한다.
2. A, B를 각각 (합병)정렬한다.
3. 정렬된 두 리스트 A, B에서 각각 최소원 a, b를 뽑아 크기를 비교한다. a, b 중에서 더 작은 것을 택하면 그것이 X에서 제일 작은 원소가 된다. 선택되지 않은 원소(일반성을 잃지 않고 b라고 하자)와 A에서 a 다음으로 작은 원소 a'를 비교하여 더 작은 것부터 나열하는 작업을 반복한다.

In [0]:
# 합병 정렬을 구현하여라. Python에서 제공하는 list.sort와 비교하여 결과가 맞는지 확인해볼 수 있다.