#### Lecture 1. 모델의 시공간

- Space(problem(state) space & search(solution) space) and Time(opearation) tradeoff

#### mini code : time complexity

In [8]:
# binary search
def binary_search_iterative(array, element):
    
    fr = 0
    to = len(array) - 1
    step = 0
    
    while (fr <= to):
        print('Subarray in step {}: {}'.format(step, str(array[fr:to+1])))
        step += 1
        ptr = (fr + to) // 2
        if element == array[ptr]:
            return ptr
        elif element < array[ptr]:
            to = ptr - 1
        else:
            fr = ptr + 1
    return -1

binary_search_iterative([x for x in range(9)], 8)
        

Subarray in step 0: [0, 1, 2, 3, 4, 5, 6, 7, 8]
Subarray in step 1: [5, 6, 7, 8]
Subarray in step 2: [7, 8]
Subarray in step 3: [8]


8

1. Space and time
- problem space : 문제가 정의된 공간 
- search space(solution space, feasible region) : 제약조건을 만족하는 solution 후보군
- time complexity
    - $ O(1) \subset O(log n) \subset O(n^{1/k}) \subset O(n) \subset O(nlogn) \subset O(n^k) \subset O(c^n) $
- P/NP 문제 : machine learning에서 모든 가능성을 고려하지 않기 때문에 접근가능한 영역
- algorithm 문제에서는 time-space trade-off 가 존재
- entropy : 정보의 불확실성의 평균 레벨을 의미하는 랜덤 변수
    - problem(low entropy) >> solving(high entropy) >> solution(low entropy)

2. parameter search
- 개발자가 architecture를 만들고 hyperparameter tuning을 통해 model building 하지만 building 설계 역시 ML model이 담당하는 영역이 커짐
- search space : binary search 확실한 답을 보장 / ml model : 통계적인 답만 줄 수 있음
- data, ml model의 가중치 모두 다차원 공간상의 하나의 점

3. hyperparameter search
- exploitation(결과 실행) 과 exploration(결과 선택 탐색)을 반복하는 작업
- grid search / random search

4. Neural Architecture Search(NAS)
- muliti-object를 만족시키는 network compression
- search strategy
- MnasNet : search space 상의 architecture를 mobile phone에 넣고 돌려 실험후 수정
- ProxylessNAS
- depth-wise separable convolution : param 수와 연산 숫자 대폭 감소

#### Lecture 2. Compression

#### mini code : Codebook

In [10]:
dic = {'A': 0, 'B': 1, 'C': 2, 'D': 3}
print('Codebook: ', dic)
string = 'BCDADA'
print('Original message: {}, ({} bytes are needed)'.format(string, len(string)))

# encoding process
encoded = [dic[item] for item in [char for char in string]]
encoded = "".join(map(str, encoded))
print("Encoded message: {}, ({} bytes are needed)".format(encoded, len(encoded)/4))
print('Compression rate: ', len(string)/(len(encoded)/4))

# decoding process
reversed_dic = dict(map(reversed, dic.items()))
a = [item for item in list(encoded)]
decoded = [reversed_dic[int(num)] for num in [item for item in list(encoded)]]
decoded = ''.join(map(str, decoded))
print('Decoded message :', decoded)

Codebook:  {'A': 0, 'B': 1, 'C': 2, 'D': 3}
Original message: BCDADA, (6 bytes are needed)
Encoded message: 123030, (1.5 bytes are needed)
Compression rate:  4.0
Decoded message : BCDADA


In [12]:
dic = {'A': 0, 'B': 10, 'C': 110, 'D': 1110, 'E':11110, 'F':111110}
print('Codebook: ', dic)
string = 'DFEADEEDE'
print('Original message: {}, ({} bytes are needed)'.format(string, len(string)))

# encoding process
encoded = [dic[item] for item in [char for char in string]]
encoded = "".join(map(str, encoded))
print("Encoded message: {}, ({} bytes are needed)".format(encoded, len(encoded)/4))
print('Compression rate: ', len(string)/(len(encoded)/4))

# decoding process
decoded = ''
temp = ''
inv_code = {v:k for k,v in dic.items()}
for c in encoded:
    temp += str(c)
    if int(temp) in inv_code.keys():
        decoded += inv_code[int(temp)]
        temp = ''
    else:
        pass
print('Decoded message :', decoded)

Codebook:  {'A': 0, 'B': 10, 'C': 110, 'D': 1110, 'E': 11110, 'F': 111110}
Original message: DFEADEEDE, (9 bytes are needed)
Encoded message: 111011111011110011101111011110111011110, (9.75 bytes are needed)
Compression rate:  0.9230769230769231
Decoded message : DFEADEEDE


1. 압축(compression)
- 비손실 압축 : zip, wav, flac, png // 손실 압축 : mp3, mp4, avi, jpg, gif
- huffman coding : original message에 들어있는 char 수가 많을수록 적은 bit로 압축
- coding 을 통해 len(data) 가 작아질 때 compression

2. 부호(coding)
- computer는 Finite State Machine(FSM)
    - computing : input state ==(time/space)==> output state
    - DB : database --(Create/Read/Update/Delete)--> database
    - Security : M --(Encrypt)--> M' --(Decrypt)--> M
    - Network : Client --(Request)--> Server --(Response)--> Client
    - Operating system : Application <--> OS <--> Hardware
    - ML : Underfit ==(Train)==> Overfit ==(Regularization)==> Underfit
        - cycle의 사이 어디에선가 optimized
        - ML model도 input으로부터 output을 생성하고 output의 길이가 작다면 압축기

3. 부호화(encoding)
- classifier도 하나의 encoder
- KL-divergence 안에도 entropy의 개념이 포함되어 있음 (CE - E)
    - 완벽히 optimized 상태는 무질서도가 0인 상태
- cross-entropy coding 관점
    - Hq(p) : q(x)라는 분포의 code로 메세지 p(x)를 해독했을 때 평균 길이

4. 압축률(compression rate)
- 압축률은 parameter 개수의 비로 나타냄
- 압축기법 : P(pruning), Q(quantization), H(huffman coding), S(SVD)

#### peer session

In [14]:
import dis
import numpy as np

In [19]:
temp = range(1,20)
def make_list(n):
    return list(range(1,n))

def make_numpy(a):
    return np.array(range(1,n))


t = list(temp)
a = np.array(temp)

In [20]:
dis.dis(make_list)

  3           0 LOAD_GLOBAL              0 (list)
              2 LOAD_GLOBAL              1 (range)
              4 LOAD_CONST               1 (1)
              6 LOAD_FAST                0 (n)
              8 CALL_FUNCTION            2
             10 CALL_FUNCTION            1
             12 RETURN_VALUE


In [21]:
dis.dis(make_numpy)

  6           0 LOAD_GLOBAL              0 (np)
              2 LOAD_ATTR                1 (array)
              4 LOAD_GLOBAL              2 (range)
              6 LOAD_CONST               1 (1)
              8 LOAD_GLOBAL              3 (n)
             10 CALL_FUNCTION            2
             12 CALL_FUNCTION            1
             14 RETURN_VALUE
