# Making One-hot Representation

기존 class label에서 one-hot representation으로 바꾸는 코드를 자주 헷갈려 가능한 방법을 정리하였습니다.

## 방법 1: 반복문을 이용하여 one_hot representation이 완성된 list 반환

In [1]:
# labels_dense: 1d list of labels (number of data)
def make_one_hot(labels_dense, num_classes):
    num_labels = len(labels_dense)
    labels_one_hot = list()
    for i in range(num_labels):
        temp = [0 for _ in range(num_classes)]
        temp[labels_dense[i]] = 1
        labels_one_hot.append(temp)
    return labels_one_hot

## 방법 2: Numpy 를 통하여 one-hot representation 만들기
 *이 방법은 tensorflow에서 one-hot representation을 구성할 때 사용하는 방법입니다.

Tensorflow에서는 2차원 구조로 일단 one-hot 결과가 들어갈 array를 구성합니다.

그 후, array.flat 함수를 통해 이를 1차원으로 변형된 형태에서 값을 빠르게 바꾸는 것을 볼 수 있습니다.

array.flat은 해당 array를 flat 한 결과의 index를 활용하여, 바로 원래 array에 접근할 수 있게 해줍니다.

(array.flatten 함수는 해당 array를 flat한 결과를 return하는 함수이며, .flat은 했을 때의 상황에서 원래 array에 접근할 수 있도록 합니다.)

In [2]:
import numpy as np
# labels_dense: numpy array
def dense_to_one_hot(labels_dense, num_classes):
    num_labels = labels_dense.shape[0]
    index_offset = np.arange(num_labels) * num_classes #2d onehot 결과를 (1-d로)flat 했을 때, 각 샘플의 위치를 저장
    labels_one_hot = np.zeros([num_labels, num_classes])
    labels_one_hot.flat[index_offset + labels_dense.ravel()] = 1
    return labels_one_hot

### 두 방법의 성능 비교

In [3]:
import random
import time
def test(n):
    a = list()
    for i in range(n):
        a.append(random.randint(0,9))
    b = np.array(a)
    
    start = time.time()
    test1 = make_one_hot(a,10)
    end = time.time()
    time_test1 = end-start
    
    start = time.time()
    test1 = dense_to_one_hot(b,10)
    end = time.time()
    time_test2 = end-start
    
    print n, time_test1, time_test2, time_test1/time_test2

In [4]:
test(100)

100 0.000530004501343 0.000138998031616 3.81303602058


In [5]:
test(10000)

10000 0.0154910087585 0.00148606300354 10.4241938072


In [6]:
test(10000)

10000 0.014585018158 0.00120615959167 12.0921130658


Tensorflow는 numpy에 내장된 함수를 적절히 활용하여 시간복잡성을 많이 낮춘 것을 볼 수 있네요.

어쩌면 당연한 것인데, 제 실력이 아직 모자란 것이네요 ㅎ...