In [1]:
import random

In [2]:
data = [x for x in range(100000)]  # n = 100k
query = [x for x in range(100000)] # m = 100k
random.shuffle(data)

In [3]:
%%time
# 전략1 - 단순한 O(n) 순차탐색: 이경우 시간복잡도는 0(mn)
for q in query: # O(mn)
    res = q in data # O(n)

Wall time: 1min 8s


In [5]:
%%time
# 전략2 - 해싱을 이용한 O(1) 탐색 - 추가 메모리 사용함, 이경우 시간복잡도는 O(m) + O(n) = O(n)
data_set = set(data) # O(n)
for q in query: # O(m)
    res = q in data_set # O(1)

Wall time: 20 ms


In [6]:
import bisect

In [7]:
%%time
# 전략3 - 정렬을 이용한 O(logn) 탐색 - 추가 메모리 사용하지만 O(n) 정도만, 시간복잡도는 O(nlogn) + O(mlogn) = O(nlogn)
data_sort = sorted(data) # O(nlogn)
for q in query: # O(mlogn)
    res = bisect.bisect(data_sort, q) # O(logn) 

Wall time: 55 ms


In [8]:
# 전략4 - 비선형 자료구조로 변환(Heap, BST, ...)
# 최소값을 하나씩 반환하는 알고리즘

In [9]:
%%time
# Naive Method, 시간복잡도는 O(n^2)
data_ = data.copy()
while data_: # O(n^2)
    val = min(data_) # O(n)
    data_.remove(val)

Wall time: 1min 28s


In [10]:
%%time
# Sorting, 시간복잡도는 O(nlogn) + O(n) = O(n)
data_sorted = sorted(data, reverse=True) # O(nlogn)
while data_sorted: # O(n)
    del data_sorted[-1] # O(1) 

Wall time: 25 ms


In [11]:
import heapq

In [14]:
%%time
# heap 사용, 시간복잡도는 O(nlogn) + O(nlogn) = O(nlogn)
data_heap = data.copy()
heapq.heapify(data_heap) # O(nlogn)

while data_heap: # O(nlogn)
    val = heapq.heappop(data_heap) # O(logn)

Wall time: 51 ms
