# PriorityQueue class

## put_nowait(item)
아이템을 하나하나 넣어 주어야 한다.  
이게 heapify와의 차이점 : heapify는 데이터(리스트)를 한번에 정렬해준다.

In [1]:
from queue import PriorityQueue

my_list=[13,2,1,5,10]
pq=PriorityQueue()

for val in my_list:
    pq.put_nowait(val)
    
print(pq.queue)

[1, 5, 2, 13, 10]


##  get_nowiat()
데이터를 가져올 때

In [3]:
from queue import PriorityQueue

my_list=[13,2,1,5,10]
pq=PriorityQueue()
for val in my_list:
    pq.put_nowait(val)
    
print(pq.get_nowait())  #가장 작은 값 꺼내준다

1


In [4]:
from queue import PriorityQueue

my_list=[13,2,1,5,10]
pq=PriorityQueue()
for val in my_list:
    pq.put_nowait(val)
    
#queue가  empty 상태가 될 때까지
while not pq.empty():
    print(pq.get_nowait())

1
2
5
10
13


## qsize()
큐에 원소가 몇개 있는지 반환

In [5]:
from queue import PriorityQueue

my_list=[13,2,1,5,10]
pq=PriorityQueue()

for val in my_list:
    pq.put_nowait(val)
    print('QUEUE SIZE: ',pq.qsize())

QUEUE SIZE:  1
QUEUE SIZE:  2
QUEUE SIZE:  3
QUEUE SIZE:  4
QUEUE SIZE:  5


## empty()
큐가 비어있는지 확인

In [6]:
from queue import PriorityQueue

pq=PriorityQueue()

print("Is the queue empty? : ",pq.empty())

my_list=[13,2,1,5,10]
for val in my_list:
    pq.put_nowait(val)
    
print("Is the queue empty? : ",pq.empty())

Is the queue empty? :  True
Is the queue empty? :  False


# heapq module과  PriorityQueue class 속도 차이

1000000개의 데이터를 넣는 코드 비교
* heapq module : 40ms (heappush)
* PriorityQueue class : 300ms (put_nowait)

확실히 heapq module이 연산의 속도가 빠르다

In [7]:
import heapq
from queue import PriorityQueue
import timeit
import random

random.seed(0)

dataset=list(range(0,100000))
random.shuffle(dataset)


In [10]:
def heapq_perform(dataset):
    lst=[]
    for data in dataset:
        heapq.heappush(lst,data)
        
#heapq
print("heapq를 사용했을 때 : ")
%timeit heapq_perform(dataset) #magic command 

heapq를 사용했을 때 : 
15 ms ± 75.9 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


%timeit : 주어진 코드를 여러번 실행해보고 그 평균시간을 알려줌
* -n : 한 루프당 몇 번 시행할지 지정 (지정하지 않으면 그냥 적당히 알아서 돌려서 정확한 값이 나올 정도로 실행해 준다.
* -r : 여러번 반복해서 그 평균값과 오차범위를 보여준다.  defalut=7번

%timeit -n 100 -r 3 sum(range(100)) 3번의 run. 1번의 run마다 100번씩 실행해서 the best result를 저장 



In [11]:
def pqclass_perform(dataset):
    pq=PriorityQueue()
    for data in dataset:
        pq.put_nowait(data)
        
print("PriorityQueue를 사용했을 때:")
%timeit -n 10 pqclass_perform(dataset)

PriorityQueue를 사용했을 때:
214 ms ± 4.17 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


## heapq module과 list간 속도 차이 

heapq는 다음과 같은 상황에서 유리하다
* 데이터가 지속적으로 정렬돼야 할 때
* 데이터의 삽입/삭제가 빈번하게 일어날 때

In [13]:
random.seed(0)

def build_commands(n=1000000):
    '''PUSH, POP 명령을 담은 리스트를 만드는 함수'''
    commands=[]
    num_inserted=0
    
    for _ in range(n):
        operation='PUSH' if num_inserted==0 else random.choice(['PUSH','POP'])
        if operation=='PUSH':
            num_inserted +=1
            number=random.randint(0,1000000)
        else:
            num_inserted-=1
            number=None
        commands.append((operation,number))
        
    commands.extend([('POP',None)]*(num_inserted-1))
    return commands

commands=build_commands()
print("commands[:5]==>",commands[:5])

commands[:5]==> [('PUSH', 885440), ('POP', None), ('PUSH', 794772), ('POP', None), ('PUSH', 42450)]


In [16]:
def heapq_perform(commands):
    hq=[]
    for [operation,value] in commands:
        if operation=='PUSH':
            heapq.heappush(hq,value)
        else:
            heapq.heappop(hq)
            
%timeit -n 10 heapq_perform(commands)

263 ms ± 1.49 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [None]:
def list_perform(commands):
    lst=[]
    for [operation, value] in commands:
        if operation=='PUSH':
            lst.append(value)
        else:
            lst.sort(reverse=True)
            lst.pop()
            
%timeit -n 10 list_perform(commands)