# 힙 정렬

In [13]:
class Heap(object):
    def __init__(self, comp):
        self.arr = [None] # [0]번째는 None으로 채워좋고 시작
        self.size = 0  # 노드의 개수
        # 우선순위 비교 함수
        self.comp = comp  # comp(d1, d2) 함수: d1이 크면 양수, d2가 크면 음수 리턴
        
    # 부모노드의 인덱스
    def get_parent_idx(self, idx):
        # return idx // 2
        return (idx >> 1)
    
    # left 자식 노드의 인덱스
    def get_left_idx(self, idx):
        # return idx * 2
        return (idx << 1)
        
    # right 자식 노드의 인덱스
    def get_right_idx(self, idx):
        #return idx * 2 + 1
        return ((idx << 1) + 1)
    
    # 두 자식 중에서 우선순위가 높은 자식의 인덱스 리턴 -> delete 동작에 사용
    def getHighPriority(self, idx):
        left_idx = self.get_left_idx(idx)
        right_idx = self.get_right_idx(idx)
        
        # 자식 노드 없다면 0 리턴
        if left_idx > self.size: return 0
        
        # 자식 노드가 하나 밖에 없다면
        if left_idx == self.size: return left_idx
        
        # 자식 노드가 두개 라면? 우선순위 비교
        if self.comp(self.arr[left_idx], self.arr[right_idx]) < 0:
            return right_idx  # 오른쪽 자식의 우선순위가 높다
        else:
            return left_idx  # 왼쪽 자식의 우선순위가 높거나 같다
    
    # 힙에 데이터 추가하는 함수 (insert)
    def insert(self, data):
        # 데이터 추가, 가장 마지막 데이터 다음에 위치
        self.arr.append(data)
        # 추가된 데이터의 리스트상의 인덱스
        idx = len(self.arr) - 1 
        
        # 결국 새로 추가된 데이터의 idx를 결정하면 된다.
        while idx != 1: # 계속 부모와 비교하다가 루트(index = 1)까지 도달하면 종료
            parentData = self.arr[self.get_parent_idx(idx)]
            if self.comp(data, parentData) > 0: # 부모보다 우선순위가 높다면
                self.arr[idx] = parentData  # 부모를 자신의 위치로 끌어 내리고
                idx = self.get_parent_idx(idx) # 자신의 idx 값을 부모의 idx 값으로 이동
            else:
                # 부모보다 우선순위가 낮거나 같으면, 거기서 멈춤
                break
                
        self.arr[idx] = data # idx가 결정된 그 위치에 새로운 data 자리잡기.
        self.size += 1
                
    # 힙에 데이터 삭제하는 함수 (delete)
    def delete(self):
        if self.size <= 0: return None
        
        retData = self.arr[1] # 인덱스 1번, 루트 노드가 리턴된다. (delete)
        
        lastData = self.arr[self.size] # 마지막 노드
        
        parentidx = 1 # 인덱스 1부터 시작해서 비교하며 내려올 것이다.
                        # 비교 다 끝나면 parentidx <-- lastData
  
        # parentidx 의 자식노드 중 우선순위가 높은걸 선택
        # 만약에 자식이 없으면? 종료
        while True:
            childidx = self.getHighPriority(parentidx) # parentidx 의 자식노드 중 우선순위가 높은걸 선택
            if not childidx: break # 만약에 자식이 없으면? 종료
        
            # 선택된 자식(childidx)과, lastData 우선순위 비교
            # 만약 자식의 우선순위가 같거나 낮다면 종료
            if self.comp(lastData, self.arr[childidx]) >= 0: break
                
            # 자식의 우선순위가 더 높다면, 자식(childidx)이 parentidx로 이동하고 
            # parentidx는 그 자식의 인덱스(childidx)로 내려와야 한다.
            self.arr[parentidx] = self.arr[childidx]
            parentidx = childidx
            
        # while이 끝난 그 자리(parentidx)가 맨 밑에서 올라왔던 lastData가 위치할 자리
        self.arr[parentidx] = lastData
        self.arr.pop() # 마지막 데이터 삭제
        self.size -= 1
        
        return retData # 최초에 뽑아낸 루트 데이터 리턴
    
    
        pass


In [14]:
def compPriority(d1, d2):
    return d2 - d1  # min-heap

In [15]:
def heap_sort(seq):
    heap = Heap(compPriority)
    
    for data in seq:
        heap.insert(data)
        
    result = []
    
    for i in range(heap.size):
        result.append(heap.delete())
        
    return result

seq = [3,5,2,6,8,1,0,3,5,6,2]
heap_sort(seq)

[0, 1, 2, 2, 3, 3, 5, 5, 6, 6, 8]

# 힙 정렬 성능 고찰
1. **O(*n* log *n*)** 




In [16]:
import time
from datetime import timedelta
import random
import copy   # deepcopy 사용할거다


# ※성능체크 시에는 '중간과정 출력' 을 끄고 하세요 ※

# 랜덤으로 리스트 작성
def gen_rand(num):
    data = [i for i in range(num)]
    random.shuffle(data)
    return data
    
# 오름차순 리스트 작성
def gen_asc(num):
    return [i for i in range(num)]

# 내림차순 리스트 작성
def gen_desc(num):
    return [i for i in range(num, 0, -1)]



# sort : 정렬함수
# data : 정렬할 데이터 (리스트)
# title : 정렬 결과 타이틀(str)
def test_sort(sort, data, title):
    
    start_time = time.time()
    
    result = sort(data)

    end_time = time.time()
    
    assert(result == sorted(data))  # 검증
    
    elapsed_time = end_time - start_time  # 경과 시간
    print('%s: 경과시간 %s' % (title, str(timedelta(seconds = elapsed_time))))
    return result

# 특정 사이즈의 생성된 데이터 x times 번 sort 수행
def test_ntimes_sort(genFunc, sort, title, size=1000, times=5):
    
    genData = genFunc(size)  # 데이터 생성
    for i in range(times):
        data = copy.deepcopy(genData) 
        test_sort(sort, data, ("%s %d차" % (title, i + 1))) 

#----------------        
gen_func_list = [
    (gen_rand, "램덤")
    #(gen_asc, "오름"),
    #(gen_desc, "내림")
]        
        
def test_double_up(sort, title, gen_list = gen_func_list, init_size = 1000, num_doubles = 3):
    data_size = init_size
    for i in range(num_doubles):
        print(f'■데이터 SIZE : {data_size}■' )
        for genFunc, genType in gen_list:
            test_ntimes_sort(genFunc, sort, f'{title}-{genType}{data_size}', data_size, 4)
            print()
        data_size *= 2
            
    print('[종료]')
    





In [17]:
test_double_up(heap_sort,'힙정렬')

■데이터 SIZE : 1000■
힙정렬-램덤1000 1차: 경과시간 0:00:00.024941
힙정렬-램덤1000 2차: 경과시간 0:00:00.019968
힙정렬-램덤1000 3차: 경과시간 0:00:00.024486
힙정렬-램덤1000 4차: 경과시간 0:00:00.015448

■데이터 SIZE : 2000■
힙정렬-램덤2000 1차: 경과시간 0:00:00.028455
힙정렬-램덤2000 2차: 경과시간 0:00:00.027456
힙정렬-램덤2000 3차: 경과시간 0:00:00.028454
힙정렬-램덤2000 4차: 경과시간 0:00:00.027976

■데이터 SIZE : 4000■
힙정렬-램덤4000 1차: 경과시간 0:00:00.075879
힙정렬-램덤4000 2차: 경과시간 0:00:00.066891
힙정렬-램덤4000 3차: 경과시간 0:00:00.066393
힙정렬-램덤4000 4차: 경과시간 0:00:00.062900

[종료]


# 연산속도도 무시 못한다.
- 함수 호출
- 곱셈, 나눗셈 >> 덧셈, 뺄셈, 비트연산

In [11]:
120 >> 1 # 비트연산자, right-shift


60

In [12]:
120 << 1 # 비트연산자,left-shift

240

In [24]:
test_double_up(heap_sort,'힙정렬', [(gen_rand, '랜덤')], 10000, 4)

■데이터 SIZE : 10000■
힙정렬-랜덤10000 1차: 경과시간 0:00:00.222640
힙정렬-랜덤10000 2차: 경과시간 0:00:00.190212
힙정렬-랜덤10000 3차: 경과시간 0:00:00.186700
힙정렬-랜덤10000 4차: 경과시간 0:00:00.171724

■데이터 SIZE : 20000■
힙정렬-랜덤20000 1차: 경과시간 0:00:00.403870
힙정렬-랜덤20000 2차: 경과시간 0:00:00.389894
힙정렬-랜덤20000 3차: 경과시간 0:00:00.391872
힙정렬-랜덤20000 4차: 경과시간 0:00:00.408328

■데이터 SIZE : 40000■
힙정렬-랜덤40000 1차: 경과시간 0:00:00.849138
힙정렬-랜덤40000 2차: 경과시간 0:00:00.848139
힙정렬-랜덤40000 3차: 경과시간 0:00:00.848657
힙정렬-랜덤40000 4차: 경과시간 0:00:00.848639

■데이터 SIZE : 80000■
힙정렬-랜덤80000 1차: 경과시간 0:00:01.887972
힙정렬-랜덤80000 2차: 경과시간 0:00:01.791126
힙정렬-랜덤80000 3차: 경과시간 0:00:01.812612
힙정렬-랜덤80000 4차: 경과시간 0:00:01.852529

[종료]
