# 힙 정렬

In [25]:
class Heap(object):
    def __init__(self, comp):
        self.arr = [None] # [0]번째는 None으로 채워놓고 시작 -> index의 계산을 위해서
        self.size = 0      # 노드(데이터)의 개수
        # 우선순위 비교함수
        self.comp = comp   # comp(d1, d2) 함수 : d1이 크면 양수, d2가 크면 음수를 리턴
        
    # 부모노드의 인덱스
    def get_parent_idx(self, idx):
        # return idx // 2
        return (idx >> 1)
    
    # left 자식 노드의 인덱스
    def get_left_idx(self, idx):
        # return idx * 2
        return (idx << 1)
    # right 자식 노드의 인덱스
    def get_right_idx(self, idx):
        return (idx << 1) + 1
    
    # 두 자식 중에서 우선순위가 높은 자식의 인덱스 리턴   -> delete에 사용
    def getHighPriority (self, idx):
        left_idx = self.get_left_idx(idx)
        right_idx = self.get_right_idx(idx)
        
        # 자식 노드 없다면 0 리턴
        if left_idx > self.size: return 0
        
        # 자식 노드가 하나밖에 없다면
        if left_idx == self.size: return left_idx
        
        # 두개의 자식 --> 비교
        # 우선순위 함수 
        if self.comp(self.arr[left_idx], self.arr[right_idx]) < 0:
            return right_idx # 오른쪽 자식의 우선순위가 높다.
        else:
            return left_idx # 왼쪽 자식의 우선순위가 같거나 높다
        
    # 힙에 데이터 추가 (insert)
    def insert(self, data):
        # 데이터 추가, 가장 마지막 데이터 다음에 위치
        self.arr.append(data)
        # 추가된 데이터의 리스트 상의 인덱스
        idx = len(self.arr) - 1
        
        # 결국 새로 추가된 데이터의 인덱스를 결정하면 된다.
        while idx != 1:   # 계속 부모와 비교하다가 루트(index 1)까지 도달하면 종료
            parentData = self.arr[self.get_parent_idx(idx)]
            if self.comp(data, parentData) > 0:    # 부모보다 우선순위가 높다면
                self.arr[idx] = parentData  # 부모를 자신의 위치로 끌어내리고
                idx = self.get_parent_idx    # 자신의 idx값을 부모 idx 값으로 이동
            else:
                # 부모보다 우선순위가 같거나 작다면, 거기서 멈추면
                break
                
        self.arr[idx] = data   # idx가 결정된 그곳에 새로운 데이터 자리잡기
        self.size += 1
 
    # 힙에 데이터 삭제 (delete)
    def delete(self):
        if self.size <= 0: return None
        
        retData = self.arr[1]    # 인덱스 1번, 루트노드가 리턴될 것읻. (delete)
        lastData = self.arr[self.size]    # 마지막 노드
        parentIdx = 1     # 인덱스 1부터 시작해서 비교하며 내려올 것이다.
        
        # 비교 다 끝나면 parentIdx <-- lastData    
        # parentIdx의 자식 노드 중 우선순위가 높은 거 선택
        while True:
            childIdx = self.getHighPriority(parentIdx)
        # 만약에 자삭이 없다면? 종료
            if not childIdx: break
                
        # 선택된 자식(childIdx)과 lastData의 우선순위 비교
        # 만약 자식의 우선순위가 같거나 낮다면 종료
            if self.comp(lastData, self.arr[childIdx]) >= 0: break
        
        # 자식의 우선순위가 더 높다면, 자식(childIdx)이 parentIdx로 이동하고
        # parentIdx는 그 자식의 인덱스(childIdx)로 내려와야한다.
        self.arr[parentIdx] = self.arr[childIdx]
        parentIdx = childIdx
        
        # while이 끝난 그 자리(parentIdx)가 맨 밑에서 올라왔던 lastData가 위치할 자리
        self.arr[parentIdx] = lastData
        self.arr.pop()   # 마지막 데이터 삭제
        self.size -= 1
        
        return retData

In [26]:
def compPriority(d1, d2):
    return d2 - d1       # min-heap

In [27]:
def heap_sort(seq):
    heap = Heap(compPriority)
    
    for data in seq:
        heap.insert(data)
        
    result = []
    
    for i in range(heap.size):
        result.append(heap.delete())
        
    return result

seq = [3, 5, 2, 6, 8, 1, 2, 3, 4, 1, 6, 3, 12]
heap_sort(seq)

TypeError: unsupported operand type(s) for >>: 'method' and 'int'

# 힙 정렬 성능고착
- O(nlog n)

In [28]:
import time
from datetime import timedelta
import random
import copy   # deepcopy 사용할거다


# ※성능체크 시에는 '중간과정 출력' 을 끄고 하세요 ※

# 랜덤으로 리스트 작성
def gen_rand(num):
    data = [i for i in range(num)]
    random.shuffle(data)
    return data
    
# 오름차순 리스트 작성
def gen_asc(num):
    return [i for i in range(num)]

# 내림차순 리스트 작성
def gen_desc(num):
    return [i for i in range(num, 0, -1)]



# sort : 정렬함수
# data : 정렬할 데이터 (리스트)
# title : 정렬 결과 타이틀(str)
def test_sort(sort, data, title):
    
    start_time = time.time()
    
    result = sort(data)

    end_time = time.time()
    
    assert(result == sorted(data))  # 검증
    
    elapsed_time = end_time - start_time  # 경과 시간
    print('%s: 경과시간 %s' % (title, str(timedelta(seconds = elapsed_time))))
    return result

# 특정 사이즈의 생성된 데이터 x times 번 sort 수행
def test_ntimes_sort(genFunc, sort, title, size=1000, times=5):
    
    genData = genFunc(size)  # 데이터 생성
    for i in range(times):
        data = copy.deepcopy(genData) 
        test_sort(sort, data, ("%s %d차" % (title, i + 1))) 

#----------------        
gen_func_list = [
    (gen_rand, "램덤")
    #(gen_asc, "오름"),
    #(gen_desc, "내림")
]        
        
def test_double_up(sort, title, gen_list = gen_func_list, init_size = 1000, num_doubles = 3):
    data_size = init_size
    for i in range(num_doubles):
        print(f'■데이터 SIZE : {data_size}■' )
        for genFunc, genType in gen_list:
            test_ntimes_sort(genFunc, sort, f'{title}-{genType}{data_size}', data_size, 4)
            print()
        data_size *= 2
            
    print('[종료]')
    

In [29]:
test_double_up(heap_sort, "힙정렬")

■데이터 SIZE : 1000■


TypeError: unsupported operand type(s) for >>: 'method' and 'int'

# 연산속도도 무시 못한다.
- 함수 호출
- 곱셈, 나눗셈 >> 덧셈, 뺄셈, 비트연산

In [30]:
4 // 2

2

In [31]:
120 >> 1   # 비트 연산자, right-shift

# 0111 1000    -> 120
# 0011 1100    ->  60
# -> 2진법에서 왼쪽으로 자리수 이동 했기때문에 2배로 나눈 것과 같음

60

In [32]:
120 << 1  # 비트 연산자, left-shift

# 0111 1000
# 1111 0000
# -> 2진법에서 오른쪽으로 자리수 이동 했기때문에 2배로 곱한 것과 같음

240

In [35]:
test_double_up(heap_sort, "힙정렬", [(gen_rand, "랜덤"), (gen_asc, "오름"), (gen_desc, "내림")], 10000, 4)

■데이터 SIZE : 10000■


TypeError: unsupported operand type(s) for >>: 'method' and 'int'