# Реализация heapsort

In [123]:
import random
import time
from heapq import heappush, heappop

In [124]:
class MaxHeap:
    
    def __init__(self):
        self.items = []
        self.size = 0
        
    def get_left_child_index(self, index):
        # определяет индекс левого потомка для текущего узла
        return 2 * index + 1
    
    def get_right_child_index(self, index):
        # определяет индекс правого потомка для текущего узла
        return 2 * index + 2
    
    def get_parent_index(self, index):
        # определяет индекс родителя для текущего узла
        return int((index - 1) / 2)
    
    def has_left_child(self, index):
        return self.get_left_child_index(index) < self.size
    
    def has_right_child(self, index):
        return self.get_right_child_index(index) < self.size
    
    def has_parent(self, index):
        return self.get_parent_index(index) >= 0
    
    def get_left_child_value(self, index):
        return self.items[self.get_left_child_index(index)]
    
    def get_right_child_value(self, index):
        return self.items[self.get_right_child_index(index)]
    
    def get_parent_value(self, index):
        return self.items[self.get_parent_index(index)]
    
    def swap(self, index_1, index_2):
        self.items[index_1], self.items[index_2] = self.items[index_2], self.items[index_1]
        
    def get_max_child_index(self, index):
        # если у текушего узла есть правый потомок
        if self.has_right_child(index):
            # если значение левого потомка меньше значения правого потомка
            if self.get_left_child_value(index) < self.get_right_child_value(index):
                # возвращаем индекс правого потомка
                return self.get_right_child_index(index)
        # иначе возвращаем индекс левого потомка
        return self.get_left_child_index(index)
    
    def heapify_down(self, index):
        # пока у текущего узла есть левый потомок
        while self.has_left_child(index):
            # определяем индекс потомка с наибольшим значением
            max_child_index = self.get_max_child_index(index)
            # если наибольшее значение обоих потомков больше значения текущего узла
            if self.items[max_child_index] > self.items[index]:
                # меняем местами текущий узел и узел потомка с наибольшим значением
                self.swap(index, max_child_index)
            # перемещаемся вниз по пирамиде
            index = max_child_index
    
    def build_heap(self, array):
        self.items = array[:]
        self.size = len(array)
        i = self.size - 1
        while i >= 0:
            self.heapify_down(i)
            i -= 1
    
    def heap_sorted(self, array):
        self.build_heap(array)
        for i in range(len(array)):
            self.swap(0, self.size - 1)
            self.size -= 1
            self.heapify_down(0)
        self.size = len(array)
        return self.items
    
    def heapify_down_recursive(self, index):
        # если есть левый потомок
        if self.has_left_child(index):
            # определяем индекс потомка с наибольшим значением
            max_child_index = self.get_max_child_index(index)
            # если наибольшее значение обоих потомков больше значения текущего узла
            if self.items[max_child_index] > self.items[index]:
                # меняем местами текущий узел и узел потомка с наибольшим значением
                self.swap(index, max_child_index)
                # перестраиваем пирамиду с вершиной в узле с индексом max_child_index
                self.heapify_down_recursive(max_child_index)

## Сравнение времени работы с insertion sort

In [125]:
def sorted_insertion(array):
    array_copy = array[:]
    for i in range(len(array_copy)):
        # выбираем элемент массива
        selected_element = array_copy[i]
        # начальный индекс для сравнения выбранного элемента с элементами в отсортированной части массива
        j = i - 1
        # пока индекс в отсортированной части массива неотрицательный и
        # пока текущий элемент отсортированного массива больше выбранного элемента
        while j >= 0 and array_copy[j] > selected_element:
            # сдвигаем элементы в отсортированной части массива вправо на 1
            array_copy[j + 1] = array_copy[j]
            # уменьшаем индекс на 1, берем элемент с меньшим (или равным) значемением
            j -= 1
        # - если текущий элемент (по индеску j) отсортированного массива меньше или равен выбранному элементу,
        # тогда записываем выбранный элемент в ячейку правее (с индексом j + 1)
        # - если индекс отрицательный - пишем в самое начало
        array_copy[j + 1] = selected_element
    return array_copy

In [126]:
A = [i for i in range(10000)]
random.shuffle(A)

In [127]:
%%time
A_sorted_insertion = sorted_insertion(A)

CPU times: user 3.72 s, sys: 7.43 ms, total: 3.73 s
Wall time: 3.74 s


In [128]:
%%time
h = MaxHeap()
A_sorted_heap = h.heap_sorted(A)

CPU times: user 214 ms, sys: 2.2 ms, total: 216 ms
Wall time: 216 ms


In [129]:
%%time
A_sorted_python = sorted(A)

CPU times: user 1.64 ms, sys: 6 µs, total: 1.64 ms
Wall time: 1.66 ms


In [130]:
print(A_sorted_insertion == A_sorted_python)
print(A_sorted_heap == A_sorted_python)

True
True


## Реализация очереди с приоритетом

In [131]:
class PriorityQueueFromHeap:
    
    def __init__(self):
        self.items = []
        
    def get_left_child_index(self, index):
        return 2 * index + 1
    
    def get_right_child_index(self, index):
        return 2 * index + 2
    
    def get_parent_index(self, index):
        return int((index - 1) / 2)
    
    def has_left_child(self, index):
        return self.get_left_child_index(index) < len(self.items)
    
    def has_right_child(self, index):
        return self.get_right_child_index(index) < len(self.items)
    
    def has_parent(self, index):
        return self.get_parent_index(index) >= 0
    
    def get_left_child(self, index):
        return self.items[self.get_left_child_index(index)]
    
    def get_right_child(self, index):
        return self.items[self.get_right_child_index(index)]
    
    def get_parent(self, index):
        return self.items[self.get_parent_index(index)]
    
    def swap(self, index_1, index_2):
        self.items[index_1], self.items[index_2] = self.items[index_2], self.items[index_1]
        
    def pop(self):
        # берем объект, сохраненный в узле на вершине пирамиды
        item = self.items[0]
        # сохраняем в узле на вершине пирамиды объект, находящийся в последнем узле
        self.items[0] = self.items[-1]
        # удаляем последний узел
        del self.items[-1]
        # перестраиваем пирамиду сверху-вниз
        self.heapify_down(0)
        #print(self.items)
        return item
    
    def get_high_priority_child_index(self, index):
        # если у текушего узла есть правый потомок
        if self.has_right_child(index):
            # если приоритет левого потомка ниже (большее значение) приоритета правого потомка
            if self.get_left_child(index)[0] > self.get_right_child(index)[0]:
                # возвращаем индекс правого потомка
                return self.get_right_child_index(index)
            # при равенстве приоритетов
            if self.get_left_child(index)[0] == self.get_right_child(index)[0]:
                # если правый потомок был создан ранее, возвращаем его
                if self.get_left_child(index)[1] > self.get_right_child(index)[1]:
                    return self.get_right_child_index(index)
        # иначе возвращаем индекс левого потомка
        return self.get_left_child_index(index)
    
    def heapify_down(self, index):
        # пока у текущего узла есть левый потомок
        while self.has_left_child(index):
            # определяем индекс потомка с наивысшим приоритетом (меньшее значение)
            high_priority_child_index = self.get_high_priority_child_index(index)
            # если приоритет одного из потомков выше приоритета текущего узла
            if self.items[high_priority_child_index][0] < self.items[index][0]:
                # меняем местами текущий узел и узел потомка с высшим приоритетом
                self.swap(index, high_priority_child_index)
            # при равенстве приоритетов выбираем между текущим узлом и узлом потомка   
            if self.items[high_priority_child_index][0] == self.items[index][0]:
                # если узел потомка был создан ранее, меняем их местами
                if self.items[high_priority_child_index][1] < self.items[index][1]:
                    self.swap(index, high_priority_child_index)
            # перемещаемся вниз по пирамиде
            index = high_priority_child_index
    
    def add(self, item):
        # создаем очередной узел в структуре пирамиды и сохраняем туда новый объект
        self.items.append(item)
        # перестраиваем пирамиду снизу-вверх
        if len(self.items) > 1:
            self.heapify_up(len(self.items) - 1)
        
    def heapify_up(self, index):
        # пока у текущего узла есть родительский узел и
        # пока приоритет родительского узла ниже приоритета (большее значение) текущем узла
        while self.has_parent(index) and self.get_parent(index)[0] > self.items[index][0]:
            # меняем местами объекты родительского и текущего узла
            self.swap(self.get_parent_index(index), index)
            # перемещаемся вверх по пирамиде
            index = self.get_parent_index(index)
    
    def is_empty(self):
        return not self.items
    
    def enqueue(self, priority, value):
        if priority < 0:
            raise ValueError('Priority must be greater than 0')
        self.add((priority, time.time(), value))
        
    def dequeue(self):
        if self.is_empty():
            raise IndexError('Queue is empty')
        return self.pop()[2]

## Проверка корректности работы

In [132]:
pq_heap = PriorityQueueFromHeap()

priorities = [1, 2, 3]
for i in range(1, 11):
    priority = random.choice(priorities)
    pq_heap.enqueue(priority, f'Priority: {priority}, element: {i}')

for i in range(10):
    print(pq_heap.dequeue())

Priority: 1, element: 2
Priority: 1, element: 3
Priority: 1, element: 6
Priority: 1, element: 9
Priority: 2, element: 4
Priority: 2, element: 5
Priority: 2, element: 7
Priority: 2, element: 8
Priority: 2, element: 10
Priority: 3, element: 1


## Сравнение с ранее реализованной очередью

In [133]:
class PriorityQueueFromList:
    
    def __init__(self):
        self.queue = []
    
    def enqueue(self, priority, value):
        if priority < 0:
            raise ValueError('Priority must be greater than 0')
        self.queue.append((priority, value))
        self.queue.sort(key=lambda x: x[0])
        
    def dequeue(self):
        if self.is_empty():
            raise IndexError('Queue is empty')
        return self.queue.pop(0)[1]
    
    def is_empty(self):
        return not self.queue

In [134]:
items = [(random.choice([1, 2, 3]), i) for i in range(10000)]

### Реализация на основе массива

In [135]:
%%time

pq_list = PriorityQueueFromList()

for item in items:
    pq_list.enqueue(*item)
    
pq_list_result = [pq_list.dequeue() for i in range(len(items))]

CPU times: user 4.08 s, sys: 14.2 ms, total: 4.1 s
Wall time: 4.11 s


### Реализация на основе пирамиды

In [136]:
%%time

pq_heap = PriorityQueueFromHeap()

for item in items:
    pq_heap.enqueue(*item)
    
pq_heap_result = [pq_heap.dequeue() for i in range(len(items))]

CPU times: user 394 ms, sys: 5.1 ms, total: 399 ms
Wall time: 401 ms


### Реализация python

In [137]:
%%time

pq_python = []

for item in items:
    heappush(pq_python, item)
    
pq_python_result = [heappop(pq_python)[1] for i in range(len(items))]

CPU times: user 7.97 ms, sys: 88 µs, total: 8.06 ms
Wall time: 8.02 ms


In [138]:
print(pq_list_result == pq_python_result)
print(pq_heap_result == pq_python_result)

True
True
