## Лекция 2. Структуры данных

Структуры данных нужны для быстрого выполнения каких-либо действий.

Рассмотрим такую структуру данных, как $\textbf{куча}$
В куче можно хранить любые элементы, для которых определена операция $x \leq y$

Нам необходимы операции:

    - insert (x)
    - get_min ()
    - remove_min ()

Попробуем несколько вариантов реализации кучи. 

1 Вариант (тупой). Будем хранить, как массив, его реализация операций: (a - массив, n - его длина)

    insert (x):
        a[n++] = x
    
    get_min ():
        m = +inf
        for i in range(n):
            m = min (m, a[i])
        return m
        
    remove_min ():
        idx_min = 0
        
        for i in range(n):
            if a[i] < a[idx_min]:
                idx_min = i
        swap (a[idx_min], a[-1])
        n -= 1
        
чтобы чуть-чуть улучшить структуру, давайте хранить индекс текущего минимума, ведь get_min каждый раз его ищет
приведу реализацию в таком виде

In [60]:
class Heap_1: 
    
    def __init__ (self):
        self.min_idx = 0
        self.length = 0
        self.container = list()
        
    def insert (self, x):
        self.container.append(x)
        self.length += 1
        self.min_idx = self.min_idx if self.container[self.min_idx] < self.container[self.length-1] else self.length-1
        
    def get_min (self):
        return self.container[self.min_idx]
    
    def remove_min (self):
        if self.length < 1:
            return
        self.container[self.min_idx], self.container[self.length - 1] = self.container[self.length - 1], self.container[self.min_idx]
        self.container.pop(-1)
        self.min_idx = 0
        for i in range(len(self.container)):
            if self.container[i] < self.container[self.min_idx]:
                self.min_idx = i
        self.length -= 1

In [61]:
hp = Heap_1()

In [62]:
hp.insert(1)

In [52]:
hp.insert(2)

In [53]:
hp.insert(10)

In [54]:
hp.insert(15)

In [55]:
hp.get_min()

1

In [56]:
hp.insert(-10)

In [57]:
hp.get_min()

-10

In [58]:
hp.remove_min()

In [59]:
hp.get_min()

1

In [63]:
class Heap_2:
    """Будем хранить в отсортированном массиве"""
    
    def __init__ (self):
        self.container = list()
    
    def insert (self, x):
        self.container.append(x)
        i = len(self.container) - 1
        
        while i > 0 and self.container[i] > self.container[i-1]:
            self.container[i], self.container[i-1] = self.container[i-1], self.container[i]
            i -= 1
    
    def get_min (self):
        return self.container[-1]
    
    def remove_min (self):
        self.container.pop(-1)

In [64]:
hp2 = Heap_2()

In [65]:
hp.insert(1)

In [66]:
hp.insert(-1)

In [67]:
hp.insert(23)

In [68]:
hp.insert(27)

In [69]:
hp.get_min()

-1

In [70]:
hp.remove_min()

In [71]:
hp.get_min()

1

Теперь рассмотрим такое понятие, как двоичная куча.

![sa](img/bin_tree.png)

In [188]:
class BinHeap_3: 
    
    def __init__ (self):
        self.container = list()
        self.n = 0
    
    def insert (self, x):
        self.container.append(x)
        self.n += 1
        i = len(self.container) - 1
        while i > 0 and self.container[i] < self.container[(i-1)//2]:
            self.container[i], self.container[(i-1)//2] = self.container[(i-1)//2], self.container[i]
            i = (i-1)//2
            
    def get_min (self):
        return self.container[0]
    
            
    def remove_min (self):
        if self.n < 1:
            return
        
        self.container[0] = self.container[-1]
        self.container.pop(-1)
        self.n -= 1
        i = 0
        
        while True:
            j = i
            if 2*i+1 < self.n and self.container[2*i+1] < self.container[j]:
                j = 2*i + 1
            if 2*i+2 < self.n and self.container[2*i+2] < self.container[j]:
                j = 2*i + 2
            if i == j: 
                break
            self.container[i], self.container[j] = self.container[j], self.container[i]
            i = j
            


In [189]:
bin_heap = BinHeap_3()

In [191]:
bin_heap.insert(1), bin_heap.insert(-5), bin_heap.insert(10), bin_heap.insert(20), bin_heap.insert(5),
bin_heap.insert(7)

В данном случае, куча устроена как двоичное дерево, операции здесь работают за O(1), O(logN), O(logN)

In [192]:
def heap_sort (A: list):
    heap = BinHeap_3()
    for i in A:
        heap.insert(i)
    for j in range(len(A)):
        A[j] = heap.get_min()
        heap.remove_min()

In [193]:
z = [-4,5,1,3,27,11,5,99,1,-1,-7,3]

heap_sort(z)

z

[-7, -4, -1, 1, 1, 3, 3, 5, 5, 11, 27, 99]

Сложность данной сортировки, очевидно O(n log n). Сильно быстрее сделать не получится!