# linear search, binary search

In [1]:
import random

In [2]:
a = list(range(10**7))
k = 10**6

In [3]:
def linear_search(arr, k):
    for elem in arr:
        if elem == k:
            return elem
    return None

In [4]:
%%timeit
linear_search(a, k)

20 ms ± 810 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [5]:
def binary_search(arr, k):
    left = 0
    right = len(arr) - 1
    while left <= right:
        mid = (left + right) // 2

        if arr[mid] == k:
            return arr[mid]

        if arr[mid] > k:
            right = mid - 1

        else:
            left = mid + 1

    return None

In [6]:
%%timeit
binary_search(a, k)

3.74 µs ± 967 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


# arrays, linked lists

In [14]:
from typing import Any, List

**Задача**: развернуть массив

In [None]:
def reverse(arr: List[Any]) -> List[Any]:
    out = arr[::-1]

    # out = []
    # for i in range(len(arr)-1, -1, 1):
    #     out.append(i)

    # out = []
    # for item in arr:
    #     out.insert(0, item)

    # length = len(arr)
    # out = [None for _ in range(length)] # out = [None] * length
    # for (index, value) in enumerate(arr):
    #     out[length - index - 1] = value

    return out

    # length = len(arr)
    # for i in range(length // 2):
    #     arr[i], arr[length - i - 1] = arr[length - i - 1], arr[i]
    # return arr

In [8]:
class Node:
    def __init__(self, data):
        self.data = data
        self.next = None

In [9]:
head = Node(0)      # используем в цикле
head_start = head   # передаём в функцию

for i in range(1, 10):
    node = Node(i)
    head.next = node
    head = node

**Задача**: распечатать односвязный список

In [10]:
def linked_list_print(head):
    while head.next:
        print(f'{head.data} -->', end=' ')
        head = head.next
    print(f'{head.data} -->', end=' ')
    print('None')

linked_list_print(head_start)

0 --> 1 --> 2 --> 3 --> 4 --> 5 --> 6 --> 7 --> 8 --> 9 --> None


**Задача**: написать функцию, которая принимает односвязный список и k, и возвращает узел со значением k или None

In [11]:
def find_node(head, k):
    if head.data == k:
        return head.data
    while head.next:
        head = head.next
        if head.data == k:
            return head.data
    return None

find_node(head_start, 6)

6

**Задача**: развернуть односвязный список

In [12]:
def linked_list_reverse(head):
    node = head
    prev = None
    while node:
        next_node = node.next
        node.next = prev
        prev = node
        node = next_node
    return prev

reversed = linked_list_reverse(head_start)
linked_list_print(reversed)

9 --> 8 --> 7 --> 6 --> 5 --> 4 --> 3 --> 2 --> 1 --> 0 --> None


In [15]:
from typing import Optional

**Задача**: отсортированный массив. Найти в нём 2 элемента, сумма которых равна $k$

Методом двух указателей:
- можно зафиксировать один и бегать вторым по массиву - $O(n^2)$
- можно прикрутить бинарный поиск - $O(log\;n)$
- можно посчитать сумму и сдвигать левый или правый - $O(n)$

In [16]:
def find_sum_k(arr: list[int], k: int) -> Optional[tuple[int, int]]:
    left = 0
    right = len(arr) - 1
    while left < right:
        summa = arr[left] + arr[right]

        if summa < k:
            left += 1
        elif summa > k:
            right -= 1
        else:
            return (left, right)
    return None


assert find_sum_k([1, 2, 3], 5) == (1, 2)
assert find_sum_k([1, 2, 3], 4) == (0, 2)
assert find_sum_k([1, 2, 8], 4) is None
assert find_sum_k([1, 2, 3], 6) is None

**Задача**: найти зацикливание в односвязном списке

Методом двух указателей:
- можно хранить список посещённых вершин и проверять - накладно по памяти
- запустить два указателя, один быстрее. Если зацикливание есть, то они сойдутся в одной точке - $O(n)$

In [17]:
class Node:
    def __init__(self, data, next=None):
        self.data = data
        self.next = next

In [18]:
# lst1 = Node(1, next=2) -> Node(2, next=3) -> Node(3, next=None)
# lst2 = Node(1, next=2) -> Node(2, next=3) -> Node(3, next=2)

lst1 = Node(1, next=Node(2, next=Node(3)))

n3 = Node(3)
n2 = Node(2, next=n3)
n3.next = n2
lst2 = Node(1, next=n2)

In [19]:
def has_cycle(head):
    fast = head
    slow = head

    while fast and fast.next:
        fast = fast.next.next
        slow = slow.next
        if fast is slow:
            return True
    return False

assert not has_cycle(lst1)
assert has_cycle(lst2)

**Задача**: функция принимает список
и возвращает список, элементами которого являются средние значения по окну из $k$ элементов

Методом скользящего окна:

In [20]:
def mean(arr: list[int]) -> float:
    value = sum(arr) / len(arr)
    return value


def rolling_mean(arr: list[int], k: int) -> list[float]:
    left = 0
    right = k
    out = []
    for i in range(len(arr)):
        if right + i == len(arr):
            break
        value = mean(arr[left+i:right+i+1])
        out.append(value)
    return out

a = [1, 2, 3, 4, 5, 6, 7]
print(rolling_mean(a, 3))

[2.5, 3.5, 4.5, 5.5]


# sorting by comparison

In [21]:
import random

In [22]:
def array_for_sorting(n):
    arr = list(range(n))
    random.shuffle(arr)
    return arr

a = array_for_sorting(10**4)
print(a[:10])

[19, 8274, 1016, 6088, 6257, 9822, 1453, 6219, 5965, 1457]


**gnome sort**

In [23]:
def gnome_sort(arr):
    length = len(arr)
    i = 1
    while i < length:
        if arr[i-1] <= arr[i]:
            i += 1
            continue
        else:
            arr[i-1], arr[i] = arr[i], arr[i-1]
            i -= 1
            if i < 1:
                i += 1
    return arr

test_arr = a.copy()
print(id(a), id(test_arr), test_arr[:5])

138831070491328 138831085158720 [19, 8274, 1016, 6088, 6257]


In [24]:
%%time
gnome_sort(test_arr)[:5]

CPU times: user 6.93 s, sys: 13.8 ms, total: 6.95 s
Wall time: 6.98 s


[0, 1, 2, 3, 4]

**bubble sort**

In [25]:
def bubble_sort(arr):
    length = len(arr)
    for i in range(length):
        swapped = False
        for j in range(1, length - i):
            if arr[j] < arr[j-1]:
                arr[j], arr[j-1] = arr[j-1], arr[j]
                swapped = True
        if not swapped:
            break
    return arr

test_arr = a.copy()
print(id(a), id(test_arr), test_arr[:5])

138831070491328 138831084603264 [19, 8274, 1016, 6088, 6257]


In [26]:
%%time
bubble_sort(test_arr)[:5]

CPU times: user 5.88 s, sys: 14.6 ms, total: 5.9 s
Wall time: 5.93 s


[0, 1, 2, 3, 4]

**insertion sort**

In [27]:
def insertion_sort(arr):
    for i in range(1, len(arr)):
        key = arr[i]
        j = i - 1
        while j >= 0 and arr[j] > key:
            arr[j+1] = arr[j]
            j -= 1
        arr[j+1] = key
    return arr

test_arr = a.copy()
print(id(a), id(test_arr), test_arr[:5])

138831070491328 138829858099968 [19, 8274, 1016, 6088, 6257]


In [28]:
%%time
insertion_sort(test_arr)[:5]

CPU times: user 2.34 s, sys: 7 ms, total: 2.35 s
Wall time: 2.35 s


[0, 1, 2, 3, 4]

**merge sort**

In [29]:
def merge_sort(arr):
    length = len(arr)
    if length <= 1:
        return arr
    left = merge_sort(arr[:length // 2])
    right = merge_sort(arr[length // 2:])
    m = n = k = 0
    out = [0 for _ in range(length)]
    while n < len(left) and m < len(right):
        if left[n] <= right[m]:
            out[k] = left[n]
            n += 1
        else:
            out[k] = right[m]
            m += 1
        k += 1
    while n < len(left):
        out[k] = left[n]
        n += 1
        k += 1
    while m < len(right):
        out[k] = right[m]
        m += 1
        k += 1
    for i in range(length):
        arr[i] = out[i]
    return arr

test_arr = a.copy()
print(id(a), id(test_arr), test_arr[:5])

138831070491328 138829857929088 [19, 8274, 1016, 6088, 6257]


In [30]:
%%time
merge_sort(test_arr)[:5]

CPU times: user 39.6 ms, sys: 0 ns, total: 39.6 ms
Wall time: 39.4 ms


[0, 1, 2, 3, 4]

**timsort** (ещё не работает)

In [31]:
MINRUN = 32
def calc_minrun(n):
    r = 0
    while n >= MINRUN:
        r |= n & 1
        n >>= 1
    return n + r

def insertion_sort_timsort(arr):
    length = len(arr)
    for i in range(1, length):
        key = arr[i]
        j = i - 1
        while j >= 0 and arr[j] > key:
            arr[j+1] = arr[j]
            j -= 1
        arr[j+1] = key
    return arr

def merge_timsort(left, right):
    out = [0 for _ in range(len(left) + len(right))]
    n = m = k = 0
    while n < len(left) and m < len(right):
        if left[n] <= right[m]:
            out[k] = left[n]
            n += 1
        else:
            out[k] = right[m]
            m += 1
        k += 1
    while n < len(left):
        out[k] = left[n]
        n += 1
        k += 1
    while m < len(right):
        out[k] = right[m]
        m += 1
        k += 1
    # out.extend(left[n:])
    # out.extend(right[m:])
    return out

def timsort(arr):
    length = len(arr)
    if length <= MINRUN:
        return insertion_sort_timsort(arr)

    minrun = calc_minrun(length)
    for start in range(0, length, minrun):
        end = min(start + minrun, length)
        arr[start:end] = insertion_sort_timsort(arr[start:end])

    while minrun < length:
        for start in range(0, length, minrun * 2):
            arr[start:start + minrun] = merge_timsort(arr[start:start+minrun], arr[start+minrun: start + min(minrun*2, length)])
        minrun *= 2

    return arr

test_arr = a.copy()
print(id(a), id(test_arr), test_arr[:5])

138831070491328 138829846589632 [19, 8274, 1016, 6088, 6257]


In [None]:
%%time
timsort(test_arr)[:65]

**quick sort**

In [33]:
def partition(arr, left, right):
    pivot = arr[right]
    i = left - 1
    for j in range(left, right):
        if arr[j] <= pivot:
            i += 1
            arr[i], arr[j] = arr[j], arr[i]
    arr[i+1], arr[right] = arr[right], arr[i+1]
    return i + 1

def quicksort(arr, left, right):
    if left < right:
        q = partition(arr, left, right)
        quicksort(arr, left, q-1)
        quicksort(arr, q+1, right)

def quicksort_and_partition(arr):
    right = len(arr) - 1
    left = 0
    quicksort(arr, left, right)

test_arr = a.copy()
print(id(a), id(test_arr), test_arr[:5])

138831070491328 138829846590016 [19, 8274, 1016, 6088, 6257]


In [None]:
%%time
quicksort_and_partition(test_arr)

# sorting in linear time

**counting sort**

In [36]:
def array_for_counting_sort(max_len, max_value):
    arr = [random.randint(0, max_value) for _ in range(max_len)]
    return arr

In [37]:
def counting_sort(arr):
    max_value = max(arr)
    length = len(arr)

    tmp = [0 for _ in range(max_value + 1)]
    out = [0 for _ in range(length)]

    for elem in arr:
        tmp[elem] += 1

    for i in range(1, max_value + 1):
        tmp[i] += tmp[i-1]

    for i in range(length - 1, -1, -1):
        out[tmp[arr[i]] - 1] = arr[i]
        tmp[arr[i]] -= 1

    return out

In [38]:
test_arr = array_for_counting_sort(1000, 100)
print(test_arr[:30])
print()
print(counting_sort(test_arr)[:30])

[44, 61, 87, 63, 30, 63, 32, 22, 66, 25, 73, 88, 39, 70, 69, 20, 11, 25, 95, 38, 29, 45, 77, 88, 61, 6, 99, 25, 85, 78]

[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2]


**Задача**: остортировать массив данных по возрасту. Элементы массива - структуры

Структура:
- имя
- фамилия
- возраст
- адрес

In [39]:
from dataclasses import dataclass
from typing import Sequence

@dataclass(order=True)
class Person:
    name: str = ''
    surname: str = ''
    age: int = 0
    address: str = ''

In [40]:
def count_sort_age(arr: Sequence[Person], key) -> Sequence[Person]:
    max_value = max(key(elem) for elem in arr)
    length = len(arr)

    tmp = [0 for _ in range(max_value + 1)]
    out = [None for _ in range(length)]

    for elem in arr:
        tmp[key(elem)] += 1

    for i in range(1, max_value + 1):
        tmp[i] += tmp[i-1]

    for elem in arr[::-1]:
        out[tmp[key(elem)] - 1] = elem
        tmp[key(elem)] -= 1
    return out

In [41]:
# рандомный порядок
persons_random = [Person(age = random.randint(10, 50)) for i in range(10)]
print(persons_random)

persons_sorted_random = count_sort_age(persons_random, key=lambda p: p.age)
print(persons_sorted_random)

[Person(name='', surname='', age=41, address=''), Person(name='', surname='', age=47, address=''), Person(name='', surname='', age=44, address=''), Person(name='', surname='', age=17, address=''), Person(name='', surname='', age=42, address=''), Person(name='', surname='', age=31, address=''), Person(name='', surname='', age=50, address=''), Person(name='', surname='', age=17, address=''), Person(name='', surname='', age=12, address=''), Person(name='', surname='', age=43, address='')]
[Person(name='', surname='', age=12, address=''), Person(name='', surname='', age=17, address=''), Person(name='', surname='', age=17, address=''), Person(name='', surname='', age=31, address=''), Person(name='', surname='', age=41, address=''), Person(name='', surname='', age=42, address=''), Person(name='', surname='', age=43, address=''), Person(name='', surname='', age=44, address=''), Person(name='', surname='', age=47, address=''), Person(name='', surname='', age=50, address='')]


In [42]:
# обратный порядок
persons_reversed = [Person(age = 50 - i) for i in range(10)]
print(persons_reversed)

persons_sorted_reversed = count_sort_age(persons_reversed, key=lambda p: p.age)
print(persons_sorted_reversed)

[Person(name='', surname='', age=50, address=''), Person(name='', surname='', age=49, address=''), Person(name='', surname='', age=48, address=''), Person(name='', surname='', age=47, address=''), Person(name='', surname='', age=46, address=''), Person(name='', surname='', age=45, address=''), Person(name='', surname='', age=44, address=''), Person(name='', surname='', age=43, address=''), Person(name='', surname='', age=42, address=''), Person(name='', surname='', age=41, address='')]
[Person(name='', surname='', age=41, address=''), Person(name='', surname='', age=42, address=''), Person(name='', surname='', age=43, address=''), Person(name='', surname='', age=44, address=''), Person(name='', surname='', age=45, address=''), Person(name='', surname='', age=46, address=''), Person(name='', surname='', age=47, address=''), Person(name='', surname='', age=48, address=''), Person(name='', surname='', age=49, address=''), Person(name='', surname='', age=50, address='')]


**Задача**: остортировать массив данных по балансу. Элементы массива - структуры. Баланс может быть отрицательным

Структура:
- баланс
- возраст

In [43]:
@dataclass(order=True)
class Person:
    balance: int = 0
    age: int = 0

In [44]:
# сдвинуть на минимум

def count_sort_balance(arr: Sequence[Person], key) -> Sequence[Person]:
    max_value = max(key(elem) for elem in arr)
    min_value = min(key(elem) for elem in arr)

    tmp = [0 for _ in range(min_value, max_value + 1)]
    out = [None for _ in arr]

    key_ = lambda x: key(x) - min_value

    for elem in arr:
        tmp[key_(elem)] += 1

    for i, c in enumerate(tmp[1:], start=1):
        tmp[i] = tmp[i-1] + c

    for elem in arr[::-1]:
        out[tmp[key_(elem)] - 1] = elem
        tmp[key_(elem)] -= 1
    return out

In [45]:
persons = [Person(balance=random.randint(-100, 100)) for i in range(15)]
print([p.balance for p in persons])

persons_sorted = count_sort_balance(persons, key=lambda p: p.balance)
print([p.balance for p in persons_sorted])

[-72, -20, -50, -89, -23, -63, 9, -64, -38, 93, -64, -90, -14, -73, -67]
[-90, -89, -73, -72, -67, -64, -64, -63, -50, -38, -23, -20, -14, 9, 93]


**radix sort**

In [46]:
def counting_sort_radix(arr, digit, base):
    tmp = [0 for _ in range(base)]
    out = [0 for _ in range(len(arr))]

    for elem in arr:
        index = (elem // digit) % base
        tmp[index] += 1

    for i in range(1, len(tmp)):
        tmp[i] += tmp[i-1]

    for elem in arr[::-1]:
        index = (elem // digit) % base
        out[tmp[index] - 1] = elem
        tmp[index] -= 1
    return out

def radix_sort(arr):
    max_value = max(arr)
    digit = 1
    base = 10
    while (max_value / digit) >= 1:
        arr = counting_sort_radix(arr, digit, base)
        digit *= base

    return arr

In [47]:
test_arr = [17, 23, 907, 135, 5, 10, 99, 245, 9]
print(radix_sort(test_arr))

[5, 9, 10, 17, 23, 99, 135, 245, 907]


# trees

In [48]:
class TreeNode:
    def __init__(self, data, left=None, right=None):
        self.data = data
        self.right = right
        self.left = left

n3 = TreeNode(3)
n1 = TreeNode(1, left=n3)
n2 = TreeNode(2)
root = TreeNode(0, n1, n2)

**Задача**: найти элемент $k$ в дереве обходом в ширину (BFS). Если элемента нет - вернуть `None`

In [49]:
from collections import deque

In [50]:
def breadth_first_search(root, k):
    if root is not None:
        nodes_queue = deque([root])

        while nodes_queue:
            node = nodes_queue.popleft()
            if node.data == k:
                return node.data
            if node.left is not None:
                nodes_queue.append(node.left)
            if node.right is not None:
                nodes_queue.append(node.right)

    return None

In [51]:
breadth_first_search(root, 1)

1

In [54]:
# ещё вариант
def find_bfs(root, k):
    if not root:
        return None

    que = deque([root])

    while que:
        current_node = que.popleft()
        if current_node.data == k:
            return current_node

        if current_node.left:
            que.append(current_node.left)
        if current_node.right:
            que.append(current_node.right)

    return None

In [55]:
assert find_bfs(root, 2) is n2, f"{find_bfs(root, 5)=}"
assert find_bfs(root, 0) is root, f"{find_bfs(root, 0)=}"
assert find_bfs(None, 0) is None
assert find_bfs(root, 5) is None

**Задача**: найти элемент $k$ в дереве прямым обходом в глубину (pre-order DFS). Если элемента нет - вернуть `None`

In [56]:
# рекурсия. выход - нашли k, либо прошли всё дерево
def pre_order_DFS(root, k):
    if root is None:
        return None
    if root.data == k:
        return root.data
    else:
        # такая схема, чтобы return из внутреннего вызова функции вернулся из внешней функции
        return pre_order_DFS(root.left, k) or pre_order_DFS(root.right, k)

In [57]:
# assert pre_order_DFS(root, 2) is n2, f"{pre_order_DFS(root, 2)=}"
# assert pre_order_DFS(root, 0) is root, f"{pre_order_DFS(root, 0)=}"
assert pre_order_DFS(None, 0) is None
assert pre_order_DFS(root, 5) is None

**Задача**: инвертировать бинарное дерево

In [None]:
#         0                   0
#     1       2   -->     2       1
# 3                                   3

In [58]:
def invert_tree(root):
    if not root:
        return None

    root.left, root.right = root.right, root.left
    invert_tree(root.left)
    invert_tree(root.right)

**Задача**: дано бинарное дерево. Вернуть список максимальных элементов с каждого уровня дерева

In [59]:
# как-то знать с какого уровня элементы
# хранить не просто узел, а номер его уровня

# а можно, вроде, двумя циклами: один по уровням, второй внутри уровня
# не храним дополнительную переменную

def find_max_bfs(root):
    if not root:
        return []

    que = deque([(root, 0)])
    max_values = []

    while que:
        current_node, node_level = que.popleft()

        if len(max_values) <= node_level:
            max_values.append(current_node.data)

        elif current_node.data > max_values[node_level]:
            max_values[node_level] = current_node.data

        if current_node.left:
            que.append((current_node.left, node_level + 1))

        if current_node.right:
            que.append((current_node.right, node_level + 1))

    return max_values

**Задача**: обойти бинарное дерево поиска (BST) нерекурсивно in-order, чтобы элементы вывелись отсортированном порядке

In [None]:
# используем уже имеющееся дерево
#         0
#     1       2
# 3

In [60]:
# потребуется стек для складывания правых элементов

def traverse_inorder(root):
    stack = []
    node = root
    result = []

    while stack or node:
        while node:
            stack.append(node)
            node = node.left

        node = stack.pop()

        print(f'{node.data=}')
        result.append(node.data)

        node = node.right

    return result

In [61]:
print(traverse_inorder(root))

node.data=3
node.data=1
node.data=0
node.data=2
[3, 1, 0, 2]


**Задача**: проверить является ли дерево бинарным деревом поиска

In [62]:
# на каждом уровне есть границы значений
# проверяем входит ли узел в эти границы

def is_bst(root, min_value=float('-inf'), max_value=float('inf')):
    if root is None:
        return True

    if not (min_value < root.data < max_value):
        return False

    return (
        is_bst(root.left, min_value, root.data)
        and is_bst(root.right, root.data, max_value))

**Задача**: вернуть сбалансированное BST из отсортированного массива. В ином случае можно вернуть односвязный список

In [63]:
# можно согнуть массив посередине и сдвигать элементы на необходимые позиции
# каждый раз брать (len(arr) // 2) или средний/медианный элемент
# всё что слева рекурсивно дальше, всё что справа рекурсивно дальше

def build_balanced_bst(arr):
    if len(arr) == 0:
        return None

    idx = len(arr) // 2
    pivot = arr[idx]

    # лучше передавать индексы, а не копировать туда-сюда массив
    node = TreeNode(pivot)
    node.left = build_balanced_bst(arr[:idx])
    node.right = build_balanced_bst(arr[idx + 1:])

    return node

In [64]:
# вроде, работает
test_array = list(range(10))
traverse_inorder(build_balanced_bst(test_array))

node.data=0
node.data=1
node.data=2
node.data=3
node.data=4
node.data=5
node.data=6
node.data=7
node.data=8
node.data=9


[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

# hash

In [65]:
class Node:
    def __init__(self, data, next=None):
        self.data = data
        self.next = next

In [66]:
head = Node(0)      # используем в цикле
head_start = head   # передаём в функцию

for i in range(1, 10):
    node = Node(i)
    head.next = node
    head = node

**Задача**: удалить из односвязного списка удалить элемент с числом $k$

In [67]:
# переставить указатели
def remove_node(head, k):
    if head is None:
        return None

    if head.data == k:
        return head.next

    current_node = head

    while current_node.next:
        prev_node = current_node
        current_node = head.next

        if current_node.data == k:
            prev_node.next = current_node.next
            break

    return head

# тесты: пустой список, список из одного элемента, если удаляем первый, если удаляем последний, если удаляем из середины

**Задача**: реализовать LRU-cache

- классическое решение делается через двусвязный список?

- нужна какая-то временная метка, чтобы удалять least recently used?

- здесь можно использовать питоновские словари? Вроде, начиная с какой-то версии они поддерживают упорядоченность

In [68]:
d = {1: '1' , 2: '2', 3: '3', 4: '4'}
print(next(iter(d)))

1


In [69]:
class LRUCache:
    def __init__(self, limit):
        self.limit = limit
        self.cache = {}

    def get(self, key):
        if key in self.cache:
            result = self.cache[key]
            del self.cache[key]
            self.cache[key] = result
            return result
        else:
            return None

    def set(self, key, value):
        if key in self.cache:
            self.cache[key] = value
        else:
            if len(self.cache == self.limit):
                del self.cache[next(iter(self.cache))]
            self.cache[key] = value

**Задача**: определить $k$-ый наибольший элемент последовательности. Функция принимает неупорядоченный `iterable` объект и возвращает $k$-ый наибольший.

Понадобится `heapq`, в питоне используется minheap. Если хотим возвращать минимальный, то можно домножать на -1

In [None]:
# [1, 2, 3, 4, 5, 6, 7, 8], 3 -> 6
# [1, 2, 3, 4, 5, 6, 7, 8], 1 -> 8
# [1, 2, 3, 4, 5, 6, 7, 8], 8 -> 1

In [None]:
import heapq
# heapq.heappush(heap, elem)
# heapq.heappop(heap)

In [None]:
class NLarge:
    def __init__(self, n):
        self.n = n
        self.h = []

    def add(self, elem) -> int:
        heapq.heappush(self.h, elem)

        if len(self.h) >= self.n:
            while len(self.h) > self.n:
                heapq.heappop(self.h)
            return self.h[0]
        return None

In [None]:
nl = NLarge(3)
assert nl.add(1) == None
assert nl.add(2) == None
assert nl.add(3) == 1
assert nl.add(0) == 1
assert nl.add(5) == 2
assert nl.add(4) == 3

print("ok")

ok


# suffix tree