# Стек

**Стек** — тип данных, представляющий собой набор элементов по принципу *Last-in-first-out* (LIFO)

LIFO означает, что последний элемент, который был добавлен в стек будет извлечен из него в первую очередь

Операции со стеком:
- push -  положить элемент наверх стека
- pop - взять элемент с верхушки
- top - посмотреть верхний элемент

Все они работают за $O(1)$

<img src='img/stack.jpg'>

## Поддержка максимума

Теперь помимо самих элементов мы хотим знать максимальный элемент в стеке. К списку операций добавляется `max()` - получить макисмум стека

Для реализации можно либо хранить еще один стек, либо хранить в стеке пары `(значение, максимум до этого значения)`. рассмотрим первый вариант.

Будет хранить параллельно еще один стек, в котором будет хранится максимальный элемент на каждом шаге. Например, пусть у нас есть стек `a` и вспомогательный `b`, оба изначально пусты. Будем постепенно добавлять какие-то элементы в стек.
- `push(3)` - теперь `a=[3]`, а `b=[3]`
- `push(2)` - теперь `a=[3, 2]`, но `b=[3, 3]`, так как после добавления элемента `2` максимум стека не поменялся
- `push(4)` - теперь `a=[3, 2, 4]`, `b=[3, 3, 4]`, так как теперь у нас новый максимум

Теперь, при вызове `max()` мы получим значение `4`. Если же сделаем `pop()`, то стеки будут выглядеть так: `a=[3, 2]`, `b=[3, 3]`, то есть удаляется верхний элемент из самого стека и из вспомогательного. И после этого `max()` вернет `3`

$$b=\max(a.top(),\ b.top())$$

## Правильная скобочная последовательность

Дана последовательность, состоящая из круглых скобок. Нужно определить, является ли данная скобочная последовательность правильной.

Примеры скобочной последовательности:
- `(()(()))` - правильная
- `())(()` - неправильная


Можно ввести понятие *скобочного баланса*. То есть, заведем какой-то счетчик `cnt=0`, который будем менять по мере прохождения по строке с последовательностью:
- если мы наткнулись на открывающую скобку, то делаем `cnt += 1`
- если встретили закрывающую, то `cnt -= 1`

Например, дана последовательность `((()))()`. Тогда, по мере прохода по этой строке `cnt` будет меняться в таком порядке: `1, 2, 3, 2, 1, 0, 1, 0`

Другая последовательность - `())(()`. Для нее `cnt` будет меняться так: `1, 0, -1, 0, 1, 0`

Несмотря на то, что количество открывающих и закрывающих скобок одинаковое и после прохода по строке `cnt=0`, у нас в какой-то момент `cnt` был равен `-1`. Значит, такая последовательность неправильная

Усложним задачу. Дана последовательность, состоящая из **круглых, квадратных и фигурных** скобок. Нужно определить, является ли данная скобочная последовательность правильной.

Примеры скобочной последовательности:
- `()[()]{()()[]}` - правильная
- `[(]{})` - неправильная

Такие ПСП лучше проверять через стек, потому что каждая открывающая скобка должна быть закрыта последней незакрытой

Алгоритм работает так:
1. Если во время прохода по строке мы встречаем открывающую скобку, то кладем ее в стек
2. Если встречаем закрывающую, то есть два пути
    - стек пуст, а значит закрывать нечего, то есть скобочная последовательность неправильная
    - взять элемент с верхушки стека и проверить - совпадает ли тип скобки (фигурная, круглая, квадратная)
    - если тип совпал, то мы просто удалим элемент из стека и пойдем дальше по строке
    - если не совпал - ошибка
3. Если после обхода всей строки в стеке остались какие-то скобки, значит они не были закрыты, следовательно, скобочная последовательность неправильная

In [3]:
def psp(chars):
    stack = []
    for el in chars:
        if el in ["(", "{", "["]:
            stack.append(el)
        else:
            if not stack:
                return False
            char = stack.pop()
            if char == '(' and el != ")":
                return False
            if char == '{' and el != "}":
                return False
            if char == '[' and el != "]":
                return False
    if stack:
        return False
    return True

print(psp('()[()]{()()[]}'))
print(psp('[(]{})'))

True
False


Естественно, реализация через стек будет работать и для последовательностей, состоящих из скобок только какого-то одного типа


In [4]:
print(psp('(()(()))'))
print(psp('())(()'))

True
False


# Очередь

**Очередь** — тип данных, представляет собой список элементов, который работает по принципу *FIFO* (first-in-first-out)

FIFO означает, что элемент который был добавлен в очередь, будет извлечен из него в первую очередь (как очередь на кассе в макдаке)

Поддерживаемые операции:
- insert - добавление элемента в конец
- remove - удаление элемента с начала
- front - посмотреть первый элемент

Операции выполняются за $O(1)$

<img src='img/queue.jpg'>

Например, есть очередь `q`. Добавим в нее какие-то элементы
- `insert(5)`, теперь `q=[5]`
- `insert(7)`, теперь `q=[5, 7]`
- `insert(2)`, теперь `q=[5, 7, 2]`
- `insert(9)`, теперь `q=[5, 7, 2, 9]`
- `front()` вернет `5`
- `remove()`, теперь `q=[7, 2, 9]`
- `front()` вернет `7`


## Поддержка максимума

Задача аналогична поддержке максимума в стеке. Здесь используется *очередь на двух стеках*:
* `st_in` - стек, в который помещаются новые элементы
* `st_out` - стек, из которого элементы извлекаются

Каждый стек хранит пары вида `(значение, текущий максимум)`, то есть при добавлении элемента `x` новый максимум определяется как
`max(x, предыдущий максимум)`.

Операции очереди:
* `insert(x)` - поместить элемент `x` в `st_in`, обновив максимум при необходимости
* `remove()`:
  * если `st_out` пуст, необходимо переложить в него все элементы из `st_in`
  * при перекладывании порядок элементов меняется на обратный, и для `st_out` пересчитывается максимум
  * верхний элемент `st_out` соответствует первому элементу очереди
  * после этого выполняется удаление верхнего элемента из `st_out`
* `get_max()` - получить максимум среди всех элементов очереди, то есть `max(максимум в st_in, максимум в st_out)`

### Пример

Хотим реализовать очередь с поддержкой максимума. Создаем два пустых стека `st_in=[]` и `st_out=[]`

* `insert(3)` - добавляем в `st_in` пару `(3,3)`; `st_out` пока пуст
* `insert(1)` - добавляем в `st_in` пару `(1, max(1,3)) = (1,3)`; `st_out` пуст
* `insert(5)` - добавляем в `st_in` пару `(5, max(5,3)) = (5,5)`; `st_out` пуст
* `get_max()` - максимум в `st_in` это `5`, так как `st_out` пуст - игнорируем его. Операция вернёт `5`
* `remove()` - `st_out` пуст, значит переливаем в него `st_in`, обновляя максимумы
    - берем `5` $\rightarrow$ кладём `(5,5)`
    - `1` $\rightarrow$ кладём `(1, max(1,5))=(1,5)`
    - `3` $\rightarrow$ кладём `(3, max(3,5))=(3,5)`
    - после этого удаляем верхний элемент стека `st_out`, то есть `(3,5)`
* `insert(2)` - `st_in=[(2,2)]`, `st_out=[(5,5), (1,5)]`
* `get_max()` - берем `max(максимум в st_in, максимум в st_out)=max(2,5)=5`

# Дек

**Дек** — это двухсторонняя очередь

Дек поддерживает такие операции, как добавление/удаление с конца и добавление/удаление с начала. Они выполняются за $O(1)$, так же как операции для обычной очереди

# Radix sort

Дан массив чисел $a=[6, 4, 2, 5, 7, 1, 3, 0]$ и нужно его отсортировать. Перепишем числа в двоичную систему счисления: $$a=[110, 100, 010, 101, 111, 001, 011, 000]$$

1. Пройдемся по младшим разрядам и создадим две очереди: `q0` и `q1`. Те числа, у которых младший разряд равен `0` положим в `q0`, а у которых равен `1` — в `q1`. Получится:
\begin{equation*}
    \begin{aligned}
        q0&= [110, 100, 010, 000]\\
        q1&= [101, 111, 001, 011]
    \end{aligned}
\end{equation*}
Теперь нам нужно разобрать очереди: сначала `q0`, а потом `q1`. Получится такой порядок чисел
$$110, 100, 010, 000, 101, 111, 001, 011$$
2. На следующей итерации нам снова нужно раскидать эти числа на две очереди, но теперь мы будем смотреть на средний разряд. Получим
\begin{equation*}
    \begin{aligned}
        q0&= [100, 000, 101, 001]\\
        q1&= [110, 010, 111, 011]
    \end{aligned}
\end{equation*}
Теперь снова разбираем очереди и получаем:
$$100, 000, 101, 001, 110, 010, 111, 011$$ 
3. Сделаем еще одну итерацию для старшего бита:
\begin{equation*}
    \begin{aligned}
        q0&= [000, 001, 010, 011]\\
        q1&= [100, 101, 110, 111]
    \end{aligned}
\end{equation*}
Разбираем очереди и получаем порядок:
$$000, 001, 010, 011, 100, 101, 110, 111$$


Алгоритм, описанный выше, сортирует числа по 1 биту, то есть мы сомтрим на каждый бит. В таком случае, сортировка чисел до $2^{32}$ займет 32 прохода

Однако умные люди предложили идею сортировать не побитово, а побайтово, то есть создать 256 очередей и закидывать числа сравниая байты. Тогда, сортировка чисел до $2^{32}$ займет всего 4 прохода (если там нет отрицательных чисел)

Недостаток - дополнительная память

In [11]:
from collections import deque
def radix_sort(a):
    for k in range(32): # предполагаем, что числа 32-битные
        q0 = deque()
        q1 = deque()
        for x in a:
            if (x & (1 << k)) == 0: # да, битовые операции
                q0.append(x)
            else:
                q1.append(x)
        i = 0
        while q0:
            a[i] = q0.popleft()
            i += 1
        # i = 0
        while q1:
            a[i] = q1.popleft()
            i += 1
a = [7, 6, 54, 2, 1, 4, 0, 5, 9]
radix_sort(a)
print(a)

[0, 1, 2, 4, 5, 6, 7, 9, 54]


А теперь давайте напишем `radix_sort_fast`, в котором будет 256 очередей

In [17]:
def radix_sort_fast(a):
    for k in range(4):
        q = [deque() for _ in range(256)]
        for x in a:
            byte = (x >> (k * 8)) & 255
            q[byte].append(x)
        i = 0
        for j in range(256):
            while q[j]:
                a[i] = q[j].popleft()
                i += 1

И теперь проверим нормально ли работает наша сортировка

In [19]:
import random

arr = [random.randint(0, 2**32 - 1) for _ in range(10000)]
arr_copy = arr.copy()

radix_sort_fast(arr)
print(arr == sorted(arr_copy))

True
