# Введение в алгоритмы


## Вычислительная модель

Архитектуры настоящих компьютеров очень сложны и многообразны. Оптимизация алгоритма под конкретную архитектуру может давать прирост производительности в десятки процентов.

Помимо оценки производительности на реальном компьютере, мы хотим теоретически предсказывать некоторые свойства алгоритма, хотя бы в первом приближении. Для этого мы создадим теоретический инструмент, который не зависит от конкретной реализации в железе.

Известная всем Машина Тьюринга под нашу цель не подходит, потому что она совсем не похожа на реальный компьютер.

### RAM-модель

**Определение:**
RAM (Random access machine) - это набор лент $M = (\Sigma, \mathcal{I}, \mathcal{O}, \mathcal{P}, \mathcal{S}, \mathcal{R})$, где:

*Здесь и далее, если не сказано другого, лента (tape) - счетное множество ячеек, каждая из которых может содержать натуральное число.*

- Таблица инструкций $\Sigma$ - конечное множество пронумерованных инструкций. Можно считать, что это набор команд какого-то простенького ассемблера

- Входная лента $\mathcal{I} = \{I_0, I_1, I_2, \dots \}$ — входные данные программы, read-only во время исполнения

- Выходная лента $\mathcal{O} = \{O_0, O_1, O_2, \dots \}$ — результат работы программы, write-only во время исполнения

- Программная лента $\mathcal{P} = \{P_0, P_1, P_2, \dots \}$ - счетное множество ячеек, каждая из которых содержит в себе номер инструкции и ее параметры как натуральные числа. Read-only во время исполнения

- Лента стека $\mathcal{S} = \{S_0, S_1, S_2, \dots \}$ - нужна для вызова функций и хранения локальных переменных

- Лента регистров $\mathcal{R} = \{R_0, R_1, R_2, \dots \}$ — "память" RAM-модели. Первые несколько регистров зарезервированны под системные цели:

    - $R_0 = \mathrm{IC}$ (счетчик входной ленты) - номер следующей к считыванию ячейки со входной ленты
    - $R_1 = \mathrm{OC}$ (счетчик выходной ленты) - номер следующей к записи на выходную ленту ячейки
    - $R_2 = \mathrm{PC}$ (программный счетчик) - номер следующей инструкции, которая будет выполнена
    - $R_3 = \mathrm{SC}$ (счетчик стека) - указатель на конец стека

**Определение:**
Программа/алгоритм - последовательность инструкций, записанная на программной ленте $\mathcal{P}$

**Инициализация**

Перед началом исполнения входные данные должны находиться на входной ленте $\mathcal{I}$, а программа должна быть записана на ленте $\mathcal{P}$. Все остальные ленты пусты. Все счетчики инициализированны нулем

**Шаг исполнения**

С ленты программы достается инструкция с номером $\mathcal{PC}$, а затем исполняется. Программный счетчик $\mathcal{PC}$ увеличивается на $1$. Затем все повторяется заново, пока не будет встречена команда HALT

**Завершение**

После исполнения команды HALT результат выполнения программы лежит на выходной ленте $\mathcal{O}$

RAM-модель является абстракцией, которая упрощает анализ алгоритмов. Несмотря на свою простоту, она достаточно хорошо отражает реальное поведение алгоритмов на современных компьютерах. Достаточно сложно найти алгоритм, существенно нарушающий допущения модели RAM.

#### Четкий список инструкций (опционально)

| Название                       | Операнды                                          | Семантика                                                 |
| :----------------------------- | :------------------------------------------------ | :-------------------------------------------------------- |
| **Работа с памятью**           |                                                   |                                                           |
| LOAD $i, v$                    | $R_i$ - регистр, $v \in \mathbb{N}$               | Присвоение $R_i := v$                                     |
| **I/O**                        |                                                   |                                                           |
| READ $i$                       | $R_i$ - регистр                                   | $R_i := I_{\mathrm{IC}}$, $\mathrm{IC} := \mathrm{IC} + 1$|
| WRITE $i$                      | $R_i$ - регистр                                   | $O_{\mathrm{OC}} := R_i$, $\mathrm{OC} := \mathrm{OC} + 1$|
| **Арифметика**                 |                                                   |                                                           |
| ADD $i, v, m$                  | $R_i$ - регистр, $v, m \in \mathbb{N}$            | $R_i := v + m$                                            |
| SUB $i, v, m$                  | $R_i$ - регистр, $v, m \in \mathbb{N}$            | $R_i := v - m$                                            |
| MULT $i, v, m$                 | $R_i$ - регистр, $v, m \in \mathbb{N}$            | $R_i := v \cdot m$                                        |
| DIV $i, v, m$                  | $R_i$ - регистр, $v, m \in \mathbb{N}$            | $R_i := [\frac{v}{m}]$                                    |
| MOD $i, v, m$                  | $R_i$ - регистр, $v, m \in \mathbb{N}$            | $R_i := v$ $\text{mod}$ $m$                               |
| **Логика**                     |                                                   |                                                           |
| NOT $i, v$                     | $R_i$ - регистр, $v \in \{0, 1 \}$                | $R_i := \neg v$                                           |
| AND $i, v, m$                  | $R_i$ - регистр, $v, m \in \{0, 1 \}$             | $R_i := v \land m$                                        |
| OR $i, v, m$                   | $R_i$ - регистр, $v, m \in \{0, 1 \}$             | $R_i := v \vee m$                                         |
| **Сравнения**                  |                                                   |                                                           |
| CMP $i, v, m$                  | $R_i$ - регистр, $v, m \in \mathbb{N}$            | $R_i := v < m$ $?$ $1$ $:$ $0$                            |
| NCMP $i, v, m$                 | $R_i$ - регистр, $v, m \in \mathbb{N}$            | $R_i := v > m$ $?$ $1$ $:$ $0$                            |
| EQ $i, v, m$                   | $R_i$ - регистр, $v, m \in \mathbb{N}$            | $R_i := v = m$ $?$ $1$ $:$ $0$                            |
| **Управляющие инструкции**     |                                                   |                                                           |
| JZ $i, j$                      | $R_i$ - регистр, $P_j$ - ячейка программной ленты | Если $R_i = 0$, то $\mathrm{PC} := j$                    |
| HALT                           |                                                   | Прервать выполнение                                       |
| **Стек**                       |                                                   |                                                           |
| PUSH $i$                       | $R_i$ - регистр                                   | $\mathrm{SP} := \mathrm{SP} + 1$, $\mathcal{S}_{\mathrm{SP}} := r_i$ |
| POP $i$                        | $R_i$ - регистр                                   | $r_i = \mathcal{S}_{\mathrm{SP}}$, $\mathrm{SP} :=\mathrm{SP} - 1$|

### Временная сложность в RAM-модели

**Определение:** Временная сложность алгоритма на входных даных $T(\text{input})$ - это количество инструкций, которые выполнила программа до своей остановки, как функция от входных данных

**Определение:** Пространственная сложность алгоритма на входных даных $S(\text{input})$ — это сумма длинны входа и выхода, номера самого большого адресованного регистра и самого большого размера счетчика стека $\mathrm{SC}$ за все время выполнения программы

Если существует разумная функция размера входного объекта $n : \text{input} \longmapsto \mathbb{N}$, то можно определить:

**Определение:** Временная сложность алгоритма $T(n)$ = $max_{|\text{input}| = n} T(\text{input})$

**Определение:** Пространственная сложность алгоритма $S(n)$ = $max_{|\text{input}| = n} S(\text{input})$

Если мы обладаем информацией о том, что $\text{input}$ семплируется из какого-то распределения $D$, мы можем рассмотреть $T_D(n) = \mathbb{E}(T(\text{input}))$. Аналогично с пространственной сложностью

Посчитать $T(n)$ и $S(n)$ напрямую достаточно проблематично, и на самом деле не имеет особого смысла, из-за погрешности переноса оценки с модели на реальное вычислительное устройство. Поэтому нас в первую очередь будут интересовать асимптотические классы этих величин - $O$, $o$, $\Omega$, $\Theta$

**Основные классы сложности**

1. **Константная сложность** — $O(1)$. _Пример:_ Доступ к элементу массива по индексу.

2. **Логарифмическая сложность** — $O(\log n)$. _Пример:_ Бинарный поиск в отсортированном массиве.

3. **Линейная сложность** — $O(n)$. _Пример:_ Линейный поиск в массиве.

4. **Линейно-логарифмическая сложность** — $O(n \log n)$ _Пример:_ Эффективные алгоритмы сортировки (быстрая сортировка, сортировка слиянием).

5. **Квадратичная сложность** — $O(n^2)$. _Пример:_ Простые алгоритмы сортировки (сортировка пузырьком, сортировка вставками).

6. **Кубическая сложность** — $O(n^3)$. _Пример:_ Наивное умножение матриц.

7. **Экспоненциальная сложность** — $O(2^n)$. _Пример:_ Рекурсивное вычисление чисел Фибоначчи, перебор всех подмножеств множества.

8. **Факториальная сложность** — $O(n!)$. _Пример:_ Перебор всех перестановок множества.


<img src="../../static/complexity.jpg" width="400" />


**Определение:** Полиномиальный класс алгоритмов $\mathrm{P}$ - это множество алгоритмов, чье время выполнения $T(n) = O(\mathrm{Poly}(n))$, где $\mathrm{Poly}(n)$ - полином произвольной степени от $n$

#### Определения нотаций (опционально)

**Определения:**

$
f(n)=O\bigl(g(n)\bigr)
\quad\Longleftrightarrow\quad
\exists\,C>0,\,N\in\mathbb{N}\ \text{такие что}\ 
\forall\,n\ge N,\ 
\bigl\lvert f(n)\bigr\rvert \;\le\; C\,\bigl\lvert g(n)\bigr\rvert.
$

$
f(n)=o\bigl(g(n)\bigr)
\quad\Longleftrightarrow\quad
\lim_{n\to\infty}\tfrac{f(n)}{g(n)}=0
$

$
f(n)=\Omega_{\text{K}}\bigl(g(n)\bigr)
\quad\Longleftrightarrow\quad
\exists\,c>0,\,N\in\mathbb{N}\ \text{такие что}\ 
\forall\,n\ge N,\ 
\bigl\lvert f(n)\bigr\rvert \;\ge\; c\,\bigl\lvert g(n)\bigr\rvert.
$

$
f(n)=\Omega_{\text{HL}}\bigl(g(n)\bigr)
\quad\Longleftrightarrow\quad
\limsup_{\,n\to\infty}\,\left\lvert \frac{f(n)}{g(n)} \right\rvert \;>\; 0.
$

$
f(n)=\Theta\bigl(g(n)\bigr)
\quad\Longleftrightarrow\quad
\bigl(f(n)=O(g(n))\bigr)\;\wedge\;\bigl(f(n)=\Omega(g(n))\bigr).
$

<br/>

Остальные свойства нотаций осталю [тут](https://chatgpt.com/share/683c79b7-6294-800d-aa04-4f103b925f7a))) 

<br/>

**Пример неэквивалентности $\Omega_{\text{K}}$ и $\Omega_{\text{HL}}$:**

Рассмотрим алгоритм с временем работы $T(n) = 1 + \mathrm{popcount}(n)$, где $\mathrm{popcount}(n)$ - количество $1$ в двоичной записи числа $n$ (такие алгоритмы действительно существуют, например дерево Фенвика)

Нетрудно проверить, что $T(n) = \Omega_{\text{K}}(1)$ и при этом $T(n) = \Omega_{\text{HL}}(\log(n))$

### Некоторые вариации RAM-модели

RAM модель, которую мы рассмотрели выше, подходит далеко не под все задачи.

Основные проблемы:
- Нет ограничений на размер чисел в ячейках, что нереалистично
- Нет представления действительных чисел
- Нет рандома, что важно для рандомизированных алгоритмов
- etc

Запихивать все нужные фичи в одну модель нецелесообразно, иначе мы получим что-то очень близкое к какой-то реально существующей архитектуре, потеряем общность и устанем бороться с теоретическими выкладками. Поэтому под каждую задачу нужно подбирать подходящую модель, возможно даже как-то модифицировать существующую в особых случаях. В общем создание подходящей вычислительной модели - чисто инженерная задача

#### Standard RAM

Это модель, к которой мы будем прибегать чаще всего. В ней появляются несколько новых условий

**Ограничение на используемую память**

$S^*(\text{input}) = O(T(\text{input}))$, где $S^*$ - дополнительно аллоцированная память во время выполнения программы (то есть обычная $S$ за вычетом размера входной ленты).

**Ограничение на максимальный размер числа**

Пусть $C$ - максимальный размер числа на входной ленте $\mathcal{I}$, тогда

$\exists D, k$ - константы не зависящие от размера входных данных, такие что

$R_i \le D \cdot (T(n)^k \cdot C^k + 1)$

Очевидно, такое ограничение не применимо к алгоритмам, в которых время выполнения само зависит от максимального доступного размера числа. В таком случае можно попробовать

$R_i \le D \cdot (n^k \cdot C^k + 1)$

Если такого размера числа не хватает, то уже нужно думать. Может быть подбирать другую модель.

#### Real RAM

В этой модели, в отличии от Standard RAM, в ячейках могут так же храниться действительные числа. Вопрос максимальной точности слишком сложный, так что правило простое - не делаем фигни).

На самом деле, можно попробовать сделать что-то в духе ограничения на максимальный размер числа в Standard RAM. Только нужно учитывать еще и точность после знака запятой. Но это правда сложный теоретический вопрос

#### Random RAM

В этой модели добавляется еще одна лента - лента рандома $\text{D}$. Эта лента read-only, двигаться по ней можно только вперед и она изначально инициализированна числами из какого-то заранее заданного распределения.

В этой модели время выполнения и память могут зависить от значения в $\text{D}$, поэтому вводится ожидаемое время работы:

$T(\text{input}) = \mathbb{E}(T(\text{input}, \text{D}))$

и ожидаемая сложность по памяти:

$S(\text{input}) = \mathbb{E}(S(\text{input}, \text{D}))$

#### Word RAM

В этой модели в ячейках лент хранятся не натуральные числа, а двоичные слова ограниченной длины $w$. Эта модель более реалистично отражает ограничения реальных компьютеров. Так же в ней добавляются побитовые операции над ячейками (AND, OR, XOR, etc.)

Мы будем использовать ее, когда в наших алгоритмах критически будут нужны побитовые операции

#### Logarithmic Cost RAM

В этой модели стоимость операции зависит от размера операндов. Если операнды имеют размер $w$ бит, то стоимость операции пропорциональна $\log w$. Эта модель более реалистична для алгоритмов, работающих с большими числами.

#### External Memory Model RAM

Модель внешней памяти учитывает иерархию памяти в современных компьютерах. В этой модели данные перемещаются между быстрой памятью ограниченного размера (кэш) и медленной памятью большого размера (диск) блоками фиксированного размера.

В модели внешней памяти, стоимость алгоритма измеряется количеством передач блоков данных между различными уровнями памяти.

*Иерархия памяти в реальном компьютере (с временем доступа):*

<img src='../../static/memory_hierarchy.png' width='200' />

#### Parallel RAM

PRAM — расширение RAM-модели для параллельных вычислений. В этой модели несколько процессоров имеют доступ к общей памяти.

## Алгоритмы

### Некоторые виды задач

#### Задача принятия решения

**Определение:** Задача принятия решения (Decision problem) — это задача, ответом на которую является "нет" или "да". Формально это функция вида $f: \text{input} \longmapsto \{0, 1\}$

_Пример:_ Проверка наличия пути между двумя вершинами, проверка графа на связность, проверка числа на простоту, проверка принадлежности элемента множеству

**Определение:** Сертификат решения — это набор данных, позволяющий проверить корректность решения задачи за время $T'(n) = O(T(n))$, где $T(n)$ - время выполнения самой задачи

_Пример:_ При проверке наличия пути между думя вершинами в графе, сертификатом наличия будет являться сам путь, а сертификатом отсутствия - две компоненты связности. При проверке составности числа, сертификатом будет являться его нетривиальный делитель.

Редко когда у задачи принятия решения есть одновременно и сертификат нуля и сертификат единицы

**Определение:** Класс алгоритмов $\mathrm{NP}$ - это множество алгоритмов, у которых есть сертификат решения, алгоритм проверки которого лежит в классе $\mathrm{P}$

#### Задача поиска

**Определение:** Задача поиска (Search problem) - задача принятия решения, которая на выход выдает сертификат единицы или нуля (не обязательно одновременно)

_Пример:_ Поиск пути в графе, поиск позиции вхождения элемента в массив

#### Задача оптимизации

**Определение:** Задача оптимизации — это задача нахождения такого решения из множества допустимых решений, которое максимизирует или минимизирует заданную целевую функцию. Формально, задача оптимизации может быть представлена как:
- Множество допустимых решений $X$
- Целевая функция $f: X \rightarrow \mathbb{R}$
- Задача: найти $x^* \in X$ такое, что $f(x^*) = \min_{x \in X} f(x)$ (для задачи минимизации)

_Пример:_ Задача о кратчайшем пути в графе, задача о максимальном потоке, задача о рюкзаке.

У задач оптимизации очень редко когда бывают сертификаты (единственное что приходит в голову - у $\mathrm{NP}$-задачи о минимальном разрезе сертификатом является максимальный поток, который является $\mathrm{P}$-задачей, так что максимальный поток - это сертификат для минимального разреза)

#### Задача подсчёта

**Определение:** Задача подсчёта (Counting problem) — это задача на вход которой подается условие и результат другой задачи, и требуется подсчитать, сколькими способами можно было получить этот результат

_Пример:_ Подсчёт количества путей между двумя вершинами в ориентированном ациклическом графе

#### Задача перечисления

**Определение:** Задача перечисления (Enumeration problem) - задача подсчета, которая на выход выдает сертификат результата

_Пример:_ Список всех путей между двумя вершинами в ориентированном ациклическом графе. Генерация всех перестановок $n$ чисел

### Некоторые виды алгоритмов

#### По характеру решения

**Точные алгоритмы (Exact Algorithms)**

Алгоритмы, для которых доказано, что они выдают наилучшее (оптимальное) решение.

_Пример:_ Алгоритм Дейкстры для нахождения кратчайшего пути в графе с неотрицательными весами рёбер

**Приближенные алгоритмы (Approximate Algorithms)**

Алгоритмы, для которых известна величина $|C - C'| < \varepsilon$, где $C$ — оптимальное решение, $C'$ — приближенное решение, $\varepsilon$ — погрешность.

_Пример:_ Жадный алгоритм для задачи о рюкзаке, который не всегда даёт оптимальное решение, но обеспечивает решение с гарантированной точностью.

**Эвристические алгоритмы** 

Алгоритмы, которые работают на практике, но для которых не существует строгого математического доказательства их оптимальности.

_Пример:_ Генетические алгоритмы, алгоритмы локального поиска для NP-трудных задач.

**Алгоритмы типа Монте-Карло**

Алгоритмы, обычно использующие генератор случайных чисел и дающие правильный ответ с вероятностью $p > 0$.

_Пример:_ Алгоритм Рабина-Карпа для поиска подстроки

#### По определенности

**Детерминированные алгоритмы**

Алгоритмы, в которых каждый шаг однозначно определен, и при одних и тех же входных данных всегда получается один и тот же результат.

_Пример:_ Алгоритм бинарного поиска, алгоритм Евклида для нахождения НОД.

**Рандомизированные алгоритмы** 

Алгоритмы, использующие генератор случайных чисел для принятия решений в процессе выполнения.

_Пример:_ Быстрая сортировка с случайным выбором опорного элемента, рандомизированный алгоритм поиска медианы.

#### По типу исполнения

**Последовательные алгоритмы (Sequential algorithms)**

Алгоритмы, в которых операции всегда выполняются одна за другой.

_Пример:_ Классический алгоритм сортировки вставками.

**Параллельные алгоритмы** 

Алгоритмы, в которых несколько операций могут выполняться одновременно.

_Пример:_ Параллельная сортировка слиянием, параллельное умножение матриц.

#### Offline/Online

**Offline алгоритмы**

Алгоритмы, которые имеют доступ ко всем входным данным перед началом работы.

_Пример:_ Сортировка массива

**Online алгоритмы**

Алгоритмы, который получают входные данные последовательно и должны принимать решения на основе уже полученных данных, без знания будущих входных данных

_Пример:_ Задача RMQ/RSQ

### Доказательство свойств алгоритма

**Методы доказательства корректности алгоритма**

- Доказательство от противного. При доказательстве от противного мы предполагаем, что алгоритм не корректен, и приходим к противоречию.

- Доказательство по индукции. При доказательстве по индукции мы доказываем базовый случай, а затем показываем, что если утверждение верно для $n$, то оно верно и для $n+1$.

- Доказательство по инварианту. При доказательстве по инварианту мы формулируем утверждение (инвариант), которое должно быть истинным до и после каждой итерации цикла.

**Методы вывода асимптотики алгоритма**

- Метод прямого учета

- Доказательство по индукции

- Амортизационный анализ

Все эти методы будут рассмотрены по существу в следующих главах. Методы доказательства корректности даже в следующем за этим ноутбуке