# Введение в алгоритмы


## Вычислительная модель

Архитектуры реальных компьютеров очень сложны и многообразны. Оптимизация алгоритма под конкретную архитектуру может давать десятки процентов производительности.

Помимо оценки производительности на реальном железе, мы хотим теоретически предсказывать некоторые свойства алгоритма, хотя бы в первом приближении. Для этого мы создадим теоретический инструмент, который не зависит от конкретной реализации.

Известная всем Машина Тьюринга под нашу цель не подходит, потому что она от слова совсем не похожа на реальный компьютер.

### RAM-модель

**Определение:**
RAM (Random access machine) - это набор $M = (\mathcal{R}, \mathcal{I}, \mathcal{O}, \Sigma, \mathcal{P}, \mathrm{PC})$, где:

1. Лента регистров (Register tape)
   $\mathcal{R} = \{r_0, r_1, r_2, \dots \}$ — счетное множество ячеек, каждая из которых может содержать натуральное число

2. Входная лента (Input tape) $\mathcal{I} = \{i_0, i_1, i_2, \dots \}$ — счетное множество ячеек, каждая из которых может содержать натуральное число. Read-only во время исполнения

3. Выходная лента (Output tape) $\mathcal{O} = \{o_0, o_1, o_2, \dots \}$ — счетное множество ячеек, каждая из которых может содержать натуральное число. Write-only во время исполнения

4. Таблица инструкций (Instruction set) $\Sigma$ - конечное множество инструкций. Обычно задают такие:
    - **Арифметические операции**: сложение, вычитание, умножение, деление, остаток от деления
    - **Логические операции**: AND, OR, NOT, XOR
    - **Операции доступа к памяти**: чтение и запись значений
    - **Операции сравнения**: равенство, неравенство, больше, меньше
    - **Управляющие инструкции**: JUMP (измненение значения программного счетчика $\mathcal{PC}$, с помощью JUMP например можно делать циклы), CALL (вызов подпрограммы), HALT (остановка выполнения)
<br/><br/>
5. Программная лента (Program tape) $\mathcal{P} = \{p_0, p_1, p_2, \dots \}$ - счетное множество ячеек, каждая из которых содержит в себе номер инструкции и ее параметры как натуральные числа. Read-only во время исполнения

6. Программный счетчик (Program counter) $\mathcal{PC}$ - специальный отдельный регистр, который хранит номер текущей исполняемой ячейки на программной ленте $\mathcal{P}$

**Определение:**
Программа (Program) - последовательность команд, записанная на программной ленте $\mathcal{P}$

**Инициализация**

Перед началом исполнения входные данные должны находиться на входной ленте $\mathcal{I}$, а программа должна быть записана на ленте $\mathcal{P}$. Программный счетчик инициализирован нулем

**Шаг исполнения**

С ленты программы достается инструкция с номером $\mathcal{PC}$, а затем исполняется. Программный счетчик $\mathcal{PC}$ увеличивается на $1$. Затем все повторяется заново, пока не будет встречена команда HALT

**Завершение**

После исполнения команды HALT результат выполнения программы лежит на выходной ленте $\mathcal{O}$

RAM-модель является абстракцией, которая упрощает анализ алгоритмов. Несмотря на свою простоту, она достаточно хорошо отражает реальное поведение алгоритмов на современных компьютерах. Достаточно сложно найти алгоритм, существенно нарушающий допущения модели RAM.

### Временная сложность в RAM-модели

**Определение:** Временная сложность алгоритма на входных даных $T(\text{input})$ - это количество элементарных операций в алгоритме как функция от входных данных

**Определение:** Временная сложность алгоритма $T(n)$ = $max_{|\text{input}| = n} T(\text{input})$

**Определение:** Пространственная сложность алгоритма на входных даных $S(\text{input})$ — это номер самой большой адресованной ячейки в ленте регистров, плюс количество занятых ячеек на входной ленте, плюс количество занятых ячеек на выходной ленте

**Определение:** Пространственная сложность алгоритма $S(n)$ = $max_{|\text{input}| = n} S(\text{input})$

### Варианты RAM-модели

RAM модель, которую мы рассмотрели выше, подходит далеко не под все задачи.

Основные проблемы:
- Нет ограничений на размер чисел в ячейках, что нереалистично
- Нет действительных чисел
- Нет рандома, что важно для рандомизированных алгоритмов
- etc

Запихивать все нужные фичи в одну модель нецелесообразно, иначе мы получим что-то очень близкое к какой-то реально существующей архитектуре, потеряем общность и заебемся с теоретическими выкладками. Поэтому под каждую задачу нужно подбирать подходящую модель, возможно даже как-то модифицировать существующие в особых случаях. В общем создание подходящей вычислительной модели - чисто инженерная задача.

**Standard RAM**

Это модель, к которой мы будем прибегать чаще всего. В ней добавляются несколько допущений

Ограничение на используемую память $S_{\mathcal{R}}(\text{input}) = O(T(\text{input}))$, где $S_{\mathcal{R}}$ - максимальный номер адресованной ячейки

Ограничения на максимальный размер числа в ячейке $r_i \le D \cdot T(n)^k \cdot C^k$

**Real RAM**

В этой модели, в отличии от Standard RAM, в ячейках могут так же храниться действительные числа. Вопрос максимальной точности слишком сложный, так что правило простое - не делаем фигни) 

**Random RAM**

В этой модели добавляется еще одна лента - лента рандома $\text(Rand)$, на которой расположены случайные действительные числа в диапазоне $[0, 1]$. Эта лента read-only и двигаться по ней можно только вперед.

В этой модели время выполнения и память могут зависить от значения в $\text{Rand}$, поэтому вводится

$T(\text{input}) = \mathbb{E}(T(\text{input}, \text{Rand}))$

**Модель с ограничением по размеру слова (Word RAM Model)**

В этой модели размер слова памяти ограничен $w$ битами. Эта модель более реалистично отражает ограничения реальных компьютеров. 

В ней мы считаем, что на лентах хранятся не произволные натуральные числа, а битовые слова (т.е. двоичные натуральные числа $< 2^w$). Мы будем использовать ее, когда в наших алгоритмах будут нужны побитовые операции

**Логарифмическая стоимость (Logarithmic Cost Model)**

В этой модели стоимость операции зависит от размера операндов. Если операнды имеют размер $w$ бит, то стоимость операции пропорциональна $\log w$. Эта модель более реалистична для алгоритмов, работающих с большими числами.

**Внешняя память (External Memory Model)**

Модель внешней памяти учитывает иерархию памяти в современных компьютерах. В этой модели данные перемещаются между быстрой памятью ограниченного размера (кэш) и медленной памятью большого размера (диск) блоками фиксированного размера.

В модели внешней памяти, стоимость алгоритма измеряется количеством передач блоков данных между различными уровнями памяти.

*Иерархия памяти в реальном компьютере (с временем доступа):*

<img src='../../static/memory_hierarchy.png' width='200' />


**PRAM (Parallel Random Access Machine)**

PRAM — расширение RAM-модели для параллельных вычислений. В этой модели несколько процессоров имеют доступ к общей памяти. В зависимости от правил доступа к памяти, различают несколько вариантов PRAM:

- **EREW PRAM (Exclusive Read Exclusive Write)**: Каждая ячейка памяти может быть прочитана или записана только одним процессором за один шаг.
- **CREW PRAM (Concurrent Read Exclusive Write)**: Несколько процессоров могут читать из одной ячейки памяти одновременно, но только один процессор может записывать в ячейку за один шаг.
- **CRCW PRAM (Concurrent Read Concurrent Write)**: Несколько процессоров могут читать и записывать в одну ячейку памяти одновременно. Варианты разрешения конфлитов записи:
    - **Common**: Все процессоры должны записывать одно и то же значение.
    - **Arbitrary**: Один из процессоров произвольно выбирается для выполнения записи.
    - **Priority**: Процессор с наименьшим индексом выполняет запись.
    - **Sum**: В ячейку записывается сумма всех значений, которые процессоры пытаются записать.

### Применение RAM-модели для анализа алгоритмов

Основные шаги анализа:

1. **Определение размера входных данных**: Например, для алгоритмов сортировки это количество элементов в массиве.
2. **Подсчет элементарных операций**: Определение количества арифметических операций, операций сравнения, доступа к памяти и т.д.
3. **Асимптотический анализ**: Определение асимптотической сложности алгоритма с использованием O-нотации, Ω-нотации и Θ-нотации.


**Основные классы сложности**

1. **Константная сложность** — $O(1)$: Время выполнения не зависит от размера входных данных.
   _Пример:_ Доступ к элементу массива по индексу.

2. **Логарифмическая сложность** — $O(\log n)$: Время выполнения пропорционально логарифму размера входных данных.
   _Пример:_ Бинарный поиск в отсортированном массиве.

3. **Линейная сложность** — $O(n)$: Время выполнения пропорционально размеру входных данных.
   _Пример:_ Линейный поиск в массиве.

4. **Линейно-логарифмическая сложность** — $O(n \log n)$: Время выполнения пропорционально произведению размера входных данных на логарифм этого размера.
   _Пример:_ Эффективные алгоритмы сортировки (быстрая сортировка, сортировка слиянием).

5. **Квадратичная сложность** — $O(n^2)$: Время выполнения пропорционально квадрату размера входных данных.
   _Пример:_ Простые алгоритмы сортировки (сортировка пузырьком, сортировка вставками).

6. **Кубическая сложность** — $O(n^3)$: Время выполнения пропорционально кубу размера входных данных.
   _Пример:_ Наивное умножение матриц.

7. **Экспоненциальная сложность** — $O(2^n)$: Время выполнения пропорционально экспоненте от размера входных данных.
   _Пример:_ Рекурсивное вычисление чисел Фибоначчи, перебор всех подмножеств множества.

8. **Факториальная сложность** — $O(n!)$: Время выполнения пропорционально факториалу размера входных данных.
   _Пример:_ Перебор всех перестановок множества.


In [2]:
# Пример алгоритма, анализируемого в RAM-модели: подсчет количества операций
def count_operations(n):
    operations = 0

    # Инициализация переменных (2 операции)
    sum_value = 0  # 1 операция
    operations += 1

    # Цикл от 1 до n
    for i in range(1, n + 1):  # n итераций
        # Проверка условия цикла (1 операция на итерацию)
        operations += 1

        # Увеличение суммы (2 операции на итерацию: чтение и запись)
        sum_value += i
        operations += 2

        # Проверка условия (1 операция на итерацию)
        if i % 2 == 0:
            operations += 1

            # Внутренний цикл (выполняется n/2 раз)
            for j in range(1, 10):
                # Проверка условия внутреннего цикла (1 операция)
                operations += 1

                # Операция внутри цикла (1 операция)
                sum_value += 1
                operations += 1

    return operations

n_values = [10, 100, 1000]
for n in n_values:
    ops = count_operations(n)
    print(f"Для n = {n}, количество операций: {ops}")

Для n = 10, количество операций: 126
Для n = 100, количество операций: 1251
Для n = 1000, количество операций: 12501


## Алгоритмы

**Определение:** Алгоритм - это программа обладающая дополнительными свойствами:
- Результативность - алгоритм решает некоторую заранее поставленную задачу
- Массовость - алгоритм решает задачу для целого класса входных данных
- Завершаемость - алгоритм завершается за конечное число шагов на любых входных данных из класса

### Виды алгоритмов

1. **Точные алгоритмы** — алгоритмы, для которых доказано, что они выдают наилучшее (оптимальное) решение.

   _Пример:_ Алгоритм Дейкстры для нахождения кратчайшего пути в графе с неотрицательными весами рёбер.

2. **Приближенные алгоритмы** — алгоритмы, для которых известна величина $|C - C'| < \varepsilon$, где $C$ — оптимальное решение, $C'$ — приближенное решение, $\varepsilon$ — погрешность.

   _Пример:_ Жадный алгоритм для задачи о рюкзаке, который не всегда даёт оптимальное решение, но обеспечивает решение с гарантированной точностью.

3. **Эвристические алгоритмы** — алгоритмы, которые работают на практике, но для которых не существует строгого математического доказательства их эффективности или оптимальности.

   _Пример:_ Генетические алгоритмы, алгоритмы локального поиска для NP-трудных задач.

4. **Вероятностные алгоритмы** — алгоритмы, использующие генератор случайных чисел и дающие правильный ответ с вероятностью $p > 0$.

   _Пример:_ Алгоритм Рабина-Карпа для поиска подстроки

5. **Последовательные алгоритмы** — алгоритмы, в которых операции выполняются одна за другой.

   _Пример:_ Классический алгоритм сортировки вставками.

6. **Параллельные алгоритмы** — алгоритмы, в которых несколько операций могут выполняться одновременно.

   _Пример:_ Параллельная сортировка слиянием, параллельное умножение матриц.

7. **Детерминированные алгоритмы** — алгоритмы, в которых каждый шаг и результат однозначно определены, и при одних и тех же входных данных всегда получается один и тот же результат.

   _Пример:_ Алгоритм бинарного поиска, алгоритм Евклида для нахождения НОД.

8. **Рандомизированные алгоритмы** — алгоритмы, использующие генератор случайных чисел для принятия решений в процессе выполнения.

   _Пример:_ Быстрая сортировка с случайным выбором опорного элемента, рандомизированный алгоритм поиска медианы.


### Типы задач в алгоритмике

#### Задача принятия решения

**Определение:** Задача принятия решения (Decision problem) — это задача, ответом на которую является "да" или "нет".

_Пример:_ Проверка графа на связность, проверка числа на простоту, проверка принадлежности элемента множеству.


#### Задача поиска

**Определение:** Задача поиска (Search problem) - это задача, 

### Сертификат решения

**Определение:** Сертификат решения (Solution certificate) — это набор данных, позволяющий эффективно проверить корректность решения задачи.

_Пример:_ При проверке наличия пути между вершинами $u$ и $v$ в графе, сертификатом будет являться сам путь. При проверке составности числа, сертификатом будет являться его нетривиальный делитель.

**Теорема:** Для любой задачи из класса NP существует полиномиальный алгоритм проверки сертификата решения.
$\square$
По определению, задача принадлежит классу NP, если существует недетерминированная машина Тьюринга, решающая эту задачу за полиномиальное время. Это эквивалентно тому, что существует полиномиальный алгоритм проверки сертификата решения.

Формально, задача $L$ принадлежит NP, если существует полиномиальный алгоритм $V$ и полином $p$ такие, что для любого входа $x$:
- Если $x \in L$, то существует строка $y$ длины не более $p(|x|)$ такая, что $V(x, y) = 1$.
- Если $x \not\in L$, то для любой строки $y$ длины не более $p(|x|)$ выполняется $V(x, y) = 0$.

Здесь $y$ и есть сертификат решения, а $V$ — алгоритм проверки сертификата.
$\blacksquare$

### Задача оптимизации

**Определение:** Задача оптимизации (Optimization problem) — это задача нахождения такого решения из множества допустимых решений, которое максимизирует или минимизирует заданную целевую функцию.

Формально, задача оптимизации может быть представлена как:
- Множество допустимых решений $X$
- Целевая функция $f: X \rightarrow \mathbb{R}$
- Задача: найти $x^* \in X$ такое, что $f(x^*) = \min_{x \in X} f(x)$ (для задачи минимизации) или $f(x^*) = \max_{x \in X} f(x)$ (для задачи максимизации)

_Пример:_ Задача о кратчайшем пути, задача о максимальном потоке, задача о рюкзаке.


### Offline и Online алгоритмы

**Определение:** Offline алгоритм — алгоритм, который имеет доступ ко всем входным данным перед началом работы.

**Определение:** Online алгоритм — алгоритм, который получает входные данные последовательно и должен принимать решения на основе уже полученных данных, без знания будущих входных данных.

**Теорема:** Для многих задач оптимизации online алгоритмы не могут достичь оптимального решения, которое может быть найдено offline алгоритмом.
$\square$
Рассмотрим задачу планирования страниц памяти (page replacement problem). В этой задаче необходимо решить, какую страницу удалить из кэша при его заполнении.

Оптимальный offline алгоритм (алгоритм Белади) удаляет страницу, которая не будет использоваться дольше всего в будущем. Этот алгоритм требует знания всей последовательности обращений к страницам заранее.

Любой online алгоритм, не имеющий информации о будущих обращениях, может быть вынужден удалить страницу, которая потребуется в ближайшем будущем, что приведет к дополнительному промаху кэша.

Можно доказать, что для любого online алгоритма существует последовательность обращений, на которой он будет работать хуже, чем оптимальный offline алгоритм. Конкретно, для задачи планирования страниц памяти с кэшем размера $k$, конкурентное отношение (competitive ratio) любого детерминированного online алгоритма не может быть лучше $k$.
$\blacksquare$


Ниже приведена классификация «типов задач» в алгоритмике с точки зрения формулировки самой задачи (то есть что именно требуется получить на выходе), а не конкретных методов решения. Важно понимать, что зачастую для одной и той же «задачи» можно поставить несколько разных целей (например, сначала решить «решение/номинальный» вариант, затем «оптимизационный» вариант, затем «подсчет количества вариантов» и т.д.), но именно формулировка задачи (decision, optimization, counting, enumeration и т. д.) определяет характер требуемого результата и сложность решения.

⸻

1. Задачи принятия решения (Decision Problems)

Определение.
На вход подаётся некоторый экземпляр (например, граф, строка, множество чисел и т. д.). Необходимо ответить «да» или «нет» на вопрос, удовлетворяет ли этот экземпляр некоторому свойству.
	•	Классический пример: «Является ли заданный граф двудольным?»
– на вход: неориентированный граф G.
– выход: “да” (если вершины можно разбить на две группы так, чтобы каждое ребро соединяло вершины разных групп) или “нет”.
	•	Типичные особенности:
	•	Формулировка «YES/NO».
	•	Часто первичная проверка возможности решения более общей (например, оптимизационной) задачи.
	•	Привязка к сложности: классы P, NP, co-NP, PSPACE, и т.д.
	•	Примеры:
	1.	CNF-SAT (Boolean satisfiability).
– вход: формула в конъюнктивной нормальной форме (CNF).
– выход: существует ли набор значений переменных, при котором формула истинна?
	2.	PATH (Reachability) в ориентированном графе.
– вход: ориентированный граф G = (V, E) и две вершины s, t.
– выход: существует ли путь из s в t?
	3.	3-Colorability.
– вход: граф G.
– выход: можно ли раскрасить вершины G в три цвета так, чтобы никакое ребро не соединяло вершины одного цвета?
	•	Когда встречается:
Любая базовая проблема «есть/нет». Обычно первый шаг перед тем, как ставить задачу поиска или оптимизационную задачу. Если задачу принятия решения можно решить за полиномиальное время, часто это означает, что можно решать и соответствующие задачи поиска.

⸻

2. Поисковые задачи (Search Problems)

Определение.
На вход подаётся экземпляр задачи (например, граф, формула, матрица). Необходимо не просто ответить «да/нет», а найти соответствующий «свидетель» (witness) или решение, если оно существует (либо сообщить, что решения нет).
	•	Отличие от задачи принятия решения:
– В задаче принятия решения достаточно проверить существование (YES/NO).
– В поисковой задаче требуется построить сам объект (например, путь, подмножество, раскраску, сам набор значений булевых переменных).
	•	Типичные примеры:
	1.	SAT (конкретный поиск присваивания).
– вход: булева формула в CNF.
– выход: либо конкретное присваивание переменным, делающее формулу истинной, либо ответ «решение не существует».
	2.	Path-finding (поиск пути).
– вход: ориентированный или неориентированный граф G = (V, E), две вершины s, t.
– выход: конкретная последовательность вершин или рёбер от s до t, если таковая существует.
	3.	Minimum Spanning Tree (MST) – поиск остовного дерева.
– вход: связный взвешенный граф.
– выход: множество рёбер, образующих минимальное по сумме весов остовное дерево.
	•	Когда применяют:
– Когда важно не просто узнать, существует ли решение, а чем именно оно является.
– Часто поисковую задачу сводят к задаче принятия решения (например, через «binary search + проверка feasibility»), а затем восстанавливают «конкретный» ответ.

⸻

3. Оптимизационные задачи (Optimization Problems)

Определение.
Дан экземпляр (граф, набор чисел, матрица, функции и т. д.). Необходимо найти «оптимальный» (минимизирующий или максимизирующий) объект из множества допустимых решений. Обычно формулируется как
\min_{x \in \mathcal{S}} f(x) \quad \text{или} \quad \max_{x \in \mathcal{S}} f(x),
где \mathcal{S} — множество всех допустимых «свидетелей» (решений), а f(x) — целевая функция (стоимость, вес, длина, прибыль и т. п.).
	•	Замечание:
Чтобы проверить, корректность решения «k-оптимального», часто вводят вспомогательную задачу принятия решения: «существует ли решение с показателем \le k?» и решают её, например, бинарным поиском по k.
	•	Ключевые характеристики:
	•	На выходе требуется численное значение (оптимальная стоимость) и/или «аргумент» x^* (конкретное решение), на котором достигается экстремум.
	•	Сложность часто описывается в терминах классов NP-hard, NP-complete (если задача сводится к SAT, Cliquе и т. д.) или может быть полиномиально решаемой (например, MST, Shortest Path).
	•	Примеры:
	1.	Задача о рюкзаке (0/1 Knapsack).
– вход: n предметов, у каждого вес w_i и ценность v_i, и вместимость рюкзака W.
– выход: выбрать подмножество предметов, суммарный вес которого \le W, чтобы суммарная ценность была максимальна.
	2.	Кратчайший путь (Shortest Path).
– вход: взвешенный ориентированный/неориентированный граф G и две вершины s, t.
– выход: путь из s в t минимальной суммарной длины (веса рёбер).
	3.	Минимальное остовное дерево (Minimum Spanning Tree, MST).
– вход: связный взвешенный неориентированный граф G.
– выход: остов T\subseteq E, минимизирующий \sum_{e\in T} \mathrm{weight}(e).
	4.	Задача о максимальном потоке (Max Flow).
– вход: сеть (V, E) с пропускными способностями на рёбрах, исток s и сток t.
– выход: поток из s в t максимальной величины.
	5.	Опти­мизация маршрутов (TSP — Traveling Salesman Problem).
– вход: полный граф на n вершинах с весами рёбер (обычно расстояния).
– выход: гамильтонов цикл минимальной длины (NP-hard).
	6.	Задачи линейного/целочисленного программирования.
– вход: матрица ограничений A x \le b, вектор ценностей c.
– выход: в случае линейного программирования — x^* = \arg\max \{ c^T x \mid A x \le b,\, x\ge 0\}. В случае целочисленного—значения x должны быть целыми (NP-hard в общем случае).
	•	Особенности:
	•	Оптимизационные задачи часто делятся на:
	1.	Полиномиально разрешимые (например, Shortest Path, MST, Min-Cut, Linear Programming).
	2.	Комбинаторно-жадные / жадные полиномиальные (Greedy решают оптимум, как в Fractional Knapsack или Activity Selection).
	3.	NP-hard / NP-complete (как TSP, Bin Packing, 0/1 Knapsack в «строгой» формулировке, Job-Scheduling на маши­нах с целыми длительностями, некоторые варианты Integer Programming).
	•	При NP-hard-задачах на практике часто применяют:
– Эвристики/метаэвристики (жадные/муравьиные методы, генетические алгоритмы, Tabu-search).
– PTAS/FPTAS (если задача допускает приближённое решение в полиномиальное время с любой точностью \varepsilon).
– Аппроксимация с гарантией качества (например, 2-approx для Vertex Cover, логарифмическая аппроксимация для Set Cover и т. д.).

⸻

4. Задачи подсчёта (Counting Problems)

Определение.
На вход подаётся экземпляр, и нужно подсчитать, сколькими способами можно получить требуемое решение (или количество объектов, удовлетворяющих условию). В отличие от «поисковых» и «optimzation»-задач, здесь важно не только найти/оптимизировать единичный вариант, но и узнать общее число.
	•	Примеры:
	1.	\#SAT («кай-эскью-эй-ти», “#Сат” — counting satisfying assignments).
– вход: булева формула в CNF.
– выход: число различных присваиваний переменных, при которых формула истинна (в отличие от SAT-задачи, где нужно лишь узнать, существует ли хотя бы одно решение).
	2.	Подсчёт числа гамильтоновых циклов в графе.
– вход: неориентированный/ориентированный граф G.
– выход: количество всех замкнутых последовательностей вершин длины n, проходящих через каждую вершину ровно один раз.
	3.	Подсчёт количества путей длины k между двумя вершинами в ориентированном ациклическом графе (DAG).
– вход: DAG, две вершины s,t, целое k.
– выход: число различных путей длины ровно k из s в t.
	4.	Число разбиений числа n на слагаемые (Partition Function p(n)).
	•	Класс сложности:
– Обычно такие задачи попадают в класс \#P (Плюс-класс).
– Многие задачи подсчёта являются \#P-полными (что, грубо говоря, сложнее NP-полноты и не предполагает полиномиального алгоритма при общепринятых допущениях).
	•	Методы решения:
	1.	DP-схемы (Tabulation / memoization). Например, для подсчёта числа LCS-пар или путей в графе используют обычный динамический программирование.
	2.	Полиномиальные методы / Fast Zeta / Moebius Transform. Для некоторых комбинаторных подсчётов на множествах.
	3.	Методы включения-исключения (Inclusion–Exclusion). Позволяют учесть пересечения множеств, но могут вести к экспоненциальному росту сложностей, оптимизируемых «по маскам» или «по преобразованию Фурье» (Subset Convolution).
	4.	Генераторы случайных образцов (Randomized Approximation): если точный подсчёт невозможен, иногда находят приближённый подсчёт через Monte-Carlo или марковские цепи (например, подсчёт числа правок графов, числа раскрасок).

⸻

5. Задачи перечисления (Enumeration Problems)

Определение.
Нужно сгенерировать (вывести, перечислить) все решения, удовлетворяющие заданному свойству. В отличие от «подсчёта» (где важен только итоговый объём), здесь важен перечень самих решений.
	•	Ключевые характеристики:
	•	Количество выходных данных может быть экспоненциальным (\Theta(2^n) или даже больше).
	•	Важна не асимптотика «полное время = \mathrm{poly}(input) \cdot#solutions» (она обычно экспоненциальна), а время «между выводами» (delay): алгоритм считается оптимальным, если задержка между генерацией i-го и (i+1)-го решения — полиномиальна, а прежде чем вывести первый результат — тоже полиномиально.
	•	Примеры:
	1.	Перечислить все гамильтоновы циклы в графе.
	2.	Перечислить все перестановки/комбинации/разбиения множества из n элементов.
	3.	Перечислить все минимальные вершинные покрытия (minimal vertex covers) в графе.
	4.	Перечислить все максимальные клики (maximal cliques) в графе.
	•	Методы решения:
	1.	Backtracking / Branch‐and‐Bound.
– Рекурсивное построение частичного решения.
– Принцип «расширяю частичное решение, если оно ещё может привести к полному».
– Если задача требует только «минимальных» или «максимальных» вариантов, часто добавляют проверки локального оптимума (branch-and-bound), чтобы можно было «отсечь» множество развилок.
	2.	Gray-code генерация (для всех подмножеств).
– Вывод всех 2^n подмножеств так, что соседние отличаются ровно в одном элементе.
	3.	Lexicographic Enumeration.
– Систематический перебор (лексикографический, кратчайший → длиннейший, и т. д.).
– Часто основан на «next_permutation» / «next_combination» и т. д.
	4.	Алгоритмы генерации вершин полиномиальной задержки (polynomial‐delay).
– Более формализованный подход: между выводом любых двух соседних решений используется не более O(\mathrm{poly}(n)) времени.

⸻

6. Задачи аппроксимации (Approximation Problems)

Определение.
Имеется оптимизационная задача, которую, вероятнее всего, не удастся решить за полиномиальное время (NP-hard). Нужен алгоритм, который гарантированно найдёт решение, приближённое к оптимальному с некоторым фактором (или добавочным приращением).
	•	Типы приближения:
	1.	Факторное приближение (Approximation Ratio):
Алгоритм гарантирует, что для \max-задачи
\frac{ALG(I)}{OPT(I)} \ge \rho,
или для \min-задачи
\frac{OPT(I)}{ALG(I)} \le \rho,
где \rho (обычно \ge 1) — «фактор приближения».
– Пример: алгоритм с гарантией 2-approx для задачи Vertex Cover возвращает покрытие не более чем вдвое больше оптимального.
	2.	ЭПТАС/ФПТАС (PTAS/FPTAS):
– PTAS (Polynomial Time Approximation Scheme) — для каждого \varepsilon > 0 даёт полиномиальный во входе (но может быть экспоненциальный в 1/\varepsilon) алгоритм, гарантирующий приближение (1 + \varepsilon) для \min-задач (или (1 - \varepsilon) для \max-задач).
– FPTAS (Fully Polynomial Time Approximation Scheme) — когда алгоритм работает за время полиномиальное и по n, и по 1/\varepsilon.
– Пример: для Knapsack 0/1 существует FPTAS.
	3.	Добавочные приближения (Additive Approximations):
– Гарантия \lvert ALG(I) - OPT(I) \rvert \le \alpha, где \alpha — некоторая константа или функция как O(f(n)).
– Например, для некоторых NP-трудных комбинаторных задач можно получить приближение «по значению» с ошибкой в O(\log n) или «псевдополиномиальным» приращением.
	•	Примеры:
	1.	Vertex Cover (2-approx).
	2.	Set Cover (ln n-approx).
	3.	TSP в метрическом случае (1.5-approx).
	4.	Knapsack 0/1 (FPTAS).
	5.	Maximum Independent Set на планарных графах (PTAS).
	•	Особенности:
	•	Если в условии явно сказано «найти решение, приближённое не хуже чем в \alpha раз», то это задача аппроксимации.
	•	Сложность обычно описывается в классах APX, PTAS, FPTAS, и т. д.
	•	Для многих NP-hard задач доказано, что нет полиномиального алгоритма с «хорошим» фактором приближения (например, Set Cover не допускает o(\log n)-аппроксимации, если не выполняется P = NP).

⸻

7. Случайные / рандомизированные задачи (Randomized Problems)

Определение.
Задача, в которой алгоритм может использовать генерацию случайных чисел, и/или где цель — «выбрать случайный» объект, удовлетворяющий условию; или даже сама формулировка задачи допускает вероятностный ответ.
	•	Варианты:
	1.	Monte Carlo-алгоритмы:
– Гарантируют полиномиальное время, но могут ошибиться с малой (контролируемой) вероятностью.
– Примеры: быстрая проверка на простоту (Miller–Rabin), проверка равенства многочленов (Fingerprinting).
	2.	Las Vegas-алгоритмы:
– Всегда дают корректный ответ, но время работы — случайная величина со «средним» полиномиальным временем (например, Randomized QuickSort, Randomized Hashing).
	3.	Задачи «рандомного выбора»:
– Выбрать единичный объект «равновероятно» из всех решений (например, выбрать случайный гамильтонов цикл или случайную раскраску).
– Иногда связано с «марковскими цепями» (MCMC) для генерации «приближённо равномерного» образца.
	4.	Алгоритмы с проверкой сертификата (Verification):
– Например, в протоколах \mathrm{NP} (NP-verification): алгоритм получает «свидетель» w, проверяет его детерминированно за полиномиальное время.
– Можно рассматривать как «задачи с интерактивным рандомизированным доказательством» (IP, Arthur–Merlin протоколы).
	•	Применение:
– Когда детерминированный алгоритм слишком «тяжёл» или неизвестен, но есть быстрое верифицирующее случайное решение.
– В задачах, где необходимо «примерная» генерация структур (комбинаторных объектов) равномерно или с заданным распределением (например, рандомизированное представление плана).

⸻

8. Задачи с элементами онлайн- vs офлайн-модели

Определение.
Задача разделяется на «динамически поступающие» запросы (online) и «полный набор» (offline). Хотя с точки зрения результата цель может оставаться прежней (решение/оптимизация), модель взаимодействия с входом и алгоритмические требования отличаются.
	1.	Offline-задача:
– Все данные (или все запросы) известны заранее.
– Алгоритм может свободно «планировать» свою стратегию, имея полный доступ к входу.
– Пример: дан массив A из n чисел и Q запросов вида «сколько чисел в A лежат в диапазоне [l, r]?» Все запросы заданы сразу; используем Mo’s Algorithm или Segment Tree «офлайн».
	2.	Online-задача:
– Запросы поступают «один за другим», и на каждый нужно ответить «на лету», не зная будущих.
– Оценка качества онлайн-алгоритма даётся через competitive ratio (отношение к оптимальному «офлайн»-решению).
– Примеры:
	1.	Online Caching / Paging (кэширование). При обращении к страницам нужно решать, какую страницу из кэша «выселить», не зная будущих запросов.
	2.	Online Bin Packing. Последовательно поступают предметы разного размера; нужно сразу поместить в один из имеющихся бин-контейнеров с ограниченной вместимостью, минимизируя число контейнеров.
	3.	Online кластирование, Online Matching (например, люди приходят последовательно, нужно сопоставлять с комнаты или с ковариантами на лету).

	•	Особенности:
	•	В offline-задачах часто применяют структуры (Segment Tree, BIT, sqrt-де­композицию, Mo’s Algorithm и пр.).
	•	В online-задачах предполагают стратегию «жадного» или «рассуждения в худшем случае» (competitive analysis).
	•	Многие offline-задачи NP-hard в offline остаются «можно приблизить» в offline, но в online вообще не существует хорошего конкурентного соотношения (или оно «неположительное»).

⸻

9. Задачи принятия решений с обещаниями (Promise Problems)

Определение.
Вход снабжается обещанием (promise) или предположением, что он удовлетворяет некоторому свойству P. Требуется решить задачу только на том множестве входов, где обещание верно; на остальных входах поведение алгоритма никак не регламентируется (он может ответить что угодно или даже «не определён»).
	•	Когда встречаются:
– В теории сложности, при анализе классов вроде BPP (вероятностный полиномиальный), Promise-BPP, Unique-SAT (гарантируется, что в формуле либо ровно одно удовлетворение, либо ни одного), Graph Isomorphism with Promise, и т. д.
– В алгоритмике: когда заранее известно, что данные «чистые» (например, граф уже ориентированно ацикличный), и нужно «скорее» проверить некую более сильную структуру.
	•	Пример:
– Unique-SAT: вход — булева формула F, обещание: либо F неразрешима, либо у неё ровно одно удовлетворящее присваивание. Нужно отличить «нет удовлетворений» от «ровно одно» за полиномиальное время (неизвестно, можно ли сделать это детерминировано).

⸻

10. Задачи серификации и верификации (Verification Problems)

Определение.
Алгоритм получает на вход два компонента: экземпляр I и «свидетель» (certificate) C. Нужно проверить, что C действительно является корректным решением для I. Важная особенность: корректный «свидетель» должен привести алгоритм к выводу «да» за полиномиальное время, а на «невалидных» свидетелях алгоритм должен уметь детектировать ложь (время может быть также полиномиальным).
	•	Связь с NP-задачами:
– Любая NP-задача формулируется именно так: «существует ли свидетель C длины poly(\lvert I\rvert) и полиномиальный верификатор V такой, что V(I, C) = \texttt{YES}?»
– Например, SAT-задача: свидетель — конкретное булево присваивание, верификатор — проверяет, делает ли оно формулу истинной, за O(\mathrm{size}(F)).
	•	Применение:
	1.	Сертифицированные алгоритмы (Certified Algorithms):
– Алгоритм выдаёт не только ответ (например, минимум остова), но и «доказательство» (certificate), проверяемое быстро (например, список ребёр MST с проверкой, что они образуют дерево нужного веса; или аргумент, почему нельзя «лучше»).
	2.	Протоколы с нулевым разглашением (Zero-Knowledge Proofs):
– Пользователь должен доказать факт владения «секретом» (например, знание корректного решения), не раскрывая сам секрет, используя рандомизированный верификатор.

⸻

11. Задачи с подсчётом вероятности / статистические задачи (Statistical/Sampling Problems)

Определение.
На вход подаётся комбинаторная структура (граф, множество, функция распределения и т. д.), и нужно либо подсчитать вероятности некоторых событий, либо сгенерировать образец (sample) из некоторого распределения на множестве решений.
	•	Примеры:
	1.	Монтекарло-методы для ближайшего соседа (Nearest Neighbor sampling).
	2.	Генерация случайного экземпляра ограниченного по условиям (например, случайный SAT-разрешитель).
	3.	Подсчёт вероятности перехода в цепи Маркова, определение стационарного распределения (Markov Chain Monte Carlo).
	•	Методы решения:
	1.	Явные формулы комбинаторики (DP, замена суммы на произведение).
	2.	Рандомизированные алгоритмы (Chain-based sampling).
	3.	Вычисление функционалов (Generating Functions, Z-transform).

⸻

12. Промежуточные / гомогенные типы

Чтобы подчеркнуть, что одна и та же формулировка задачи может следовать нескольким вышеперечисленным «типа», приведём несколько гибридных примеров:
	1.	Optimization + Decision.
– Чаще всего ставят «решение задачи оптимизации через бинарный поиск по ответу и в каждой итерации решают задачу принятия решения».
– Пример: «Существует ли маршрут длины \le k?» (Decision) → «Найти минимальную длину маршрута» (Optimization).
	2.	Counting + Approximation.
– Часто подсчёт точного числа решений NP-полных проблем (\#P) невозможен за полиномиальное время, но можно получить «распределённую» оценку через аппроксимирующие алгоритмы (FPRAS – Fully Polynomial Randomized Approximation Scheme for Counting).
– Пример: приближённый подсчёт числа раскрасок графа.
	3.	Search + Verification + Randomization.
– Поиск туза (witness) может включать генерацию случайных кандидатов и верификацию каждого (например, Pollard’s Rho для факторизации: случайный «дразнящий» полином и поиск цикла, пока не найдётся нетривиальный делитель; проверка делимости).

⸻

13. Краткий свод «Типов задач» (классификация)
	1.	Decision Problems (задачи принятия решения, YES/NO).
	2.	Search Problems (задачи поиска witness’а, построения решения).
	3.	Optimization Problems (задачи оптимизации, min/max).
	4.	Counting Problems (\#P-задачи, подсчёт числа решений).
	5.	Enumeration Problems (перечисление всех решений, генерация со временем задержки).
	6.	Approximation Problems (задачи приближения, с гарантией качества решения).
	7.	Randomized Problems (задачи с использованием случайности, Monte Carlo / Las Vegas).
	8.	Online vs Offline Problems (модель поступления запросов и данных).
	9.	Promise Problems (задачи с «обещанием» об ограничении входа).
	10.	Verification / Certification Problems (проверка корректности witness’а или доказательства).
	11.	Statistical / Sampling Problems (задачи генерации/подсчёта вероятностей, MCMC, etc.).

⸻

14. Связь с классами сложности
	•	P (Polynomial time):
– Все задачи принятия решений, где существует детерминированный алгоритм за полиномиальное время.
– Все задачи поиска/восстановления witness’а, если соответствующая задача принятия решения лежит в P и дополнительно «рецепт восстановления» тоже в P (например, Shortest Path).
	•	NP (Nondeterministic Polynomial time):
– Класс задач принятия решения, где «да»-ответ можно верифицировать за полиномиальное время при помощи «свидетеля» (certificate).
– Соответствующие Search-задачи (NP-search problems) формально называются FNP.
	•	co-NP:
– Представляет противоположности NP-задач (например, UNSAT — «формула неразрешима»).
	•	\#P:
– Класс подсчётных задач (Counting Problems).
	•	PSPACE, EXPTIME и др.:
– Если требуется полиномиальный объём памяти или экспоненциальное время, соответственно.
	•	APX, PTAS, FPTAS:
– Классы оптимизационных приближений (Approximation).
	•	BPP, RP, ZPP:
– Рандомизированные классы (Randomized Problems).

⸻

15. Как на практике «распознать» тип задачи?
	1.	Прочитать условие и ответить на вопрос: What is the output?
	•	«да/нет» → Decision.
	•	«конкретная структура (путь, подмножество, раскраска)» → Search или Optimization (если есть критерий «лучшего»).
	•	«минимальная/максимальная стоимость» → Optimization.
	•	«сколько существует решений» → Counting.
	•	«перечислить все решения» → Enumeration.
	•	«приблизить» → Approximation.
	•	«онлайн-протокол» → Online Problem.
	•	«рандомизированный алгоритм, допускающий ошибку» → Randomized Problem / Monte Carlo.
	2.	Определить ограничения по n:
	•	Если n достаточно мало (например, n \le 20), возможно, это задача Enumeration или Full brute-force.
	•	Если n \le 10^5 или 10^6, явно речь о полиномиальных (P) или приближённых.
	3.	Понять, уместна ли верификация witness’а:
	•	Если в условии явно сказано «если есть решение, выведите его; если нет – выведите NO», то задача получилась Search/Decision.
	•	Если же «подсчитайте число решений», нужна другая техника (DP, Inclusion–Exclusion).
	4.	Смотреть на словосочетания «минимизировать», «максимизировать», «оптимальное»:
– Это Optimization.
– Если рядом встречаются «NP-hard», «аппроксимация», «2-approx» – значит, под NP-hard задачу подведут.
	5.	Упоминание вероятности, «с большой вероятностью», «рандомизированно»:
– Скорее всего, Monte Carlo / Las Vegas / Sampling (Randomized Problems).
	6.	Наличие обещаний («гарантируется, что…», «гарантированно ли данные…»):
– Возможно, Promise Problem.

⸻

Заключение

В алгоритмике важно чётко различать формулировку задачи (decision, search, optimization, counting, enumeration, approximation и т. д.) от методов решения (DP, графовые алгоритмы, жадные стратегии, потоки, структуры данных и т. д.). Как правило, первый шаг при анализе любо­й задачи – это понять, к какому из вышеописанных «типов задач» она принадлежит, ведь от этого зависит:
	1.	Какой выход мы должны получить (да/нет, конкретный объект, число способов, список всех решений и т.д.).
	2.	Какие алгоритмические приёмы и классы сложности применять.
	3.	Какая оценка сложности (P, NP, \#P, APX и т. д.) у данной задачи.

Понимание «типа» задачи часто сокращает дальнейшую работу над выбором подходящей техники в разы.

### Доказательство свойств алгоритма

**Методы доказательства корректности алгоритма**

- Доказательство от противного. При доказательстве от противного мы предполагаем, что алгоритм не корректен, и приходим к противоречию.

- Доказательство по индукции. При доказательстве по индукции мы доказываем базовый случай, а затем показываем, что если утверждение верно для $n$, то оно верно и для $n+1$.

- Доказательство по инварианту. При доказательстве по инварианту мы формулируем утверждение (инвариант), которое должно быть истинным до и после каждой итерации цикла.

**Методы доказательства асимптотики алгоритма**

- Метод прямого учета

- Доказательство по индукции

- Амортизационный анализ

Все эти методы будут рассмотрены по существу в следующих главах. Методы доказательства корректности даже в следующем за этим ноутбуке