# Сложность алгоритмов

## Понятие алгоритма
Чем метод отличается от алгоритма?

Метод - идея - алгоритм без модели вычислений (мы не говорим о том, кто и как будет выполнять операции).

Алгоритм - последовательность шагов (в основе лежат элементарные операции)

Алгоритм - это заданное на некотором языке конечное предписание, задающее конечную последовательность выполнимых элементарных операций для решения задачи,
общее для класса возможных исходных данных.

## Описание алгоритма

Оценка сложности алгоритма производится на гипотетическом компьютере Random Access Machine, действующим по следующим правилам:
* Простые арифметические операции исполняются за один временной шаг
* Обращение к памяти исполняется за один временной шаг
* Время исполнения сложных подпрограмм (напр., циклов) зависит от количества переданных в них элементов

Важно: мы пренебрегаем средним временем выполнения одного элементарного действия.

Наиболее простой анализ алгоритма можно провести по следующим пунктам:
* Задача
* Вход задачи
* Выход задачи

### Вход алгоритма
* Конкретная проблема => Индивидуальная задача => Вход
* $D = \{ d_i | i = 1, m\}$
* $D_A$ - множество допустимых конкретных проблем задачи, решаемых алгоритмом $A$, $ D \in D_A$ - конкретная проблема (вход)
* Длина входа: $n = |D|$ (мощность)
* Мера по задаче $z$: $\mu_z(D) = n$
* $D_n$ - допустимые входы длины $n$: $D_n = \{ D | \mu_z(D) = n \}$

### Сложность (трудоемкость)
* Ресурсы: **время** и **память**
* Сложность алгоритма - количественная характеристика, которая отражает, сколько времени он работает (временная сложность), либо сколько памяти требуется для его работы (емкостная сложность)
* $f_A(D)$ - число элементарных операций, заданных алгоритмом $A$ на входе $D$ или функция трудоемкости алгоритма $A$ для входа $D$
* $f_{A_1}(D) < f_{A_2}(D)$ не означает, что алгоритм $A_1$ лучше, чем $A_2$, но если придет $D$, то мы будем использовать $A_1$

#### Затраты по времени
* Сложность в наихудшем случае: $\check{f_A}(n) = \min_{D \in D_n} (f_A(D))$
* Сложность в наилучшем случае: $\hat{f_A}(n) = \max_{D \in D_n} (f_A(D))$
* Сложность в среднем случае (ожидаемое время работы алгоритма): 
    * Если выходы равновероятны: $\bar{f_A}(n) = \frac{1}{\mu_z(D)} \sum_{D \in D_n} (f_A(D))$
    * Если выходы встречаются с разной вероятностью: $\bar{f_A}(n) = \sum_{D \in D_n} (P(D) f_A(D))$, $P(D)$ - частотная встречаемость входа $D$

#### Затраты по памяти
Емкостная сложность алгоритма определяется числом ячеек памяти, используемых в процессе его выполнения.

Сложность по памяти может быть разложена на следующие составляющие:
* Память входа
* Память результата
* Паммять алгоритма
* Память кода

## Классификация алгоритмов по виду функции трудоемкости

В зависимости от влияния исходных данных на функцию трудоемкости алгоритма может быть предложена следующая классификация, имеющая практическое значение для анализа алгоритмов:

1. **Класс N** (количественно-зависимые)

    Это алгоритмы, функция трудоемкости которых зависит только от размерности конкретного входа, и не зависит от конкретных значений: $f_A(n) = \check{f}(n) = \hat{f}(n)$

    Устойчивы по времени!
    
    Примеры алгоритмов: матрично-векторные алгоритмы (умножение матриц, умножение матрицы на вектор), некоторые сортировки.

2. **Класс PR** (параметрически-зависимые)

    Это алгоритмы, трудоемкость которых определяется не размерностью входа (как правило, для этой группы размерность входа обычно фиксирована), а конкретными значениями обрабатываемых слов памяти.

    Примеры алгоритмов: алгоритмы вычисления стандартных функций (sin, cos) с заданной точностью путем вычисления соответствующих степенных рядов.

3. **Класс NPR** (количественно-параметрические)

    Функция трудоемкости зависит как от количества данных на входе, так и от значений входных данных. Параметры определяют лучший и худший по трудоемкости случай.

    Примеры алгоритмов: алгоритмы численных методов, в которых параметрически-зависимый внешний цикл по точности включает в себя количественно-зависимый фрагмент по размерности.

    * **Подкласс NPRL** (low) - слабая параметрическая зависимость
    * **Подкласс NPRE** (equal) - схожая параметрическая зависимость
    * **Подкласс NPRH** (hard) - сильная параметрическая зависимость

## Асимптотические обозначения степени роста

Хорошо написано здесь: [Учебный модуль "Сложность алгоритмов" - Е. В. Разова](http://kuimova.ucoz.ru/modul_6-slozhnost_algoritmov.pdf) 

Временную сложность алгоритма принято обозначать $T(n)$, где $n$ - размер входа.

При анализе поведения функции трудоемкости алгоритма часто используют принятые в математике асимптотические обозначения, позволяющие показать скорость роста функции, маскируя при этом конкретные коэффициенты.

Такая оценка функции трудоемкости алгоритма называется сложностью алгоритма и позволяет определить предпочтения в использовании того или иного алгоритма для больших значений размерности исходных данных.

В асимптотическом анализе приняты следующие обозначения:

* $T(n) = O(g(n))$ - верхняя оценка (оценка худшего случая)

    $T(n)$ растет не быстрее $g(n)$

    Наиболее интересный нам вид оценок, так как время работы алгоритма принято рассматривать в худшем случае.

    $$T(n) = O(g(n)) \text{, если } \exists n_0 \in N, c > 0$$
    $$\forall n \geq n_0 \quad T(n) \leq c \cdot g(n)$$
    
    $3n^2 - 200n + 8 = O(n^2)$, $c=3$ и $3n^2 > 3n^2 - 200n + 8$
    
    $3n^2 - 200n + 8 = O(n^3)$, $c=1$ и $n^3 > 3n^2 - 200n + 8$ при $n > 3$
    
    $3n^2 - 200n + 8 \neq O(n^2)$, так как $\forall c $ справедливо $ cn < 3n^2$ при $n > c$
    
    $T(n) = o(g(n))$: $T(n)$ растет медленнее $g(n)$

* $T(n) = Ω(g(n))$ - нижняя оценка (оценка лучшего случая)

    $T(n)$ растет не медленнее $g(n)$

    $$T(n) = Ω(g(n)) \text{, если } \exists n_0 \in N, c > 0$$
    $$\forall n \geq n_0 \quad c \cdot g(n) \leq T(n)$$

    $3n^2 - 200n + 8 = Ω(n^2)$, $c=2$ и $2n^2 < 3n^2 - 200n + 8$ при $n > 100$
    
    $3n^2 - 200n + 8 \neq Ω(n^3)$, $c=3$ и $3n^2 - 200n + 8 < n^3$ при $n > 3$
    
    $3n^2 - 200n + 8 = Ω(n^2)$, так как $\forall c $ справедливо $ cn < 3n^2 - 200n + 8$ при $n > 100c$

* $T(n) = \Theta(g(n))$ - порядок роста

    $T(n)$ и $g(n)$ растут с одинаковой скоростью

    Время работы алгоритма $T(n)$ имеет порядок роста $g(n)$, если и сверху и снизу время работы ограничено функцией с одной и той же степенью роста, если это не так, то говорят о верхних и нижних оценках.
    
    $$T(n) = \Theta(g(n)) \text{, если } \exists n_0 \in N, 0 < c1 \leq c2$$
    $$\forall n \geq n_0 \quad c_1 \cdot g(n) \leq T(n) \leq c2 \cdot g(n)$$
    
    $3n^2 - 200n + 8 = \Theta(n^2)$, применимо и к $O$, и к $Ω$
    
    $3n^2 - 200n + 8 \neq \Theta(n^3)$, применимо только к $O$
    
    $3n^2 - 200n + 8 \neq \Theta(n^2)$, применимо только к $Ω$

### Правила работы с асимптотическими функциями
* $f(n) + g(n) \rightarrow O(\max{(f(n), g(n))})$ (справедливо и для $Ω$, и для $\Theta$)
* $O(c \cdot f(n)) \rightarrow O(f(n))$ (справедливо и для $Ω$, и для $\Theta$)
* $O(f(n) \cdot g(n)) \rightarrow O(f(n)) \cdot O(g(n))$ (справедливо и для $Ω$, и для $\Theta$)
* $f(n) = O(g(n))$ и $g(n) = O(h(n))$, тогда $f(n) = O(h(n))$

[(Источник примера)](https://www.youtube.com/watch?v=t-t_VaVY-TA&list=PLlb7e2G7aSpQutUr7qYIunvm04cqdr5mx&index=1) Пусть у нас есть 2 алгоритма:
* Первый делает на входе $3n^2 + 5n + 2$ операций
* Второй делает на входе $n^2$ операций
* При $n=1$: первый делает в 10 раз больше операций, чем второй
* При $n \rightarrow \infty$: в соотношении $\frac{3n^2 + 5n + 2}{n^2}$ легко заметить, что $\frac{5}{n} + \frac{2}{n^2} \rightarrow 0$ при $n \rightarrow \infty$, то есть $3n^2 + 5n + 2 \sim 3n^2$ - разница в 3 раза
* Тем не менее, мы "закрываем глаза" на разницу в 3 раза, поскольку она будет компенсирована машиной, на которой работает алгоритм

### Наиболее часто встречающиеся классы сложности (в порядке увеличения скорости роста)

* $O(1)$ - константное время (great)
* $O(\log{(n)})$ - логарифмическое время (great)
* $O(\sqrt{(n)})$ (great)
* $O(n)$ - линейное время (good)
* $O(n\log{(n)})$ - линейно-логарифмическое время (good)
* $O(n^2)$ - квадратичное время (bad)
* $O(n^3)$ - кубическое время (bad)
* $O(2^n)$ - экспоненциальное время (terrible)
* $O(n^k)$ - полиномиальное время (класс P) (terrible) - не любая задача может быть решена за полиномиальное время!

### Примеры вычисления сложности:

* Определение чётности целого числа: $O(1)$
* Двоичный поиск: $O(\log{(n)})$
* Поиск наименьшего или наибольшего элемента в неотсортированном массиве: $O(n)$
* Самая быстрая сортировка сравнением: $O(n\log{(n)})$
* Сортировка пузырьком, сортировка вставками, прямая свёртка: $O(n^2)$
* Обычное умножение двух nxn матриц, вычисление частичной корреляции: $O(n^3)$
* Линейный поиск: $T(n) = Ω(1)$ и $T(n) = О(n)$
* $2^{n+1} = O(2^n) = Ω(2^n) = \Theta(2^n)$

### Пара примеров про числа Фибоначчи

Скорость роста чисел Фибоначчи экспоненциальная: $F_n \geq 2^{\frac{2}{n}}$ для $n \geq 6$, это хороший пример того, как важно писать оптимизированный с точки зрения временной сложности код.

Задача вычисления n-го числа Фибоначчи:
* [Habr - 5 способов вычисления чисел Фибоначчи: реализация и сравнение](https://habr.com/ru/post/261159/)
* [CSC - Введение в алгоритмы и структуры данных - Куликов](https://www.youtube.com/watch?v=t-t_VaVY-TA&list=PLlb7e2G7aSpQutUr7qYIunvm04cqdr5mx&index=1)

## Сложностные классы задач

Концепция полиномиального времени приводит к нескольким классам сложности в теории сложности вычислений. Некоторые важные классы, определяемые с помощью полиномиального времени:

1. **Класс P** - задачи с полиномиальной сложностью (фактически решаемые) - $O(n^k)$. Для этого класса **существует алгоритм**, решающий ее за реальное время.

2. **Класс NP** (NPC и NPH) - задачи с полиномиально **проверяемым решением**
    * Класс задач, решаемых при помощи исчерпывающего поиска (exhaustive search)
    * Для задач этого класса принято искать хорошее приближенное решение, выполняя либо жадный поиск (greedy search), либо лучевой поиск (beam search). Жадный поиск означает, что на каждом шаге мы ищем локально оптимальное решение, то есть решение, приводящее к наибольшему "сиюминутному" выигрышу.
    * $P \in NP$
    * $P = NP$ или $P \neq NP$ ???
    * Подклассы: **Класс NPC или NP-complete** и **класс NPH или NP-hard**

### Примеры
* Задача нахождения наиболее простого решающего дерева для данного датасета (по суммрному количеству листьев или по средней длине пути в графе) является NP-полной, то есть экспоненциально сложной
* Задача поиска у графа полных подграфов - класс NP
* Задачи, принадлежность которых к классу P неизвестна (класс NPC): задача комивояжера, разложение числа на простые множители

## Литература
* "Алгоритмы. Руководство по разработке" Стивен Скиена
* "Ресурсно-эффективные компьютерные алгоритмы" Ульянов
* [Введение в анализ алгоритмов](http://th-algoritmov.narod.ru/4.htm)
* [Учебный модуль "Сложность алгоритмов" - Е. В. Разова](http://kuimova.ucoz.ru/modul_6-slozhnost_algoritmov.pdf)
* [Временная сложность алгоритма - wiki](https://ru.wikipedia.org/wiki/%D0%92%D1%80%D0%B5%D0%BC%D0%B5%D0%BD%D0%BD%D0%B0%D1%8F_%D1%81%D0%BB%D0%BE%D0%B6%D0%BD%D0%BE%D1%81%D1%82%D1%8C_%D0%B0%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC%D0%B0)