# Вычислительная сложность алгоритмов

Во время своей работы программы используют различные структуры данных и алгоритмы, в связи с чем обладают разной эффективностью и скоростью решения задачи. Дать оценку оптимальности решения, реализованного в программе, поможет понятие вычислительной сложности алгоритмов.

**Вычислительная сложность (алгоритмическая сложность)** - понятие, обозначающее функцию зависимости объема работы алгоритма от размера обрабатываемых данных.

Вычислительная сложность пытается ответить на центральный вопрос разработки алгоритмов: как изменится время исполнения и объем занятой памяти в зависимости от размера входных данных?. С помощью вычислительной сложности также появляется возможность классификации алгоритмов согласно их производительности.

В качестве показателей вычислительной сложности алгоритма выступают:

1. **Временная сложность (время выполнения).**

    Временная сложность алгоритма - это функция от размера входных данных, равная количеству элементарных операций, проделываемых алгоритмом для решения экземпляра задачи указанного размера.
    Временная сложность алгоритма зачастую может быть определена точно, однако в большинстве случаев искать точное ее значение бессмысленно, т.к. работа алгоритма зависит от ряда факторов, например, скорости процессора, набора его инструкций и т.д.


2. **Асимптотическая сложность.**

    Асимптотическая сложность оценивает сложность работы алгоритма с использованием асимптотического анализа.
    Алгоритм с меньшей асимптотической сложностью является более эффективным для всех входных данных.

## Асимптотические нотации

Асимптотическая сложность алгоритма описывается соответствующей нотацией:

О-нотация, O («О»-большое): описывает верхнюю границу времени (время выполнения «не более, чем…»);

Омега-нотация, Ω («Омега»-большое): описывает нижнюю границу времени (время выполнения «не менее, чем…»).

Например,

![image.png](attachment:image.png)
говорит о том, что алгоритм имеет квадратичное время выполнения относительно размера входных данных в качестве верхней оценки («О большое от эн квадрат»).

Каждая оценка при этом может быть:
- наилучшая: минимальная временная оценка;

- наихудшая: максимальная временная оценка;

- средняя: средняя временная оценка.

При оценке, как правило, указывается наихудшая оценка.

Примечание

![image-2.png](attachment:image-2.png)

## Верхняя оценка О-нотация

Наиболее часто используемой оценкой сложности алгоритма является верхняя (наихудшая) оценка, которая обычно выражается с использованием нотации O-большое.

Выделяют следующие основные категории алгоритмической сложности в O-нотации:

- Постоянное время: O(1).

    Время выполнения не зависит от количества элементов во входном наборе данных.
    Пример: операции присваивания, сложения, взятия элемента списка по индексу и др.

- Линейное время: O(N).

    Время выполнения пропорционально количеству элементов в коллекции.
    Пример: найти имя в телефонной книге простым перелистыванием, почистить ковер пылесосом и т.д.

- Логарифмическое время: O(logN).

    Время выполнения пропорционально логарифму от количества элементов в коллекции.
    Пример: найти имя в телефонной книге (используя двоичный поиск).

- Линейно-логарифмическое время: O(NlogN).

    Время выполнения больше чем, линейное, но меньше квадратичного.
    Пример: обработка N телефонных справочников двоичным поиском.

- Квадратичное время: O(N2).

    Время выполнения пропорционально квадрату количества элементов в коллекции.
    Пример: вложенные циклы (сортировка, перебор делителей и т.д.).

На Рисунке приведен график роста O-большое.

![image.png](attachment:image.png)

## Оценка сложности алгоритмов

Для оценки вычислительной сложности алгоритмов необходимо знать и учитывать сложности:

- используемых структур данных;
- совокупности различных операций.

## Операции над структурами данных

### Список и кортеж
![image.png](attachment:image.png)

### Множество

![image.png](attachment:image.png)

### Словарь

![image.png](attachment:image.png)

![image.png](attachment:image.png)

## Закон сложения  и умножения О-нотации

Для оценки сложности совокупности операций используются законы сложения и умножения.

1.Закон сложения: итоговая сложность двух последовательных действий равна сумме их сложностей:

![image.png](attachment:image.png)

Особенности:

- итоговая сложность алгоритма оценивается наихудшим из слагаемых:

![image-2.png](attachment:image-2.png)
в итоговой сложности константы отбрасываются

![image-3.png](attachment:image-3.png)
- при ветвлении берется наихудший вариант

In [None]:
if test:     # O(t)
    block 1  # O(b1)
else:
    block 2  # O(b2)

![image.png](attachment:image.png)

2.Закон умножения: итоговая сложность двух вложенных действий равна произведению их сложностей:

![image.png](attachment:image.png)

In [None]:
# Общая                   O(N^2)
for i in range(N):      # O(N)
    for j in range(N):  # O(N)

## Сравнение работы производительности алгоритмов

Как правило существует не один алгоритм, позволяющий решить требуемую задачу, поэтому при разработке алгоритма необходимо учитывать его вычислительную сложность.

В Листинге приведен пример решений одной и той же задачи, используя алгоритмы с разной алгоритмической сложностью.

In [3]:
# 3 алгоритма, выполняющих одну и ту же задачу - проверку, что
# все значения списка различны - но имеющие разную вычислительную сложность

import random
import time


def timeit(func, *args, **kw):
    """Выполнить функицю 'func' с параметрами '*args', '**kw' и
    вернуть время выполнения в мс."""

    time_start = time.time()
    res = func(*args, **kw)
    time_end = time.time()

    return (time_end - time_start) * 1000.0, res


def is_unique_1(data):
    """Вернуть 'True', если все значения 'data' различны.

    Алгоритм 1:
      Пробежимся по списку с первого до последнего элемента и для каждого из
      них проверим, что такого элемента нет в оставшихся справа элементах.

    Сложность: O(N^2).
    """
    for i in range(len(data)):       # O(N)
        if data[i] in data[i+1:]:    # O(N) - срез + in: O(N) + O(N) = O(N)
            return False             # O(1) - в худшем случае не выполнится
    return True                      # O(1)


def is_unique_2(data):
    """Вернуть 'True', если все значения 'data' различны.

    Алгоритм 2:
      Отсортируем список. Затем, если в нем есть повторяющиеся элементы, они
      будут расположены рядом — т.о. необходимо лишь попарно их сравнить.

    Сложность: O(N Log N).
    """
    copy = list(data)                # O(N)
    copy.sort()                      # O(N Log N) - «быстрая» сортировка
    for i in range(len(data) - 1):   # O(N) - N-1, округлим до O(N)
        if copy[i] == copy[i+1]:     # O(1) - [i] и ==, оба по O(1)
            return False             # O(1) - в худшем случае не выполнится
    return True                      # O(1)


def is_unique_3(data):
    """Вернуть 'True', если все значения 'data' различны.

    Алгоритм 3:
      Создадим множество из списка, при создании автоматически удалятся
      дубликаты если они есть. Если длина множества == длине списка, то
      дубликатов нет.

    Сложность: O(N).
    """
    aset = set(data)                # O(N)
    return len(aset) == len(data)   # O(1) - 2 * len (O(1)) + == O(1)

# Проверка

res = [["i", "1 (мс.)", "2 (мс.)", "3 (мс.)"]]
for i in (100, 1000, 10000, 20000, 30000):
    # Из 100000 чисел выбираем 'i' случайных
    data = random.sample(range(-100000, 100000), i)

    res.append([i,
                timeit(is_unique_1, data)[0],
                timeit(is_unique_2, data)[0],
                timeit(is_unique_3, data)[0]])

print("{:>10} {:>10} {:>10} {:>10}".format(*res[0]))
for r in res[1:]:
    print("{:>10} {:>10.2f} {:>10.2f} {:>10.2f}".format(*r))

# -------------
# Пример вывода:
#
#         i    1 (мс.)    2 (мс.)    3 (мс.)
#       100       0.00       0.00       0.00
#      1000      15.01       0.00       0.00
#     10000    1581.05       5.00       2.00
#     20000    7322.86      12.01       2.00
#     30000   35176.36      25.02       8.01



         i    1 (мс.)    2 (мс.)    3 (мс.)
       100       0.13       0.03       0.01
      1000      11.75       0.19       0.04
     10000    1022.02       3.21       0.45
     20000    4417.86       5.03       2.36
     30000   16507.56       8.65       3.07
