# Основные оценки сложности алгоритмов

## Константа $O(1)$
Самый простой в оценке вариант алгоритма — алгоритм, который не зависит от размера входных данных. 
Посчитаем сумму первых пяти натуральных чисел. Для этого сравним два алгоритма.

In [5]:
# Алгоритм 1 (линейный, см. ниже)

a = [1, 2, 3, 4, 5]

summ = 0
for element in a:
    summ += element

print(summ)

15


Первый алгоритм будет перебирать все элементы массива и добавлять их к общей сумме. \
*Количество операций*: 1 (создание переменной) + n (проходимся по всему массиву) + n (операция суммы).

In [7]:
# Алгоритм 2 (постоянное время или константа)

a = [1, 2, 3, 4, 5]

summ = (a[0] + a[4]) / 2 * 5

print(summ)

15.0


Второй алгоритм не будет проходиться по всему массиву, а сразу сложит нужные элементы. \
*Количество операций*: 3.

В этой задаче нам нужно сделать три действия, независимо от того, какой массив мы передали. То есть мы говорим, что данный алгоритм имеет сложность $О(1)$.

## Линейная $О(n)$

Линейная оценка, или сложность $О(n)$, будет у алгоритма, который проходит один или несколько раз по всем переданным объектам. Например, алгоритм поиска числа в неупорядоченном массиве.

In [32]:
a = [5, 9, 7, 3, 6, 4]
to_find = 4

for elem in a:
    if elem == to_find:
        print('ID =', a.index(elem))
        break

ID = 5


В этом примере в худшем случае (а нам интересен именно худший случай) мы пройдемся по всему массиву, сравнивая каждый элемент с искомым, пока не найдем подходящий. Это и есть линейная сложность алгоритма. 

**Определить на глаз, что алгоритм линейный, можно по следующему признаку: в алгоритме будет цикл или несколько циклов подряд. Но несколько циклов должны идти строго подряд и ни в коем случае не быть вложены друг в друга!**

## Квадратичная $О(n^2)$

Оценка алгоритма в $О(n^2)$ будет уалгоритма, который для каждого элемента множества перебирает все остальные элементы множества. Таковым, например, является **пузырьковая сортировка**.

<img src="https://i.sstatic.net/XNbE0.gif">

In [12]:
def bubble_sort(nums):

    # Устанавливаем swapped в True, чтобы цикл запустился хотя бы один раз
    swapped = True

    while swapped:
        swapped = False

        # Идем циклом по индексам наших элементов
        for i in range(len(nums) - 1):

            # Если текущий элемент слева больше своего элемента справа
            if nums[i] > nums[i + 1]:

                # Меняем элементы местами
                nums[i], nums[i + 1] = nums[i + 1], nums[i]

                # Устанавливаем swapped в True для следующей итерации
                swapped = True

                # По окончании первого прогона цикла for
                # самый большой элемент "Всплывет" наверх


# Проверяем, что оно работает
random_list_of_nums = [9, 5, 2, 1, 8, 4, 3, 7, 6]
bubble_sort(random_list_of_nums)
print(random_list_of_nums)

[1, 2, 3, 4, 5, 6, 7, 8, 9]


Обратите внимание на циклы: первый цикл перебирает все элементы и второй цикл в худшем случае тоже перебирает все элементы. То есть на каждую из $n$ итераций первого цикла мы сделаем $n$ итераций второго цикла. Комбинаторика говорит нам, что общее количество операций в этом случае равно $n*n$, или $n^2$. 

Оценку $О(n^2)$ будет иметь алгоритм, в котором есть один вложенный цикл. 

## Логарифмическая $О(log(n))$

Оценку $О(log(n))$ чаще всего имеют алгоритмы, которые на каждом шаге работы с данными уменьшают размер этих данных в разы. Мы преимущественно будем иметь дело с основанием логарифма, равным 2, поскольку в компьютерах принята двоичная система счисления, но в общем случае основание может быть любым. 

Классический пример логарифмического алгоритма — **бинарный поиск**. Опишем вкратце его работу: мы делим данные пополам, выбираем ту часть, где должен находиться искомый элемент, и запускаем все заново, пока не найдем нужный элемент.

<img src="https://d18l82el6cdm1i.cloudfront.net/uploads/bePceUMnSG-binary_search_gif.gif">

In [1]:
from random import randint

# Сделали список
a = []
for i in range(15):
    
    # Случайное целое число от 1 до 49 включительно
    a.append(randint(1, 50))

# Отсортировали список
a.sort()

# Распечатали
print(a)

# Вводим с клавиатуры искомое число
value = int(input())

# Индекс середины списка
mid = len(a) // 2

# Индекс начала списка
low = 0

# Индекс конца списка
high = len(a) - 1

# Пока позиция "середины" не равна нашему значению
# и левый конце области, где мы ищем, меньше или равен правому концу:
while a[mid] != value and low <= high:

    # Если наше значение больше значения в центре области поиска:
    if value > a[mid]:
        
        # Начинаем искать в области "справа от середины"
        low = mid + 1
    
    else:
        
        # Иначе начинаем искать в области "слева от середины"
        high = mid - 1
    
    # Середина новой области поиска
    mid = (low + high) // 2

if low > high:
    print("No value")
else:
    print("ID =", mid)

[1, 3, 4, 5, 6, 6, 6, 10, 11, 26, 34, 36, 40, 49, 49]
34
ID = 10


Получается, что в алгоритме бинарного поиска мы каждый раз будем делить наше множество пополам, пока не останется один элемент. Значит, функция, которая будет описывать оценку нашего алгоритма, должна показывать, сколько раз число $n$, которое описывает размер наших данных, можно поделить на 2, или наоборот — в какую степень надо возвести 2, чтобы получилось наше число. Это и есть определение логарифма $log(n)$. 

## Линейно-логарифмическая $О(n * log(n))$

По названию можно догадаться, что алгоритмы подобного рода представляют собой тандем алгоритмов линейной и логарифмической сложностей: в решении будет присутствовать как логарифмический алгоритм, так и линейный. 

Яркий пример такого алгоритма — **быстрая сортировка**. В этом алгоритме мы сначала разбиваем все элементы (логарифмическая часть), а затем отсортированные элементы последовательно соединяем (линейная часть). 

**Алгоритм с оценкой $О(n * log(n))$ считается самым быстрым решением задачи сортировки в общем случае. Быстрее нельзя!**

![QuickSort](https://upload.wikimedia.org/wikipedia/commons/9/9c/Quicksort-example.gif)

И еще:
<img src="https://ronnyml.files.wordpress.com/2009/05/quicksort_tree.jpg">

In [13]:
# Функция принимает на вход список nums
def quicksort(nums):
    
    # Если его длина 0 и 1, возвращает его же - такой список всегда отсортирован :)
    if len(nums) <= 1:
        return nums
    else:
        
        # Если длина > 1 в качестве опорного выбирается случайный элемент из списка
        q = random.choice(nums)
        
        # Создается три списка: 
        # Сюда запишем элементы < q
        s_nums = []
        
        # Сюда запишем элементы > q
        m_nums = []
        
        # Сюда запишем элементы = q
        e_nums = []
        
    # Пишем
    for n in nums:
        if n < q:
            s_nums.append(n)
        elif n > q:
            m_nums.append(n)
        else:
            e_nums.append(n)
            
    # А теперь рекурсивно проделаем ту же процедуру с левым и правым списками: s_nums и m_nums
    return quicksort(s_nums) + e_nums + quicksort(m_nums)

In [15]:
quicksort([1, 2, 3, 4, 9, 6, 7, 5])

[1, 2, 3, 4, 5, 6, 7, 9]

## Модуль timeit

Этот модуль предназначен для оценки производительности небольших фрагментов кода. 

Для этого необходимо импортировать саму библиотеку `timeit` и вызвать из нее метод `.timeit()`, передав ему название нашей функции и количество необходимых повторений.

Рассмотрим следующую задачу конкатенации строк: Составить строку из чисел от 1 до 100, отделив числа друг от друга запятой.

In [3]:
import timeit

# Алгоритм 1
def concat():
    s = ""
    for i in range(100):
        s += str(i) + ","
    s += "100"

# Алгоритм 2
def join():
    s = ",".join(map(str, range(101)))

print(timeit.timeit(concat, number=1000))
print(timeit.timeit(join, number=1000))

0.03369116700014274
0.01715766600000279
