# Алгоритмы

**Алгоpитм** - заранее заданное понятное и точное пpедписание возможному исполнителю совеpшить определенную
последовательность действий для получения решения задачи за конечное число шагов.

Это — не математическое, а логическое определение алгоритма, дающее его содержательно-логическую суть.
Понятие алгоритма, трансформированное для вычислительно- прикладных и теоретико-математических нужд является не только одним из главных понятий математики, но, главное, одним из главных понятий современной науки. Более того, с наступлением информационной эры алгоритмы становятся одним из важнейших факторов развития технологий.

Если говорить нормальным языком, **алгоритм – это пошаговая инструкция**, где результат прошлого шага строго определен и используется в качестве входных данных для следующего шага.

Основные свойства алгоритмов следующие:

1. Реализуемость — исполнитель алгоритма должен "понимать", как его выполнять. Иными словами, имея алгоритм и произвольный вариант исходных данных, исполнитель должен знать, как надо действовать для выполнения этого алгоритма.

2. Дискpетность (прерывность, раздельность) — алгоpитм должен пpедставлять пpоцесс pешения задачи как оследовательное выполнение пpостых (или pанее опpеделенных) шагов (этапов).

3. Опpеделенность — каждое пpавило алгоpитма должно быть четким, однозначным и не оставлять места для пpоизвола. Благодаpя этому свойству выполнение алгоpитма носит механический хаpактеp и не тpебует никаких дополнительных указаний или сведений о pешаемой задаче.

4. Pезультативность (или конечность) состоит в том, что за конечное число шагов алгоpитм либо должен пpиводить к pешению задачи, либо после конечного числа шагов останавливаться из-за невозможности получить решение с выдачей соответствующего сообщения, либо неограниченно продолжаться в течение времени, отведенного для исполнения алгоритма, с выдачей промежуточных результатов.

5. Массовость означает, что алгоpитм pешения задачи pазpабатывается в общем виде, т.е. он должен быть пpименим для некотоpого класса задач, pазличающихся лишь исходными данными. Пpи этом исходные данные могут выбиpаться из некотоpой области, котоpая называется областью пpименимости алгоpитма.

Алгоритмы можно представлять как некоторые структуры, состоящие из отдельных базовых (т.е. основных) элементов.
Логическая структура любого алгоритма может быть представлена комбинацией трех базовых структур:

- следование
- ветвление
- цикл.

Характерной особенностью базовых структур является наличие в них одного входа и одного выхода.

### Оценка сложности алгоритмов

Сложность алгоритмов обычно оценивают по времени выполнения или по используемой памяти. В обоих случаях сложность зависит от размеров входных данных - ***массив из 100 элементов будет обработан быстрее, чем аналогичный из 1000.***

При этом точное время мало кого интересует: оно зависит от процессора, типа данных, языка программирования и множества других параметров. Важна лишь **асимптотическая сложность**, т. е. сложность при стремлении размера входных данных к бесконечности.

Допустим, некоторому алгоритму нужно выполнить **4n 3 + 7n** условных операций, чтобы обработать n элементов входных данных. При увеличении **n**, на итоговое время работы будет **значительно больше влиять возведение n в куб**, чем умножение его на 4 или же прибавление 7n. Тогда говорят, что временная сложность этого алгоритма равна **О(n3 )**, т.е. зависит от размера входных данных кубически.

Использование заглавной буквы **О** (или так называемая **О-нотация**) пришло из математики, где её применяют для сравнения асимптотического поведения функций.

Формально **O(f(n))** означает, что время работы алгоритма (или объём занимаемой памяти) растёт в зависимости от объёма входных данных не быстрее, чем некоторая константа, умноженная на f(n).

**O(n)** — линейная сложность Такой сложностью обладает, например, алгоритм поиска наибольшего элемента в не
отсортированном массиве. Нам придётся пройтись по всем n элементам массива, чтобы понять, какой из них максимальный.

**O(log n)** — логарифмическая сложность Простейший пример — бинарный поиск. Если массив отсортирован, мы можем
проверить, есть ли в нём какое-то конкретное значение, методом деления пополам. Проверим средний элемент, если он больше искомого, то отбросим вторую половину массива — там его точно нет. Если же меньше, то наоборот — отбросим начальную половину. И так будем продолжать делить пополам, в итоге проверим log n элементов.

**O(n2)** — квадратичная сложность. Такую сложность имеет, например, алгоритм сортировки вставками. В канонической
реализации он представляет из себя два вложенных цикла: один, чтобы проходить по
всему массиву, а второй, чтобы находить место очередному элементу в уже отсортированной части. Таким образом, количество операций будет зависеть от размера массива как n * n, т. е. n2.

Также случается, что время работы алгоритма вообще не зависит от размера входных данных. Тогда сложность обозначают как **O(1)**

Графики:
https://media.springernature.com/original/springer-static/image/chp%3A10.1007%2F978-1-4842-3988-9_1/MediaObjects/465726_1_En_1_Fig1_HTML.jpg

Сложность в цифрах
https://thatcomputerscientist.com/big-o-notation-explained-as-easily-as-possible

Таблица
https://tproger.ru/articles/computational-complexity-explained/


### Алгоритм сортировки пузырьком

Сортировка пузырьком (обменная сортировка) – простой в реализации алгоритм сортировки, но в чистом виде на практике используется очень редко. Этот метод сортировки лежит в основе некоторых более совершенных алгоритмов, таких как шейкерная сортировка, пирамидальная сортировка и быстрая сортировка.

Суть алгоритма - соседние элементы последовательности сравниваются между собой и, в случае необходимости, меняются местами.
https://hsto.org/getpro/habr/post_images/187/5a3/929/1875a3929dd14c8ea5ff4ccc3d0db9bd.gif


In [1]:
def bubble_sort(lst: list) -> list:
    """сортировки пузырьком - решение в лоб
    """
    size = len(lst)
    for i in range(size):
        for j in range(size - 1):
            if lst[j] > lst[j + 1]:
                lst[j], lst[j + 1] = lst[j + 1], lst[j]
    return lst


In [2]:
import random
import time
my_list = [random.randint(0, 100) for i in range(100)]
start = time.time()
bubble_sort(my_list)
print(time.time() - start)

0.003596067428588867


In [3]:
my_list = [random.randint(0, 100) for i in range(1000)]
start = time.time()
bubble_sort(my_list)
print(time.time() - start)

0.3841557502746582


In [4]:
def bubble_sort_1(lst: list) -> list:
    """сортировки пузырьком - уменьшение действий
    при необязательных сравнениях
    """
    size = len(lst)
    for i in range(size):
        for j in range(size - 1 - i):
            if lst[j] > lst[j + 1]:
                lst[j], lst[j + 1] = lst[j + 1], lst[j]
    return lst

In [8]:
my_list = [random.randint(0, 100) for i in range(1000)]
lst1 = my_list[:]
start = time.time()
bubble_sort(my_list)
print(time.time() - start)


0.47849106788635254


In [7]:
start = time.time()
bubble_sort_1(lst1)
print(time.time() - start)

0.2035527229309082


In [10]:
def bubble_sort_2(lst: list) -> list:
    """сортировки пузырьком - уменьшение действий
    если массив уже отсортирован
    """
    size = len(lst)
    for i in range(size):
        swap = False
        for j in range(size - 1 - i):
            if lst[j] > lst[j + 1]:
                lst[j], lst[j + 1] = lst[j + 1], lst[j]
                swap = True
        if not swap:
            break
    return lst

In [11]:
my_list = [random.randint(0, 100) for i in range(1000)]
lst1 = my_list[:]
lst2 = my_list[:]


In [12]:
start = time.time()
bubble_sort(my_list)
print(time.time() - start)

0.4157137870788574


In [13]:
start = time.time()
bubble_sort_1(lst1)
print(time.time() - start)

0.2656376361846924


In [14]:
start = time.time()
bubble_sort_2(lst2)
print(time.time() - start)

0.24635529518127441


In [15]:
# Отсортированные данные
start = time.time()
bubble_sort_2(lst2)
print(time.time() - start)

0.0011699199676513672


In [16]:
# Отсортированные данные
start = time.time()
bubble_sort_1(lst1)
print(time.time() - start)

0.17519855499267578


In [17]:
lst3 = list(reversed(lst2))
start = time.time()
bubble_sort_2(lst3)
print(time.time() - start)

0.37165236473083496


В Python встроенный алгоритм сортировки — Timsort.

Виды сортировок: https://neerc.ifmo.ru/wiki/index.php?title=%D0%A1%D0%BE%D1%80%D1%82%D0%B8%D1%80%D0%BE%D0%B2%D0%BA%D0%B8
Визуализация алгоритмов сортировки: https://www.youtube.com/watch?v=Gnp8G1_kO3I

### Алгоритм линейного поиска
Суть алгоритма заключается в том, чтобы перебрать массив и вернуть индекс первого вхождения элемента, когда он найден

In [18]:
from typing import Union, List

def linear_search(lst: List, element: Union[int, float]) -> int:
    """  Линейный поиск    """
    for i in range(len(lst)):
        if lst[i] == element:
            return i
    return -1

In [19]:
print(linear_search([1, 2, 3, 4, 5, 2, 1], 2))

1


In [20]:
print(linear_search([1, 2, 3, 4, 5, 2, 1], 22))

-1


### Бинарный поиск

Бинарный поиск работает по принципу «разделяй и властвуй». Он быстрее, чем линейный поиск, но требует, чтобы массив был отсортирован перед выполнением алгоритма.

Предполагая, что мы ищем значение val в отсортированном массиве, алгоритм сравнивает val со значением среднего элемента массива, который мы будем называть mid.

Если mid — это тот элемент, который мы ищем (в лучшем случае), мы возвращаем его индекс.

Если нет, мы определяем, в какой половине массива мы будем искать val дальше, основываясь на том, меньше или больше значение val значения mid, и отбрасываем вторую половину массива.

Затем мы выполняем те же шаги, выбирая новое значение для mid, сравнивая его с val и отбрасывая половину массива на каждой итерации алгоритма.

In [21]:

def binary_search(lst: List, val: Union[int, float]):
    """    Бинарный поиск     """
    first = 0
    last = len(lst)-1
    index = -1
    while (first <= last) and (index == -1):
        mid = (first + last) // 2
        if lst[mid] == val:
            index = mid
        else:
            if val < lst[mid]:
                last = mid - 1
            else:
                first = mid + 1
    return index

In [25]:
my_list = [random.randint(0, 20000) for i in range(10000)]
lst1 = my_list[:]
my_list.sort()
start = time.time()
res = binary_search(my_list, 15000)
print(time.time() - start)

0.0002644062042236328


In [23]:
start = time.time()
res = linear_search(my_list, 15000) # Отсортированный список
print(time.time() - start)

0.0016303062438964844


In [26]:
start = time.time()
res = linear_search(lst1, 15000) # Неотсортированный
print(time.time() - start)

0.008376359939575195


In [27]:
start = time.time()
res = linear_search(my_list, 25000) # Отсутствующий элемент
print(time.time() - start)

0.027322769165039062


In [28]:
start = time.time()
res = binary_search(my_list, 25000) # Отсутствующий элемент
print(time.time() - start)

0.00016641616821289062


https://edx.prometheus.org.ua/courses/KPI/Algorithms101/2015_Spring/about
