# Алгоритми

**Алгоритм** - заздалегідь задане зрозуміле і точний припис можливому виконавцю зробити певну послідовність дій для одержання розв'язання задачі за кінцеве число кроків.

Це не математичне, а логічне визначення алгоритму, що дає його змістовно-логічну суть.
Поняття алгоритму, трансформоване для обчислювально-прикладних і теоретико-математичних потреб не лише однією з головних понять математики, але, головне, однією з головних понять сучасної науки. Більше того, з настанням інформаційної ери алгоритми стають одним із найважливіших факторів розвитку технологій.

Якщо говорити нормальною мовою, **алгоритм – це покрокова інструкція**, де результат минулого кроку суворо визначений і використовується як вхідні дані для наступного кроку.

Основні властивості алгоритмів такі:

1. Реалізованість - виконавець алгоритму повинен "розуміти", як його виконувати. Іншими словами, маючи алгоритм та довільний варіант вихідних даних, виконавець повинен знати, як треба діяти для виконання цього алгоритму.

2. Дискретність (перервність, роздільність) - алгоритм повинен представляти процес вирішення задачі як послідовне виконання простих (або раніше визначених) кроків (етапів).

3. Визначеність - кожне правило алгоритму має бути чітким, однозначним і не залишати місця для свавілля. Завдяки цій властивості виконання алгоритму носить механічний характер і не вимагає ніяких додаткових вказівок або відомостей про вирішувану задачу.

4. Результативність (або кінцівка) полягає в тому, що за кінцеве число кроків алгоритм або повинен призводити до вирішення завдання, або після кінцевого числа кроків зупинятися через неможливість отримати рішення з видачею відповідного повідомлення, або необмежено продовжуватися протягом часу, відведеного для виконання алгоритму з видачею проміжних результатів.

5. Масовість означає, що алгоритм вирішення завдання розробляється у загальному вигляді, тобто. він повинен бути застосований для деякого класу завдань, що відрізняються лише вихідними даними. При цьому вихідні дані можуть вибиратися з деякої області, яка називається областю прийнятності алгоритму.

Алгоритм можна уявити у вигляді деяких структур, які складаються з окремих елементів.
Логічна структура будь-якого алгоритму може бути представлена комбінацією трьох базових структур:

- слідування
- розгалуження
- Цикл.

Характерною особливістю базових структур є наявність у них одного входу та одного виходу.

### Оцінка складності алгоритмів

Складність алгоритмів зазвичай оцінюють за часом виконання або використовуваної пам'яті. В обох випадках складність залежить від розмірів вхідних даних - ***масив із 100 елементів буде оброблений швидше, ніж аналогічний із 1000.***

При цьому точний час мало кого цікавить: він залежить від процесора, типу даних, мови програмування та багатьох інших параметрів. Важлива лише асимптотична складність, тобто складність при прагненні розміру вхідних даних до нескінченності.

Припустимо, деякому алгоритму потрібно виконати 4n 3 + 7n умовних операцій, щоб обробити n елементів вхідних даних. При збільшенні **n**, на підсумковий час роботи буде значно більше впливати зведення n в куб**, ніж множення його на 4 або додаток 7n. Тоді стверджують, що тимчасова складність цього алгоритму дорівнює **О(n3 )**, тобто. залежить від розміру вхідних даних кубічно.

Використання великої літери **О** (або так звана **О-нотація**) прийшло з математики, де її застосовують для порівняння асимптотичної поведінки функцій.

Формально **O(f(n))** означає, що час роботи алгоритму (або обсяг займаної пам'яті) зростає залежно від обсягу вхідних даних не швидше ніж деяка константа, помножена на f(n).

**O(n)** — лінійна складність Такою складністю володіє, наприклад, алгоритм пошуку найбільшого елемента в не
відсортований масив. Нам доведеться пройтися всіма n елементами масиву, щоб зрозуміти, який з них максимальний.

**O(log n)** — логарифмічна складність Найпростіший приклад — бінарний пошук. Якщо масив відсортований, ми можемо
перевірити, чи є у ньому якесь конкретне значення, шляхом розподілу навпіл. Перевіримо середній елемент, якщо він більше за шуканий, то відкинемо другу половину масиву — там його точно немає. Якщо ж менше, то, навпаки, відкинемо початкову половину. І так продовжуватимемо ділити навпіл, у результаті перевіримо log n елементів.

**O(n2)** — квадратична складність. Таку складність має, наприклад, алгоритм сортування вставками. У канонічній
реалізації він представляє собою два вкладені цикли: один, щоб проходити по
всьому масиву, а другий, щоб знаходити місце черговому елементу вже відсортованої частини. Таким чином, кількість операцій залежатиме від розміру масиву як n*n, тобто n2.

Також трапляється, що час роботи алгоритму взагалі не залежить від розміру вхідних даних. Тоді складність позначають як **O(1)**

Графіки:
https://media.springernature.com/original/springer-static/image/chp%3A10.1007%2F978-1-4842-3988-9_1/MediaObjects/465726_1_En_1_Fig1_HTML.jpg

Таблиця
https://tproger.ru/articles/computational-complexity-explained/


### Алгоритм сортування бульбашкою

Сортування бульбашкою (обмінне сортування) – простий у реалізації алгоритм сортування, але у чистому вигляді практично використовується дуже рідко. Цей метод сортування лежить в основі деяких досконаліших алгоритмів, таких як шейкерне сортування, пірамідальне сортування та швидке сортування.

Суть алгоритму - сусідні елементи послідовності порівнюються між собою і, у разі потреби, змінюються місцями.
https://hsto.org/getpro/habr/post_images/187/5a3/929/1875a3929dd14c8ea5ff4ccc3d0db9bd.gif


In [None]:
def bubble_sort(lst: list) -> list:
    """сортування бульбашкою - не найкраще рішення
    """
    size = len(lst)
    for i in range(size):
        for j in range(size - 1):
            if lst[j] > lst[j + 1]:
                lst[j], lst[j + 1] = lst[j + 1], lst[j]
    return lst


In [None]:
# Зробимо виміри часу роботи
import random
import time
my_list = [random.randint(0, 100) for i in range(100)]
start = time.time()
bubble_sort(my_list)
print(time.time() - start)

In [None]:
#При збільшенні розміру в 10 разів, час роботи збільшився в 100
my_list = [random.randint(0, 100) for i in range(1000)]
start = time.time()
bubble_sort(my_list)
print(time.time() - start)
#Асимптотична складність n у квадраті: 10 * 10 = 100

In [None]:
def bubble_sort_1(lst: list) -> list:
    """сортування бульбашкою - зменшення дій
     при необов'язкових порівняннях
    """
    size = len(lst)
    for i in range(size):
        for j in range(size - 1 - i):
            if lst[j] > lst[j + 1]:
                lst[j], lst[j + 1] = lst[j + 1], lst[j]
    return lst

In [None]:
#Перший варіант реалізації - ті ж показники
my_list = [random.randint(0, 100) for i in range(1000)]
lst1 = my_list[:]
start = time.time()
bubble_sort(my_list)
print(time.time() - start)


In [None]:
# Покращений варіант реалізації - результат трохи кращий. Але не принципово
start = time.time()
bubble_sort_1(lst1)
print(time.time() - start)

In [None]:
def bubble_sort_2(lst: list) -> list:
    """сортування бульбашкою - зменшення дій
     якщо масив вже відсортовано
    """
    size = len(lst)
    for i in range(size):
        swap = False # введемо додатковий параметр
        for j in range(size - 1 - i):
            if lst[j] > lst[j + 1]:
                lst[j], lst[j + 1] = lst[j + 1], lst[j]
                swap = True # Якщо була хоча б одна перестановка, значення зміниться на протилежне
        if not swap:
            break # якщо перестановок не було, вихід із циклу
    return lst

In [None]:
# 3 однакові копії
my_list = [random.randint(0, 100) for i in range(1000)]
lst1 = my_list[:]
lst2 = my_list[:]


##### Усі 3 реалізації покажуть порівнянний час роботи

In [None]:
start = time.time()
bubble_sort(my_list)
print(time.time() - start)

In [None]:
start = time.time()
bubble_sort_1(lst1)
print(time.time() - start)

In [None]:
start = time.time()
bubble_sort_2(lst2)
print(time.time() - start)

##### Але якщо дані будуть відсортовані, то реалізація з додатковим параметром буде кардинально швидше

In [None]:
# Відсортовані дані
start = time.time()
bubble_sort_2(lst2)
print(time.time() - start)

In [None]:
# Відсортовані дані
start = time.time()
bubble_sort_1(lst1)
print(time.time() - start)

##### Але якщо дані відсортовані у зворотному напрямку, то час роботи буде схожим з іншими реалізаціями

In [None]:
lst3 = list(reversed(lst2))
start = time.time()
bubble_sort_2(lst3)
print(time.time() - start)

#### Тобто, при оцінці складності алгоритму, прийнято говорити про найкращий варіант, середній і найгірший варіант.
Для реалізації алгоритму сортування бульбашкою в функції bubble_sort_2 – найкращий варіант це **O(n)**, найгірший варіант – **O(n2)**. Середній, те саме, що й найгірший

У Python для сортування списків використовується алгоритм сортування - Timsort.

Види сортувань: https://neerc.ifmo.ru/wiki/index.php?title=%D0%A1%D0%BE%D1%80%D1%82%D0%B8%D1%80%D0%BE%D0%B2%D0%BA%D0%B8

Візуалізація алгоритмів сортування: https://www.youtube.com/watch?v=Gnp8G1_kO3I

### Алгоритм лінійного пошуку
Суть алгоритму полягає в тому, щоб перебрати масив та повернути індекс першого входження елемента, коли він знайдений

In [None]:
from typing import Union, List

def linear_search(lst: List, element: Union[int, float]) -> int:
    """  Лінійний пошук  O(n)  """
    for i in range(len(lst)):
        if lst[i] == element:
            return i
    return -1

In [None]:
# Пошук існуючого елемента у списку
print(linear_search([1, 2, 3, 4, 5, 2, 1], 2))

In [None]:
# Пошук елемента, якого немає у списку
print(linear_search([1, 2, 3, 4, 5, 2, 1], 22))

### Бінарний пошук

Бінарний пошук працює за принципом «розділяй і володарюй». Він швидший, ніж лінійний пошук, але вимагає, щоб масив був відсортований перед виконанням алгоритму.

Припускаючи, що ми шукаємо значення val у відсортованому масиві, алгоритм порівнює val зі значенням середнього елемента масиву, який ми називатимемо mid.

Якщо mid це той елемент, який ми шукаємо (у кращому випадку), ми повертаємо його індекс.

Якщо ні, ми визначаємо, в якій половині масиву ми шукатимемо val далі, ґрунтуючись на тому, менше або більше значення val значення mid, і відкидаємо другу половину масиву.

Потім ми виконуємо самі кроки, вибираючи нове значення для mid, порівнюючи його з val і відкидаючи половину масиву кожної ітерації алгоритму.

In [None]:

def binary_search(lst: List, val: Union[int, float]):
    """    Бінарний пошук   O(log n)  """
    first = 0
    last = len(lst)-1
    index = -1
    while (first <= last) and (index == -1): # Поки є умови для пошуку
        mid = (first + last) // 2
        if lst[mid] == val: # Якщо знайшли потрібний елемент
            index = mid
        else:
            # Визначаємо в якій частині потрібно шукати
            if val < lst[mid]: 
                last = mid - 1
            else:
                first = mid + 1
    return index

#### Проведемо порівняння часу виконання для різних алгоритмів

In [None]:
my_list = [random.randint(0, 20000) for i in range(10000)]
lst1 = my_list[:]
my_list.sort()
start = time.time()
res = binary_search(my_list, 10000)
print(time.time() - start)

##### Подивимось на результати лінійного пошуку для відсортованого та невідсортованого списків

In [None]:
start = time.time()
res = linear_search(my_list, 10000) #відсортований список
print(time.time() - start)

In [None]:
# невідсортований список
start = time.time()
res = linear_search(lst1, 15000) # Для невідсортованого списку результат дуже залежить від випадковості.
print(time.time() - start)

##### Пошук відсутнього елемента

In [None]:
# При лінійному пошуку, потрібно пройтися всіма елементами списку від початку і до кінця.
start = time.time()
res = linear_search(my_list, 25000) 
print(time.time() - start)

In [None]:
# Час пошуку відсутнього елемента для бінарного пошуку, не сильно відрізняється від часу пошуку елемента, який є у списку
start = time.time()
res = binary_search(my_list, 25000) 
print(time.time() - start)

Рекомендую дуже хороший курс з алгоритмів на платформі Прометеус
https://edx.prometheus.org.ua/courses/KPI/Algorithms101/2015_Spring/about
