# <center> Практична робота №3 </center>
## Тема: 
### Алгоритми сортування та їх складність. Порівняння алгоритмів сортування*
## Мета: 
### Oпанувати основні алгоритми сортування та навчитись методам аналізу їх асимптотичної складності.

## <center> Хід роботи </center>

## 1) Вивчити самостійно і записати (будь-яким способом) алгоритм бульбашкового сортування. Оцінити асимптотику алгоритму сортування методом бульбашки в найгіршому і в найкращому випадку. Порівняти за цими показниками бульбашковий алгоритм з алгоритмом сортування вставлянням. Чому на практиці бульбашковий алгоритм виявляється менш ефективним у порівнянні з сортуванням методом зливанням?

In [1]:
def bubble_sort(arr):
    n = len(arr)
    # Проходимо по всьому списку
    for i in range(n):
        # Останні i елементи вже відсортовані
        for j in range(0, n - i - 1):
            # Якщо поточний елемент більший за наступний, міняємо їх місцями
            if arr[j] > arr[j + 1]:
                arr[j], arr[j + 1] = arr[j + 1], arr[j]
    return arr

# Приклад використання
unsorted_list = [64, 34, 25, 12, 22, 11, 90]
sorted_list = bubble_sort(unsorted_list)
print("Відсортований список:", sorted_list)


Відсортований список: [11, 12, 22, 25, 34, 64, 90]


### Оцінка асимптотики

**Найгірший випадок**:
У найгіршому випадку елементи списку впорядковані у зворотному порядку. 
На кожній ітерації внутрішнього циклу здійснюється $n - i - 1$ порівнянь, де $i$ змінюється від $0$ до $n-1$. Загальна кількість операцій пропорційна $n \cdot (n-1) / 2$, що дає асимптотичну оцінку:
$$
O(n^2)
$$

**Найкращий випадок**:
У найкращому випадку список вже відсортований, і жодних обмінів не відбувається. Якщо алгоритм реалізований з оптимізацією для перевірки, чи були обміни, тоді після першої ітерації він завершиться:
$$
O(n)
$$

**Середній випадок**:
Для випадкових списків кількість порівнянь та обмінів також буде пропорційна $n^2$:
$$
O(n^2)
$$

---

### Порівняння асимптотики

| **Алгоритм**        | **Найгірший випадок** | **Найкращий випадок** | **Середній випадок** |
|----------------------|-----------------------|------------------------|-----------------------|
| Бульбашкове сортування | $O(n^2)$             | $O(n)$                | $O(n^2)$             |
| Сортування вставляння | $O(n^2)$             | $O(n)$                | $O(n^2)$             |

#### Основні відмінності:
1. **Продуктивність на практиці**:
   - Бульбашкове сортування виконує більше операцій обміну, що робить його менш ефективним.
   - Сортування вставлянням має перевагу, оскільки мінімізує кількість обмінів, виконуючи їх лише тоді, коли це необхідно.

2. **Оптимізація найкращого випадку**:
   - Обидва алгоритми досягають $O(n)$ у найкращому випадку, але сортування вставлянням виконується швидше через простіший механізм порівнянь і переміщень.

---

### Причини меншої ефективності

1. **Асимптотика**:
   - Бульбашкове сортування має найгіршу асимптотику $O(n^2)$ для будь-якого випадку, окрім найкращого.
   - Сортування злиттям гарантує асимптотику $O(n \log n)$ навіть у найгіршому випадку.

2. **Кількість обмінів**:
   - У бульбашковому сортуванні кожен обмін потребує трьох операцій присвоєння, що значно сповільнює алгоритм.
   - У злитті жодних обмінів не відбувається; елементи просто копіюються у допоміжні масиви.

3. **Паралельність**:
   - Сортування злиттям легко оптимізувати для паралельного виконання, оскільки кожен етап ділиться на незалежні підзадачі.
   - Бульбашкове сортування має послідовну природу, що ускладнює його паралелізацію.

4. **Пам'ять**:
   - Сортування злиттям потребує додаткової пам'яті $O(n)$, але це компенсується його швидкістю.
   - Бульбашкове сортування працює "на місці", але через низьку ефективність це рідко дає перевагу.

---

## 2) Оцінити асимптотичну складність алгоритму сортування зливанням, скориставшись основною теоремою рекурсії

### Алгоритм сортування злиттям працює за принципом "розділяй і володарюй". Рекурсивно розбиваючи масив на дві половини, він потім об'єднує їх у впорядкований масив.  

#### Рекурентне співвідношення

Нехай $T(n)$ — час виконання сортування масиву розміру $n$. Тоді алгоритм має таке рекурентне співвідношення:
$$
T(n) = 2T\left(\frac{n}{2}\right) + O(n),
$$
де:
- $2T\left(\frac{n}{2}\right)$ — сортування двох половин масиву,
- $O(n)$ — злиття двох відсортованих половин у єдиний масив.

#### Розв'язання за основною теоремою рекурсії

Основна теорема рекурсії стверджує, що для співвідношення виду:
$$
T(n) = aT\left(\frac{n}{b}\right) + O(n^d),
$$
асимптотична складність залежить від порівняння $d$ і $\log_b a$:
1. Якщо $d < \log_b a$, то $T(n) = O(n^{\log_b a})$.
2. Якщо $d = \log_b a$, то $T(n) = O(n^d \log n)$.
3. Якщо $d > \log_b a$, то $T(n) = O(n^d)$.

У нашому випадку:
- $a = 2$ (дві половини масиву),
- $b = 2$ (масив ділиться на 2),
- $d = 1$ (лінійна складність злиття двох половин).

Розрахуємо $\log_b a$:
$$
\log_2 2 = 1.
$$
Отже, $d = \log_2 a$. Згідно з теоремою, асимптотична складність:
$$
T(n) = O(n \log n).
$$

#### Висновок

Сортування злиттям має асимптотичну складність:
- У найгіршому випадку: $O(n \log n)$.
- У найкращому випадку: також $O(n \log n)$, адже незалежно від початкового порядку елементів, усі етапи злиття виконуються.


## 3) Вивчити і записати (будь-яким способом) самостійно алгоритм швидкого сортування. Оцінити асимптотичну складність алгоритму швидкого сортування, скориставшись основною теоремою рекурсії

In [8]:
def quicksort(arr):
    if len(arr) <= 1:
        return arr  # База рекурсії
    pivot = arr[len(arr) // 2]  # Вибір опорного елемента
    left = [x for x in arr if x < pivot]  # Елементи, менші за опорний
    middle = [x for x in arr if x == pivot]  # Елементи, рівні опорному
    right = [x for x in arr if x > pivot]  # Елементи, більші за опорний
    return quicksort(left) + middle + quicksort(right)

# Приклад використання
unsorted_list = [10, 7, 8, 9, 1, 5]
sorted_list = quicksort(unsorted_list)
print("Відсортований список:", sorted_list)


Відсортований список: [1, 5, 7, 8, 9, 10]


# Алгоритм швидкого сортування (Quick Sort)

### Рекурентне співвідношення для швидкого сортування

У швидкому сортуванні масив ділиться на дві частини на основі опорного елемента. Потім обидві частини сортуються рекурсивно. 

Рекурентне співвідношення виглядає так:
$$
T(n) = T(k) + T(n - k - 1) + O(n),
$$
де:
- $T(k)$ і $T(n - k - 1)$ — сортування двох частин масиву,
- $O(n)$ — розбиття масиву (partitioning) навколо опорного елемента.

#### Найгірший випадок
У найгіршому випадку вибір опорного елемента є невдалим (наприклад, мінімальний або максимальний елемент), що дає розбиття на масиви розмірів $1$ і $n-1$. Рекурентне співвідношення:
$$
T(n) = T(n-1) + O(n).
$$
Розв'язуючи це співвідношення, отримаємо:
$$
T(n) = O(n^2).
$$

#### Найкращий випадок
У найкращому випадку масив ділиться на дві рівні частини. Тоді рекурентне співвідношення стає:
$$
T(n) = 2T\left(\frac{n}{2}\right) + O(n).
$$
За основною теоремою рекурсії:
- $a = 2$, $b = 2$, $d = 1$.
- $\log_b a = \log_2 2 = 1$.
Оскільки $d = \log_b a$, отримуємо:
$$
T(n) = O(n \log n).
$$

#### Середній випадок
Для випадкових даних середній розмір частин, на які ділиться масив, близький до рівних. Тому складність також:
$$
T(n) = O(n \log n).
$$

---

### Порівняння найгіршого, найкращого і середнього випадків

| **Випадок**         | **Складність** |
|----------------------|----------------|
| Найгірший            | $O(n^2)$       |
| Найкращий            | $O(n \log n)$  |
| Середній             | $O(n \log n)$  |




# <center> Контрольні питання </center>


## 1) Що таке асимптотична складність алгоритму сортування і чому вона важлива для порівняння алгоритмів?

### Що таке асимптотична складність алгоритму сортування і чому вона важлива для порівняння алгоритмів?
Асимптотична складність алгоритму сортування — це математична оцінка швидкості роботи алгоритму залежно від розміру вхідних даних $n$. Вона показує, як кількість операцій (або ресурсів, що використовуються алгоритмом) змінюється при збільшенні $n$. Асимптотична складність зазвичай записується в нотації $O$ («О велике»), наприклад: $O(n^2)$, $O(n \log n)$ тощо.

### Чому це важливо?
Порівняння продуктивності: Складність дозволяє об'єктивно порівняти різні алгоритми. Наприклад, $O(n^2)$ алгоритм при великих $n$ буде значно повільнішим, ніж $O(n \log n)$.
Передбачуваність: Дає змогу оцінити, як алгоритм поводитиметься при різних обсягах даних.
Вибір оптимального алгоритму: Для великих наборів даних алгоритми з меншою асимптотичною складністю є більш ефективними.

## 2) Які алгоритми сортування мають квадратичну складність у найгіршому випадку? Поясніть, чому це може бути проблемою для великих обсягів даних.

### Приклади алгоритмів:
Бульбашкове сортування: $O(n^2)$ у найгіршому випадку через велику кількість порівнянь і обмінів.
Сортування вибором: $O(n^2)$, оскільки на кожному кроці потрібно знайти мінімальний елемент у невідсортованій частині масиву.
Сортування вставлянням: $O(n^2)$, якщо дані впорядковані у зворотному порядку.
### Чому це проблема для великих обсягів даних?
Повільність: Час виконання зростає квадратично зі збільшенням $n$. Для великих наборів даних (наприклад, $n = 10^6$) ці алгоритми стають непрактичними.
Велика кількість операцій: Вони виконують надмірну кількість порівнянь і обмінів, що збільшує витрати часу й ресурсів.
Обмежена масштабованість: Алгоритми з $O(n^2)$ стають неефективними для великих $n$ навіть на потужному обладнанні.

## 3) В чому полягає перевага сортування злиттям над сортуванням вставками для великих наборів даних?


## Перевага сортування злиттям над сортуванням вставками для великих наборів даних

### Асимптотична складність:

Сортування злиттям: $O(n \log n)$.
Сортування вставлянням: $O(n^2)$ у найгіршому випадку. Для великих $n$ логарифмічна складова робить сортування злиттям значно швидшим.
### Обробка великих наборів даних:

Сортування злиттям ефективно працює з великими обсягами даних, оскільки поділяє масив на менші підмасиви, які потім об'єднуються.
Сортування вставлянням виконує багато операцій порівняння й переміщення для кожного елемента, що уповільнює його роботу.
### Стабільність продуктивності:

У сортуванні вставлянням продуктивність різко погіршується при погано впорядкованих даних.
У сортуванні злиттям продуктивність однакова для всіх випадків ($O(n \log n)$).
### Розширення та паралелізація:

Сортування злиттям легко оптимізується для багатопотокової обробки, розподіляючи підмасиви між процесами.
Сортування вставлянням є послідовним, тому складно масштабувати.

## 4) Які алгоритми сортування використовуються для сортування списків у стандартних бібліотеках мов програмування, таких як Python, Java або C++?

## Алгоритми сортування в стандартних бібліотеках мов програмування

### Python
Python використовує алгоритм Timsort, який є комбінацією сортування вставками та сортування злиттям.
Особливості Timsort:
Оптимізований для реальних даних, які часто містять частково відсортовані послідовності.
Має найгіршу складність $O(n \log n)$ та найкращу $O(n)$.
### Java
Java (починаючи з Java 7) використовує:
Для масивів Dual-Pivot Quicksort (двовісне швидке сортування), яке є модифікацією швидкого сортування.
Для списків (List) — Timsort.
### C++
У стандартній бібліотеці C++ (std::sort) зазвичай використовується Introsort.
Особливості Introsort:
Комбінація швидкого сортування, сортування злиттям і сортування купою.
Переходить від швидкого сортування до сортування купою у найгірших випадках для забезпечення $O(n \log n)$.

## 5) Яка різниця між алгоритмами сортування злиттям і швидким сортуванням? У яких випадках краще використовувати кожен з цих алгоритмів?

#### Порівняння алгоритмів:

| **Характеристика**            | **Сортування злиттям**          | **Швидке сортування**            |
|--------------------------------|---------------------------------|-----------------------------------|
| **Асимптотика**                | $O(n \log n)$ (усі випадки)     | $O(n \log n)$ (середній), $O(n^2)$ (найгірший) |
| **Принцип роботи**             | Рекурсивний поділ і злиття      | Рекурсивний поділ навколо опорного елемента |
| **Стабільність**               | Стабільний                     | Нестабільний                     |
| **Використання пам’яті**       | Додаткова пам’ять $O(n)$        | Додаткова пам’ять $O(\log n)$ (рекурсія) |
| **Продуктивність на практиці** | Повільніший на реальних даних   | Дуже швидкий у середньому випадку |

#### Відмінності в деталях:

1. **Асимптотика**:
   - У сортуванні злиттям асимптотична складність завжди $O(n \log n)$, незалежно від розподілу даних.
   - У швидкому сортуванні складність у середньому випадку також $O(n \log n)$, але у найгіршому — $O(n^2)$ (наприклад, якщо дані впорядковані).

2. **Стабільність**:
   - Сортування злиттям є **стабільним** алгоритмом, тобто зберігає порядок рівних елементів.
   - Швидке сортування є **нестабільним**.

3. **Використання пам’яті**:
   - Сортування злиттям потребує додаткової пам'яті $O(n)$ для збереження проміжних результатів.
   - Швидке сортування використовує лише $O(\log n)$ додаткової пам’яті для рекурсії.

4. **Реальна продуктивність**:
   - Швидке сортування зазвичай працює швидше на практиці, оскільки має низькі константи та краще використовує кешування.

---

#### У яких випадках краще використовувати кожен алгоритм?

1. **Сортування злиттям**:
   - Якщо необхідна **стабільність** (наприклад, при сортуванні записів із збереженням порядку).
   - Для **великих наборів даних**, коли потрібна гарантована продуктивність $O(n \log n)$ у всіх випадках.
   - Якщо дані зберігаються в списках, а не масивах (підходить через ефективність роботи зі списками).

2. **Швидке сортування**:
   - Якщо важлива **швидкість** і дані знаходяться в пам'яті (масиви).
   - Для **випадкових або частково впорядкованих даних**, де ймовірність найгіршого випадку мала.
   - Коли немає вимоги до стабільності сортування.


## **6)** Які фактори слід враховувати при виборі алгоритму сортування для конкретної задачі?

## Розмір даних:

Для малих обсягів даних підійдуть прості алгоритми, як-от сортування вставками ($O(n^2)$), через їхню низьку константу.
Для великих наборів даних краще обирати алгоритми $O(n \log n)$ (сортування злиттям, швидке сортування, Introsort).
## Вимоги до стабільності:

Якщо важливо зберегти порядок рівних елементів, вибирайте стабільні алгоритми (Timsort, сортування злиттям).
## Тип даних і структура зберігання:

Для масивів ефективніше працюють швидке сортування або Introsort.
Для списків краще використовувати сортування злиттям, оскільки його можна реалізувати без випадкових доступів.
## Обмеження пам’яті:

Якщо додаткова пам’ять обмежена, вибирайте алгоритми, які працюють у межах $O(1)$ додаткової пам’яті (швидке сортування, Introsort).
## Характеристика даних:

Якщо дані частково відсортовані, підійде Timsort або сортування вставками.
Якщо дані можуть мати багато однакових елементів, швидке сортування з випадковим вибором опорного елемента (Randomized Quicksort) є ефективним.
## Практична продуктивність:

Для реальних задач важливо враховувати не лише асимптотику, але й константи в часі виконання, оптимізації кешу, а також реальну поведінку на тестових наборах.