# Лабораторна робота № 3
## Тема: Аналіз складності алгоритмів. Алгоритми сортування

**Мета:** засвоїти аналіз складності алгоритмів як технологію на прикладі алгоритмів сортування методами включення та обміну.

## Вступ

Аналіз складності алгоритмів є ключовим аспектом розробки ефективних програм. У цій лабораторній роботі ми зосередимось на вивченні та порівнянні часової складності двох популярних алгоритмів сортування: методом вставляння (insertion sort) та методом бульбашки (bubble sort).

**Після виконання роботи ми будемо вміти:**
* Виконувати асимптотичний аналіз складності алгоритмів
* Досліджувати часову складність алгоритмів емпіричним способом за допомогою Python
* Вибирати оптимальний алгоритм для різних умов
* Генерувати випадкові послідовності чисел засобами Python
* Будувати графіки за допомогою бібліотеки matplotlib

## Хід роботи

### 1. Теоретичний аналіз складності алгоритмів сортування

#### 1.1 Аналіз складності алгоритму сортування методом вставляння (insertion sort)

Алгоритм сортування методом вставляння працює за принципом послідовного додавання елементів до відсортованої частини масиву.

**Асимптотична складність:**
- Найкращий випадок: O(n) - коли масив уже відсортований
- Середній випадок: O(n²)
- Найгірший випадок: O(n²) - коли масив відсортований у зворотному порядку

Для масиву розміром n, алгоритм виконує приблизно n²/4 порівнянь та n²/4 обмінів у середньому випадку.

#### 1.2 Аналіз складності алгоритму сортування методом бульбашки (bubble sort)

Алгоритм сортування методом бульбашки працює шляхом багаторазового проходження через масив і обміну сусідніх елементів, якщо вони розташовані в неправильному порядку.

**Асимптотична складність:**
- Найкращий випадок: O(n) - з оптимізацією раннього завершення
- Середній випадок: O(n²)
- Найгірший випадок: O(n²)

Для масиву розміром n, алгоритм виконує n(n-1)/2 порівнянь у найгіршому випадку.

### 2. Імплементація алгоритмів сортування на Python

#### 2.1 Алгоритм сортування методом вставляння

In [None]:
def insertion_sort(nums):
    # починаємо з другого елемента
    for j in range(1, len(nums)):
        key = nums[j]
        # Зберігаємо посилання на індекс першого елемента
        i = j - 1
        # Елементи відсортованого сегрмента переміщуємо вперед, якщо вони більше елемента вставки
        while i >= 0 and nums[i] > key:
            nums[i + 1] = nums[i]
            i -= 1
        # Вставляємо елемент
        nums[i + 1] = key
    return nums

#### 2.2 Алгоритм сортування методом бульбашки

In [None]:
def bubble_sort(nums):
    n = len(nums)
    # Проходимо по всіх елементах масиву
    for i in range(n):
        swapped = False
        # Останні i елементів уже на своїх місцях
        for j in range(0, n-i-1):
            # Проходимо по масиву від 0 до n-i-1
            # Якщо поточний елемент більший за наступний, міняємо їх місцями
            if nums[j] > nums[j+1]:
                nums[j], nums[j+1] = nums[j+1], nums[j]
                swapped = True
        # Якщо внутрішній цикл не виконав жодного обміну, масив відсортований
        if not swapped:
            break
    return nums

### 3. Емпіричне дослідження часової складності алгоритмів

In [None]:
import time
import random
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline

In [None]:
def measure_time(sort_function, array):
    # Створюємо копію масиву, щоб не змінювати оригінал
    arr_copy = array.copy()
    # Вимірюємо час виконання
    start_time = time.time()
    sort_function(arr_copy)
    end_time = time.time()
    return end_time - start_time

In [None]:
# Розміри масивів для тестування
sizes = [5, 10, 50, 100, 500, 1000, 2000, 3000, 4000, 5000, 10000]

# Для більших розмірів масивів (20000, 50000, 100000) потрібно більше часу на виконання
# Тому їх додамо окремо для сортування методом вставки
large_sizes = sizes + [20000, 50000]

# Словники для збереження результатів
insertion_times = {}
bubble_times = {}

# Тестування для різних розмірів масивів
for size in large_sizes:
    # Генеруємо випадковий масив чисел
    random_array = [random.randint(-1000, 1000) for _ in range(size)]
    
    # Вимірюємо час сортування методом вставки
    insertion_times[size] = measure_time(insertion_sort, random_array)
    
    # Для бульбашкового сортування використовуємо тільки менші масиви,
    # так як він значно повільніший
    if size <= 10000:
        bubble_times[size] = measure_time(bubble_sort, random_array)
    
    print(f"Розмір масиву: {size}")
    print(f"Час сортування методом вставки: {insertion_times[size]:.6f} сек.")
    if size <= 10000:
        print(f"Час сортування методом бульбашки: {bubble_times[size]:.6f} сек.")
    print("---")

### 4. Побудова графіків залежності часу виконання від розміру масиву

In [None]:
# Підготовка даних для побудови графіків
sizes_common = list(sizes)
insertion_times_common = [insertion_times[size] for size in sizes_common]
bubble_times_common = [bubble_times[size] for size in sizes_common]

# Графік 1: порівняння обох алгоритмів на спільних розмірах масивів
plt.figure(figsize=(12, 6))
plt.plot(sizes_common, insertion_times_common, 'b-o', label='Insertion Sort')
plt.plot(sizes_common, bubble_times_common, 'r-o', label='Bubble Sort')
plt.xlabel('Розмір масиву (n)')
plt.ylabel('Час виконання (секунди)')
plt.title('Порівняння часу виконання алгоритмів сортування')
plt.legend()
plt.grid(True)
plt.show()

# Графік 2: сортування методом вставки для всіх розмірів масивів
sizes_insertion = list(large_sizes)
insertion_times_all = [insertion_times[size] for size in sizes_insertion]

plt.figure(figsize=(12, 6))
plt.plot(sizes_insertion, insertion_times_all, 'b-o', label='Insertion Sort')
plt.xlabel('Розмір масиву (n)')
plt.ylabel('Час виконання (секунди)')
plt.title('Час виконання сортування методом вставки')
plt.legend()
plt.grid(True)
plt.show()

# Графік 3: логарифмічна шкала для кращої візуалізації залежності O(n²)
plt.figure(figsize=(12, 6))
plt.loglog(sizes_common, insertion_times_common, 'b-o', label='Insertion Sort')
plt.loglog(sizes_common, bubble_times_common, 'r-o', label='Bubble Sort')
plt.loglog(sizes_common, [n**2 * 1e-6 for n in sizes_common], 'g--', label='O(n²)')
plt.xlabel('Розмір масиву (n)')
plt.ylabel('Час виконання (секунди)')
plt.title('Порівняння алгоритмів сортування (логарифмічна шкала)')
plt.legend()
plt.grid(True)
plt.show()

## Висновки

В ході виконання лабораторної роботи було проведено теоретичний аналіз та емпіричне дослідження часової складності двох алгоритмів сортування: методом вставляння (insertion sort) та методом бульбашки (bubble sort).

Теоретичний аналіз показав, що обидва алгоритми мають асимптотичну складність O(n²) у середньому та найгіршому випадках. Однак, алгоритм вставляння може досягати O(n) у найкращому випадку, коли масив уже відсортований.

Експериментальні дослідження підтвердили теоретичні розрахунки. Графіки залежності часу виконання від розміру масиву показали квадратичне зростання часу зі збільшенням розміру вхідних даних. Логарифмічний графік наочно демонструє відповідність часу виконання обох алгоритмів асимптотиці O(n²).

Порівняння алгоритмів показало, що:
1. Сортування методом вставляння працює швидше, ніж сортування методом бульбашки для всіх розмірів масивів.
2. Різниця в швидкості стає більш помітною зі збільшенням розміру масиву.
3. Для невеликих масивів (до 100 елементів) обидва алгоритми показують прийнятну швидкість.
4. Для великих масивів (більше 10000 елементів) обидва алгоритми стають неефективними, і краще використовувати алгоритми з кращою асимптотичною складністю, такі як швидке сортування O(n log n) або сортування злиттям O(n log n).

В ході роботи ми також навчилися:
- Генерувати випадкові масиви за допомогою модуля random
- Вимірювати час виконання коду за допомогою модуля time
- Будувати інформативні графіки за допомогою бібліотеки matplotlib

Ця лабораторна робота демонструє важливість аналізу складності алгоритмів при розробці програмного забезпечення та допомагає зрозуміти, як теоретична асимптотична складність співвідноситься з реальним часом виконання.