## Завдання для самостійної роботи

---

### 1. Оцінити асимптотичну складність алгоритму бінарного пошуку в O-нотації.

**Відповідь:**

У кожній ітерації алгоритму бінарного пошуку розмір області пошуку зменшується вдвічі. У найгіршому випадку (коли елемент не знайдено або знаходиться на крайній позиції), кількість порівнянь буде відповідати кількості разів, яку ми можемо поділити розмір масиву $n$ на 2, поки не отримаємо 1. Це математично виражається як $\log_2 n$. Тому асимптотична складність бінарного пошуку в O-нотації становить:

$$O(\log n)$$

---

### 2. Написати функцію, яка б могла повертати датафрейм з таким складом полів: («n», «time»), де n – розмір масиву для функції `linear_search()`.

Спочатку визначимо саму функцію лінійного пошуку:

```python
import time
import pandas as pd
import numpy as np
import random
import matplotlib.pyplot as plt

def linear_search(arr, target):
    for i in range(len(arr)):
        if arr[i] == target:
            return i
    return -1

In [2]:
def measure_linear_search_time(sizes, target=None):
    results = []
    for n in sizes:
        arr = list(range(n))
        if target is None:
            target = -1  # Елемент, якого немає в масиві (найгірший випадок)
        start_time = time.time()
        linear_search(arr, target)
        end_time = time.time()
        results.append({'n': n, 'time': end_time - start_time})
    return pd.DataFrame(results)

In [4]:
def bin_search(arr, target):
    low = 0
    high = len(arr) - 1
    while low <= high:
        mid = (low + high) // 2
        if arr[mid] == target:
            return mid
        elif arr[mid] < target:
            low = mid + 1
        else:
            high = mid - 1
    return -1

In [6]:
def measure_bin_search_time(sizes, target=None):
    results = []
    for n in sizes:
        arr = sorted(list(range(n))) # Сортуємо масив для бінарного пошуку
        if target is None:
            target = -1  # Елемент, якого немає в масиві (найгірший випадок)
        start_time = time.time()
        bin_search(arr, target)
        end_time = time.time()
        results.append({'n': n, 'time': end_time - start_time})
    return pd.DataFrame(results)

# Задамо різні розміри масивів для тестування
array_sizes = np.logspace(1, 5, 20, dtype=int) # Генеруємо 20 розмірів від 10 до 100000

# Вимірюємо час виконання лінійного пошуку
linear_time_df = measure_linear_search_time(array_sizes)

# Вимірюємо час виконання бінарного пошуку
binary_time_df = measure_bin_search_time(array_sizes)

# Побудова графіків
plt.figure(figsize=(12, 6))
plt.plot(linear_time_df['n'], linear_time_df['time'], label='Лінійний пошук', marker='o')
plt.plot(binary_time_df['n'], binary_time_df['time'], label='Бінарний пошук', marker='o')
plt.xlabel('Розмір масиву (n)')
plt.ylabel('Час виконання (секунди)')
plt.title('Залежність часу виконання від розміру масиву')
plt.legend()
plt.grid(True)
plt.xscale('log')
plt.yscale('log')
plt.show()



5. Оцінити, який з двох алгоритмів є ефективнішим і в якому діапазоні розміру задачі.
Оцінка ефективності:

Бінарний пошук має асимптотичну складність $O(\log n)$, що значно краще за лінійний пошук для великих розмірів масивів. Час його виконання зростає набагато повільніше зі збільшенням кількості елементів.
Лінійний пошук має асимптотичну складність $O(n)$, тобто час його виконання зростає лінійно пропорційно розміру масиву.
Діапазон розміру задачі:

Для дуже малих розмірів масивів (наприклад, одиниці або десятки елементів), різниця в часі виконання між двома алгоритмами може бути незначною. У деяких випадках, накладні витрати на початкові перевірки в бінарному пошуку можуть зробити його трохи повільнішим для дуже малих $n$.
Зі збільшенням розміру масиву перевага бінарного пошуку стає очевидною. Графік, який ви побудуєте, покаже, що час виконання лінійного пошуку зростає значно швидше, ніж час виконання бінарного пошуку.
Для великих розмірів масивів (сотні, тисячі, мільйони елементів і більше), бінарний пошук є набагато ефективнішим і практичнішим вибором завдяки його логарифмічній складності.
Висновок:

Бінарний пошук є значно ефективнішим алгоритмом для пошуку в великих відсортованих масивах. Для малих масивів різниця в продуктивності може бути несуттєвою, але зі зростанням розміру задачі перевага бінарного пошуку стає суттєвою. Бінарний пошук слід використовувати, коли масив відсортований і розмір його може бути значним. Лінійний пошук може бути простішим для реалізації та прийнятним для невеликих невідсортованих масивів.



## Контрольні запитання

---

### 1. Сформулювати задачу пошуку.

**Задача пошуку** полягає у знаходженні одного або всіх входжень заданого елемента (ключового значення) в певній структурі даних (наприклад, масиві, списку, дереві тощо). Якщо елемент знайдено, зазвичай повертається його індекс або посилання на нього. Якщо елемент не знайдено, повертається спеціальне значення (наприклад, -1 або null).

---

### 2. Які критерії можна використовувати для оцінювання ефективності алгоритмів пошуку?

Для оцінювання ефективності алгоритмів пошуку використовуються такі основні критерії:

* **Часова складність:** Визначає, як час виконання алгоритму залежить від розміру вхідних даних (кількості елементів у структурі). Зазвичай аналізується найкращий, середній та найгірший випадки.
* **Просторова складність:** Визначає, який обсяг додаткової пам'яті використовує алгоритм під час своєї роботи, залежно від розміру вхідних даних.
* **Простота реалізації:** Оцінює складність написання та налагодження алгоритму.
* **Стабільність (для деяких видів пошуку, наприклад, пов'язаних із сортуванням):** Чи зберігається порядок елементів з однаковими ключами після пошуку (хоча це менш актуально для базових алгоритмів пошуку).

---

### 4. Що таке лінійний пошук і яка його асимптотична складність?

**Лінійний пошук (послідовний пошук)** — це найпростіший алгоритм пошуку, який полягає в послідовному переборі всіх елементів структури даних до тих пір, поки не буде знайдено шуканий елемент або не буде досягнуто кінця структури.

**Асимптотична складність лінійного пошуку:**

* **Найкращий випадок:** $O(1)$ (шуканий елемент знаходиться на першій позиції).
* **Середній випадок:** $O(n)$ (шуканий елемент знаходиться в середині структури або відсутній).
* **Найгірший випадок:** $O(n)$ (шуканий елемент знаходиться на останній позиції або відсутній у структурі з $n$ елементів).

---

### 5. Що таке бінарний (двійковий) пошук і в чому полягає його головний принцип роботи?

**Бінарний (двійковий) пошук** — це ефективний алгоритм пошуку, який застосовується до **відсортованих** структур даних (наприклад, відсортованих масивів).

**Головний принцип роботи бінарного пошуку:**

1.  Визначається середина поточної області пошуку.
2.  Шуканий елемент порівнюється з елементом, що знаходиться в середині.
3.  Якщо шуканий елемент дорівнює середньому, пошук завершується успішно.
4.  Якщо шуканий елемент менший за середній, пошук продовжується в лівій половині області.
5.  Якщо шуканий елемент більший за середній, пошук продовжується в правій половині області.
6.  Ці кроки повторюються до тих пір, поки не буде знайдено шуканий елемент або область пошуку не стане порожньою.

---

### 6. Які переваги і недоліки використання бінарного пошуку порівняно з лінійним?

**Переваги бінарного пошуку:**

* **Вища ефективність для великих обсягів даних:** Асимптотична складність $O(\log n)$ значно краща за $O(n)$ лінійного пошуку при великих $n$.
* **Швидший пошук:** Потрібно значно менше порівнянь для знаходження елемента у великому відсортованому масиві.

**Недоліки бінарного пошуку:**

* **Вимагає попереднього сортування даних:** Бінарний пошук працює лише з відсортованими структурами даних. Якщо дані не відсортовані, їх потрібно спочатку відсортувати, що може зайняти додатковий час ($O(n \log n)$ для ефективних алгоритмів сортування).
* **Менша ефективність для малих обсягів даних:** Для невеликих структур даних накладні витрати на визначення середини та порівняння можуть зробити бінарний пошук несуттєво швидшим або навіть повільнішим за лінійний.
* **Складніша реалізація:** Алгоритм бінарного пошуку трохи складніший для реалізації, ніж лінійний.

---

### 7. Які ще алгоритми пошуку існують, окрім лінійного і бінарного?

Окрім лінійного та бінарного пошуку, існують й інші алгоритми пошуку, серед яких:

* **Інтерполяційний пошук:** Покращена версія бінарного пошуку, яка враховує можливе розташування шуканого елемента в межах області пошуку (працює краще для рівномірно розподілених даних).
* **Пошук стрибками (Jump Search):** Працює на відсортованих масивах, робить "стрибки" фіксованого розміру, а потім виконує лінійний пошук у межах знайденого блоку.
* **Хешування (Hashing):** Використовує хеш-функції для відображення ключів у індекси хеш-таблиці, забезпечуючи в середньому $O(1)$ час пошуку, вставки та видалення.
* **Пошук у глибину (Depth-First Search, DFS) та пошук у ширину (Breadth-First Search, BFS):** Алгоритми для обходу та пошуку в графах і деревах.
* **Алгоритми пошуку рядків:** Такі як алгоритм Кнута-Морріса-Пратта (KMP), алгоритм Бойєра-Мура, які використовуються для пошуку підрядка в рядку.
* **Пошук за зразком (Pattern Matching):** Більш загальна категорія алгоритмів, що включає пошук рядків та інші види пошуку за заданим зразком.