# Лабораторна робота 9

# Тема. Алгоритми на рядках
# Мета: освоїти низку основних алгоритмів на рядках засобами мови Python.

## 1.Власна реалізація Z-функції:

In [None]:
def compute_z_array(s: str) -> list[int]:
    n = len(s)
    z = [0] * n
    z[0] = n  # Повна довжина — перший елемент

    left, right = 0, 0
    for i in range(1, n):
        if i <= right:
            z[i] = min(right - i + 1, z[i - left])
        while i + z[i] < n and s[z[i]] == s[i + z[i]]:
            z[i] += 1
        if i + z[i] - 1 > right:
            left, right = i, i + z[i] - 1
    return z

## 2.Власна реалізація пошуку шаблону у тексті через Z-функцію:

In [None]:
def find_substring(pattern: str, text: str) -> list[int]:
    combined = pattern + "#" + text
    z = compute_z_array(combined)
    positions = []

    pattern_length = len(pattern)
    for i in range(pattern_length + 1, len(combined)):
        if z[i] == pattern_length:
            positions.append(i - pattern_length - 1)
    return positions

## 3.Власна реалізація стиснення рядка на основі періодичності через Z-функцію:

In [None]:
def compress_string_by_z(s: str) -> str:
    z = compute_z_array(s)
    for i in range(1, len(s)):
        if z[i] + i == len(s) and len(s) % i == 0:
            return s[:i]
    return s

## 4.Асимптотика алгоритму пошуку підрядка:


Найкращий випадок:O(n) Якщо шаблон відразу не збігається з першим символом кожного вікна.

Найгірший випадок: O(n*m) Це трапляється, коли всі символи в тексті збігаються з першими символами шаблону, але не є повним збігом (наприклад, шаблон aaaab, текст aaaaaaaaaa).

## 5.Асимптотичну складність алгоритму стиснення рядка за допомогою 𝑧-функції:

Стандартний алгоритм обчислення Z-функції працює за O(n), де 
𝑛 — довжина рядка. Це досягається шляхом використання правильної межі 
𝑟 і лівої межі 𝑙, що дозволяє уникнути зайвих порівнянь та використовувати вже обчислені значення.
if i + Zi = n and Z i mod ==0
Пошук повторюваних фрагментів — O(n), якщо використовують Z-функцію

Кодування повторюваних блоків - O(n log n),

## 6.Відповіді на запитання:
1. Що таке «префікс-функція» у контексті алгоритмів на рядках, і як вона відрізняється від Z-функції?
Префікс-функція визначає, яка максимальна довжина префікса рядка, що є його суфіксом. Вона використовується в алгоритмі Кнута-Морріса-Пратта (KMP) для ефективного пошуку підрядків.

Z-функція визначає, яка максимальна довжина префікса рядка, що збігається з його суфіксом, починаючи з кожної позиції. Застосовується для пошуку повторюваних фрагментів і аналізу тексту.

Головна відмінність: префікс-функція аналізує префікси рядка загалом, а Z-функція — відповідність префікса, що починається з різних позицій.

2. Що таке Z-функція у вищому контексті алгоритмів на рядках, і яка її роль у вирішенні задач?

Z-функція — це математична функція, яка для кожної позиції рядка визначає довжину найбільшого префікса, що збігається з суфіксом, починаючи з цієї позиції. Вона є ключовим інструментом у багатьох алгоритмах обробки тексту.

Роль Z-функції у вирішенні задач: Пошук підрядків,Аналіз повторюваних фрагментів,Оптимізація алгоритмів стиснення,Побудова суфіксних структур.

3. Які існують підходи до вирішення задачі «найдовший спільний підрядок» для двох рядків?

Динамічне програмування (O(mn)) – будується таблиця для обчислення найдовшого спільного підрядка.

Суфіксні структури (O(m log n)) – використовує суфіксні масиви для швидкого пошуку.

Роллінг хеші (O(m log n)) – застосовуються для ефективного порівняння підрядків.

4. Як можна застосувати алгоритми на рядках у задачах обробки природної мови або обробки текстів?

Пошук підрядків – використовується для знаходження ключових слів у текстах.

Аналіз тексту – допомагає визначати частоту слів, розпізнавати шаблони.

Стиснення даних – застосовується в алгоритмах кодування, таких як Huffman.

Перевірка правопису – використовується для корекції тексту.

Обробка природної мови – допомагає у токенізації, лематизації та розпізнаванні мовних структур.

## 7.Висновок:
Освоїв низку основних алгоритмів на рядках засобами мови Python.