## Вступ

**Тема:** Алгоритми на рядках

**Мета:** Освоїти низку основних алгоритмів на рядках засобами мови Python.

**Завдання:**
- Реалізувати алгоритм пошуку підрядка в рядку
- Реалізувати z-функцію і застосовувати її в алгоритмах аналізу рядків

## Хід роботи

### 1. Наївний алгоритм пошуку підрядка

Наївний алгоритм - найпростіший метод пошуку шаблону в тексті. Він перевіряє всі можливі позиції тексту і порівнює символи шаблону з відповідними символами тексту.

**Складність:** O(|t| × |p|) у найгіршому випадку.

In [None]:
def naive_match(p, t):
    """Наївний алгоритм пошуку підрядка"""
    assert len(p) <= len(t)
    occurrences = []
    
    for i in range(0, len(t) - len(p) + 1):
        match = True
        for j in range(0, len(p)):
            if t[i + j] != p[j]:
                match = False
                break
        if match:
            occurrences.append(i)
    
    return occurrences

In [None]:
# Тестування наївного алгоритму
result = naive_match('needle', 'needleneedleneedle')
print(f"Знайдені позиції: {result}")
print(f"Перевірка: {result == [0, 6, 12]}")

### 2. Z-функція

Z-функція для рядка s - це масив довжини n, де i-й елемент дорівнює найбільшому числу символів, починаючи з позиції i, які співпадають з першими символами рядка s.

In [None]:
def z_func(s):
    """Обчислення Z-функції для рядка s"""
    Z = [len(s)] + [0] * (len(s) - 1)
    assert len(s) > 1
    
    # Початкові порівняння
    for i in range(1, len(s)):
        if s[i] == s[i-1]:
            Z[1] += 1
        else:
            break
    
    r, l = 0, 0
    if Z[1] > 0:
        r, l = Z[1], 1
    
    # Основний цикл обчислення Z-функції
    for k in range(2, len(s)):
        if k > r:
            # Випадок 1: k за межами поточного діапазону
            for i in range(k, len(s)):
                if s[i] == s[i-k]:
                    Z[k] += 1
                else:
                    break
            r, l = k + Z[k] - 1, k
        else:
            # Випадок 2: k всередині діапазону
            nbeta = r - k + 1
            Zkp = Z[k - l]
            if nbeta > Zkp:
                Z[k] = Zkp
            else:
                nmatch = 0
                for i in range(r+1, len(s)):
                    if s[i] == s[i - k]:
                        nmatch += 1
                    else:
                        break
                l, r = k, r + nmatch
                Z[k] = r - k + 1
    
    return Z

In [None]:
# Тестування Z-функції
test_string = 'abracadabra'
z_result = z_func(test_string)
print(f"Рядок: {test_string}")
print(f"Z-функція: {z_result}")

### 3. Пошук підрядка за допомогою Z-функції

Для пошуку підрядка p в тексті t створюємо рядок s = p + '$' + t і обчислюємо Z-функцію. Позиції, де Z[i] = len(p), відповідають входженням підрядка.

**Складність:** O(len(p) + len(t))

In [None]:
def zMatch(p, t):
    """Пошук підрядка за допомогою Z-функції"""
    s = p + "$" + t
    Z = z_func(s)
    occurrences = []
    
    for i in range(len(p) + 1, len(s)):
        if Z[i] == len(p):
            occurrences.append(i - (len(p) + 1))
    
    return occurrences

In [None]:
# Тестування пошуку з Z-функцією
t, p = "абабагаламага", "аб"
calculated_z = z_func("аб$абабагаламага")
print(f"Z-функція для '{p}${t}': {calculated_z}")

matches = zMatch(p, t)
print(f"Знайдені входження '{p}' в '{t}': {matches}")

### 4. Стиснення рядка за допомогою Z-функції

Z-функція дозволяє знайти найкоротше періодичне представлення рядка.

In [None]:
def compress_with_z(s):
    """Стиснення рядка за допомогою Z-функції"""
    z_vec = z_func(s)
    
    for i in range(1, len(s)):
        if (i + z_vec[i] == len(s)) and (len(s) % i == 0):
            return s[:i]
    
    return s

In [None]:
# Тестування стиснення
s = "абырвалгабырвалгабырвалг"
z_result = z_func(s)
compressed = compress_with_z(s)

print(f"Оригінальний рядок: {s}")
print(f"Z-функція: {z_result}")
print(f"Стиснутий рядок: {compressed}")

### 5. Аналіз асимптотичної складності

**Наївний алгоритм:**
- У найгіршому випадку: O(|t| × |p|)
- Це відбувається, коли потрібно перевіряти всі символи шаблону на кожній позиції тексту

**Алгоритм з Z-функцією:**
- Складність: O(|p| + |t|)
- Значно ефективніший для великих текстів

**Стиснення рядка:**
- Складність: O(n), де n - довжина рядка
- Обчислення Z-функції займає O(n), пошук найкоротшого періоду - також O(n)

## Відповіді на контрольні питання

**1. Що таке "префікс-функція" у контексті алгоритмів на рядках, і як вона відрізняється від Z-функції?**

Префікс-функція (π-функція) для рядка s - це масив, де π[i] дорівнює довжині найдовшого власного префікса підрядка s[0...i], який також є суфіксом цього підрядка. Z-функція обчислює довжину найдовшого спільного префікса всього рядка з його суфіксом, що починається з позиції i.

**2. Що таке Z-функція у контексті алгоритмів на рядках, і яка її роль у вирішенні задач?**

Z-функція - це масив, де Z[i] дорівнює довжині найдовшого підрядка, що починається з позиції i і співпадає з prefіксом всього рядка. Вона використовується для ефективного пошуку підрядків, стиснення рядків та інших задач обробки текстів.

**3. Які існують підходи до вирішення задачі "найдовший спільний підрядок" для двох рядків?**

Основні підходи: динамічне програмування (O(n×m)), суфіксні масиви, використання Z-функції або префікс-функції для об'єднаного рядка, алгоритми на основі хешування.

**4. Як можна застосувати алгоритми на рядках у задачах обробки природної мови або обробки текстів?**

Застосування включають: пошук ключових слів у документах, виявлення плагіату, стиснення тексту, автокомплітування, пошук схожих документів, індексування для пошукових систем, обробка ДНК-послідовностей у біоінформатиці.

## Висновки

У ході виконання лабораторної роботи було:

1. **Реалізовано наївний алгоритм пошуку підрядка** з асимптотичною складністю O(|t| × |p|)

2. **Імплементовано Z-функцію** та продемонстровано її застосування для:
   - Ефективного пошуку підрядків з складністю O(|p| + |t|)
   - Стиснення рядків шляхом знаходження найкоротшого періоду

3. **Проаналізовано асимптотичну складність** алгоритмів:
   - Наївний алгоритм: O(n×m) у найгіршому випадку
   - Z-функція: O(n) для обчислення, O(n+m) для пошуку
   - Стиснення: O(n)

4. **Практично перевірено роботу** всіх реалізованих алгоритмів на тестових прикладах

Z-функція показала свою ефективність порівняно з наївним підходом, особливо для великих текстів, що робить її корисною для реальних застосувань у обробці текстів та біоінформатиці.