# Лабораторна робота №9
# Тема: Алгоритми на рядках
# Мета: Освоїти низку основних алгоритмів на рядках засобами мови Python.

# Наївний пошук шаблонів

In [1]:
def naive_match(p, t):
    assert len(p) <= len(t)
    occurrences = []
    for i in range(len(t) - len(p) + 1):
        match = True
        for j in range(len(p)):
            if t[i + j] != p[j]:
                match = False
                break
        if match:
            occurrences.append(i)
    return occurrences

# Приклад використання:
text = "hellohell"
pattern = "hell"
print("Naive Match:", naive_match(pattern, text))

Naive Match: [0, 5]


# Z-Функція

In [2]:
def z_func(s):
    Z = [len(s)] + [0] * (len(s) - 1)
    l, r = 0, 0
    for i in range(1, len(s)):
        if i <= r:
            Z[i] = min(r - i + 1, Z[i - l])
        while i + Z[i] < len(s) and s[Z[i]] == s[i + Z[i]]:
            Z[i] += 1
        if i + Z[i] - 1 > r:
            l, r = i, i + Z[i] - 1
    return Z

# Приклад використання:
print("Z-функція для 'abacaba':", z_func("abacaba"))

Z-функція для 'abacaba': [7, 0, 1, 0, 3, 0, 1]


# Пошук підрядка в рядку за допомогою Z-функції

In [3]:
def z_search(p, t):
    s = p + "$" + t
    Z = z_func(s)
    result = []
    for i in range(len(p) + 1, len(s)):
        if Z[i] == len(p):
            result.append(i - len(p) - 1)
    return result

# Приклад використання:
pattern = "aba"
text = "abacabadabacaba"
print("Z-пошук:", z_search(pattern, text))

Z-пошук: [0, 4, 8, 12]


# Стиснення рядка за допомогою Z-функції

In [4]:
def compress_with_z(s):
    Z = z_func(s)
    for i in range(1, len(s)):
        if i + Z[i] == len(s) and len(s) % i == 0:
            return s[:i]
    return s
compressed = compress_with_z("abcabcabcabc")
print("Стиснутий рядок:", compressed)

Стиснутий рядок: abc


# Приклади для довільних рядків

In [5]:
examples = [
    ("abcabcabc", "abc"),        
    ("aaaaaa", "aaa"),           
    ("abcdef", "def"),           
    ("abababab", "aba"),         
    ("abcd", "xyz"),             
]

for t, p in examples:
    print(f"\n---\nText: {t}, Pattern: {p}")
    print("Naive:", naive_match(p, t))
    print("Z-Search:", z_search(p, t))
    print("Compressed:", compress_with_z(t))


---
Text: abcabcabc, Pattern: abc
Naive: [0, 3, 6]
Z-Search: [0, 3, 6]
Compressed: abc

---
Text: aaaaaa, Pattern: aaa
Naive: [0, 1, 2, 3]
Z-Search: [0, 1, 2, 3]
Compressed: a

---
Text: abcdef, Pattern: def
Naive: [3]
Z-Search: [3]
Compressed: abcdef

---
Text: abababab, Pattern: aba
Naive: [0, 2, 4]
Z-Search: [0, 2, 4]
Compressed: ab

---
Text: abcd, Pattern: xyz
Naive: []
Z-Search: []
Compressed: abcd


# Контрольні запитання 

# 1. Префікс-функція — для кожної позиції рядка обчислює довжину найбільшого власного префікса, що є суфіксом.
* Відмінність від Z-функції: префікс-функція порівнює суфікси з префіксами, а Z-функція — підрядки з початковим префіксом.
# 2. Z-функція — масив, де кожен елемент показує довжину спільного префікса між рядком і його підрядком з поточної позиції.
* Значення: використовується для пошуку підрядка, стиснення рядків, побудови індексів — усе з лінійною складністю.
# 3. Підходи до пошуку найдовшого спільного підрядка:
* Динамічне програмування (O(n·m))
* Суфісне дерево або масив (O(n + m))
* Rolling Hash (Рабін-Карп)
* Z-функція (для включення одного рядка в інший)
# 4. Застосування алгоритмів на рядках в NLP і текстах:
* Пошукові системи (пошук фраз)
* Виявлення спаму та дублювання
* Токенізація, нормалізація текстів
* Аналіз лексики, плагіату, машинний переклад

# Висновок:

# Під час цієї лабораторної роботи ми освоїли низку основних алгоритмів на рядках засобами мови Python.