## Практична робота № 7 Алгоритми на рядках.
## Мета: набути практичних навичок застосування базових алгоритмів на рядках та оцінювання їх асимптотичної складності.
### Виконав: Яцентюк Євгеній, група: КІ-24-1 

##### Мій Варіант 1 (23) = 23-22=**1**


### Завдання: Маємо дві короткі послідовності символів: «ABCDF» і «ACEDB». Знайти найдовшу спільну підпослідовності символів, використовуючи алгоритм динамічного програмування. 

# 1. Реалізація алгоритму

In [7]:
import pandas as pd

def print_dp_matrix(dp, s1, s2):
  
    cols = [''] + list(s2)
    rows = [''] + list(s1)
    
    df = pd.DataFrame(dp, index=rows, columns=cols)
    print("Матриця динамічного програмування:")
    display(df)

def longest_common_subsequence(s1, s2):
    m = len(s1)
    n = len(s2)

    dp = [[0] * (n + 1) for _ in range(m + 1)]


    for i in range(1, m + 1):
        for j in range(1, n + 1):
            if s1[i - 1] == s2[j - 1]:
                dp[i][j] = dp[i - 1][j - 1] + 1
            else:
                dp[i][j] = max(dp[i - 1][j], dp[i][j - 1])

    print_dp_matrix(dp, s1, s2)

    lcs = []
    i, j = m, n
    while i > 0 and j > 0:
        if s1[i - 1] == s2[j - 1]:
            lcs.append(s1[i - 1])
            i -= 1
            j -= 1
        elif dp[i - 1][j] > dp[i][j - 1]:
            i -= 1
        else:
            j -= 1
            
    lcs.reverse()
    return ''.join(lcs)

## 2. Виконання

In [9]:
sequence_1 = "ABCDF"
sequence_2 = "ACEDB"

print(f"Рядок 1: {sequence_1}")
print(f"Рядок 2: {sequence_2}")
print("-" * 30)


result_lcs = longest_common_subsequence(sequence_1, sequence_2)

print("-" * 30)
print(f"Довжина LCS: {len(result_lcs)}")
print(f"Найдовша спільна підпослідовність: {result_lcs}")

Рядок 1: ABCDF
Рядок 2: ACEDB
------------------------------
Матриця динамічного програмування:


Unnamed: 0,Unnamed: 1,A,C,E,D,B
,0,0,0,0,0,0
A,0,1,1,1,1,1
B,0,1,1,1,1,2
C,0,1,2,2,2,2
D,0,1,2,2,3,3
F,0,1,2,2,3,3


------------------------------
Довжина LCS: 3
Найдовша спільна підпослідовність: ACD


## Відповіді на контрольні питання 

**1. У чому полягає задача знаходження найдовшої спільної підпослідовності (LCS)?** 

Задача знаходження найдовшої спільної підпослідовності (LCS) полягає в пошуку найбільшої за довжиною послідовності, яка є підпослідовністю двох або більше заданих рядків. Підпослідовність — це рядок, який можна отримати з вихідного шляхом вилучення деяких елементів, але зі збереженням порядку тих, що залишилися. Результатом є послідовність символів, що зустрічається в обох вхідних рядках у однаковому порядку.

**2. Які головні методи можна використовувати для знаходження найдовшої спільної підпослідовності?**

Згідно з теоретичними відомостями, існують такі основні алгоритми:
* Динамічне програмування (Dynamic Programming): використовує таблицю для зберігання проміжних результатів.
* Рекурсивний алгоритм з використанням мемоізації (Recursion with Memoization): зберігає проміжні результати у пам'яті, щоб уникнути повторних обчислень.
* Алгоритм Хаббарда (Hirschberg's Algorithm): використовує рекурсію та розподіл задачі на менші підзадачі.
* Алгоритм повного перебору: перебирає всі можливі варіанти, але є неефективним через експоненціальну складність.

**3. Як працює алгоритм динамічного програмування для знаходження LCS?**

Алгоритм працює шляхом заповнення двовимірного масиву (таблиці), де порівнюється кожен символ однієї послідовності з кожним символом іншої Процес складається з таких кроків:
* Створення масиву `dp`, заповненого нулями
* Обчислення значень: якщо символи збігаються, значення клітинки дорівнює діагональному сусіду + 1 ($dp[i-1][j-1] + 1$). Якщо не збігаються — береться максимум із верхнього або лівого сусіда
* Відновлення результату шляхом зворотного проходу від кінця таблиці до початку.

**4. Як працює алгоритм Хаббарда для знаходження LCS?**

Алгоритм Хаббарда (або алгоритм Хіршберга) використовує рекурсивний підхід. Його особливість полягає у зменшенні кількості необхідних операцій шляхом розділення основної задачі на менші підзадачі. Це дозволяє оптимізувати використання пам'яті порівняно зі стандартним динамічним програмуванням, хоча часова складність залишається тією ж.

**5. Які переваги та недоліки алгоритмів динамічного програмування та Хаббарда для знаходження LCS?**
* **Динамічне програмування:**
    * Переваги: Дозволяє знайти розв'язок за поліноміальний час $O(m \cdot n)$, що значно швидше за повний  * перебір ($O(2^n)$).
    * Недоліки: Потребує зберігання повної таблиці проміжних результатів у пам'яті.
* **Алгоритм Хаббарда:**
    * Переваги: Має ту ж часову складність $O(m \cdot n)$, але зменшує кількість необхідних операцій завдяки підходу "розділяй і володарюй" (поділ на підзадачі)
    * Недоліки: Складніша реалізація через використання рекурсії.

**6. Які існують практичні застосування для задачі знаходження найдовшої спільної підпослідовності?**

Застосовуючи алгоритми LCS, можна розв'язувати такі задачі:
* Порівняння текстів (знаходження схожості, плагіату, змін у файлах).
* Біологічні дослідження, зокрема порівняння генетичних послідовностей (ДНК).
* Розв'язання різноманітних задач на графах