# Вызовы Хиршберга

Реализуйте алгоритм, который принимал бы на вход две строки, штраф за удаления, вставки и несовпадения, а так-же цену совпадений. А возвращал бы дерево рекурсивных вызовов алгоритма Хоршберга. В вершинах дерева должны храниться пары строк, на которых будут происходит вызовы алгоритма Хиршберга.
За 3 балла можно реализовать алгоритм используя квадрат памяти. При использовании линейного размера памяти задача стоит 8 баллов.

In [46]:
class Node():
    def __init__(self) -> None:
        self.left = None
        self.right = None
        self.strings = None

def calc_last_row(seq1, seq2, cost_del, cost_ins, cost_match, cost_mismatch):
    n = len(seq1)
    m = len(seq2)
    dp = [[0 for _ in range(m+1)] for _ in range(2)]
    for i in range(1, m+1):
        dp[0][i] = dp[0][i-1] + cost_del
    for i in range(1, n+1):
        dp[1][0] = dp[0][0] + cost_ins
        for j in range(1, m+1):
            dp[1][j] = max(
                dp[0][j] + cost_ins,
                dp[1][j-1] + cost_del,
                dp[0][j-1] + (cost_match if seq1[i-1] == seq2[j-1] else cost_mismatch)
            )
        dp[0], dp[1] = dp[1], dp[0]
    return dp[0]

def hirschberg(str1, str2, cost_del, cost_ins, cost_match, cost_mismatch, node):
    node.strings = (str1, str2)
    n = len(str1)
    m = len(str2)
    if n <= 1 or m <= 1:
        return node
    mid = n // 2
    row_up = calc_last_row(str1[:mid+1], str2, cost_del, cost_ins, cost_match, cost_mismatch)
    row_down = calc_last_row(str1[:mid:-1], str2[::-1], cost_del, cost_ins, cost_match, cost_mismatch)
    max_val = -10e6
    split_ind = -1
    for i in range(m):
        if row_up[i] + row_down[m-(i+1)] > max_val:
            max_val = row_up[i] + row_down[m-(i+1)]
            split_ind = i
    node.left = hirschberg(str1[:mid], str2[:split_ind], cost_del, cost_ins, cost_match, cost_mismatch, Node())
    node.right = hirschberg(str1[mid:], str2[split_ind:], cost_del, cost_ins, cost_match, cost_mismatch, Node())
    return node

def print_tree(node, level=0):
    if node != None:
        print_tree(node.right, level + 1)
        print(' ' * 20 * level + '-----> ' + str(node.strings))
        print_tree(node.left, level + 1)




str1 = "AGTACGCA"
str2 = "TATGC"
cost_del = -2
cost_ins = -2
cost_match = 2
cost_mismatch = -1

root = hirschberg(str1, str2, cost_del, cost_ins, cost_match, cost_mismatch, Node())
print_tree(root)


                                        -----> ('CA', 'C')
                    -----> ('CGCA', 'TGC')
                                                            -----> ('G', 'G')
                                        -----> ('CG', 'TG')
                                                            -----> ('C', 'T')
-----> ('AGTACGCA', 'TATGC')
                                                            -----> ('A', 'A')
                                        -----> ('TA', 'TA')
                                                            -----> ('T', 'T')
                    -----> ('AGTA', 'TA')
                                        -----> ('AG', '')


# Дополнительная задача
Показать, что в алгоритме поиска локального выравнивания можно использовать O(max(n, (W/w)^2)) памяти, где W- это вес оптимального локального выравнивания, а w - это вес который дается за совпадение символов.

Видно, что максимальное число совпадений в оптимальном локальном выравнивании равно W/w. Значит, вместо рассмотрения всей марицы, можно рассмотреть квадрат размером (W/w)^2 вокруг оптимального выравнивания. Таким образом, мы будем работать только с той частью матрицы, которая может привести к оптимальному выравниванию, а в алгоритме поиска локального выравнивания можно использовать O(max(n, (W/w)^2)) памяти