**ФИО:** Смольков Максим Дмитриевич


**Группа:** 25152

# **Глобальное выравнивание - Алгоритм Нидлмана-Вунша**

Необходимо реализовать алгоритм Нидлмана-Вунша, позволяющий выполнять глобальное выравнивание двух нуклеотидных последовательностей.

Для удобства можно весь алгоритм записать в виде функции, принимающий набор аргментов:

* Первая последовательность нуклеотидов
* Вторая последовательность нуклеотидов
* Параметр значения за соответствие (match)
* Штраф за несоответствие (mismatch)
* Штраф за гэп (gap)

Функция должна возвращать непосредственно само выравнивание и score данного выравнивания:

```
# Заданные параметры:
match_score = 1
mismatch = -1
gap = -1

# Результат выравнивания:
ATGCGGGT
 |||*|||
-TGCCGGT

score = 4 (может варьироваться в зависимости от заданных параметров)
```

P.S. Представить выравнивание лучше в формате трех строк (см. на результат выравнивания), то есть строка между двумя последовательностями, которые выравнивались, будет состоять из трех символов: | (match), * (mismatch) и пустой символ (gap)

In [1]:
match_score = 1
mismatch = -1
gap = -1

seq_1 = 'ATGCGGGT'
seq_2 = 'TGCCGGT'

In [2]:
def needleman_wunsch(seq1, seq2, match_score=1, mismatch=-1, gap=-1):    
    # Инициализация матрицы
    m, n = len(seq1), len(seq2)
    score_matrix = [[0 for _ in range(n + 1)] for _ in range(m + 1)]
    
    # Заполнение первой строки и первого столбца
    for i in range(m + 1):
        score_matrix[i][0] = i * gap
    for j in range(n + 1):
        score_matrix[0][j] = j * gap
    
    # Заполнение матрицы
    for i in range(1, m + 1):
        for j in range(1, n + 1):
            # Вычисление трех возможных значений
            match = score_matrix[i-1][j-1] + (match_score if seq1[i-1] == seq2[j-1] else mismatch)
            delete = score_matrix[i-1][j] + gap
            insert = score_matrix[i][j-1] + gap
            
            # Выбор максимального значения
            score_matrix[i][j] = max(match, delete, insert)
    
    # Обратный ход
    aligned_seq1 = ""
    aligned_seq2 = ""
    alignment_line = ""
    
    i, j = m, n
    while i > 0 or j > 0:
        if i > 0 and j > 0 and score_matrix[i][j] == score_matrix[i-1][j-1] + (match_score if seq1[i-1] == seq2[j-1] else mismatch):
            # Диагональный переход (совпадение или несовпадение)
            aligned_seq1 = seq1[i-1] + aligned_seq1
            aligned_seq2 = seq2[j-1] + aligned_seq2
            if seq1[i-1] == seq2[j-1]:
                alignment_line = "|" + alignment_line
            else:
                alignment_line = "*" + alignment_line
            i -= 1
            j -= 1
        elif i > 0 and score_matrix[i][j] == score_matrix[i-1][j] + gap:
            # Вертикальный переход (гэп во второй последовательности)
            aligned_seq1 = seq1[i-1] + aligned_seq1
            aligned_seq2 = "-" + aligned_seq2
            alignment_line = " " + alignment_line
            i -= 1
        else:
            # Горизонтальный переход (гэп в первой последовательности)
            aligned_seq1 = "-" + aligned_seq1
            aligned_seq2 = seq2[j-1] + aligned_seq2
            alignment_line = " " + alignment_line
            j -= 1
    
    return aligned_seq1, alignment_line, aligned_seq2, score_matrix[m][n]


In [3]:
# Тестирование функции
result = needleman_wunsch(seq_1, seq_2, match_score, mismatch, gap)

print("Результат выравнивания:")
print(result[0])  # Первая последовательность
print(result[1])  # Линия выравнивания
print(result[2])  # Вторая последовательность
print(f"\nScore: {result[3]}")

Результат выравнивания:
ATGCGGGT
 |||*|||
-TGCCGGT

Score: 4
