# 1. Выравнивание с использованием алгоритма Needleman-Wunsch


In [20]:
import numpy as np

def needleman_wunsch(seq1, seq2, match, mismatch, indel):
    
    n = len(seq1)
    m = len(seq2)

    dp = [[0] * (m + 1) for _ in range(n + 1)]

    for i in range(n + 1):
        dp[i][0] = indel * i
    for j in range(m + 1):
        dp[0][j] = indel * j

    for i in range(1, n + 1):
        for j in range(1, m + 1):
            score = match if seq1[i - 1] == seq2[j - 1] else mismatch
            dp[i][j] = max(dp[i - 1][j - 1] + score,
                           dp[i - 1][j] + indel,
                           dp[i][j - 1] + indel)

    # Traceback
    aligned_seq1 = ""
    aligned_seq2 = ""
    i = n
    j = m

    while i > 0 or j > 0:
        if i > 0 and j > 0 and dp[i][j] == dp[i - 1][j - 1] + (match if seq1[i - 1] == seq2[j - 1] else mismatch):
            aligned_seq1 = seq1[i - 1] + aligned_seq1
            aligned_seq2 = seq2[j - 1] + aligned_seq2
            i -= 1
            j -= 1
        elif i > 0 and dp[i][j] == dp[i - 1][j] + indel:
            aligned_seq1 = seq1[i - 1] + aligned_seq1
            aligned_seq2 = "-" + aligned_seq2
            i -= 1
        else:
            aligned_seq1 = "-" + aligned_seq1
            aligned_seq2 = seq2[j - 1] + aligned_seq2
            j -= 1

    return aligned_seq1, aligned_seq2, dp[n][m]

sequences = [
    ("GACGAAG", "ACCAAG", 1, -1, -1),  
    ("CGTCTT", "CATTCT", 1, -1, -2),  
    ("ATGTCAC", "ATCTCC", 1, -2, -2)   
]

for i, (seq1, seq2, match, mismatch, indel) in enumerate(sequences):
    print(f"\n Выравнивание пары {i+1} ")
    aligned_seq1, aligned_seq2, score = needleman_wunsch(seq1, seq2, match, mismatch, indel)

    print("Выровненная последовательность 1:", aligned_seq1)
    print("Выровненная последовательность 2:", aligned_seq2)
    print("Скор выравнивания:", score)


 Выравнивание пары 1 
Выровненная последовательность 1: GACGAAG
Выровненная последовательность 2: -ACCAAG
Скор выравнивания: 3

 Выравнивание пары 2 
Выровненная последовательность 1: CGTCTT
Выровненная последовательность 2: CATTCT
Скор выравнивания: 0

 Выравнивание пары 3 
Выровненная последовательность 1: ATGTCAC
Выровненная последовательность 2: ATCTC-C
Скор выравнивания: 1


 # 2. Выравнивание с использованием Python

In [22]:
from Bio import pairwise2
from Bio.pairwise2 import format_alignment

def выполнить_выравнивание(sequence_a, sequence_b, align_name, gap_penalty, mismatch_penalty, match_score=1):
    
    print(f"\n Выравнивание {align_name} ")

    alignments = pairwise2.align.globalms(sequence_a, sequence_b, match_score, mismatch_penalty, gap_penalty, gap_penalty)

    if alignments:
        top_alignment = alignments[0]  
        aligned_a, aligned_b, alignment_score, _, _ = top_alignment  
        print(format_alignment(*top_alignment))  
        print(f"Скор выравнивания {alignment_score}")
    else:
        print("Невозможно выполнить выравнивание для этих последовательностей.")


seq_1 = "GACGAAG"
seq_2 = "ACCAAG"
gap_cost_1 = -1
mismatch_cost_1 = -1

seq_3 = "CGTCTT"
seq_4 = "CATTCT"
gap_cost_2 = -2
mismatch_cost_2 = -1

seq_5 = "ATGTCAC"
seq_6 = "ATCTCC"
gap_cost_3 = -2
mismatch_cost_3 = -2

выполнить_выравнивание(seq_1, seq_2, "Последовательностей 1", gap_cost_1, mismatch_cost_1)
выполнить_выравнивание(seq_3, seq_4, "Последовательностей 2", gap_cost_2, mismatch_cost_2)
выполнить_выравнивание(seq_5, seq_6, " Последовательностей 3", gap_cost_3, mismatch_cost_3)


 Выравнивание Последовательностей 1 
GACGAAG
 ||.|||
-ACCAAG
  Score=3

Скор выравнивания 3.0

 Выравнивание Последовательностей 2 
CGTCTT
|.|..|
CATTCT
  Score=0

Скор выравнивания 0.0

 Выравнивание  Последовательностей 3 
ATGTCAC
||.|| |
ATCTC-C
  Score=1

Скор выравнивания 1.0
