In [4]:
from Bio.Align import PairwiseAligner, substitution_matrices
from Bio import SeqIO
sequences = SeqIO.parse("SARS_Spike_NSP12.fasta", "fasta")
d = dict()
for seq in sequences:
    d[seq.id] = seq.seq

aligner = PairwiseAligner()
aligner.mode = "global"
aligner.substitution_matrix = substitution_matrices.load("BLOSUM62")
aligner.open_gap_score = -10
aligner.extend_gap_score = -0.5

alignments_nsp12 = aligner.align(d['SARS-CoV_NSP12'], d['SARS-CoV-2_NSP12'])
alignments_spike = aligner.align(d['SARS-CoV_Spike'], d['SARS-CoV-2_Spike'])

print(f'Score for NSP12-proteins: {alignments_nsp12.score}')
print(f'Score for Spike-proteins: {alignments_spike.score}')
print(f'Score for NSP12-proteins (relative to the length of the protein): '
      f'{alignments_nsp12.score/alignments_nsp12[0].shape[1]}')
print(f'Score for Spike-proteins (relative to the length of the protein): '
      f'{alignments_spike.score/alignments_spike[0].shape[1]}')

# NSP12-белки обладает активностью РНК-зависимой РНК-полимеразы, т.е. принимает
# участие в синтезе РНК коронавируса, в то время как Spike-белок необходим для
# прикрепления к клеткам и инфицирования. Таким образом, в выравнивании NSP12
# белков score выше т.к. эти белки консервативны и отвечают за функции,
# необходимые для вирусов в целом, Spike-белки же более вариабельны в силу
# своих функций (мутации могут быть им полезны, т.к. это может снизить имунный
# ответ) и могут различаться от вируса к вирусу

Score for NSP12-proteins: 4867.0
Score for Spike-proteins: 5230.0
Score for NSP12-proteins (relative to the length of the protein): 5.222103004291846
Score for Spike-proteins (relative to the length of the protein): 4.095536413469068
