In [3]:
from Bio import AlignIO
from SARS_CoV_2_genes import gene_coordinates

aln = AlignIO.read("SARS_CoV_2_Russia_aligned.fasta", "fasta")
number_of_genomes = len(aln)


def coord(a, local):
    seq = a[0]
    global_ = -1
    for j in range(len(seq)):
        if a[0][j] != "-":
            global_ += 1
        if global_ == local:
            return j


start_Spike = coord(aln, gene_coordinates["Spike"][0] - 1)
end_Spike = coord(aln, gene_coordinates["Spike"][1])
len_Spike = len(aln[0, start_Spike:end_Spike])

start_NSP12 = coord(aln, gene_coordinates["NSP12"][0] - 1)
end_NSP12 = coord(aln, gene_coordinates["NSP12"][1])
len_NSP12 = len(aln[0, start_NSP12:end_NSP12])

number_of_mutations_of_Spike = 0
for i in range(1, number_of_genomes):
    for n in range(start_Spike, end_Spike):
        if aln[i, n] != aln[0, n]:
            number_of_mutations_of_Spike += 1

number_of_mutations_of_NSP12 = 0
for j in range(1, number_of_genomes):
    for k in range(start_NSP12, end_NSP12):
        if aln[j, k] != aln[0, k]:
            number_of_mutations_of_NSP12 += 1

print(f'Average number of mutations in the Spike protein gene: '
      f'{number_of_mutations_of_Spike / (number_of_genomes * len_Spike)}')
print(f'Average number of mutations in the NSP12 protein gene: '
      f'{number_of_mutations_of_NSP12 / (number_of_genomes * len_NSP12)}')

# Вывод программы:
# Среднее число мутаций в гене Spike-белка: 0.006334388622301215
# Среднее число мутаций в гене NSP12-белка: 0.0022040242497592226

# NSP12-белки обладает активностью РНК-зависимой РНК-полимеразы, т.е. принимают
# участие в синтезе РНК коронавируса, в то время как Spike-белок необходим для
# прикрепления к клеткам и инфицирования. NSP12 - консервативен, т.к.
# осуществляет важную функцию, не зависящую от конкретного вируса. Мутации в
# этом гене этого белка могли бы быть фатальны для вируса, поэтому там они
# встречаются реже.

Average number of mutations in the Spike protein gene: 0.006334388622301215
Average number of mutations in the NSP12 protein gene: 0.0022040242497592226
