In [2]:
from Bio.Seq import Seq
from Bio import pairwise2
from Bio.pairwise2 import format_alignment
from collections import Counter
from Levenshtein import distance



In [4]:
SeqA = Seq("AAGCTTAGCTAGAGCAGTCAGCTAGCTAGCT")
SeqB = Seq("TCTGAAGCTAGCTAGTGCATAGCTAGCTAGC")

In [8]:
# Global and Local Alignment
global_align = pairwise2.align.globalxx(SeqA, SeqB)
local_align = pairwise2.align.localxx(SeqA, SeqB)


In [9]:
align = format_alignment(*local_align[0])
global_align = format_alignment(*local_align[0])

for a in local_align:
    print(format_alignment(*a))

1 AAGCTTAGCTAGA-GCAGTCAGCTAGCTAGC
  |||| |||||||  ||| | |||||||||||
5 AAGC-TAGCTAG-TGCA-T-AGCTAGCTAGC
  Score=26

1 AAGCTTAGCTAGA-GCAGTCAGCTAGCTAGC
  ||||| ||||||  ||| | |||||||||||
5 AAGCT-AGCTAG-TGCA-T-AGCTAGCTAGC
  Score=26

1 AAGCTTAGCTAGAGCAGTCAGCTAGCTAGC
  |||| |||||||.||| | |||||||||||
5 AAGC-TAGCTAGTGCA-T-AGCTAGCTAGC
  Score=26

1 AAGCTTAGCTAGAGCAGTCAGCTAGCTAGC
  ||||| ||||||.||| | |||||||||||
5 AAGCT-AGCTAGTGCA-T-AGCTAGCTAGC
  Score=26



In [10]:
# Global Matching Score
score = pairwise2.align.globalms(SeqA, SeqB, 2, -1, -0.5, -0.1)
score
for s in score:
    print(format_alignment(*s))

----AAGCTTAGCTAGA-GCAGTCAGCTAGCTAGCT
    |||| |||||||  ||| | ||||||||||| 
TCTGAAGC-TAGCTAG-TGCA-T-AGCTAGCTAGC-
  Score=48.2

----AAGCTTAGCTAGA-GCAGTCAGCTAGCTAGCT
    ||||| ||||||  ||| | ||||||||||| 
TCTGAAGCT-AGCTAG-TGCA-T-AGCTAGCTAGC-
  Score=48.2

----AAGCTTAGCTAGAGCAGTCAGCTAGCTAGCT
    |||| |||||||.||| | ||||||||||| 
TCTGAAGC-TAGCTAGTGCA-T-AGCTAGCTAGC-
  Score=48.2

----AAGCTTAGCTAGAGCAGTCAGCTAGCTAGCT
    ||||| ||||||.||| | ||||||||||| 
TCTGAAGCT-AGCTAGTGCA-T-AGCTAGCTAGC-
  Score=48.2



In [11]:
# Hamming Distance
def hamming_lc(seq1, seq2):
  return len([(x,y) for (x,y) in zip(seq1, seq2) if x!=y])

hamming_lc(SeqA, SeqB)

30

In [12]:
distance(SeqA, SeqB)

9

In [14]:
# Create Matrix
def create_matrix_lc(seq_a, seq_b):
  return [[a==b for b in seq_b]for a in seq_a]

print(create_matrix_lc(SeqA,SeqB))

# Write Map
def write_map_lc(seq_a, seq_b):
  matrix = create_matrix_lc(seq_a, seq_b)

  res = ""
  res += " |" + "".join([b for b in seq_b]) + "\n"

  for i in range(len(matrix)):
    res += seq_a[i] + "|" +"".join([chr(0x25A0) if j == True else " " for j in matrix[i]]) + "\n"

  return res
print(write_map_lc(SeqA, SeqB))

[[False, False, False, False, True, True, False, False, False, True, False, False, False, True, False, False, False, False, True, False, True, False, False, False, True, False, False, False, True, False, False], [False, False, False, False, True, True, False, False, False, True, False, False, False, True, False, False, False, False, True, False, True, False, False, False, True, False, False, False, True, False, False], [False, False, False, True, False, False, True, False, False, False, True, False, False, False, True, False, True, False, False, False, False, True, False, False, False, True, False, False, False, True, False], [False, True, False, False, False, False, False, True, False, False, False, True, False, False, False, False, False, True, False, False, False, False, True, False, False, False, True, False, False, False, True], [True, False, True, False, False, False, False, False, True, False, False, False, True, False, False, True, False, False, False, True, False, False, False

In [15]:
def count_match(seq_a, seq_b):
  res = [0 for i in range(len(seq_b))]
  for i in range(len(seq_b)):
    for j in seq_a:
      if seq_b[i] == j:
        res[i] += 1
  return res
print(write_map_lc(SeqA, SeqB))
print(count_match(SeqA, SeqB))

 |TCTGAAGCTAGCTAGTGCATAGCTAGCTAGC
A|    ■■   ■   ■    ■ ■   ■   ■  
A|    ■■   ■   ■    ■ ■   ■   ■  
G|   ■  ■   ■   ■ ■    ■   ■   ■ 
C| ■     ■   ■     ■    ■   ■   ■
T|■ ■     ■   ■  ■   ■   ■   ■   
T|■ ■     ■   ■  ■   ■   ■   ■   
A|    ■■   ■   ■    ■ ■   ■   ■  
G|   ■  ■   ■   ■ ■    ■   ■   ■ 
C| ■     ■   ■     ■    ■   ■   ■
T|■ ■     ■   ■  ■   ■   ■   ■   
A|    ■■   ■   ■    ■ ■   ■   ■  
G|   ■  ■   ■   ■ ■    ■   ■   ■ 
A|    ■■   ■   ■    ■ ■   ■   ■  
G|   ■  ■   ■   ■ ■    ■   ■   ■ 
C| ■     ■   ■     ■    ■   ■   ■
A|    ■■   ■   ■    ■ ■   ■   ■  
G|   ■  ■   ■   ■ ■    ■   ■   ■ 
T|■ ■     ■   ■  ■   ■   ■   ■   
C| ■     ■   ■     ■    ■   ■   ■
A|    ■■   ■   ■    ■ ■   ■   ■  
G|   ■  ■   ■   ■ ■    ■   ■   ■ 
C| ■     ■   ■     ■    ■   ■   ■
T|■ ■     ■   ■  ■   ■   ■   ■   
A|    ■■   ■   ■    ■ ■   ■   ■  
G|   ■  ■   ■   ■ ■    ■   ■   ■ 
C| ■     ■   ■     ■    ■   ■   ■
T|■ ■     ■   ■  ■   ■   ■   ■   
A|    ■■   ■   ■    ■ ■   ■   ■  
G|   ■  ■   ■ 