In [1]:
%load_ext autoreload
# reloads the file constantly so you don't need to reset
%autoreload 2 

In [2]:
%reload_ext autoreload

In [3]:
# import the libraries
from align import (
    NeedlemanWunsch,
    read_fasta)
import numpy as np
from typing import Tuple

In [4]:
scores = np.zeros([(3 + 1), (2 + 1)])
scores

array([[0., 0., 0.],
       [0., 0., 0.],
       [0., 0., 0.],
       [0., 0., 0.]])

In [5]:
scores[:, 0] = [-1 * i for i in range(0, 3 + 1)]
scores = np.insert(scores, [0][0], 0)
scores

array([ 0.,  0.,  0.,  0., -1.,  0.,  0., -2.,  0.,  0., -3.,  0.,  0.])

In [6]:
seq1, _ = read_fasta("./data/test_seq1.fa")
seq2, _ = read_fasta("./data/test_seq2.fa")
seq1, seq2


('MYQR', 'MQR')

In [7]:
seq3, _ = read_fasta("./data/test_seq3.fa")
seq4, _ = read_fasta("./data/test_seq4.fa")
seq3, seq4

('MAVHQLIRRP', 'MQLIRHP')

In [8]:
N_W = NeedlemanWunsch(sub_matrix_file = "./substitution_matrices/BLOSUM62.mat", gap_open = -10, gap_extend = -1)
if ('M', 'M') in N_W.sub_dict:
    # get the score for the two values, return error if not a match/mismatch
    score = (N_W.sub_dict.get(('Q', 'Q'), 'NO VALUE'))
    
score

5.0

In [9]:
print(N_W.align(seq1, seq2))

[[  0. -10. -11. -12. -13.]
 [-10.   5.  -5. -11. -13.]
 [-11.  -5.   4.   0. -10.]
 [-12. -12.  -6.   5.   5.]]
[[0. 0. 0. 0. 0.]
 [0. 3. 2. 3. 3.]
 [0. 1. 3. 3. 2.]
 [0. 3. 1. 3. 3.]]
3 4
Q
2 3
Y
1 2
1 1
M
(5.0, 'MQQR', 'M-QR')


In [10]:
N_W.align(seq3, seq4)

[[  0. -10. -11. -12. -13. -14. -15. -16. -17. -18. -19.]
 [-10.   5.  -5. -10. -14. -13. -12. -14. -17. -18. -20.]
 [-11.  -5.   4.  -6. -10.  -9. -15. -15. -13. -16. -19.]
 [-12.  -9.  -6.   5.  -5. -12.  -5. -13. -17. -15. -19.]
 [-13. -11. -10.  -3.   2.  -8. -10.  -1. -11. -20. -18.]
 [-14. -14. -12. -13.  -3.   3.  -7. -11.   4.  -6. -16.]
 [-15. -16. -16. -15.  -5.  -3.   0. -10.  -6.   4.  -6.]
 [-16. -17. -17. -18. -15.  -6.  -6.  -3. -12.  -6.  11.]]
[[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 3. 2. 3. 3. 3. 3. 3. 3. 3. 3.]
 [0. 1. 3. 2. 3. 3. 3. 3. 3. 3. 3.]
 [0. 3. 1. 3. 2. 3. 3. 3. 3. 3. 3.]
 [0. 3. 3. 3. 3. 2. 3. 3. 2. 3. 3.]
 [0. 3. 3. 1. 3. 3. 2. 1. 3. 2. 2.]
 [0. 3. 3. 3. 3. 3. 3. 2. 1. 3. 2.]
 [0. 3. 3. 3. 1. 3. 3. 3. 3. 1. 3.]]
7 10
I
6 9
L
5 8
Q
4 7
H
3 6
V
2 5
A
1 4
M


(23.0, 'HQLIRRP', 'MQLIRHP')

In [11]:
N_W.align('JJKFGKJHSDKJ', 'JKFDHJKSFD')

[[  0. -10. -11. -12. -13. -14. -15. -16. -17. -18. -19. -20. -21.]
 [-10. -10. -20. -21. -22. -23. -24. -25. -26. -27. -28. -29. -30.]
 [-11. -20. -20. -15. -24. -24. -18. -28. -26. -26. -28. -23. -33.]
 [-12. -21. -30. -23.  -9. -19. -27. -28. -29. -28. -29. -31. -33.]
 [-13. -22. -31. -31. -19. -10. -20. -30. -29. -29. -22. -30. -40.]
 [-14. -23. -32. -32. -29. -20. -11. -21. -22. -30. -30. -23. -33.]
 [-15. -24. -33. -42. -39. -30. -21. -21. -31. -32. -40. -33. -33.]
 [-16. -25. -34. -28. -38. -40. -25. -31. -22. -31. -33. -35. -43.]
 [-17. -26. -35. -34. -30. -38. -35. -35. -32. -18. -28. -33. -43.]
 [-18. -27. -36. -38. -28. -33. -41. -45. -36. -28. -21. -31. -41.]
 [-19. -28. -37. -37. -38. -29. -34. -44. -46. -36. -22. -22. -32.]]
[[0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 3. 2. 3. 3. 3. 3. 3. 3. 3. 3. 3. 3.]
 [0. 1. 3. 3. 3. 3. 3. 2. 3. 3. 3. 3. 2.]
 [0. 3. 1. 3. 3. 2. 3. 3. 3. 3. 3. 3. 3.]
 [0. 3. 3. 3. 1. 3. 2. 2. 3. 3. 3. 3. 2.]
 [0. 3. 3. 3. 1. 1. 3. 2. 3. 3. 3. 3. 2.]

IndexError: string index out of range