In [3]:
import Bio
#%pip install biopython
from Bio.Seq import Seq

In [4]:
def PatternCount(Text, Pattern):
    """
    Creates a sliding window for a string and checks if the window matches the pattern.

    Args:
        Text (str): The input string.
        Pattern (str): The pattern to search for in the input string.

    Returns:
        int: The count of occurrences of the pattern in the input string.
    """
    count = 0
    for i in range(len(Text) - len(Pattern) + 1):
        if Text[i:i+len(Pattern)] == Pattern:
            count += 1
    return count

In [5]:
def FrequentWords(Text, k):
    """
    Finds more frequent k-mers in a string using a sliding window.

    Args:
        Text (str): The input string.
        k (int): The length of the k-mers.

    Returns:
        list: A list of the most frequent k-mers in the input string.
    """
    FrequentPatterns = set()
    Count = []
    for i in range(len(Text) - k + 1):
        Pattern = Text[i:i+k]
        Count.append(PatternCount(Text, Pattern))
    maxCount = max(Count)
    for i in range(len(Text) - k + 1):
        if Count[i] == maxCount:
            FrequentPatterns.add(Text[i:i+k])
    FrequentPatterns = list(FrequentPatterns)
    return FrequentPatterns

In [6]:
def FrequencyTable(Text, k):
    """
    Creates a frequency map of k-mers in the given Text.

    Parameters:
    Text (str): The input text.
    k (int): The length of the k-mers.

    Returns:
    dict: A dictionary containing the k-mers as keys and their frequencies as values.
    """
    freqMap = {}
    n = len(Text)
    for i in range(n - k + 1):
        Pattern = Text[i:i+k]
        if Pattern not in freqMap:
            freqMap[Pattern] = 1
        else:
            freqMap[Pattern] += 1
    return freqMap

In [7]:
def kmer_detector(Text,k):
    """
    Find all kmers in a given DNA sequence and its complementary strand and return their positions.

    Args:
        sequence (str): The DNA sequence to search for start codons.

    Returns:
        dict: A dictionary containing the positions of all start codons found in the sequence.

    """
    highest_kmer = 0
    kmer_dict = {}
    for i in range(len(Text) - int(k) + 1):
        kmer = Text[i:i+int(k)]
        if kmer not in kmer_dict:
            kmer_dict[kmer] = 1
        else:
            kmer_dict[kmer] += 1
    for i in kmer_dict:
        # if kmer_dict[i] == 1:
        #     pass
        if kmer_dict[i] > highest_kmer:
            highest_kmer = kmer_dict[i]
        elif kmer_dict[i] < highest_kmer:
            pass
    print("kmer_dict",kmer_dict)
    print("highest_kmer",highest_kmer)
    return kmer_dict

In [8]:
def reverse_complement(sequence):
    """
    Find all start codons in a given DNA sequence and its complementary strand and return their positions.

    Args:
        sequence (str): The DNA sequence to search for start codons.

    Returns:
        dict: A dictionary containing the positions of all start codons found in the sequence.

    """
    sequence = Seq(sequence)
    reverse_complement = sequence.reverse_complement()
    print("reverse_complement:",reverse_complement)
    return reverse_complement

In [9]:
def print_list_without_commas(x):
    items_str = [f"'{item}'" if isinstance(item, str) else str(item) for item in x]
    print("[" + " ".join(items_str) + "]")

In [10]:
def overlapping_pattern_matching(pattern, sequence):
    """
    Find all overlapping occurrences of a pattern in a sequence.

    Args:
        pattern (str): The pattern to search for.
        sequence (str): The sequence to search in.

    Returns:
        list: A list of positions where the pattern occurs in the sequence.
    """
    positions = []
    pattern_length = len(pattern)
    sequence_length = len(sequence)
    for i in range(sequence_length - pattern_length + 1):
        if sequence[i:i + pattern_length] == pattern:
            positions.append(i)

    return positions

In [11]:
def kmer_clump_finder(Text, k, L, t):
    """
    Uses a frequency table to find repeated k-mers in short intervals of the genome.
    
    Args:
        Text (str): The genome string.
        k (int): The length of the k-mer pattern.
        L (int): The length of the interval.
        t (int): The minimum number of occurrences for a k-mer pattern to be considered a clump.
        
    Returns:
        list: A list of unique k-mer patterns that form an (L,t)-clump inside the genome string.
        
    Note:
        This function does not take reverse complements into account.
    """
    Patterns = []
    n = len(Text)
    for i in range(n - L + 1):
        Window = Text[i:i+L]
        freqMap = FrequencyTable(Window, k)
        for s in freqMap:
            if freqMap[s] >= t:
                Patterns.append(s)
    Patterns = list(set(Patterns))
    return Patterns


In [12]:
def find_start_codons(sequence):
    """
    Find all start codons in a given DNA sequence and its complementary strand and return their positions.

    Args:
        sequence (str): The DNA sequence to search for start codons.

    Returns:
        dict: A dictionary containing the positions of all start codons found in the sequence.

    """
    with open(sequence, "r") as file:
        sequence = file.read()

    start_codon = "ATG"
    sequence = Seq(sequence)
    reverse_complement = sequence.reverse_complement()
    forward_codon_dict = {}
    reverse_codon_dict = {}

    for i in range(len(sequence) - 2):
        if sequence[i:i+3] == start_codon:
            forward_codon_dict[i] = sequence[i:i+3]

    for i in range(len(reverse_complement) - 2):
        if reverse_complement[i:i+3] == start_codon:
            reverse_codon_dict[len(sequence) - i - 3] = reverse_complement[i:i+3]
    #file.close()
    return forward_codon_dict, reverse_codon_dict

In [14]:
Text = "CGGACTCGACAGATGTGAAGAACGACAATGTGAAGACTCGACACGACAGAGTGAAGAGAAGAGGAAACATTGTAA"
pattern = "TAGATTGTA"
k= "12"
L = "50"
t = "4"
sequence = "TTAGATTGTTGTAGATTGATAGATTGTAGTAGATTGTACCATAGATTGGTTAGATTGGCGTAGATTGTCTAGATTGGTAGATTGTAGATTGCGGGTAGATTGTAGATTGACTAGATTGGCTGACGTAGATTGTAGATTGTTCCAATAGATTGCGGGGTGACGGTAGATTGGTAGATTGCTAGATTGGTAGATTGCTAGATTGTAGATTGTATGTAGATTGGCTTAGATTGATCTCATTAGATTGTTAGATTGACTGGTAGATTGTAGATTGCAGGTAGATTGTAGATTGTAGATTGTAGATTGTAGATTGTAAATAGATTGCCGTAGATTGAGAGTATAGATTGGCCGATTTAGATTGAATAGATTGTACTAGATTGATCGGTTCGAAGTCCTAGATTGCGACGTTAGATTGTAGATTGCTTAGATTGTTAAAAACCTCTAGATTGGTAGATTGTAGATTGCAGACCTAATGGATAGATTGCGCGCGTAGATTGCATAGATTGAACCCTAGATTGAGATAGATTGTAGATTGTAGATTGTCTGTAGATTGCCTAGATTGTAGATTGCACTAGTTAGATTGGCCCCTCGGTAGATTGTAGATTGCGTCTAGATTGTCTAGATTGTTAGATTGACAAGAGGTCTATAGATTGGACTGTAGATTGACTAGATTGTAGATTGTGTCTTAGATTGTAGATTGTAGATTGTCCGTAACTAGATTGATCTAGATTGCTTGGTAGATTGTAGATTGAACGCCTCGTTAGATTGATGATAGATTGCACTAGATTGACAGGCAGTAGATTGGACCGACATAGATTGCAATGTAGATTGGATAGATTGCATAGATTGCTAGATTGTTGCTAGATTGGCCATATAGATTGTTAGATTGATAGATTGCTAGATTGGCCTTAGATTGTCTTAGATTGAGAAACCAGTTAGATTGTAGATTGTAGATTGCCTAGATTGCAATAGATTGTAGATTGGTAGATTGATAGATTGATGGACTGGTTCACCATTAATTAGATTGATTAGATTGTAGATTGGTAGATTGCTAGATTGCTTTAGATTGGAATAGATTGTGGCATAGATTGTAGATTGGTAGATTGCTTCTAGATTGTAGATTGTTGGATAGATTGATAGATTGTTCAATAGATTGGGCTCATAGATTGAATTAGATTGTTCTAGATTGTAACTCACCTTAGATTGAGGTAGATTGTAGATTGTTCGGTAGATTGTAGATTGTAGATTGTCCCTAGATTGTTAGATTGTAAAGCTACTAGATTGAAGTAGATTGACGAGTTAGATTGATATTATAGATTGTAGATTGAGGTTTATAGATTGGTCCTAGATTGTAGATTGATTAGATTGGTTAGATTGCTAGATTGCCCTAGATTGTAGATTGCAACACTATAGATTGGGTTAGATTGACGGAAGTATTAGATTGATAGATTGTATATAGATTGGTAGATTGCCTAGATTGATTCCATAGATTGTTCGCTAGATTGCTGTAGATTGTCTCTAATAGATTGTAGATTGGCCTAGATTGCCACTAGATTGGCACAACATTAGATTGTAGATTGTTTAGATTGATAGATTGACTAGATTGAACGGGTAGATTGCTACTAGATTGATAGATTGGTAGATTGGCGTATATAGATTGTAGATTGTCTTTAGATTGACGCCAGTAGATTGCTTAGATTGCTAGATTGAAATGAGTAGATTGTTTTTAGATTGGTAGATTGCTAGATTGCTTGGGGTAGATTGCTAGATTGTAGATTGCTAGATTGTTAGATTGCCGGTAGATTGCATATTAGATTGCCGAACCTAAGCAAGTCTAACTAGATTGCACCTAGATTGCACGCAGCTAGATTGCGCTAGATTGGACCTTTAGATTGATAGATTGGCTAGATTGTTAGATTGTAGATTGCAGTCCGTAGATTGATCTTAGATTGCTAGATTGGAAACTAGATTGTAGATTGCTAGATTGTTGGTAGATTGCTACTCGTAGATTGTTAGATTGTTAGATTGTAGATTGCTAGATTGTAGATTGTATAGATTGCTGCTCTAGATTGATTGTTAGATTGATAGATTGGAGTAGATTGATTCTAGATTGGTAGATTGCTAGATTGTAGATTGTAGATTGAGAGTAGATTGAGTAGATTGATAGATTGTAGATTGATAGATTGTAGATTGCGGTATGTAGATTGGGCCTAAATAGATTGGCGTAGATTGCTAGATTGTGAAAATAGATTGTAGATTGATATAGATTGGTTAGATTGTAGATTGGGGAACTGTAGATTGTATTGTAGATTGCGCGCATATAGATTGCGTTAGATTGATTAGATTGTAGATTGGATAGATTGTGTAAATAGATTGTAGATTGGTGCTATTAGATTGTAGATTGTTAGATTGCTAGATTGTTACTTATAGATTGATTAGATTGCACTTAGATTGAAGGTAGATTGTAGATTGCTAGATTGAATACTAGATTGGGTAGATTGATGGGCTAGATTGTTTAGATTGCGTGAGCTCTAGATTGGCTTTAGATTGACTAGATTGCATTTAGATTGTTGCGTAGATTGGTAGATTGTAGATTGTATAGATTGTAGATTGTAGATTGTGGTAGATTGAGAAGTACCTTAGATTGTAGATTGTTTAGATTGGTTAGATTGGCCTAGATTGCCAGCGTAGATTGTACATAGATTGACAAGTAGATTGTAGATTGGGTATAGATTGTATAGTAGATTGTTAGATTGATGTTTAGGGTGCTAGATTGGCCATCCGTCTAGATTGCATAGATTGTAGATTGCCTAGATTGGACGCTTTAACTCTTAGTAGGACAGACGTAGATTGGCTAGATTGTGTAGATTGTAGATTGATAGATTGTAGATTGTAGATTGCCGTAGATTGTAGGTAGATTGTAGATTGTAGATTGCGTCACTTTAGATTGATAGATTGATAGATTGATAGATTGGGATAGATTGCTAGATTGGGTAGATTGGGATAGATTGAATCGTTAGATTGTAGATTGACGTACGTTTAGATTGCATAGATTGATGAGACTAGATTGTGCTTAGATTGTAAGTTAGATTGACCTAGATTGTTAGATTGGCTAGATTGCTAGATTGCGTGAAAAGTAGATTGTAGATTGCCGACTAGATTGGCGCTAGATTGTCCAGCTAGATTGCCCCCGTAGATTGCCCTAGATTGGGTAGATTGTAGATTGAGGGCGGACGTAGATTGTCTAGATTGTAGATTGCAGGAAGGAGTTAGATTGGCTAGGGTAGATTGTAGATTGTTAGATTGATAGATTGTGTAGATTGTATAGATTGCTTAGATTGTAGATTGTAGATTGCGTAGATTGAGGACTAGATTGTTAGATTGCTAGATTGTAGATTGATAGATTGGATAGATTGATTAGATTGCTTAGATTGATAGATTGGCTAGATTGGGGCAAATAGATTGAAAACAGATAGATTGATCATTAGATTGTAGATTGATTGGTAGATTGTCTAGATTGTAGATTGTAGATTGGCCATATAGATTGTAGATTGCAGTTTAGATTGGTTAGATTGTTATGTCTTTTAGATTGTAGATTGCTCTAGATTGGCATAGATTGGCTAGATTGGTTAGATTGTAGATTGACACTAGATTGCGCGTAGATTGGTAGATTGGATGTAGATTGGCGCTATAGATTGATGCGAGGGGTAGATTGCTTAGATTGCATTTTAGATTGTAATAGATTGGTGTTAGATTGGACTAGATTGGGTTAGATTGTAGATTGGTAGATTGAAGGCTAGATTGGATAGATTGGCTTAGATTGGATCCATAGATTGCAGTCCCTAGATTGTTAGATTGCATTTGTTAGATTGTAGATTGTTTAGATTGGGTAGATTGTTAGATTGTAGATTGTAGATTGTAGATTGGTAGATTGGGCTATTTCATAGATTGTAGATTGTAGATTGATAGATTGATTAGATTGGACTAGATTGTAGATTGTTAGATTGCATCGTAGATTGTAGATTGTAGATTGCAATAGATTGGAAACATGATAGATTGCTGAGTGTTAGATTGTAGATTGACTAGATTGCCTTGTTAGATTGTACGCAGTAGATTGGATTAGATTGTTATAGATTGTCTTAAGGAAGATTAGATTGGTCTATAGATTGTAGATTGTAGATTGGTAGATTGTAGATTGTGCTGACTAACTGTAGATTGGTAGATTGTAGATTGTTAGATTGGTTTTAGATTGTTAGATTGTATCGTAGATTGAATCATCGGTCTAGACCTCCTAGATTGTTCGAAGTAGATTGTAGATTGTAGATTGTGCGTTAGATTGTAGATTGTAGATTGTCCCAAATACGATAGATTGAAGGGTTAGATTGTAGATTGTAGATTGTAGATTGCAACTAGATTGTAGATTGTAGATTGCATAGATTGTAGATTGTTACGCCCTGCTAGATTGATTTAGATTGTCTAGATTGGTAGTAGATTGTCTAGATTGGTAGATTGTAGATTGCATAGATTGCGTAGATTGTAGATTGTAGATTGTCCTACTAGATTGCTATAGATTGTTAGATTGTAGATTGTAACTAGATTGGACCATAGATTGCCTAGATTGCTAGATTGTAGATTGAAGAGTGATCGCTTGGTCTAGATTGTCTAGATTGTGAGTAGATTGTCCAGTAGATTGACGCCAGAGCTAGATTGTGGGTTAGATTGAGCTTAGATTGTAGATTGCTGATATAGATTGATATAGATTGCCTAGATTGACCCTAGATTGCTTCTAGATTGTTAGATTGATCGGGCATAGATTGCGAATAGATTGTAGATTGTAGATTGACGACTAGATTGGATTCCTAGATTGCTAGATTGTAGATTGGGCAGTAGATTGGTTAGATTGGATAGATTGAGTAGATTGTAGATTGCGTAGATTGTTAGATTGATAGATTGTAGATTGATAGATTGGCATAGATTGCTGCTTCTAGATTGTAGATTGTGTAGATTGTATGAGCTAGATTGAGGAGTAGATTGGCGTAGATTGAAGTAGATTGCTAGATTGTTAGATTGTAGATTGTAGATTGTGTAGATTGGGTAGATTGTGTAGATTGTAGATTGTAGATTGGATTAGATTGTTTCCGACTGATAGATTGGTTAGATTGATTAGATTGGTAGATTGCTTAGATTGAGCTAGATTGTGTAGATTGTAGATTGATAGATTGCTAGATTGTCTAGATTGCCCTAGATTGTTCGCATTAGATTGTAGATTGGAATAGATTGTATTGTGCACTTTAGATTGGTGATTCTAGATTGCTAGATTGGCTAGATTGTAGATTGGCATAGAACCAGGCTAGATTGATTAGATTGATAGATTGTGTAGATTGGGTAGATTGTAGATTGCCATTGAACATAGATTGTAGATTGTAGATTGGTAGATTGCTAGATTGGGATAGATTGTAGATTGATAGATTGTAGATTGGGTTTAGATTGTAGATTGAATAGATTGACATTAGATTGTAGATTGATTAGATTGTTAGATTGTGAGTAGATTGTAGATTGTCAGTAGATTGCTAGATTGTAGATTGTATAGATTGTAGATTGTGTAGATTGATTCCTAGATTGCTATTCTAGATTGATTTAGATTGTAGATTGTTTATAGATTGTGACTAGATTGGGTAGATTGGAGTAGATTGTAGATTGTAGATTGATTGAACGCGTAAGATAGATTGAGGGGCGTAACGCTTGGTAGATTGATTTAGATTGTAGATTGGGTCGCTAGATTGCATTAGATTGTAGATTGTAGATTGTAGATTGATAGATTGCAGGTATAAGTCTAGATTGTAGATTGTAGATTGTAGATTGGTTAGATTGGGCCAATAGATTGCCGGTTAGATTGATTTCATAGATTGTTCTAGATTGTGATAGATTGTAGATTGGTTTTAGATTGACGCTAGATTGTGGTAGATTGTAGATTGCAGGTAGATTGTAGATTGTAGATTGACCTAGATTGCAATTAGATTGTTAGATTGTAGATTGCCTTCCTAGATTGTAAGGGACGTGTTAGATTGTAGATTGCTAGATTGTGACCTAGATTGTAGATTGCACGAAATAGATTGATAGATTGATAGATTGTTAGATTGCGCGTAGATTGTAGATTGTAGATTGCTCTAGATTGCGGTAGATTGAATTAGCTAGATTGTTAATAGATTGCGGCAACGTCTAGATTGTAGATTGTCGTTAGATTGGTCGGTAGATTGACATAGATTGGTAGATTGGTAGATTGTTAGATTGGATAGATTGGAGATTTAGATTGACTAGATTGATAGATTGGTAGATTGAGTAGATTGCTAGATTGACGTAGATTGGGTAGATTGTGTAGCATAGATTGTGGGTAGATTGAGTAGATTGTCGCTAGATTGTTGTAGATTGCATCTGGTAGATTGCTAGATTGGACTAGATTGATAGATTGTAGATTGTAGATTGCTAGATTGGCTCTTAGATTGTATTAGATTGTATAGATTGGTAGATTGCGGGCTAGGCTAGATTGTAGATTGCCGTCCGTTTTATATAGATTGCCTAGATTGAGAGTGTAGATTGTAGATTGAATAGATTGAGCTGCTAGATTGACAGCATAGATTGCAGTATAGATTGCATCTAGATTGGCTAGATTGTCGGGTAGATTGCTAGATTGTAGATTGAATGTTAGATTGTAGATTGATGTTTAGATTGTAGATTGTTAGATTGGTAGATTGTAGATTGTAGATTGGTCTAGATTGAGCTAGATTGTGGTTGCTAGATTGATAGATTGTCTAGATTGTAGATTGAAATAGATTGTAGATTGCCGGGTTCCCTAGATTGTAGATTGGATAGATTGTGTAGATTGTCTAGATTGTAGATTGTGTAAAAAGGGATAGATTGGATAGATTGCGTAGATTGTTTAGATTGATAGATTGTAGATTGCAAGCCAGCAATAGATTGCGCGCCATAGATTGGGTAGATTGTTAGATTGTAGATTGTAGATTGTAGATTGGTAGATTGGTCTAGATTGCGCTAGATTGGTAGATTGCACAGTAGTACCACTGTAGATTGATTAGATTGGTAGATTGTAGATTGTAGATTGATCTAGATTGATAGTACAGTAGATTGCAATCCATTAGATTGAGTTTTGCACATAGATTGATTAGATTGAATTAGATTGTAGATTGAACTAGATTGCATAGATTGGGTAATCCGCGTTAGATTGCTTAGATTGCCGTCACATAGATTGTTAGATTGACATAGATTGTTAGATTGGTAGCCTGTGGCTAGATTGTAGATTGATAGATTGTTAGATTGGTATAGATTGCTGTAGATTGAGCTAGATTGACGTAGATTGTTAGATTGGAATAGATTGCCTAGATTGTACCAATTAGATTGCTAGATTGGTAGATTGTGGCATGATGTAGATTGGTTAGATTGACGGGTAGATTGTAGATTGTCATCTAGATTGCTAGATTGAATAGATTGTTAGATTGACTAGATTGTAGATTGTAGATTGTAGATTGCCCCATAGATTGTAGATTGGCTCGTAGATTGTAGATTGACGCTAGATTGGTAGATTGATCAACTTCGTAGATTGTTAGATTGTAGATTGGTAGTAGATTGAATAGATTGTAGATTGATAGATTGTAGATTGTCGTTCTAGATTGGTAGATTGGCTTAGATTGTTAGATTGCCTAGATTGTTATATAGATTGTAGATTGCGGTTAGATTGCAAGTTAGATTGTAGATTGTAGATTGGTAGATTGTAGATTGAACGATAGATTGGCTAGTATAGATTGTATAGATTGTAGATTGATGTAGATTGTAGATTGTAGATTGAGCTTAGATTGTAGATTGATAGATTGACCTAGATTGTAGACTCCCAGGGTGTAGATTGTAGATTGAGTAGATTGTGTTAGATTGAACGAGTAGATTGGGTAGATTGTAGATTGTAGATTGTTTAGATTGGTAGATTGTCTAGATTGATAGATTGCCCTAGATTGTAGATTGTAGATTGTAGATTGCATTTAGATTGTAGATTGCCTCTCGCCATGTAGATTGGGACTAGATTGTGGCTGATTTAGATTGCACAAGAATCTCTATTCATTAGATTGTAGATTGTAGATTGTAGATTGGACATAGATTGCATAGATTGATAGATTGTAGATTGCCTCGTAGATTGTAGATTGGACGTAGATTGGTAGATTGGTAGATTGGGCTAGATTGAAACACGTATATCTCTAGATTGTAGATTGGGATTAGATTGCCGCACAATAGATTGCTAGATTGAATAGATTGGCCTTAGATTGTTTAGATTGTAGATTGGGTATAGATTGCTAGATTGCTCCTGATTAGATTGAGCTAGATTGGGTAGATTGTGGATAGGGTAGATTGCCTAGATTGGTAGATTGGCTTAGATTGAATAGATTGATAGATTGGGTAGATTGTCTAGATTGTAGATTGAGATGTAGATTGACTTAGATTGCACCTATTAGATTGTCCTAGATTGTGTTAGATTGTAGAGAACATAGATTGCTTAGATTGCGTAAACTAGATTGTTAGATTGTTAGATTGTAGATTGTAGATTGAAACGTTCCCATAGATTGACGGACAAGTTAGATTGGTTTAGATTGAGGTAGTAGATTGGTGCACGTAGATTGTAGATTGTAGATTGGCCGCCCATTACATAGATTGAATATTAGATTGTAGATTGTCCTAGATTGGGGTGAGCATAGATTGTTTCTAGATTGCTAGATTGATTCTTTTGTTGTGACTTAGATTGCTTCGTATAGATTGGTAGATTGATGTATTAGATTGTAGATTGTGTGTAGATTGTAGATTGATCTAGATTGCTAGATTGGAGTAGATTGTCCATAGATTGTCCTTAAGCTTAGATTGTAGATTGGTTTAGATTGTAGATTGTAGATTGAATAGATTGTTAGATTGGGTGGCCCACGTAGATTGGCGTAGATTGACTAGATTGGTTTAGATTGTAGATTGTAGATTGATAGATTGGTCTAGATTGACTTAGATTGTAGATTGTGCTAGATTGCTAGATTGGCGTAGATTGCTAGATTGCTAGATTGCGCTAGATTGTAGATTGTAGATTGGATAGATTGTAGATTGTAGATTGTGTAGATTGTGATAGATTGTGTAGATTGCGGCATAGATTGGAGTAGATTGCTTTAGATTGGTATAGATTGGCTAGATTGAGTAGATTGTAGATTGACTTAGATTGTATAGATTGGGTTGCCTTAGATTGCTTAGATTGCTAGATTGTAGATTGTAGATTGTTTAGATTGAGGCCCTCGTTGAGTTAACTAGATTGCGGTGACGTTAGATTGATAGATTGAGAGTCGTAGATTGACTAGATTGAATAGATTGCCCTACTTTTCTAGATTGAACTCTAGATTGTTTTCCCTTAGATTGTAGATTGGGTTAGATTGGGAGTTAGATTGTCTTGGTAGATTGTAGATTGTGTAGATTGCATTTAGATTGGCTCTAGATTGTAGATTGCTAGATTGCCCCCGGATAGATTGCTTAGATTG"
# forward_codon_dict, reverse_codon_dict= find_start_codons("/home/namorak/Bioinformatics_Portfolio/Data/Vibrio_cholera_genome.txt")
# print("forward_codon_dict",forward_codon_dict)
# print("reverse_codon_dict",reverse_codon_dict)
#kmer_detector(Text,k)
#reverse_complement(sequence)
positions= overlapping_pattern_matching(pattern, sequence)
print_list_without_commas(positions)
kmer_clump_finder(Text, k, L, t)

[19 29 77 95 125 195 202 257 275 282 289 296 303 360 405 447 518 525 552 589 664 683 690 734 933 940 966 1026 1081 1107 1179 1206 1225 1232 1258 1310 1342 1385 1442 1519 1563 1650 1762 1910 1962 2018 2033 2040 2119 2126 2161 2176 2243 2269 2291 2337 2366 2387 2455 2580 2587 2596 2603 2637 2685 2708 2726 2792 2861 2876 2883 2900 2911 2918 3014 3071 3134 3209 3242 3281 3313 3331 3338 3382 3482 3510 3517 3537 3582 3627 3726 3767 3862 3895 3902 3909 3941 3948 3982 4009 4016 4064 4093 4159 4166 4181 4216 4250 4303 4310 4329 4336 4375 4382 4389 4407 4414 4430 4502 4527 4534 4572 4579 4619 4723 4818 4825 4865 4911 4943 4982 4998 5060 5067 5101 5108 5197 5253 5270 5320 5383 5407 5414 5447 5462 5480 5507 5542 5568 5575 5584 5635 5683 5690 5753 5783 5790 5797 5831 5838 5845 5919 5958 5976 5983 6019 6039 6058 6085 6141 6148 6217 6459 6466 6493 6503 6537 6587 6681 6700 6719 6742 6749 6807 6824 6848 6882 6943 6999 7006 7013 7096 7103 7188 7302 7392 7460 7513 7520 7527 7546 7565 7616 7643 7658 7725 

TypeError: unsupported operand type(s) for -: 'int' and 'str'

In [13]:
# def main():
#     Text = "CGGACTCGACAGATGTGAAGAACGACAATGTGAAGACTCGACACGACAGAGTGAAGAGAAGAGGAAACATTGTAA"
#     pattern = "TAGATTGTA"
#     k= "12"
#     L = "50"
#     t = "4"
#     sequence = "TTAGATTGTTGTAGATTGATAGATTGTAGTAGATTGTACCATAGATTGGTTAGATTGGCGTAGATTGTCTAGATTGGTAGATTGTAGATTGCGGGTAGATTGTAGATTGACTAGATTGGCTGACGTAGATTGTAGATTGTTCCAATAGATTGCGGGGTGACGGTAGATTGGTAGATTGCTAGATTGGTAGATTGCTAGATTGTAGATTGTATGTAGATTGGCTTAGATTGATCTCATTAGATTGTTAGATTGACTGGTAGATTGTAGATTGCAGGTAGATTGTAGATTGTAGATTGTAGATTGTAGATTGTAAATAGATTGCCGTAGATTGAGAGTATAGATTGGCCGATTTAGATTGAATAGATTGTACTAGATTGATCGGTTCGAAGTCCTAGATTGCGACGTTAGATTGTAGATTGCTTAGATTGTTAAAAACCTCTAGATTGGTAGATTGTAGATTGCAGACCTAATGGATAGATTGCGCGCGTAGATTGCATAGATTGAACCCTAGATTGAGATAGATTGTAGATTGTAGATTGTCTGTAGATTGCCTAGATTGTAGATTGCACTAGTTAGATTGGCCCCTCGGTAGATTGTAGATTGCGTCTAGATTGTCTAGATTGTTAGATTGACAAGAGGTCTATAGATTGGACTGTAGATTGACTAGATTGTAGATTGTGTCTTAGATTGTAGATTGTAGATTGTCCGTAACTAGATTGATCTAGATTGCTTGGTAGATTGTAGATTGAACGCCTCGTTAGATTGATGATAGATTGCACTAGATTGACAGGCAGTAGATTGGACCGACATAGATTGCAATGTAGATTGGATAGATTGCATAGATTGCTAGATTGTTGCTAGATTGGCCATATAGATTGTTAGATTGATAGATTGCTAGATTGGCCTTAGATTGTCTTAGATTGAGAAACCAGTTAGATTGTAGATTGTAGATTGCCTAGATTGCAATAGATTGTAGATTGGTAGATTGATAGATTGATGGACTGGTTCACCATTAATTAGATTGATTAGATTGTAGATTGGTAGATTGCTAGATTGCTTTAGATTGGAATAGATTGTGGCATAGATTGTAGATTGGTAGATTGCTTCTAGATTGTAGATTGTTGGATAGATTGATAGATTGTTCAATAGATTGGGCTCATAGATTGAATTAGATTGTTCTAGATTGTAACTCACCTTAGATTGAGGTAGATTGTAGATTGTTCGGTAGATTGTAGATTGTAGATTGTCCCTAGATTGTTAGATTGTAAAGCTACTAGATTGAAGTAGATTGACGAGTTAGATTGATATTATAGATTGTAGATTGAGGTTTATAGATTGGTCCTAGATTGTAGATTGATTAGATTGGTTAGATTGCTAGATTGCCCTAGATTGTAGATTGCAACACTATAGATTGGGTTAGATTGACGGAAGTATTAGATTGATAGATTGTATATAGATTGGTAGATTGCCTAGATTGATTCCATAGATTGTTCGCTAGATTGCTGTAGATTGTCTCTAATAGATTGTAGATTGGCCTAGATTGCCACTAGATTGGCACAACATTAGATTGTAGATTGTTTAGATTGATAGATTGACTAGATTGAACGGGTAGATTGCTACTAGATTGATAGATTGGTAGATTGGCGTATATAGATTGTAGATTGTCTTTAGATTGACGCCAGTAGATTGCTTAGATTGCTAGATTGAAATGAGTAGATTGTTTTTAGATTGGTAGATTGCTAGATTGCTTGGGGTAGATTGCTAGATTGTAGATTGCTAGATTGTTAGATTGCCGGTAGATTGCATATTAGATTGCCGAACCTAAGCAAGTCTAACTAGATTGCACCTAGATTGCACGCAGCTAGATTGCGCTAGATTGGACCTTTAGATTGATAGATTGGCTAGATTGTTAGATTGTAGATTGCAGTCCGTAGATTGATCTTAGATTGCTAGATTGGAAACTAGATTGTAGATTGCTAGATTGTTGGTAGATTGCTACTCGTAGATTGTTAGATTGTTAGATTGTAGATTGCTAGATTGTAGATTGTATAGATTGCTGCTCTAGATTGATTGTTAGATTGATAGATTGGAGTAGATTGATTCTAGATTGGTAGATTGCTAGATTGTAGATTGTAGATTGAGAGTAGATTGAGTAGATTGATAGATTGTAGATTGATAGATTGTAGATTGCGGTATGTAGATTGGGCCTAAATAGATTGGCGTAGATTGCTAGATTGTGAAAATAGATTGTAGATTGATATAGATTGGTTAGATTGTAGATTGGGGAACTGTAGATTGTATTGTAGATTGCGCGCATATAGATTGCGTTAGATTGATTAGATTGTAGATTGGATAGATTGTGTAAATAGATTGTAGATTGGTGCTATTAGATTGTAGATTGTTAGATTGCTAGATTGTTACTTATAGATTGATTAGATTGCACTTAGATTGAAGGTAGATTGTAGATTGCTAGATTGAATACTAGATTGGGTAGATTGATGGGCTAGATTGTTTAGATTGCGTGAGCTCTAGATTGGCTTTAGATTGACTAGATTGCATTTAGATTGTTGCGTAGATTGGTAGATTGTAGATTGTATAGATTGTAGATTGTAGATTGTGGTAGATTGAGAAGTACCTTAGATTGTAGATTGTTTAGATTGGTTAGATTGGCCTAGATTGCCAGCGTAGATTGTACATAGATTGACAAGTAGATTGTAGATTGGGTATAGATTGTATAGTAGATTGTTAGATTGATGTTTAGGGTGCTAGATTGGCCATCCGTCTAGATTGCATAGATTGTAGATTGCCTAGATTGGACGCTTTAACTCTTAGTAGGACAGACGTAGATTGGCTAGATTGTGTAGATTGTAGATTGATAGATTGTAGATTGTAGATTGCCGTAGATTGTAGGTAGATTGTAGATTGTAGATTGCGTCACTTTAGATTGATAGATTGATAGATTGATAGATTGGGATAGATTGCTAGATTGGGTAGATTGGGATAGATTGAATCGTTAGATTGTAGATTGACGTACGTTTAGATTGCATAGATTGATGAGACTAGATTGTGCTTAGATTGTAAGTTAGATTGACCTAGATTGTTAGATTGGCTAGATTGCTAGATTGCGTGAAAAGTAGATTGTAGATTGCCGACTAGATTGGCGCTAGATTGTCCAGCTAGATTGCCCCCGTAGATTGCCCTAGATTGGGTAGATTGTAGATTGAGGGCGGACGTAGATTGTCTAGATTGTAGATTGCAGGAAGGAGTTAGATTGGCTAGGGTAGATTGTAGATTGTTAGATTGATAGATTGTGTAGATTGTATAGATTGCTTAGATTGTAGATTGTAGATTGCGTAGATTGAGGACTAGATTGTTAGATTGCTAGATTGTAGATTGATAGATTGGATAGATTGATTAGATTGCTTAGATTGATAGATTGGCTAGATTGGGGCAAATAGATTGAAAACAGATAGATTGATCATTAGATTGTAGATTGATTGGTAGATTGTCTAGATTGTAGATTGTAGATTGGCCATATAGATTGTAGATTGCAGTTTAGATTGGTTAGATTGTTATGTCTTTTAGATTGTAGATTGCTCTAGATTGGCATAGATTGGCTAGATTGGTTAGATTGTAGATTGACACTAGATTGCGCGTAGATTGGTAGATTGGATGTAGATTGGCGCTATAGATTGATGCGAGGGGTAGATTGCTTAGATTGCATTTTAGATTGTAATAGATTGGTGTTAGATTGGACTAGATTGGGTTAGATTGTAGATTGGTAGATTGAAGGCTAGATTGGATAGATTGGCTTAGATTGGATCCATAGATTGCAGTCCCTAGATTGTTAGATTGCATTTGTTAGATTGTAGATTGTTTAGATTGGGTAGATTGTTAGATTGTAGATTGTAGATTGTAGATTGGTAGATTGGGCTATTTCATAGATTGTAGATTGTAGATTGATAGATTGATTAGATTGGACTAGATTGTAGATTGTTAGATTGCATCGTAGATTGTAGATTGTAGATTGCAATAGATTGGAAACATGATAGATTGCTGAGTGTTAGATTGTAGATTGACTAGATTGCCTTGTTAGATTGTACGCAGTAGATTGGATTAGATTGTTATAGATTGTCTTAAGGAAGATTAGATTGGTCTATAGATTGTAGATTGTAGATTGGTAGATTGTAGATTGTGCTGACTAACTGTAGATTGGTAGATTGTAGATTGTTAGATTGGTTTTAGATTGTTAGATTGTATCGTAGATTGAATCATCGGTCTAGACCTCCTAGATTGTTCGAAGTAGATTGTAGATTGTAGATTGTGCGTTAGATTGTAGATTGTAGATTGTCCCAAATACGATAGATTGAAGGGTTAGATTGTAGATTGTAGATTGTAGATTGCAACTAGATTGTAGATTGTAGATTGCATAGATTGTAGATTGTTACGCCCTGCTAGATTGATTTAGATTGTCTAGATTGGTAGTAGATTGTCTAGATTGGTAGATTGTAGATTGCATAGATTGCGTAGATTGTAGATTGTAGATTGTCCTACTAGATTGCTATAGATTGTTAGATTGTAGATTGTAACTAGATTGGACCATAGATTGCCTAGATTGCTAGATTGTAGATTGAAGAGTGATCGCTTGGTCTAGATTGTCTAGATTGTGAGTAGATTGTCCAGTAGATTGACGCCAGAGCTAGATTGTGGGTTAGATTGAGCTTAGATTGTAGATTGCTGATATAGATTGATATAGATTGCCTAGATTGACCCTAGATTGCTTCTAGATTGTTAGATTGATCGGGCATAGATTGCGAATAGATTGTAGATTGTAGATTGACGACTAGATTGGATTCCTAGATTGCTAGATTGTAGATTGGGCAGTAGATTGGTTAGATTGGATAGATTGAGTAGATTGTAGATTGCGTAGATTGTTAGATTGATAGATTGTAGATTGATAGATTGGCATAGATTGCTGCTTCTAGATTGTAGATTGTGTAGATTGTATGAGCTAGATTGAGGAGTAGATTGGCGTAGATTGAAGTAGATTGCTAGATTGTTAGATTGTAGATTGTAGATTGTGTAGATTGGGTAGATTGTGTAGATTGTAGATTGTAGATTGGATTAGATTGTTTCCGACTGATAGATTGGTTAGATTGATTAGATTGGTAGATTGCTTAGATTGAGCTAGATTGTGTAGATTGTAGATTGATAGATTGCTAGATTGTCTAGATTGCCCTAGATTGTTCGCATTAGATTGTAGATTGGAATAGATTGTATTGTGCACTTTAGATTGGTGATTCTAGATTGCTAGATTGGCTAGATTGTAGATTGGCATAGAACCAGGCTAGATTGATTAGATTGATAGATTGTGTAGATTGGGTAGATTGTAGATTGCCATTGAACATAGATTGTAGATTGTAGATTGGTAGATTGCTAGATTGGGATAGATTGTAGATTGATAGATTGTAGATTGGGTTTAGATTGTAGATTGAATAGATTGACATTAGATTGTAGATTGATTAGATTGTTAGATTGTGAGTAGATTGTAGATTGTCAGTAGATTGCTAGATTGTAGATTGTATAGATTGTAGATTGTGTAGATTGATTCCTAGATTGCTATTCTAGATTGATTTAGATTGTAGATTGTTTATAGATTGTGACTAGATTGGGTAGATTGGAGTAGATTGTAGATTGTAGATTGATTGAACGCGTAAGATAGATTGAGGGGCGTAACGCTTGGTAGATTGATTTAGATTGTAGATTGGGTCGCTAGATTGCATTAGATTGTAGATTGTAGATTGTAGATTGATAGATTGCAGGTATAAGTCTAGATTGTAGATTGTAGATTGTAGATTGGTTAGATTGGGCCAATAGATTGCCGGTTAGATTGATTTCATAGATTGTTCTAGATTGTGATAGATTGTAGATTGGTTTTAGATTGACGCTAGATTGTGGTAGATTGTAGATTGCAGGTAGATTGTAGATTGTAGATTGACCTAGATTGCAATTAGATTGTTAGATTGTAGATTGCCTTCCTAGATTGTAAGGGACGTGTTAGATTGTAGATTGCTAGATTGTGACCTAGATTGTAGATTGCACGAAATAGATTGATAGATTGATAGATTGTTAGATTGCGCGTAGATTGTAGATTGTAGATTGCTCTAGATTGCGGTAGATTGAATTAGCTAGATTGTTAATAGATTGCGGCAACGTCTAGATTGTAGATTGTCGTTAGATTGGTCGGTAGATTGACATAGATTGGTAGATTGGTAGATTGTTAGATTGGATAGATTGGAGATTTAGATTGACTAGATTGATAGATTGGTAGATTGAGTAGATTGCTAGATTGACGTAGATTGGGTAGATTGTGTAGCATAGATTGTGGGTAGATTGAGTAGATTGTCGCTAGATTGTTGTAGATTGCATCTGGTAGATTGCTAGATTGGACTAGATTGATAGATTGTAGATTGTAGATTGCTAGATTGGCTCTTAGATTGTATTAGATTGTATAGATTGGTAGATTGCGGGCTAGGCTAGATTGTAGATTGCCGTCCGTTTTATATAGATTGCCTAGATTGAGAGTGTAGATTGTAGATTGAATAGATTGAGCTGCTAGATTGACAGCATAGATTGCAGTATAGATTGCATCTAGATTGGCTAGATTGTCGGGTAGATTGCTAGATTGTAGATTGAATGTTAGATTGTAGATTGATGTTTAGATTGTAGATTGTTAGATTGGTAGATTGTAGATTGTAGATTGGTCTAGATTGAGCTAGATTGTGGTTGCTAGATTGATAGATTGTCTAGATTGTAGATTGAAATAGATTGTAGATTGCCGGGTTCCCTAGATTGTAGATTGGATAGATTGTGTAGATTGTCTAGATTGTAGATTGTGTAAAAAGGGATAGATTGGATAGATTGCGTAGATTGTTTAGATTGATAGATTGTAGATTGCAAGCCAGCAATAGATTGCGCGCCATAGATTGGGTAGATTGTTAGATTGTAGATTGTAGATTGTAGATTGGTAGATTGGTCTAGATTGCGCTAGATTGGTAGATTGCACAGTAGTACCACTGTAGATTGATTAGATTGGTAGATTGTAGATTGTAGATTGATCTAGATTGATAGTACAGTAGATTGCAATCCATTAGATTGAGTTTTGCACATAGATTGATTAGATTGAATTAGATTGTAGATTGAACTAGATTGCATAGATTGGGTAATCCGCGTTAGATTGCTTAGATTGCCGTCACATAGATTGTTAGATTGACATAGATTGTTAGATTGGTAGCCTGTGGCTAGATTGTAGATTGATAGATTGTTAGATTGGTATAGATTGCTGTAGATTGAGCTAGATTGACGTAGATTGTTAGATTGGAATAGATTGCCTAGATTGTACCAATTAGATTGCTAGATTGGTAGATTGTGGCATGATGTAGATTGGTTAGATTGACGGGTAGATTGTAGATTGTCATCTAGATTGCTAGATTGAATAGATTGTTAGATTGACTAGATTGTAGATTGTAGATTGTAGATTGCCCCATAGATTGTAGATTGGCTCGTAGATTGTAGATTGACGCTAGATTGGTAGATTGATCAACTTCGTAGATTGTTAGATTGTAGATTGGTAGTAGATTGAATAGATTGTAGATTGATAGATTGTAGATTGTCGTTCTAGATTGGTAGATTGGCTTAGATTGTTAGATTGCCTAGATTGTTATATAGATTGTAGATTGCGGTTAGATTGCAAGTTAGATTGTAGATTGTAGATTGGTAGATTGTAGATTGAACGATAGATTGGCTAGTATAGATTGTATAGATTGTAGATTGATGTAGATTGTAGATTGTAGATTGAGCTTAGATTGTAGATTGATAGATTGACCTAGATTGTAGACTCCCAGGGTGTAGATTGTAGATTGAGTAGATTGTGTTAGATTGAACGAGTAGATTGGGTAGATTGTAGATTGTAGATTGTTTAGATTGGTAGATTGTCTAGATTGATAGATTGCCCTAGATTGTAGATTGTAGATTGTAGATTGCATTTAGATTGTAGATTGCCTCTCGCCATGTAGATTGGGACTAGATTGTGGCTGATTTAGATTGCACAAGAATCTCTATTCATTAGATTGTAGATTGTAGATTGTAGATTGGACATAGATTGCATAGATTGATAGATTGTAGATTGCCTCGTAGATTGTAGATTGGACGTAGATTGGTAGATTGGTAGATTGGGCTAGATTGAAACACGTATATCTCTAGATTGTAGATTGGGATTAGATTGCCGCACAATAGATTGCTAGATTGAATAGATTGGCCTTAGATTGTTTAGATTGTAGATTGGGTATAGATTGCTAGATTGCTCCTGATTAGATTGAGCTAGATTGGGTAGATTGTGGATAGGGTAGATTGCCTAGATTGGTAGATTGGCTTAGATTGAATAGATTGATAGATTGGGTAGATTGTCTAGATTGTAGATTGAGATGTAGATTGACTTAGATTGCACCTATTAGATTGTCCTAGATTGTGTTAGATTGTAGAGAACATAGATTGCTTAGATTGCGTAAACTAGATTGTTAGATTGTTAGATTGTAGATTGTAGATTGAAACGTTCCCATAGATTGACGGACAAGTTAGATTGGTTTAGATTGAGGTAGTAGATTGGTGCACGTAGATTGTAGATTGTAGATTGGCCGCCCATTACATAGATTGAATATTAGATTGTAGATTGTCCTAGATTGGGGTGAGCATAGATTGTTTCTAGATTGCTAGATTGATTCTTTTGTTGTGACTTAGATTGCTTCGTATAGATTGGTAGATTGATGTATTAGATTGTAGATTGTGTGTAGATTGTAGATTGATCTAGATTGCTAGATTGGAGTAGATTGTCCATAGATTGTCCTTAAGCTTAGATTGTAGATTGGTTTAGATTGTAGATTGTAGATTGAATAGATTGTTAGATTGGGTGGCCCACGTAGATTGGCGTAGATTGACTAGATTGGTTTAGATTGTAGATTGTAGATTGATAGATTGGTCTAGATTGACTTAGATTGTAGATTGTGCTAGATTGCTAGATTGGCGTAGATTGCTAGATTGCTAGATTGCGCTAGATTGTAGATTGTAGATTGGATAGATTGTAGATTGTAGATTGTGTAGATTGTGATAGATTGTGTAGATTGCGGCATAGATTGGAGTAGATTGCTTTAGATTGGTATAGATTGGCTAGATTGAGTAGATTGTAGATTGACTTAGATTGTATAGATTGGGTTGCCTTAGATTGCTTAGATTGCTAGATTGTAGATTGTAGATTGTTTAGATTGAGGCCCTCGTTGAGTTAACTAGATTGCGGTGACGTTAGATTGATAGATTGAGAGTCGTAGATTGACTAGATTGAATAGATTGCCCTACTTTTCTAGATTGAACTCTAGATTGTTTTCCCTTAGATTGTAGATTGGGTTAGATTGGGAGTTAGATTGTCTTGGTAGATTGTAGATTGTGTAGATTGCATTTAGATTGGCTCTAGATTGTAGATTGCTAGATTGCCCCCGGATAGATTGCTTAGATTG"
#     # forward_codon_dict, reverse_codon_dict= find_start_codons("/home/namorak/Bioinformatics_Portfolio/Data/Vibrio_cholera_genome.txt")
#     # print("forward_codon_dict",forward_codon_dict)
#     # print("reverse_codon_dict",reverse_codon_dict)
#     #kmer_detector(Text,k)
#     #reverse_complement(sequence)
#     positions= overlapping_pattern_matching(pattern, sequence)
#     print_list_without_commas(positions)
#     kmer_clump_finder(Text, k, L, t)

# if __name__ == "__main__":
#     main()

[19 29 77 95 125 195 202 257 275 282 289 296 303 360 405 447 518 525 552 589 664 683 690 734 933 940 966 1026 1081 1107 1179 1206 1225 1232 1258 1310 1342 1385 1442 1519 1563 1650 1762 1910 1962 2018 2033 2040 2119 2126 2161 2176 2243 2269 2291 2337 2366 2387 2455 2580 2587 2596 2603 2637 2685 2708 2726 2792 2861 2876 2883 2900 2911 2918 3014 3071 3134 3209 3242 3281 3313 3331 3338 3382 3482 3510 3517 3537 3582 3627 3726 3767 3862 3895 3902 3909 3941 3948 3982 4009 4016 4064 4093 4159 4166 4181 4216 4250 4303 4310 4329 4336 4375 4382 4389 4407 4414 4430 4502 4527 4534 4572 4579 4619 4723 4818 4825 4865 4911 4943 4982 4998 5060 5067 5101 5108 5197 5253 5270 5320 5383 5407 5414 5447 5462 5480 5507 5542 5568 5575 5584 5635 5683 5690 5753 5783 5790 5797 5831 5838 5845 5919 5958 5976 5983 6019 6039 6058 6085 6141 6148 6217 6459 6466 6493 6503 6537 6587 6681 6700 6719 6742 6749 6807 6824 6848 6882 6943 6999 7006 7013 7096 7103 7188 7302 7392 7460 7513 7520 7527 7546 7565 7616 7643 7658 7725 

TypeError: unsupported operand type(s) for -: 'int' and 'str'