## Define a custom Python function for nucleotide analysis

In [1]:
def calculate_nucleotide_frequencies_dna(sequence):
    """Calculate the frequency of A, T, C, G
    in a DNA sequence, provided as a string to the function.
    """
    
    seq_length = len(sequence)
    num_A = 0
    num_T = 0
    num_C = 0
    num_G = 0
    for i in sequence: ## first get a "raw count" of each nucleotide
        if i == 'A':
            num_A += 1
        elif i == 'T':
            num_T += 1
        elif i == 'C':
            num_C += 1
        elif i == 'G':
            num_G += 1
    ## Below, we use the same variable names but they now hold percentage values
    num_A = num_A / seq_length
    num_T = num_T / seq_length
    num_C = num_C / seq_length
    num_G = num_G / seq_length
    
    ## string concatenation (so info can be printed to the console)
    return ("A:" + format(num_A, '.2%') + " T:" + format(num_T, '.2%') + " C:" + format(num_C, '.2%') + " G:" + format(num_G, '.2%'))

## Import Collagen IV a-1 data as Python strings, and pass them into the function

In [10]:
danaus_plexippus_seq_1 = "ATGAAGTTAGCAGGATTCGTTATTCGATCGTTTGTTCAAGTTCAAGATCTCGTTGAAGTCTTTTCAATGATCAATTCTTGGTTAGTTCTTAGAGTAGAAGTTACAGAGGCACTTACAGCAGATACAGGAGCCGAAATCCTGGAGAGAAGGAGGAGAACGGGCACAAGGTGTACAGCGAGGAGGCGCGCACGCGCCGGGCCCGACATGGCTGCGCCGCACTACTGGTCGCGCGCCCTCACACACAGGGACGAGCGCAGCGCCTCCCGTACAGTCAGGCGCGGGGCGGGGGCTCAGAGACCGCCGCCCGAGCGCTCCTCTTTCCTTAGTATCCCGGCTCAAACGGCGCGCGCGCACGGGACACTGGCGCAGCGCGCTTTGGGCCATGGCGGTCCACGTACTTTGGTAAGATTCTATTTCAAATTTATTTATTTTCTTAGTTAAATTATAACTATTTTTTTTTCTTGTAAATGCGATGAGTCTTTTGATTAAATAATATTTTTTTATGTCTATATTCTTGGAAGACAATTATTAAAAAAGTATTGATTTAGGTTGCTGGTTTTGGTGACATTTGGTGGAGTTAATACGGTGAGTTAATTTTATTTTATAAAAGTGTCTTTAATGAGCAATTATTATAATAAGCTATAATACATACATTTTAATATAAATCATGAACGCTGTTTGGTTTAGGGAATGTTAGGACAACGAAAGGGCGCTCTGACTGGTCTGTCAGCTTATTTTGTCTTTTTGCAATTTCTTTTAAAGCGCGAACTTTGGCAGATAGTGTTTGAAAGTGAGGCAGTTGCGCTCTAAATAAAAGATTTTTAAAAAATAAAAAAATATTAGGTATTTACTGAAATATGTTTCTGTAACATCAAATATATATTTCATTATAAAACGTAGGACCGACAAAGTTTATCATTCGGATGTATAGTGATATAGAGCAGAACATTTCAATAAATTAATGAAGGAATAAGAACAAGTGTGATAAAAATAAATAGTCCACGTCGTGACTTACTCATGTATAATATTAAATATTGCGCTAAATAATTCATATTGAAAATATGAAACATAATTTACATATTTTTTTATCTTTGTAACCTTTGCAACTTTTTTAATTGAAAATATTTGCTGAGGGGATAATTTTTTTTATTTTTTACAATAATAGTCAAAGTTGATTTTTTTTTTATTAAAAATGAAATGACAATCACATCTCGTATGCCCGTGATCACGGTCGCTGAAAAGTAACCGAAACGTCGGGAGTATGTAGTTTTTTACAAAAATAAATCACGCATAGTTTATCCGAAAAATACTAGTTTCATTTAAATTAAATGACAAATGTTAATAATAAAAGAAAAGGATTTTTTTAATTACAAAAGTGTACTTTGGAAAATGAAATATAAAGAAAATGTTGTGCAATTGATTGTAACAATTTTAACAAATCAAACTCATCTCATGAGCGAACTAAAAGTATAAAGACAAGAAAATAATAGTATAAATCAACCTTTATATTAAGTAAGTGTACATACATATGAAATTAACTATTTCCATTTAATGGCGTATTCTCATAATTATAATATTATATATTATTGAATATTATCTTAAAATAAAAATAATAATTTCGGCAAATTTCAATAATCAGAAAAACAATATTTAAAATATATGTAAATTTCAAGTTTGTTAGGAAACTGAATCGTGATCACCGAGTTTAGAATCACGATGATTTTCGTTTGAGTTTGGGATTACTAAACGAAGTAATAATTTGGTATCAGCTTACATAGCTAACGCTTTGCCAGCAAAATATCGCAAAACAGTGACGAAAATGAGCAGTCACTATATTATACCTATTATAATACATTCATACGATGCGAAAATCACTAAATATATATAATTTTCATTTCATTGTTGCGATAAGAAAATTCATCGGTTTTGTTTCAACTTTAAACCGATAAATTAAACTTCGTTTTAACATGAATAAATTTAATATAACTGACAATTACATAGTTCTATATTAGTTGCGCAATTTATTTTTTGGAATCTTTTAACTTCGGCTTCATAATTTCGAAACCAGAATATGTAAGATTTTTTTGATAATTTCTGTAAATTAAGGAACCACTGATACAATAGAAATTACAAACTTTGTAAGTTAACATAGCCTGATTTCTAACACGAAGCAGAGGCAATGTTAAATAAAAATTTAACTTGTACAAAAATTTATCCTTAACAAAAAGCCATATTAACGCAACAGTATTGTTTGTAAAAAAATACGTCAGTCAAAACTTGTTATATAAAGTTGACCCGATTGATTTATATGTGAAATAGTTGTGATATTAAGACTTTAACATTGTAAGGTATGTTAAAAAAGGACTCGTGTTTCTTACTGACTCAACACAACAGGACTGTGTTGAGTGCTTGCTGCATCTTTCTTGCAGACCACCTGTAAACTATCTTATTAATTTTATTTGAAGATTTAATATGTTATGATTTTATTGATTATAATGCTTACTAGATTAAGTATATTTTATTTTGATTTCTTATATTTCAGCAACGAAACGAATATGAAAGAGGAGACGTCGAAGAAAATAATATTTATGATAATCAAGACTGGATGTATCAGAATAGTTACAATCCGCAACCAACAATAAATTCATACTATGGTTTATCTAGAAGGCAGGACTTACCGACACCCTCTGCCCCCCCTTCTCCTCCACCGGAAAGAGTACAGCCCTCAAGAAGTTTTGGACAAAACTTTGCTGTGTATGACCCAGTAACTCGTCAGCGGACAAATGCATTTGATCGTAATTGTACGGCCCCTGGCTGCTGTGTACCAAAATGTTTTGCAGAAAAGGGTAGTAGGGTGCGTAATCCATTGTTATATCATGTTTAATATTCTATATTATGAATACTTTTGTTACTTAAACATTAGAAAGCTCTTTTAATACTCGTAAGTAATCTGATTAAACAAGATAAGAAATTAATATTAAATATTAATAATAGGCATTTTTTACCTAGGGTTTCCCAGGAATGCGGGGACCACCTGGAATCACAGGTCTACCAGGACACGTTGGCGCTGAAGGTCCACAGGGACTTAAGGGTCAAAAAGGTCAAGATGGACCACAAGGTCCTCGGGGTCCGCGAGGAGAAAAGGGTAAACCTGGAGCTCAAGGATTTATAGGCTTAGCAGGACCACCAGGTCCTCAAGGAGAACCTGGTATGCCAGGGATTCCTGGACGTGATGGTTGTAACGGAACTGATGTACGTTATAAAGCAAAATGATCTACAAAAAAGATCAATAACATACAAAGGTGATGTTTTAAATATGAATAAACTTTTAGGGAGAACCTGGAATGGTGGGGATCAAAGGTTCACAGGGTCCACGTGGATTTGCTGGGCCTAAAGGTAACAAGGGTGATAAAGGAGAGCCGGCTTATATGGGTCGATACCCAAAAGGTGAAAAAGGAGAACCTGGAGCTGATGGTTTACAAGGCCAATCTGGCCCAGCTGGACCAACAGGTCCTCCAGGTTTGGCTGGTCCCAAAGGAATGACTGGACCTATGGTAAGTAATGCTAATAAAATATAACATTCTATAAATTGTTTGTTTAACCATTATAAACTAATTTTAGGGACCACCTGGATATAAAGGTGATAAAGGTCCTAAAGGATCTAAAGGACAATCTATTCAAGGTGATAAAGGAGACCGAGGTGACAAAGGTGACAGAGGACCCGGTTGTCCATCAACAACGTTACCTTCATTGGATAATAAAGGAGCAATAAAAGGTGTCAAAGGTGATATGGGATCAAAAGGTGAAAAGGGAGAACCTGGGAGAATGGGTGAAAAGGGAGAAACAGGTCCAATGGGGGAACCTGGCTTGCCTGGATTAATGGGCATTAAAGGAGAAAAGGGCTTAAGAGGAAATCCTGGGGAACGGGTTAGTATTTTCGTAATAATTTATAGAATTGAAATAATAAAAATTAAATTAATTTTAAATAATTAATCCATTCTTTTTGTTTTTCAAACTTATAATACAAAATATATTTAAATAGGGTCGTGAAGGAATGTATGGTGAACCCGGACCTATGGGAAGAAAAGGTGATAGAGGCATTGATGGACTGAATGGTCTTCCCGGCCGACCGGGTTTGAAAGGAGAACCCGGCAGGGATGGAGCAACAGGTCTAATGGGCTTAAAAGGAGTGCCAGGTCCACCTGGTGGTCGAGCTGGAGCACGAGGTCCACCTGGGCCACCAGGTCCTCGGGGCTATATCGGCGTTGCTGGTGCACCAGGGTCTAGTGGTAGGCCCGGAGAAAATGGATTACCAGGACCTATGGGTCCAAGAGGTGGACAGGGAGAACCAGGTGACACAGGCATTGAAGGTCCAGCAGGTCAAAAAGGAGAAAAAGGAGAACCTGGTCTTGATGGCTTGCCTGGAGAAATAGGTCAACGAGGATATGATGGACCCATTGGTCCTCAAGGACCTAGGGGACTAAAAGGAGAAGAAGGTCAATCAATTCCTGTAAGTTTACGACATAAATATTTGTATAATAGAGATTGCAACAAAAAAATTATATCATAAAATTATTTTTTAATGACAGATAAATTTCCAAAAAATATAATAGAATTTGAAATAATTATAAGTTCATAAAATTAAAAAATGCCTATTTGATAGTGATAATCATATTTATATTTACCACCAAATTTATAATCAGGGTGACAAGGGAAACAGTGGCCAACCAGGAATTCCAGGAGATAAGGGAGCCAAGGGCGAAAGAGGTTATCCAGGATTACGAGGTACACCTGGAAACTCTACATTAGGTACACCAGGAAGTCCCGGAGAAATGGGTCCACCTGGTGAAAAAGGTGAAAAAGGAACTCCTGGGTACGATGGAATACCTGGTAATCCTGGACAAAAAGGTGACATTGGAGGACGGTGTAACGAATGTCGACCTGGAAGTATGGGCGAAAAGGGAGACCGCGGTGCTGATGGTCTACCTGGTGAACGGGGTGAACGAGGTCACATCGGACCCATCGGGATGACCGGGGAGCGTGGTGCTGACGGTATGAATGGAATGCCTGGAGCTGCTGGAGCACCGGTATGTTAAAAAATCATGTTGTATTGAATTTGATATGCATTTTTCCTTTATTTATTATTTTATTTATTAAGGGTGAACGTGGATTGGACGGACCAATAGGACCACCAGGAATGAGGGGAGCAGATGCAATGATACCGTCCAATTTAGTAAAAGGACCTCCCGGAGAAAGAGGTGAACCAGGAGAAAAAGGAAACATGGGACCTAAGGGTGAAAGAGGACCTGATGGAATAATGGGTGATCGTGGATTAAATGGCATGCCCGGACAGAAGGGTGACATGGGTAGAATGGGACCTTCTGGTATAGATGGCACACCTGGTAGTGATGGAATACCGGGACGGCCAGGAATGAAAGGCATGTCCATCAAAGGTGAAAAAGGAATATCTGGTGATCAGGGTGAAAAAGGTGACAAAGGATTTTCTGGAAGACCAGGACTTAAAGGTGAACCTGGTCAATGTCCCAATGAGTTAAAAATTCGCACAAAGGGAGAAAAAGGCAACCCTGGCGTTCCAGGACCACAAGGACCATTAGGTACTGATTTTATTTCATTAATCTTGTCTTTTAATTTTAACAAACCTAAATATACATTTAAAAAATAATAATTTTTATTTTTAAAGGTATGAAGGGTGAAAAAGGTAATCAAGGGCCATTCGGTTTTACTGGTCCAAAGGGAGAGATGGGTTTACCAGGACGAGCTGGACCGGTAGGTCCACGTGGTCTTCCGGGTTTCAAAGGCGATAAAGGTGAAATGGGTTCAATGGGATTTCCGGGAACACCAGGGGATTTAGGCCCTAGAGGTTTTCCAGGGTTACCAGGATTAAAAGGAGACAAAGGTGAGATTGGTCCTTCTATGCCTGGACCACCTGGACCTGCTGGATTAAAGGGAGATAAAGGAGAACAAGGTCCAAGAGGTCAACCTGGAATAGAAGGAAAGGATGGTCCTCCAGGATTAGCTGGCTTACAAGGTGAAAAAGGTGATATGGGATTAATAGGAAGGCAAGGTTATCCAGGACCTATTGGATTAAAGGGCGAACCGGGTCCTATAGGACCATCCGGAGTTCCGGGCATTCCTGGTACGCCAGGAAGAGATGGACCTAAAGGTCAACAAGGATTTCCCGGTCCACCTGGTAAACCTGGTGTAATTGGCTTACCTGGACAAAAAGGTGAACCAGGTATTCAAGGTCCAGATGGCCCGAAAGGTTTCCCAGGACCTCGTGGTCATGTTGGTATGCAAGGGCAAACTGGTCTTGATGGAAGTCCCGGTGAAAAAGGAGATAAGGGTGATATAGGATTCCCGGGTGAGCCTGGTAGACCTGGTCTTGATGGACCTAGAGGATTAGCTGGTGCACCTGGTGAGAAAGGTGATATAGGTTTCCCAGGAAACCCTGGGTTGAATGGATTTATTGGACCAGCTGGCCCAAGAGGTGATATAGGCTTCAAGGGTTCCAGGGGACCAAAAGGAGAACCTGGTTTAGCTTCAGAAAAGGGAGAAAAAGGAGATCAAGGTTTTCCAGGATTACCTGGTGTTGATGGAAGACCTGGGCAAGATGGAGAAAAAGGTGACAAAGGTTTCCCTGGCTATCCAGGTCAAGGCATTCCAGGAAGTCAAGGTGAAAAGGGAGATGCAGGTTTGCCTGGAAAAATGGGTTTTCCTGGTATTCCTGGCGATAAAGGCGACCGAGGCTTTCCAGGACTGGCAGGTTTAAAGGGAGAAAGAGGCCCTGCAGGCAAAGACGGTTTGCCAGGAATGCCGGGAAGAGATGGCAGTCCTGGTGCTCCAGGCCAAGATGGTTTACCAGGAATGGATGGCGAAAAGGGTGAAAGAGGTGATCGAGGATTACCAGGTCGTGATGGTCTTGATGGATTGAAAGGTGACCAGGGTATTGCTGGACCACCAGGGCCAATAGGACCAATGGGTTTTCCGGGTCCTAAAGGAGACATTGGTTTACCTGGGCCATCTATAAATATCAAAGGTGAAAAGGGAGATATAGGTTTTCCCGGTATTACTGGACTTCAAGGAGATAAGGGTGATCGAGGTAGAGATGGCTTCCAAGGTCTACAAGGGGAAAAGGGTGATCAAGGATTCACTGGACAAAAGGGTGAAATGGGTAGAATGGGCGCCATGGGTGAAAGAGGTATTTTATTTTTCATTTATTTAATTAAATATCTACAACACTTTTGCAAGAATAATTTCAAAGTACAATTCAAATGTTTTTTCGAATCCAATATCAACAAGTGATAATTTAATTATAAAAAAATTAAGACAATTTTAACAGTAATTATGTTTATCTAGGTGAAAGAGGTCCAATTGGACCGACTGGTATTCCTGGACTCACAGTAAAAGGTGAAAAAGGTTTACCTGGAAATAACGGAAAACACGGCAGACCTGGCATGCGCGGTGCTACTGGAGAAAAAGGAGAACAAGGATTACCTGGACTTCCAGGTCCAATTGGGCGCTCTGGCATGCCAGGAACACCGGGACCTAGAGGTGAACCCGGTGAACCAGGAAGTGAAGGAGTCGCAGGACCCCCTGGGTTTGACGGTCCTCCGGGGCTACAAGGTCGTCCTGGCGAATATGGTGAAAAAGGTAACAAGGGTGATAAGGGTGCTGTTGGTTTTGGTTTACCTGGCCCGAAAGGAGACACTGGCTTGCCAGGATTACCGGGTTTAAATGGTGAAAAAGGTGATAAAGGAGATCAGGGTTTCGATGGATTAGTTGGAGAGATGGGTGAGAAAGGTAACCAAGGAGAAAAAGGTGACAGAGGCTATCCTGGTCGGCCTGGAATTCCTGGCCTTGATGGTGTAAAAGGAGATAAGGGAGAAGCGGCTGCTATAGTTTATGGAAGTAAGGGAGAACCAGGACCAAGAGGTCCTCCTGGATTGAATGGTCCACCTGGACTTGACGGATTACCTGGTCCTAAAGGCTGGGATGGTGCTCCAGGCATGAAAGGAGATAAAGGTTTCCAAGGACCTATGGGCCCACCAGGCTTACCAGGACCTCAAGGAATAATGGGTATTCAAGGTGAACGTGGTGAAACAGGTCGTATGGGATTACAAGGTGTACCTGGAATACCTGGTGCTCCTTGTGCTACTACAGACTATCTTACTGGCATCCTTTTAGTGCGTCATAGTCAAACAAACATAGTACCCCAATGTGAACCCGGACATATTAAATTGTGGGATGGCTATTCCTTACTTTACATTGATGGAAATGAAAAGGCTCATAATCAAGATCTGGGATATGCTGGATCTTGTGTAAGAAAGTTCAGTACCATGCCATTCCTTTTCTGTGATCTTAATGATGTATGCAATTACGCAAGTCGAAATGATCGCAGTTATTGGCTTTCTACAAATTTGCCGATACCCATGATGCCAGTAAACAACAATGAAATTTCACGATATATTTCAAGATGTGTTGTTTGTGAGGTTCCAGCCAATGTCATAGCTGTTCACAGTCAAACTCTTGATATACCTAGTTGTCCAGTGGGTTGGAACTCATTATGGATTGGATACAGTTTTGTTATGGTAAGACCTATCGCAATTTTATTACATTGAATAATCAATACATAAGTTCGTACATATTATTAAACAAAAAGATTAAATCATTAAATTGTGGTCTAAACATGAATTATTCATTGTATCTCTGATTTTAGCACACTGGAGCTGGTGGACAAGGCGGTGGTCAAGCCCTTGCTAGTCCGGGATCTTGTCTTGAAGACTTCCGAGCGACACCATTTATTGAATGTAACGGTGAAGGTGGTACTTGCCATCATTTCGCCAATAAACTTAGTTTTTGGCTAACAACTATAGATGATAAGAAGCAATTCGCAAAACCAGAGCGTGAAACTCTTAAATCTGGACGACTATTGCAGCGAGTGTCTAGATGCGCTGTTTGCATTAAGAATACCACATAG"
danaus_plexippus_seq_2 = "ATGCAGGTTGTATGCAATCAGACCGTATGTGATTGTGCTGGTCTCAAAGGAGATCGAGGTGACATTGGTTCTCCAGGAATACCCGGACCCCAAGGCGACTATGGAGAGGATGGACCTGATGGACCCATGGGACCCCCTGGTGAACCAGGGGACTGGGGCGAGAAGGGTATCTCGGGTGACAAAGGAGAAAGGGTAACTACCTACGACAAAATAAGCCTTATATCAAAAAAATGCTTGAAATATTTATTTATTCTTAAATATTCTTTGTTTATTTCTATTTTTATATTTTTTTTCAGGGTGTAGATGGCCCATACGGACCGAGGGGATTCACTGGACCTCAGGTTTGAAGTTTAATGTCATTAAACATACAAAATATATGAACATACAAAATTATAATTAACTGATTATCATGCATGTATTAACATTTTCTTTATAAATTCTTTAAGGGACCCACTGGTTTAGAAGGTGTGAGAGGTATTGCTGGTCTTGATGGATGCAGTGGTATTGATGGTATTATGGGTCCTCCTGGCCCCCAAGGTATACCTGGTGATAGAGGGTTACCAGGTCCCTATGGTGAAAAAGGAACACAAGGGTTAGCAGGAGAGGGTGGTGTTAATTCAAGAGGAGCGAAGGGAGATCAAGGTGATAGTGGACGACCTGGCTTACAAGGACCAAGAGGGCCTATTGGATGGCGAGGTGATAGTGGTATGCCGGGAGAAGTTGGTGATCAGGTACTTATTATAACAATAACGTAAAATTATGTTATATAATCCAATGAGAAATATAACGTATATAATAATTTCCTCTACGTAGGGACCTATGGGGTACCGAGGAGAACCGGGATATAGAGGAGATCTCGGCGACGACGTTGTGGGGCCTCAAGGTGAAAAGGGAGATCAAGGGGAAGTTGGCGAATCAGGGAGGCCAGCGAAAGTTATCTATATTGATCATCTTCAAGAAAATGTTACGATATTAGCCAAGGGAAACAGGGGTGACAAAGGATTTGCGGGTACACAGGGCGTCAAAGGTGTTAAAGGAGACACTGGCTCTATGGGTCCTCCAGTAAGTTAAAAACTAATAAAATAAATAAAAACTTTCATACCATAATGTTATAAAATATTTAAATTCCAACCATAATCTCTTAGTAGTCTATCTGCTATCATCTTTTTTTATCAATCTTTTATCTTATCTATATCTATCTATCTACATATGTTTTATCTAATAGGGGCCAAATGGACTTAACGGAGACCAAGGTTACAAAGGCGATCAAGGAATAGACGGCCCTAGAGGTAAACCTGGACATCGTGGACGCAAAGGGCCTCTTGGACCAAAAGGTGATAAAGGCTGGCCAGGATATGCTGGGCTAGATGGAGAAGACGGAGAGCCGGGAGCAAGAGGAGAAGACGGAAGACCTGGAATGCCGGGAGTTCAGGGACCTCAAGGAGAGAAAGGAATATACGACGAACGACTTAATGAACCACTTCTGCCAGGTTCAAACGGTCCACAAGGTCCTGTAGGTTATCCAGGACCTCCAGGACCTCCAGGTGCAGATGGAACCAGAGGTTTGCCTGGAATTCAAGGTCCACCAGGTCTTCCGGGACCGAAAGGAATAGCTGGACGTCAAGGACCGCCAGGAAGTTCAGAAAAAGGAGAACCAGGAAATGACGGTTTTAAGGGTTTACCTGGACCTCGAGGTCCTATGGGCTACCCAGGTCCACAGGGAGTATTAGGACCAAAAGGTTTTAAAGGCTCAGCTGTAAGAGGCCCCGAGGGTGAAGAAGGTACACCGGGATTAGATGGCAGACCTGGTATAAGAGGAGACAGAGGGGACTTCGGTTTCATGGGCCTGCCCGGGTATCCAGGTCGAGGTGTTCACGGTGTTGGTCCACCAGGGGAGGATGGTCCTCCAGGACGTCCTGGAGTCGTTGGTGATAGTGGAACACCTGGAAGACCTGGATTTAGAGGTCCAAAAGGAGAACGTGGTGACGACTGTCCATTCTGTCCATCAGGTAAGCTTATCACAAACATTAATCTTAACGAACTTTCGTAATTAACAATATCCAATAAATCATACTTTATGCGAAATAAATGTCCTTATGTTATTACAACATTTTGAATAACTATTTATACTCACTTTACTTATATATTTCTACTATATCATATTTAAAATGTATTTATTACGTTTAACATAGAATTTAACTGTTCTTATAATTGTACTAAATTATTTTATTTTAGGTTTACCAGGTATGAAGGGAAAGAGAGGAGATGAAGGTTTTAAAGGTCAAAAAGGATATCCTGGCCCTGAAGGAGATCGTGGCCAGCGTGGGTTAAAAGGAGAAAGTGGATCACCAGGTTTACCTGGATCAAAAGGTCCGAAGGGCATTACTGGTCCGCCCGGAATGACTGGCCGTCCTGGTCTACAAGGAGAGAAGGGACGACTTATACAGCCTCCTCTTTCCTTAATAATAGCTGAACGTGGACCTCGTGGTGAACCAGGCACGTAAAAACATACTTATTTATTTTTATATAATAAATTAATACAAAAAATATAAATCCGTTTTTTTTAAATAATTTGTTATGTGATTTTTAAAAATATTTTTTTTACATACATATTTTACATAGCATTACAATAACATGTACCAAGTTTCATCCTTCTAATTACACCAAATATAGTATTCATGTCTAAAAAAAAATTACGCCGTATTTGAAATATATTTTTTTTTATATAATTAAGACCAAAAATCATTAAATTTAGATCAATATTGCACTGATGGTTATTTGAAATTTGTTATATAACACCTATTACTTTGTAGGTTTTATTGGGGATCCTGGTCTTCGTGGAGATCCAGGTTTTCCTGGGCTTCGAGGAGAAAATGGCTGGAAAGGTTCCAAAGGTATGGCTGGTGAGGATGGTTTCCCTGGTCCTGATGGAAGGGATGGATTAAAAGGACGAGACGGCGTACCAGGAATGCCTGGTGAACATGCCGATGTTCCTATACAATTTCTATTTGGACAACGAGGAGATAAAGGGATTAAGTGAGTTTTATATAATTCTATATATCATATTAAAATATTTGCTGTATTTTTGTTTAGAATCGGCAAAACTTCGATCCACAAACTTCAGGAGTAATAAAAACAATTAAGTGTGCCCTTTGAAGTCCTGCTACATTCGATACTTTAAACTGATAATAAAACTTAATAGAGTACTTTTCAAACACTTAATATTTTTATAAGAAAAAATAATTTTGCAGTCTAAATATTACATATGAAGAAATATTCTTATTCGCATTTGACCTTATATTCACAAAAAATGTTGGAAACTAAAATATTTACTTCATTATTTGTTTTTCTGTTTAATTATACGTTTTTAATTTCATTAATACCCATCGTTATCTTTTAAAATTAATATGTAATAATACGTATTTATAATTGGTATTTATATAATATTTGCAAATATAGTAAGGCAATAATTATTGTTATGTATAGTATAAGATGAGGTGGGAGAGCACATGGTACCTAATATAAGTCAGGAAAACTTTCGAGTATTTCGGATTCAATAATATTTTTATTTCTTCCAATAGAGGACAACTCGGAGAACCCGGAGATGATGGTCTAAAGGGTGATGCCGGAGAAGCCCTTGGTTTCGGAATAAATGCTAAAGGAGAAAAAGGGGAACCGGGACCGATGGGTCCAGAAGGTACAAAATTATTAAAATTGAGCTAAATTTACTTCCGTTAATTTTAGTTTTTGTAATTTTAAATTAAACAATATTGTTATGAAATAAAAAATCTATCACACAACAAAATTTGAATATCATATTCGCATATCTCACCATACTCGCTTATTGTTATAAATATTAAGTAATTTACCTAATACAATGAATAACTATTTTTAATAATGACCAACTTACAAGAACTTGAATGTTATTAAAAATACAAGTATATGTGTTTAAAATATAACAATTTTAAACCTCGTTAATAAAATTATTATATCTTAATCATTATATTCACCAAAAAGGTCTATTTTTATTTTACTTATATTAAATAATCATTGTTAGCATATTCAAAGTTTTGAACTGAGAAATATCAAATTGTCATAAAGCAGCTATTTCAGTATAAAAAACATAATAGCATGACATTTTACTAATTCATATGTATATCTCGTAATATGATTATTCCTAATGAAATACATTACTGTCAACTGATTATAAGAAGATGTATTTATTTGATTTCCTGCAATACTTTTTTATTCCTTATGAATTTTTGAATTATATCCATTTTAAGAACAACGAATTATTTTATGACTGGCGAGAAACAAATTGATTTGTCATTTTAACAAGTACAATTACGACAACTACAAATGCAAATTCTTATTTTTTTTAGGTTTGCAAGGAATTAAAGGAGATTCTGGTGATATTGGATACGAAGGACTTCCAGGAGAACGAGGGGATATTGGTCTACCTGGTGTTTCTAAACAAGGAGAAAGAGGTGCTAGAGGTTTTCCCGGAGACAAAGGAGATATAGGTCCCTACGGAGAACCTGGAGGTCCAGGTCTTAGGGGTCCTGTGGGATTTGATGCACTTAAAGGCAAGAAAGGTAGTCGGGGAGAAGTTGGGTACGCAATTATTTACGGAGAAAGAGGTTTCGATGGTATGGCCGGGGATTATGGTGATGTAGGTGAACCTGGTTATGCTGGAAACCCCGGAAGAGCAGGTTTGATGGGACCTAAAGGGGAACCAGGTTTACCTGGTGATGTGGGTCCACCTGGACCCGTAGGACCACCAGTAAGTATGGAGATTTAACCATTCTGATATTTTATAATATTCTATAAGTTTATTTCTATTTATTGTTTCTTTTTTGCGGTAAATATTACCATTCAACTATTCGAATATTACACTTAAATATTCGGTAATAAATAATTAAAACAAGATGTAATAAATAATACAATATGCATAAATTATTAGGATTTCTAACTAAAAACGTTTTTAGGGACGAAAAGGAATGTCAGGAAACATTATACAGGGTGCACCTGGTATGCCAGGTCAACCCGGACGACTGGGTTCTATAGGATTAATCGGTGAACCAGGACTACAGGGCTACAATGGCTTGCAAGGGGATGTTGGTCCTAAAGGGATGAAAGGAGAAGCTGGTCGAATGGGAAATCGTGGCTGGACTGGTGAACGTGGTCTTACGGGCAGAAGAGGGCGACCCGGACTTATGGGTCAACCTGGCCTGAGTGGCGAAACGGGAGACCGAGGTGAAACTGGTCTTCGTGGTTATGATGGTTTACCTGGTAAAGAAGGTCCCCTGGGCATAATTGGTCAAAAAGGAATACGTGGTGATATTGGTTTACCGGGAGCAGACGGTTTAGGTGGACCTCCAGGTCCTAAAGGAGAGAGAGGTTACGATGGAGTTGTTGGTGATAAAGGAATGCAGGGAGAAAACGCCTCCATAGGAATGAAAGGCATGTCTGGAGACATGGGTTTTAATGGAATGCCAGGAAGACCAGGGCAAACTGGTTTAAAAGGTTTAAGAGGTGACATCGGCAACCCAGGATTAAATTTAAGAGGCCTTAATGGTACAAAAGGATTCCGAGGTGATGATGGCATTCCTGGAAGAGTAGGGGAAAAGGGTTTAAAAGGATTCCAAGGAGATTACGGTTTCGAGGGTATTGCTGGTGAAATAGGAGACGAAGGTTTTCCAGGTTTATCTGGTTTACCTGGACGAATAGGATTTGATGGTGCCAAAGGACCTTCAGGGCACAAAGGATTGCCAGGTTTACAGGGTCCGAAAGGTGATACAGGATTTGAGGGTGAACCAGGTAGAATGGGTTCACCAGGATATCCCGGTGACGTAGGCTTGCGAGGCTTGGTTGGTGAAAGGGGTCCATCTGGCGCCAAAGGAATGTCAGGAGATATTGGACCCAGTATTTATTTACCAGCCACCAAAGGGGATATGGGAGATATCGGAATGGAGGGACTAAAAGGGGGTAAAGGCGAAATGGGTGAACCTGGATTTCCAGGATTAAAAGGCCACAAAGGAGAACAAGGCGATGTAGGCTTACAAGGAGAATTTGGTGATGATGGACTTCCAGGTCCTAAGGGTTATTTAGGAGTAATGGGACCTCCAGGTTTACCAGGTCTAGATGGCATCAACCCTGAGCCAGGAGAACAAGGCAAATCTGGAATTGACGGATTACCAGGTTGGCCAGGTCCCATGGGTCAAAAGGGTGCTCCGGGAGAGTTTGGTATTAATGGTCCTGAAGGAGCACCTGGTCAACCAGGGCTCATTTTTAGTGGACCAAAAGGGTATAAGGGAGCAACTGGTCGACCCGGGCTAAGGGGCATTTCTGGTAAGCCTGGTTCAACAGGATTACAAGGAAATCCGGGACTAAAAGGATTAACTGGTGACATTGGTGAACCTGGCTATGCTATAAGCCCTAAGGGTGAAACAGGAAATCCTGGTATATCAGGGTTTTATGGCTTGAAAGGGATAAAAGGAGAAGCTGGAGATTTGGGACTGGCAGGTTTGAAAGGATATCAAGGCCCAATGGGAATGAAAGGAGAAAGAGGTGACGAAGGCTATGAAGGACTTAATGGATATTCAGGTGCTAAGGGAATGAAAGGTGATAGAGGAGATGAAATACTTCCATCAGATGTTGAGCCCGGGCCAATTGGTGATATAGGTCCTCCTGGATTTGATGGGCAACCTGGTCGTGCAGGAGCTCCCGGAAATTTCGGAGAAAATGGCATTCCTGGATTCAAAGGTGAAAGAGGTGATATTGGAGATATTGGTCCTGAAGGTTTGCTAGGCAAACAAGGTGGACAAGGGTTCATGGGTATCAAAGGAGAAATTGGTTTTGATGGAATCCGTGGTTTGCCTGGTCTTCCTGGATTACCAGCACCTCCTCCACCAATTCCTAAATCAAGAGGATTCTATTTTACAGTACATTCACAGACTCATCTCATTCCCGAATGCCCCTCTGGAACTACACCTTTATGGGAAGGATTCTCCTTACTTCATATAGTTGCAAATTCTAAGGCCCATGGACAAGATTTAGGTAAGTTGTTAAATGAAATGAAATATAAAAAAAATCTGTTATATTTTTCAGTTCTTTGTAATCTAATTTATATATTTTTAAAATCTTTACACAGTTTCAAAATCCCCTATTTTCATAATAGCTTAGATATAGTTAGTAACTTTTTTGCTAATAAAAACCAGGCTATGGTTATACAAAATACCAATTTTAAAATATGCTGATGTTAAAACAAGGGTCATTTCAATTAACCATAATTAATTTGCTTCTCAAACACTAATTTTAAAATTTATACTGTTTATATTAGGTGCACCTGGAAGTTGTCTTCGAAGATTTTCAACAATGCCTTATATGTTCTGTAACATAAACAATGTTTGTGATTTCGCCCAACGCGAAGACTACAGTTTTTGGCTATCAACACCAGAACCAATGCCAAGCGGAATGACCCCAATTCCAGCAACTGACGTTGGATCATACATATCCAGGTAAAGTCATTTGAATTTATAAAAAAGAGACTTGAAAAGTATTCTTATTTACTTATGATATAACATATTTTTAGGTGTCAAGTGTGCGAGACATCAACACGATCCATTGCTATTCATAGCCAAAGCAGCTCCATACCAACTTGTCCAGATGGTTGGGATGAATTATGGATAGGTTATAGTTTCCTTATGGTAAGAACAAAAGGTTGATATAAATGACTGTAAACTTTTTAGATATTAGTGATTATGCTTAATTATCTTTGTATCAGCATACCGCTGGAGCTGATGCGGCAGGTCAAAGTCTCATATCACCGGGATCCTGCCTTCGGGAATTCAGAACGCGACCATTCATAGAATGTAACGGACTCGGCCGTTGCAACTTTTTCGCAACCGCGGTTTCATATTGGTTATCAACAATTGATGACAACAAAATGTTTGAAACACCTATTCAAGAAACACTGAAACAAAATAAAGTTTCTAGAGTCAGCAGGTACGTAGTATAATATTTATATTAATCAGTAATTAAAATATTATAATGGCCAGTATTTTTTTCATTTACAAATATTATTGTGCAGGTGCGCCGTATGTATGCGACGTCAACCACAGAGGTCGTATAGCGCAGGCACAGTGGAGGCTGTACCTAACGCAGTAGTACGACGCCCCGTCAACCGACCTCTTAACCGGCTTCGGCCTCGCTACCCTGCGAGGTACCGGGGGAGACGCCGCCATTGA"
papilio_xuthus_seq = "ATGACGGTGACAAAGAGGTGGAGCACTTTGGTGCGCGCACGCGCCGGACCCGACATGGCTGCGCCGCGCTACTGGTGGCGGCGAGCGCTGCTGGCCGCCGTTAGGGCGGCGCGGGGGCAGCGCGGGGTAGTGCGGGGTGGCGCGCGGCAGGCGGGGCGGGGCGCGCAGGCCACCGCCAGCCGCTTCTCGCTCCTTAGTATCCCGGCACGAACGGCGCGCGCGCACGGGACAAACGCGCAGCGCGCTCCGTGCCATGGCGCTCCACGTACTTTGGTAACTTTTTAAACTTTAAATATTTTATTTCCTTCTTTTAAAACTTATAATTTTTTTAAATCATTTTTTATAAACGGATCATTAGAATATATTTATTTATAGCTATTTATTCTATGGTATTTCAATATTATATTTATATAATATTTTAATAATTAACTGAAAATTCACAACTGAGTGGCCTGATTTTCATATCTTTTAATTAGGTTGGTGGCTGTATTGGCGCCTTTAACAGGAGTAATAACGGTAAGTAAGATTTTATTTTTTCTATGCTTAACTAAAACTATTTTGTTCATTCTGAAATTTAAAGTCAATATTAAGCAAAAACTGTGCGGAATCGGGAATGACGGAGGAGGCAGGCGCAGGCGCGTCCCGACTCGCCGGTTCGCTTGTTTTATTCCTTTTGCAATTTCTTCAAAACGCGAACTATATCAAGGCTTTGACGGACACTCAAATTAAACGAGTTAGAAATAAGTAAAATTTTGAATGATAGAGCTTTTTCAAGTAAACTTTTGATTTAACAAAATGTAACATTTGATTTACTTATATACATAGTATTTATGTTGTTTACATATATAGTATGTAAATCATTTGTAAGCGCGATGTGAACACCGACAAAGTTTATCATCGGATGCAGTGCCCCCACATTGCGCAAACTGCGCCTCGGTCGCTACAATTATTTTTAATTTAATTACTAATATAGAATGTGTATCGAATTTTTTGTTAAGAAGATTATAAAAGTATAATTTTTTTCATTAAAATTAAATTATGTTCTAAGTGGTAACAAACAATATTTGCTATATAAAACTTTCGTTTTTTGGCTGCTAAATGTTTCTGTAAGTTTATTAATTTAGTTCGATATTCACCTAATACTACTCCAAACTATGGACAAGCCAAAAGTCAAAGGAGTCATTTTTTTGGGCATAAATTTTATGGCGGCGTAAAATTATAAAAATAAATATTAATAAAGATATTATTGCAGTCAATTTATTTTTGTGAAGGCTAAATACAATCATAACATTTCAAATAATAGAAGATGTCTCGTTGCGGTTCAATACATTTAGATATGGCCGATAACCTCAAAATTAATGATAATTTTGTTCAATATTCAGTATATTCCGCTAAAATACGTTAAAACTTTATTGTTACGAATTCAGTGATTTTACTGTTCTTCACTAAGACTGGTGAGCCTAAATCCCAAGAAAGAATTTTTTTCCTACAGGATTTTTTCCATTCTTAAAATAAAAAAAAATATGCAGGAAACACGCTTTATAATTTATAGTCAGTGTCAAATTTATCATCTCGCTGGCCTTTGTACCAATGATTTTAATTAGTAGGTACTAAGCGACTGAAAGACATAAAGTGAAGCATAAGTTCTATAAAAATATGTTACGAAACTACGGTGTCATCTTACAAGCAAATGCAAACGTAGAGAAATGTGGCATATCAAATTATGCTAGTAATACCTAACGTTGTTCATTAGATTTCTGTGAATTGCGCATTGTACTTATTCAATTGTATTAGATACACATAAAATATCCTTCATCTTTGATGCCACACCATGAAGATAGGCAATCACGGCAGCTCGAACTTTCAACGCGGTTATTTTTACCAAATTGTCAGTACCTTTTCGCCGAATCGTCTGTGAAGAGCAGCCGCTGTGAGAGTTCGAAATGTCAGAACAGGGTGGATAATAATGTAATAATAAATATAAAATAGTTATTATTACATTATTATGTACCCTCATAACGTTATGACAAATATAGACAGTAAATATTTTATTACAAGTATTTTGGTAATGGAATTTTACAATTGACTTAACATTTTATGACATAAAATTATGTTTTATATTGAGTATAGATATTTCTTATAAGAGACTTAGCCATTTTAATTAAATGTTTTAAGATAAAAACATGCTGTAATTAACTTTTTTTAATGTTTATAAAATATATGTTTCAGACAATAATCATTTATGTTTAATAATTAAAATGATCAAAAACATTGATTATTTTTTGTATTACTTGTTTTGTAAGGGCATGTTTTTGCTCTTGTATTGAAGTTGACGGCTCAGAAGCTTTCTTCTCTTATCTTTTATACTATGACTACGGCGGCAAAAAAGTTCAGGTATATATTTTTCTTGCAGCAAGATGATGGTTGGATGGACGTTAACGACATAAATGCAAGCCGTTGGCCGCCGACCGATTGGTATGGTACCCGGAACCAACCATCGCCGCCCTCGCCGACGGATTGGTACGGTGCGCGTAATGATCCGCGCAATGATCCGCGCAGTGATCCGCGCAGTGATCCGCGCAATGACCCTCGCCCAGAACCTCCTGCGCCTACAAGATATTACGGGCTGTCAGGGCGGCCAGACGTTCCCGCGCCACGACCGCCGCCCAGCCCAGGCCTTAACTTCGCTGTATACGACCCTGTAACGCGGCAGCGCACCACCGCTGTGGACCGGAACTGTACGGCGCCCGGTTGCTGTGTACCAAAATGTTTTGCTGAAAAGGGATCAAGAGTAAGTCACATTATAGATACACCTTAAGCTTAAATTTCTTTCATATATCAACAAAAGCTAAACGTTACCTCGGATTTAGAAAAATCCTATGTAGTGATGATACCGTCTAGGTTTGGTCTAATTTTCAGGACACAAATCTAAATGTATTCATCTATCATCCTCTAATTTTTTTATTCGTGTTAGCATGGGAGGTAATGTATTTTTGCGCCTTCATGGTGTGTTTGTATGTACTAATGTATTAGCTAATTTATTAGTTTGTATGTGTAATGGTTTTAATATTTCTTCGCAGGGTTTTCCAGGTATTGCAGGTCCACCGGGAATGAGAGGTCTCCCTGGTCACGAAGGTGCTGAAGGCCCGCAAGGACCAAAGGGACAAAAAGGACAGTTGGGTCCACAGGGTCCTCGAGGTCCAAAGGGCGATAGAGGTAAACCTGGAGCTCAAGGTTTTATTGGTCTCACCGGACCGCCGGGACCACAAGGAGAAACTGGAATTCCCGGTATACCAGGAAGAGATGGCTGTAATGGAACAGATGTAAGTATTTAACTTTTTTTCTAACAACTACAAACTACGCCACCAGAACATCTGCTTACCTTTGATTTAAAATTAGGGTGAACCGGGAGAATCAGGTCCCAAGGGTTCGCAAGGGCCCCGGGGTATCGGGGGACCAAAGGGAGATAAAGGAGACAAGGGAGAAGCAGCTCATATGGGCCGATATCCCAAAGGACAGAAAGGAGAACCTGGAGCTGATGGTATGCAAGGTAGTCAAGGACCTGTCGGACCACCAGGACCTTCTGGATTACAAGGACCAAAAGGAAATACGGGTCCAATGGTAAGCCATAAATTTACCAATTAAAATATTTTTATTTTTAAATTGATTTTTATATTTCATTTCTTTATTTTAAAAAATGTGTTATATATTTTTCTTCCTTTAGGGACAACAAGGATTTAAAGGAGATAAGGGCACTAAAGGTTCAAGGGGTCAATCGATTCAAGGAGACAAGGGAGATAGGGGGGATCGAGGTGACAAAGGGCCAGGTTGTCCTCCGATTATATTGCCTTGGGAGGATAATAAAAGCGCGATCAGAGGAGTTCCAGGTGATATGGGACCAAAAGGAGAGAAAGGAGAGCCTGGAAAATTTGGCGAGAAGGGGGATACTGGTCCTGTAGGTGAACCAGGTTTATCAGGACAAATGGGAATTAAAGGAGAGAAAGGCATTAGAGGAAATCCCGGAGCAATAGTAAGTTATAATTTTTGGTGTGCCATACAAACTAAGGTCAATCGTAGTCACACAACATTATATATGACACACATTGCTATATGAAAATAGGTAATTACAATAATATCAACATTAGTATCAAATCATGCCATTCAGACTATATCGGTGGAATGATAGGTTTTTATGGGGAAATATACTTTATTCTTTATTTTTATAAGGATTCTATGAACATTACATACTCATAGCAAACTACTTACAAAATAATTATAACTAAAAGAGCCAGTAAAAACAAAAATTCTCATAATAATAATAATAATAACAAGAAATGTATTTACTAACTTATAAGGCTTTTAGCACTATGCTGAGAACTAAGGTCCGACAATGGTTGGGCCAAGGCAGACAGGGTAGACAATATTGAACGAAAATATTATTCGTTTAGCAGAAATATAATACTTGAAAATTACATTATTTTTATTAAATAATACAAAATTTCAAATCCAAATTATAGAATAGTTATTCAAGTTTAGTAATTACATTCATACTCTATATGAACAAAGTCGCGGGAGTCACCAAGTTAGAAAATGTATATGACATAAAAAATACTTGTAAAACTTTCAGGGAAGAGATGGTATGTATGGCGCTCCAGGACCAATGGGACAAAAGGGAGACAGAGGTAATGATGGACTTGCAGGATTACCAGGACGCCCAGGTGGAAAGGGAGAACCTGGAAGGGATGGGTTACCAGGACAAAGAGGTCTTAAAGGTGTGCAAGGATTACCCGGTGGGCGCACTGGATCTCGCGGCCCGCCAGGTCCTGCAGGACCCAGAGGTTATATGGGCCCAGCGGGACCGAAAGGTACAGACGGAAGACCTGGGGAACGGGGAGAATCAGGTCCAATTGGATCTCCGGGTGGTCAAGGAGAACCAGGAACACCAGGCATAGAAGGACCTGCTGGTCATAAGGGAGAAAAGGGAGAGCCTGGCTTGGATGGGCCTCAAGGAGAAGTTGGTGCTAGAGGTTATGATGGACCAGTTGGCCCACAAGGACCAAGAGGATTTAAAGGCGAAGACGGTTATTCGATCCCCGTAAGTGACTTTTTTACATGTATATTTTTAATTTTTTAGTGTGCAAGAACAAATACACTTATTTATGCGACTACCAAACATTTTTCCTGATACACAAGTTGAGCCGAGCTGTAGTCAATTTGAGGATGCTCAAAAGTGGTTAAATGCTTCTCAGTCGTAGAATGTTTTTGGTTTCAGTTCAGGTAACAACTGTGAGCAATGGATACTTTTGGAAAGTTCCTAGGTGTTACATTAGTAGTAAGTAAATAGCATAAGCATATTTAAATTTTGCCATTTACATTATTTATCAGGGTGATAAAGGCATGAGTGGTCGTCCCGGAATACCTGGAGAAAGAGGACAAAAAGGTGAACGAGGTTATCCCGGATTACGTGGTGTACCCGGAAATTCCACATTGGGAACTCCTGGAAGCCCGGGAGAAATGGGTGCTCCGGGAGAGAAGGGAGATAAAGGTACTCCTGGTACTGATGGCACACCTGGAACTTCTGGACCTAAAGGTGACATAGGTGGCCGTTGTAATGAATGTTGGCCTGGCGGTCCGGGTGAGAAGGGTGATCGTGGTGAAGACGGATTCCCGGGCGAAAGGGGGGAAAGAGGACCTTCAGGTCCTGTAGGCCTACCAGGTGAACGTGGCGCGGATGGGTTAAATGGATTACCCGGTTCAGCAGGCGCTCCCGTACGTATTACTTTATTTCTATTCATATCAGTAGTAAACTTTTAAACAAGACCGTGCTCTTTCCACGACTGAGTTTTCGGTTATTCTTATTGTTTGTGATGATGTTCTACCATATTTGTCAGATATATCTTAATACTATTATCAATGCTGGATGGATGGATGAATGTTTGAAGGTGTCTCATGAACGGTTTGAAATCTGTAAAAACATAGTCTAGAAGAGCATATAGACTACTAATAGTAGTAGGCTTTTTTTATTCCGCGGGGAAGTAGTCGCGGGCGATAAGCTAGTATACCCTAAAACACAATTTAAATCAATATTAAATTCTTCTGATAACAAACACATTTATTTGCATAGGAGTCAATATTAAAACGAAAAAAAAAGCCCTAAATAACATGTAAGTTTTAAATGCTTTTTCAAATTGTGGTTATTGTGAGAAAACCAAATAAGACAGATGAGAGATGCAATTCCTGACTTTTTTGCGGCACTTTTTAAGATCAATATAATTTTAATATGGCATAAAAAGTCAAATTTTGATGGGTTCACAAATATCTACGTTGTTTATTCTATTACTCAATGATATGTTAAGTAATTTATTATTGGATATCTACAAAGGTAGAAGGAGACCAATGGAAGTATGGATGGATTGTGTGAAAGACGCTGTACGTAAGAATCGAGTGATTTCAGGAATGACGGCTTATAAGATATATGAAAGAGTAGTACATGATGTGTTGACCCTCCGTAGGCATTAATAGCAGGATGGTGATGTGGTTTTACAAGACTGGATGAATCATTTAACATTTTTTAAATATTGTGTTTATAGGGCGAACGCGGTGACGAGGGCCCTATGGGTCCACCTGGAGATAAAGGCGCCGATGCTATTATACCATCAAGCTTGATAAAGGGACCTCCTGGAGAAAAGGGACTACAAGGGCCGAGAGGCCCACCAGGCCCAAAAGGTGAAAGAGGAAGCGATGGCTTTAAAGGCGATCGTGGTCAGATTGGTATGCCTGGACATAAGGGAGATCAAGGCTTTTTAGGACCGCCTGGCGCGGATGGTATTCCTGGAATTCCTGGGACTCCTGGAGTACCTGGTGCCAAAGGTGCTTCAGTTAAAGGAGAAAAGGGAACTCCTGGTGATGTAGGTCAAAAGGGTGATAAAGGATTCCCAGGAATCTTAGGAAGGAAAGGAGAACCTGGCATGTGTCCGGCAAATCTACTAGAGTTAACCAAGGGTGATAGGGGAGCTCAAGGACCACCAGGACCTCAAGGATTACCAGGTAACTAAACGGACAATAAAATATTCATTAAGTTATTGATAAAACATGTATGTTTGTTATGTATGTTACAATGAACATGAATTCGAAATAAAAATGTTCGGTAATCTTATAATTCGACACTTAAATGGAAACACGTACACATTGAGTTCGTACTCACACATATACACATCGAGTTATAAAGTTAAATCGCGACTTCGGTCGCGCGATATTAGAAAAAGATCAATAGTTTTTGGACAAAATTATAGGTGCTTACAAAATTTGATAAGAATTGGTTCAGTACTTTTGGAGTTTATCGCGAAAACGCGTCGTGACATGAAATTAATTTATATCTCCAGATGAATTACGATATGGCAAATGCACGGTGTAATCAAGTTATTCTGACATCGTGAGCTAAGCTAACCCCATATTTCAATTTTGTTTTGCATTTTTTTCTTCTTATATTTGATCAATATCGTCAACAGGAAACGCAATTAATTTTTTGCGATTATTGTTATAAGTTTCTACTTACATTAATGAATTTCTTTGAGTGTTATTTGTATCTAAGAAATCGTGTTATTTATTTTACAGGTGACATAGGTGAAAAGGGAGATAAAGGTTTCTCAGGTCGCCCTGGAGATAAGGGTGATATGGGGTTAGTTGGAAGACCGGGTCCAGTTGGACCTCGTGGACTTCCTGGACCAAGAGGTGAAAAAGGTGATATGGGTAGTATGGGCTTCCCCGGAACACCTGGCGAATTCGGCCCTAGAGGATTCCCCGGAATTCCTGGGCTAAAAGGAGATAAGGGTGAAATTGGTCCTTCCATGCCTGGTCCTCCTGGACCTGCAGGTCTAACTGGAGAAAAAGGAGACCAGGGACCAAGAGGAATATCTGGACTACCTGGAAATGACGGACCACCGGGAGCAATGGGCTTACCAGGTGAAAAGGGAGAAATGGGATTATTTGGAAGGCAGGGAAGTCCAGGACTCCCAGGACAGAAAGGTGATGATGGCCCTATTGGTCCTCCTGGCGTACCAGGTCTTCCAGGTACACCTGGGAGGGAGGGTCCTAAAGGACAGCAAGGATATCCCGGCATTCCAGGTAAATCAGGAGTTATAGGCTTGCCTGGCAAAAAAGGAGAACCTGGCCTGCAGGGGCCTGATGGCCCTAAAGGTTTCCCTGGAGCTCGTGGTCGTCCAGGTCCCAGAGGCATAACGGGGGTAGATGGCATGCCAGGGGATAAAGGAGATAAGGGAGAATTAGGTTTTCCGGGCATACCTGGAGTAGCAGGCCCTGCCGGACCCATTGGCCCCGTAGGTGTCCCTGGTCTCAAGGGCGATCAAGGTTTTGACGGACCAGCTGGAACGCCAGGAAGAACAGGTTTATCTGGAGATAAGGGTGATAGAGGTTTTCCAGGTATTCCTGGCCCCAAAGGTGAACCAGGTTTAGCAGCAGACAAAGGTGACAAAGGCGACCAAGGTTTACCTGGTTTGAGAGGTTTGGATGGAGCTCCAGGAATGACAGGCGACAAAGGAGATAAAGGGAATGCTGGTTTACCGGGTTACGGTCTACAGGGAACGCCCGGACAAAAAGGTGACACAGGTCCTCAAGGATTCAATGGCTTACCTGGATTACCAGGTGTTAAAGGGGATCGGGGATACCCTGGTGTACGAGGCCAGAAAGGCGAAAGAGGCATTGCAGGGGAACCTGGCAGACCAGGCACACCAGGTATTGATGGAATGCCTGGGTCAGTTGGTGAGCCGGGATTCCCCGGGCTGCAAGGTGAAAAAGGTGATAAAGGAGACAGGGGCTTCCCTGGACCTGATGGATTAGATGGTCTTAAAGGAGAACGAGGTCCTGTTGGCCCTGTTGGTCTACCAGGACTAAGAGGAGACAAAGGATTGAAAGGCGATCTGGGTCTACCTGGAATATCAATTGACATTAAGGGAGATAAAGGAGATACAGGCCCTCAAGGAAATCCTGGTTTTAGTGGAGAGAAAGGAGATGCCGGTAGAGATGGAGAGCGAGGCTTACAAGGAGAAAAGGGAGATCAAGGATTTACGGGACAAAAGGGAGAGCGGGGAAGAACTGGATTTACAGGAGAAAGAGGTAAAATTTATATAAGTATCATATTCTATCAACCCTTCGTCGTAGTATAAAAAAAATTTTTTGATAGTTGCGAATGCGGTATCATTTCTTATTAATTTTTTAAAGATATTTCTCTATTTTAATTTTATTAGATAGCCGGAGTGAGTCCTTTTTTTAAATACCACTTCTAATTCTTTTGCTTTTTCTCATTCATTTTAATATTAAGCTTTCAAAGCCTACTGGAAACAAGAAGAAAACCTTTAACTACCTATGTTTTATTGTATTATAACAAACCTTTTATTGCAGGAGAAAGAGGTCCTATTGGTCCATCTGGCATCCCTGGACTTACAATCAAAGGAGAAAAAGGATTACCTGGAACACCTGGCAAACATGGACGTCCTGGCCAACAAGGTGCTCATGGTGAGAAAGGAGAAATAGGATTCCCTGGTCTTCCAGGTCCAATGGGTCTACCGGGGCTTTCTGCTCCACCAGGGCAACGGGGAGAGAAAGGAGAACAAGGACTAGAAGGAGCTGCTGGACCACCCGGCGTTGACGGTGTACCAGGTGTACCAGGATTACCTGGAATTGAAGGACCAAAAGGTGATAAAGGAGACAAAGGAGCAACTGGATTTGGCTTACCGGGCCAAAAGGGTGATCAAGGAGCACCTGGTATACCTGGAATTATAGGCGAAAAAGGAGCTAAAGGGGAGCGTGGTTTTGATGGACTACACGGTCAAACAGGCGCAATTGGTTTACAAGGGGAGAAAGGTGATAGAGGATATCCTGGTGCGCCAGGTTTGATTGGTATGGCTGGTGAAAAGGGCGACAAGGGCGAAGATGCAGAGTTTATTTTAGGAGAAAAGGGGGTAACAGGACCTCGTGGTCCTCCTGGGTTCGACGGTCTACCAGGCAATCCTGGACCACCAGGTGTGCCAGGCATAGACGGCACTCCAGGAATGAAAGGCGATCGTGGTTATCCAGGTCCTCAAGGTCCTCCAGGCATACCCGGACCGCAAGGTATTCAAGGTTTACAAGGTGAAAGAGGTGAAACTGGTCGTACCGGTGCCACTGGGATTCCCGGAACTCCAGGGGCTCCATGTGTTACAACTGATTATTTGACGGGTATTCTCTTAGTTAGGCACAGCCAGAGTGACGCAGTACCACAATGTGAAGCTGGCCACGTCAAGTTATGGGACGGATACTCCTTACTTTACATCGACGGCAATGAAAAGGCCCACAACCAAGATTTGGGTTACGCCGGCTCATGTGTCCGTAAATTCAGTACGATGCCTTTCCTATTTTGCGACCTTAATGATGTTTGTAATTATGCTAGTCGCAACGACCGAAGCTACTGGCTGTCCACTGGCCAACCAATTCCAATGATGCCAGTTGAAGGCAATGAAATAATGCGATACATATCAAGATGCGTGGTTTGCGAAGTGCCAGCAAACGTTATAGCAGTACACAGTCAAACACTGGACATTCCGAGCTGCCCGGCGGGTTGGCGAGAACTATGGATCGGTTACAGCTTTGTCATGGTGAGTTATCTCTTTAATTATTTTGTACAATGTATACAACTATTTAATATTTCAAAAACCAAGCAGCCAAACTGATAATAGCATTACATCTATTTCCTATATGTTTGGTAAACATTTTATTTACCTAATTTAATTCCGTTTTATCAATTTCGATGGTACAATTATAATACAAATCGAATGACGGGATAAATTAAAAATAAACGTACATACATGTGATAGAATAATTTATAATACGTTTTTTTAGCACACGGGAGCGGGTGGTCAAGGTGGCGGCCAAGCATTGGCTAGTCCTGGGTCATGTCTCGAAGATTTCCGCTCTACGCCGTTTATTGAATGTAACGGAGAGGGCGGCACTTGTCATCACTTTGCCAACAAACTTAGCTTCTGGCTCACGATTATTGAAGACAATAAACAATTCGCAAAACCTGAACGTGACACACTTAAATCTGGACGATTATTGGAGCGTGTCTCGCGGTGCTCCGTTTGCATAAAAAATACCGTTTAA"
papilio_glaucus_seq = "ATGGTAATTGACGATTCATTTTTATGTAAAGCGATTTTATTACGATTACGAATAATTAAAGCACAATTTTTGTCCATAGGTCGTGTGCAATCAGACAGTATGTGACTGTTCCGGTTTAAAGGGAGATCGTGGTGACCCAGGTCCTCCTGGCATTCCTGGACTTCAAGGAGACTACGGTGATGATGGACCCGAAGGCCAGCTTGGCATAAACGGCGAACCAGGTGCCTGGGGCGAGAAAGGAGATGTCGGTGACAAAGGCGAACGGGTAAAATCAAATCTTTATTAATTTAAATTATATTGCATGTAAAGCTTGTTATGATTTATATTTTGATGGACTTATTATTCTTGTTTTTACAGGGAGCGGACGGCGCCTACGGGAGTAGGGGATACACAGGACCACAGGTATATTAGTATTACCTTATTTATTAATTATAATAAACGCGTACTTATTACACTCCTCTGTTTTATAAATACATGCATTATTTACCATTCCAATTTAATCTATATTAAACAATAAGTGTCATATATAAAGAATCATAAAGAGAGCCCGCGTTGACATTTCACTCCATCTTGAATAGGTATATCGGGCATTTAGTAGGGCGAGAAGAACGATATGTCACAAAATACGTTACAATAAGGATGTTACAAAATATATTTAAGGATTAATGGTATAGTCATTAGGAACACTGAATAAAGAAGCACTCCACCAAATACGAAACGTGTAGTTGCGATGCACCCTTATTGCCATGTATTTTGGTGTTGCGTCAGAGTGAATTACAACACACAGCCCTCGCGTTGACAAATCGGCGTCATTCACTTTCTTCCAGAAGCCAGAAGTGCCATCATGTACTACTTGTATATGTATATTTTATACAGTAATTTAATGTTTCCCTTCAGGGGCCACACGGATTGGAAGGCGTTCGAGGTGTGGCTGGATTCGACGGCTGTAGCGGTGTCGATGGTGTAGTTGGACCACCTGGAAGGCAAGGTCCTCCCGGTGACAGAGGTCCCCCCGGACCATATGGAGAAAAGGGGTCACAAGGTTTAGCCGGTGAAGGAGGAGTCAATTCAAGGGGCGCAAAAGGAGTTCAGGGTGACTCTGGTAGTCATGGCATACCTGGACCGCCTGGCCCAATGGGTTGGAGAGGAGACAGTGGTCTCCGTGGTGAAGAAGGTGACGAGGTAAATTTTATCTAAACCTAAACATCTCGAAATTTTTGTTTTTTACGTACAAAAAAAAAATATTATTTTTGTTTCTCAGGGTATTATGGGTATCAAAGGAGAACCAGGTTACAGAGGCGATCCAGGTGATATTGTGGTGGGGCCACCAGGAATAAAAGGAGATCAAGGAGAAACCGGTGAACCTGGAAGACCAGCCACCATAGTCAACATAGATACCTTTAAACATAATTTAAGTATTATAGCCAGAGGAGACAAAGGCGAGAAAGGACTTAAAGGAATGCAAGGTGTAAAAGGATTAAAAGGAGAAATAGGTTCAAGAGGTCAAATGGTAAGTAAAATATATAATCTGAGAAATTCTAAGGAGCATATTTAAGGAAAAGAGAAATTTCACATTAAAATGTATAATATATAGATAGATAGATAGATAGATAGATAAACACTTTATTGCTCACATTACATTAAATACAAAGTTTTGAAGTTGTGTCTTTTAACAAAAAATACGATTTTTTCCTACTTAAATACATAGAATGTCGTAATTTACGCCCGTTATAAAATATCGTAATACCTAATATAAACAAAATCTAACGTTTTATAAAGCGCTAATGTCACTACAATAAGAGTATACCACTATTTACCTCTCAATATAAAGGCACTGAACACTAAAATCTTTAAAAAGCTGAAGAACTGGTAGCTGGAACGTTGATGATGATGATTTATTCGATTATGTTTTTTTATTTATTTATTAAAAACACTTAAAATGTATTAAGTTTGGAATTTTAACTTGTTTGCGTTACAGTTTATACCTAGCCACTGTAATATTGCAGGATGGGGTCACTGTTGATACTGTTATACCTATATCACCTATATGTATGTAATTCATAACTTAACCATTGTACACAGTTTTGCAATAAAATAATTAATTGATATTACGTGGTTTTGTGAACATTTTTTTTTCGTCTGGTTGGGTAGAATTATATACAATATATAAAATAAATACATATTTCAAAATATAAACCATAAAATTAATACCATCTAAGTATTTCATCAACTTTTCTTTGATATCGACTGACATTAGACGACTGACGACAGATCGTTATTTTATTATTTATTCAATGTAATGCAATTTGACGCTTTTATGCTTTTAGGGTCCATATGGTCAAAACGGTCCACAAGGTTACAAAGGAGATCAAGGTGAAGAGGGCTCTAGAGGAAAACCTGGTCGCCGAGGAAAAGACGGTCCTCCTGGTCCTAAGGGCGACAAAGGGGCACCTGGGTTCCTAGGCATCGATGGAGAAGATGGGATACCTGGGGGACCTGGAGAAGATGGTAGACCAGGGATTCCCGGCGAGCAAGGACCTATAGGAGAACCAGGAATTTTCGATGAAAGATTGAATGAACCTTTACTACCAGGTGCTCAAGGGCCGCAGGGACCGGTAGGTTTTATGGGACCAATAGGAGCCCCAGGAATTGATGGATTCAAAGGAATACCCGGAGTTATGGGACCACCTGGTTATCCAGGTGTCAAAGGATTTCCTGGAAGAGTAGGAAACCCAGGAAAATCTCCCAAGGGAGAACCGGGGAGTGACGGACGCAAAGGTCTACCTGGGCCCCGAGGACCCCCAGGTTTACAAGGATTGCCTGGTACATTAGGTCCAAAAGGTTTTAAAGGTGCAACAGTCAGAGGTCCTGATGGTGAAGATGGCATGCCCGGCATAGACGGTGTCCCTGGACCAAGAGGAGATAGAGGTGAACCTGGGTTTATGGGTCCACCGGGATATCCTGGCCGTGGGGTACATGGAATGGGACCCCAAGGAGAAGACGGGCCACCAGGGCCGCCTGGTATGATTGGTGACCTAGGCACCCCAGGCCGACCAGGTTATCCGGGGTCGAGAGGACCGAGAGGTGATGACTGCCCATTCTGTAAATCAGGTAAGTTGTTTGAATCTCTGTTAGTATTTTTCAGCCATCGTTTAAAATGTGCCGTTCGTCTAGAATCGTAATTTAGCATTATAGACAATAATTTACTTGTTTAAGGTAATATTAATGTCATTTCTGTGATATTGTATATAATTTACATTAAACACAGGTTCACCTGGACCTCAGGGCCAAAGGGGCGATGACGGATTCCCAGGACAAAAAGGATATCCAGGATATGAAGGTTTACCGGGACCACGAGGTCAAGTTGGGTTACCCGGTACTTCTGGCATACCAGGTGCAAAGGGTTCAAAAGGAAATAAGGGACAATCAGGAATGGCTGGACCCCAAGGGCCGAAAGGGCAAAAGGGACGACTTAACCACCCACCGTTGGATTTAACCTTAGCAGAAAGAGGTCCCCCGGGAGATCAAGGTGAGGAAAATTATTTTACCAAAGATAAAACGCCTTCCATCTTTACATCATCGACCGTGGACGTATTGAAAGATAAAATAAGAAATTAAATCCTACGAACAATTTCTCTTATAGGTGGACGATGGTTGAAGAGGGATGAAATGTCCACCACAAAAACTTCTTTTAGCATACCAAAAAAAATAAGAAACTACCTTGACAGCAGTAGATGAATTAGATTAGACGCACATATTACATAGTAAAAGCTAATTTTGTAATGTTCACAGATTTTTTTCCTTAACAAATATGTAATTTATATAATCTTTCACTACATTGTTAACCATTCCTATTCTTGATAATTTTGCGCATGAACATATAAAACTATTTTTTTCCATATTTTTTTCCTTTAATAGGTTTCATAGGTCCACAAGGCCTACCCGGTGATGCAGGTTGGCCTGGACTTAGCGGTGACGTCGGCCCAATCGGTATTAAGGGAAGAATGGGAGATTTCGGCTATCCCGGGCTTCCTGGACGTAATGGATCAAGAGGAAGGGATGGTGCTCCTGGGTGGCCGGGTGCGCCTGCTGATATACCGATAGCATTTCTGCGTGGAGAGAAAGGGGATGCTGGGATAAAGTAAATCTAAAACATCACCGTCTAATATAACAATAATTTAAACGTTAAATACGATCCCTTGTACAGTCCATAAATGTTTAATTAAATATTTACTGTTGCCATTCCAAAAATCTTTTCGAATATGTTTAATATGTACATGTCACTGGCCGATTGTCACAAATAATTGGGCTAGACAAATTCTAAATTCAAAAAGGCACATTCTCAGTTAAACGAATCATTGACAATATGACGTTCCATTTCCAGTCACTTTCTAATGGGGCGAAGGCTAAATTTAAACCTGCTATTTATTTTGACAAGAGTGAGAATTGAAGACAATGAAAAATAATTATTAGTGAATTCAACGATATCTTTTTTGTTTAAATAATTTATAATCTTAAAAAAACCTGCGTAATATTGTTTGTGACGTCTATATCCAGTTGATATAGGTGAAAATTCTTTTGGTTATTTTTCACTGTCCTGACCTGGTAGAAAATAAATAACATATTTAATTAATTAAATAGTTATAGTCTAATGAGTGAGGTGCCGGAGGCCTAATTTCAGTCCTCTTCCCCTTCCCACCCTTTCTTCATAAGGATAGGATGGGCTCGGGAAGAGGATTGGACAGGGAGGGGGTTAACGGGGAAATGGAAATATTTTTTTTCCTGTCTATGCCTCAGTCCATTAATGGTAGGTAACGCGTCTGCAGCACATTTGCTTGTTGCCGATGTCTGTGGGTAGCGCTCACTTAACATCAGGTGATCCGCTTGCTCGTTTGCCACCTTCTCCCTTAAAAAAAAGTTACTAATGCTACGAAAAAAAAAATCACATTTAGTTGTTTACGTTTAGCGACTGGCAACGAATCAAAAAAAGCGGGTCTCAAGTTCCGACCAATCAGCGCTCAAAGTTCTTTTGTAGACAAAGACATTCATGTCTATTGGATACATATGCGTCTGCCTTACGTCGCCTCTTTGTAAAGTGCCTAAAAAAGAAACGGCGCATTCTCAAATTCGTATATTGGTATTTCCTTGACTGATGCCGACTCCAAAACTAAATATTTTTATTTGTTCAATTTTTTTAAAATAAGATCTCACAACTTTTTGTTGCGGAAAAACTGCGTTCCGACACTTGGCTTTTTTAGATTTTTTGTTTTTGATGGAATCTGCTCAACAGTTTGACATTCTTTAATACGCAAAATCTATATTATATATAAAAATCAATTGCTGTTCGTTAGTCTCGCTAAAACTCGAGAAGGCCGAACGTATTTATCTTATCTTGGTGTTGAAATGTTCGTGGAGGTCTAGGGAAGGTTTAAAAGGTGAGAAACAATCGAATAATTGCCGCGAAAACCCTAACAACAGCCCTTTTCGTTTTCCCATATAAACGTTTTCTAAATAAAATGTAGAGTCAATTTGAACTTTATTGATATTCAATAAAGTTCATATTAAATTATAATCACTCATGTTGTCTAAGAAATGTAGATGTGTTCCTAATTTAGAAGATTCAATTTGCAATTTATTGCCGCTGCACATAGTTCAAATTCAATCATATATATCAAAAAACTTTTAAACAAAACCGACTTCAAACAAACTGTATGCAATAACAAGAAATGCACTTAAAAGTATAAAATAATTTTACGCAATTAAACATAAGAATCGATTCTTAATCATATTTCTTTTTTGGAGTCGGTGTCAGCTGTGTTTGATAGTGTTCGGATAAACAAATTAAGTGGTTCCCAGGCGAAGCCGGGGCGGGTCACTAGTAAACATTAAAAACCCAGATTTGAAAACTCAAAACCTTTTTATTTTTATAGATTATTAAGTAATTTCTTTAATTTCTTACACAAATTATGAATTCCAGAGGCGAAGCTGGAGACAATGGAGAACCTGGTCTACCTGGCGAGGTTGGAGATTCCTTAGATTCTGACATTAATGTTAAAGGTGAAAGAGGGCCCCCAGGAGTCATTGGCAGAAAAGGTTTGTATGACATCAAAACTAACTATTGACTATAAATAAATAAATAAATATGCGCTCACTTCCGTAACCCAGAGGGGTAGGCAGAGATCATGGATTTCCATTTGGCGCGATCCTGGCACACCTCTATCGCTTCTTCTACATTCATACAGTACAGTACAGTAGTGAGTAGTCAGAATGTGTGTCAGGCTCTTCTGGCAATACACAATACTGTACTAGTCCCCACTTTAATGTATGGAAGTGAGAGCTGAGTTTGGCAGCATGTTAGTAAAGTTATTGCTGTTGAGACGCGATCCTTAAGAAGTATGTTAGGCGTGACATTGAATGATAGTATTAAAAATAGCATTGTAAGGGAAGTGTGGCTTAAAAGTGAATTTTGTGACTAGAATTGAGAAAGGTATGCTTCGGTGGTTCGGGCATGTTGAAAGGATGAATGAAGAGAGAATAATGAAACAAATTTATGTTGCAAAAGTGAGTGGCAGTGTTGAGAACTTATATAGATCAGATTATGCTTATTAAAAAAAGGGCGATATAAAGAGTACCCATAACCGACGAGCATGCATGCGTAGATGTATGAATGTAGAAGAAGCGAGAGAGGTGTGCTAGGATCGTGCCAAATGAAAATCCATGATCTCTGCCTACCCCTTAGGGTTACGGGCGTGAGCACATATTTATTTATTTTATATGGTATCTTGGATTTAAAATGATACTGTATATATTATATTGCATTGTCATCAGGGCAAAAAATTGGAAGGGTATAAAATTTAAATTATTAAATTTGACCCAAAGAAACATGTAATTTATACAGAGTGTTAGTGACGGATACACAATAAACGAAAACGCAACTTGTTGATGATTGATGCCATAAAATCTTTAAAAAAATATCACATTACTGAACACAAAAAAATAAAAATAATTCAAACAAAATAAATAATACATAAATCGTTCCGAACCTAAGCACCATTGCTAGCACGAGTTCAATAACCTATTCCGTCACCCACCATCGGTTAGACCACGCGCGGGGGTGCGCGTCATCTCTCATTTTTAAATTTGGACCGTTAATTGTTTTTTTTATAATGATAAATAAACAGTGTTTATTCTTTTTTATAAATCAGAAGAAAAATTGAGATTTAAACGATATTATAAAAGGTTACAATTATCGCAAATAGTCACCGCTATCACTCCTAACGGGAATACGAATGATTACCAGTCGAATTACCAATGATTTACATATAATGTTTCGACAAGCTACAGATTTTGTGAAAGTAATTAAAAATGTGGTCCTGTGACTTTACTGTTTAAGATATTTAGCTGTCTCGTAAATACGTAACTGTTACACGCATAGTAATGCGTGGTTGTTTTTTGTATATTAGATAATGTTTCGATAAACAATTATGTGTGATACACAATGTCTCGTAAGGGAATGGAAGCGCTCAAAAATACACAATTTTTTTCCCCTAAAAGTACCTTTTTTTACTTTACTGCACTTTCAGGTACACCACAAATGATGGAAATTTGTAACGTTTTTGGTATTATATAACCCTCACAGACTACACTATTATGACTTCAGCAAATAGTATGAGTACCTATTGTACATTTTCGAAAAAAAATAACTAAAAATTTTACCATGATATTTAACAGAATTGAAATTTGTAAAGCTTGTGAGGGTTTCATGAAAAAAAATTATGAAAATAAAAACCAAAGTGAAAAATTATTTAAAGGATGTGCACAGTTGAAACAGTTTACAAAAGTTTTTTTTTAATAATAGGTATTCATACTGTTTGCTGCATTTATAATAATGTAGTCTTATGAGGATTCAGATTACATCGAAAAAGTAACAAATTTCATTAATTTGCAACTGTAGTGTGGTGACTGTGCGGTGGTGGTGTGACTGACATTAATGTACAGTGAAGTAAAAGTGGTACATATTATATTAAATAGTGTCATATTGTGGATGCCAATACATCAATGTACCTTGTAGCAATATACATATATTTTTAAAGAGCTTCACATTTTAAAAAAAATGTGTATTTTTTCAGTTCTAGGATTATCCATACATTACAGCATACTCTGTATATAAAGCGGACTTACTACAACAATCTGACAAGATGAACACTTAATAATTTTTGTCTACAATTGTCACATAGGTTATCGCGGAAGAAAAGGAGAACGTGGGGACATGGGATATGACGGATTCAGAGGCACTCCCGGTGATCAGGGACTTCCGGGTAGATCTATACAAGGCCCTGGTGGAATAAAGGGATTTGCTGGTGAAAAGGGGGAAATAGGTCCTAGCGGAGAGGCAGGAACAGTCGGTCAACGTGGACTCTCTGGATTTAGTGGCAATAAAGGGCATAAAGGATCAAGGGGCGATGTTGGCCTTGCTACAATTTTTGGTGAAAGAGGTACAGATGGTTACCGCGGGGAGCGGGGTGATGTCGGTGAACCAGGGTACCCCGGCACACCGGGACGCGGCGGTGTCATCGGAATTAAAGGAGTTACTGGACAACCTGGCGACATTGGTCCAGAAGGACCACGGGGACCACCAGTAAGATATTTTATTTACAATGTACATTCATAAGATCATAAATTATTTAACGTTACTGATTTATTGGCTTAATTCTAAGTGTTGTACCAATAACATGATCAAAAAACAATCAAAGACAATTAAATTCAATTAACAAGAACAAACAGATGAACAGATAAAAGTTACACGCAATATTTACAAATATCCATATTACATTTTTAAACATCCATAAATAATAGAACTAAAAACTAAAGATCCAAAACATCAAAAAATTAAAGAACTTATTAAATTATATTTTACGGGCCTTCGGACTTATTCGTGGAAAAGGATCATGATTTTTGGATAATTGTATTTGATAGAAATTCTATAATAACAGAATCTTTACCTTTTGTGCCACACCAGGAACAGTATATAGAATAGGTTGTCGTTAATCAAGATCCAATGTGTGTATGCCTGCCTACCTACACGTACTTCGCGATTACTTGGAATTATAATATTAAATAAATTGATTTGGTTTGATTTTTTCGCTGTTCATTTGCTTTGTCTACTTAAATACCACTTTATTGCATTCTAGAATCGTCTTTAGCGTCCTTTTTAACATATACAGCCATTATCAAGTATAGTGCCACGTAAAAAGTACGTAAAAAGTACGTAAAAAGTACGTAAAAAGTCATCTTATAATGAGTTAAAACCCTATAAAATACATGTTAGTTCTTAGTTTTCTTAAACATTTAAAATTTACAGGGTCGAAAAGGATTAACTGGTATCATAGTGCAAGGTGCTCCTGGAATACCTGGACGACCAGGATTCTCTGGGCCATTCGGTCAAATTGGTGAACCTGGTTTGCAAGGATTAAACGGCTTGCAAGGTGATGTTGGACCTAAAGGCGTAAAAGGACAAGCAGGCCGTATTGGAATTCGTGGATGGACCGGTGATATGGGTGCAGTTGGAGTCCCCGGATTCCCAGGAGTTATGGGAACACCCGGATCTAACGGTGAAGTTGGAAGTCGTGGTGAGACTGGGGCTCCTGGATATCCAGGGGCACCTGGAAAAATGGGCTTTCCGGGATCTGAAGGAGTTAAGGGTAAACAAGGCGACACAGGTTTTGTGGGATTACCAGGGGTAGATGGTTTAAATGGTGTTAAAGGAGTCATAGGAGACCAAGGATTTCAAGGTGTAAAAGGTTTAAGAGGTGAAAATGCTTTAGTCGGAATGAGGGGTGATGTTGGAGAACCAGGGCTCGATGGGGTATCTGGCATACCTGGTACCTTTGGACTCAAAGGGTCAAAAGGAGACTTAGGAAATCCTGGCTTAGCAATTGGAGGATACGAAGGTATAAAAGGGGAACAAGGGGAGCCTGGATTACCAGGTCACCCTGGTTTCAACGGAACCAAGGGTGAATTCGGTACCTATGGAATTGAGGGTCCTCGAGGTGATATTGGTGATAAAGGATATCCAGGCCAACAGGGACGGCCCGGGAGAAATGGATTTAATGGTTTAAAAGGAAGAATGGGAGTGCCGGGTCTTGTTGGATTAACTGGAGAAAAGGGAGACTTAGGACAGGAAGGGGAGCCAGGTATTATGGGTAGACCCGGTTTTCCAGGAGACGAAGGTATGCAAGGTCCAATGGGCAGCAAAGGCGAAATGGGTTTAAAAGGAGAACGCGGAGACATGGGTATAACTACCCGTTTACCGGCTACAAAAGGTGACATGGGAGACATAGGAATCGATGGAATACCTGGAACAAAAGGACAGGTTGGAGACGACGGCTTTTTTGGAATTAAAGGAATAAAAGGTGAACGTGGTGACTTTGGTTTCCAAGGAGAAATGGGTGAAGATGGACTACCAGGAGAGAAAGGTCCTCTAGGAGATCGAGGTCCACCGGGATTACCTGGTTTAGATGGAATTGACGCTGAGAGAGGACAAAAAGGTAGAGCTGGAATTGATGGACTTTCTGGATGGCCTGGACCAATGGGACAAAAAGGTGCTCCTGGTGAATATGGTGTAACCGGTCCTATTGGTGAACCTGGACCTCCAGGATTAAGTTTCCAGGGTCCGAAAGGTTTTAGAGGAATGGACGGTTTTAACGGTAGGCAAGGAGCGCCTGGAAAACCTGGACCTAGAGGAATGGAAGGTGTTCCTGGATTACAAGGAAAACCAGGAGAAATAGGTGAACTAGGTTCATCATTTAGTGCTAAGGGTGCCAGAGGTGATCAAGGGTGGCAAGGCTTAAATGGCTTCCAAGGAAATAAAGGTGACATGGGTGAAGCTGGATTTGATGGCTATTCAGGCTTGCAAGGCCCTAGAGGTATTAAAGGAGAAAGAGGAGATGAAGGAATGCAAGGCATAACAGGTTTAAGAGGACTAAGAGGAATGAAAGGGGATAAAGGTAAAACTATTCACCCCTCGGAAATATTGCCCGGCCCAATTGGTGATATCGGACCCCCCGGATTTCCTGGACGACGCGGTGAAGATGGCCCTCCAGGTTTTATGGGACGTAATGGAATAGTCGGTTTTAAAGGTGAAAGAGGAGAAATTGGTTTTATGGGCGCTGTAGGACTTCCAGGACATCAAGGCGTTCAAGGAATAAAAGGAAATGTAGGGTCTGTAGGTTTTGAAGGTTTACACGGAGCCCCAGGAGCTCCGGGTAGGCCTGCACCACCACCGCCGATACCGAAATCAAGAGGTTTTTACTTTACAGTACATTCTCAAACCAGAATGATTCCAGAATGTCCATCAGGAACTTCACCTCTTTGGGAAGGATTCTCACTCATACATATAGTTGCAAATGCAAAAGCCCACGGCCAAGATTTAGGTTGGTATTTCTTTGGTTTTCCCTATTTTATGCAAAATATTGTGAATTCATATTTTTAGGTCGCTTATATATACATATTATAAAAATATAACTGATCGCTGTCTGTAAATTGTAGATATTTGAGAAAAACTATTAACTAAACGCAATAAAACCCAAAACAATGATTATTAGAATTTTTGTCTGTTTATCTGTGCGTTTGTTACCGGTAATCTCAGAAACGGCTTAACCAATTTGGGTGCGGTTTTCCCTAATGTATGTAAGCTTCACTAATCATTTAGTGTTTGTTTTATCTCAATCGGTTTATAAATAAAAAAGTTATACACATTTAACTGTGCTACGGCCATACTGTGTCAAACCCACATACGCGGGAAAAGGGCAGTGAGATGATAATGAGGTTACGGTAGTATTAAGAAGGTAATATCATTTCGTTTAAGTAAAATTGCAGGGCGGATGAAACCGCGGGGCACAGCTAGTTCTGAATAATTTAATAGTATTCGATGTTAGTACTACAACGATTAAAATCTGTATATTTTTTTTCGAATAAGAATGATAATTATTGTTTGACAGGTGCACCTGGCAGTTGTCTACGAAAATTCTCCACGATGCCCTACATGTTCTGCAATCTTAACAATGTTTGTGACTTTGCTCAACGAGAGGATTACAGTTTCTGGCTTTCTACGCCCGAGCCAATGCCAATAGCTATGAAGCCCATTCAAGCGAGAGATGTTGGCTCTTACATATCGAGGTTACAATTCTATAATTCCTATTGTTTTTATTAGAAAGCATTAAGAGCTAAAACTATAATCCGTATCAATTTAACCTTAAACTTATTAAATAAAAATATTTTAACACATATTTATCACGTCTTTAAATTAAATTATTCAAGTTTATAGTTATTGCATTATTTTTAATTAAATTCTACATTAAGAATAAAATACAAGAAATTCGACCTTTAAAAATCGATTTTTTTTAGATTTTTAGAATTTTTTCCTTGCCTATTGGTCGTATGATTTTTTTTTCCTTATTTGTCATCTATATTTATAAACCGATATAAAAAAAAAGTTTTTGTTGTAAGGGGGACATCTTTTCTTAAAGAATATATGGGACACTCTTGTGTCCCATATTATTTTGAATGGCAACTTTAGATTCCGAATATATATTGCGCATCGTGAGACTCGAGCTCAGTTTGTTAACGTCCACGTAAACTTGACCCCTAGGATCTCCAATGGCAAGTTACGCAAGGGTTGAGCCTAATTTGGTTAATCGAAAAAATTGCAAAGGGACATTTCGCTCCAGCATACTGTAATTCCAAGTCGGTTTTATTTTTTAATTAACGCAGTTTAATTGATTATTATTGTTTTAGATGTCAAGTGTGTGAATCATCGACACGAACAATCGCCATACATAGCCAAAGTAATGAAGTGCCAACGTGTCCGCAAGGTTGGGATGAATTATGGATTGGGTACAGCTTTTTAATGGTATGATTATCCTTGAAATTTAAGCTAATCAGAGTTAATATATTCTTACAACCTAAATATCTTTATCGGATATGCAGTTGGTCCCTGGCATGACATGGTCGTATATCCTTTGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTTCATAACGCCCTTCTTACGTAACGGTAATGACGGTTTCATAGTATCACGTTTTCATTAAAAATGAAGAAATATTTTCTATAATATTCGACAAAAATTTTGACTCAAAGATCATCAAAATTTTGGTGTATAATACAGTTTAGAGTTAGAATAATCATCATTTGCCTGCAGCAGTCTAGTGCTAGGCAAGGGCCCTTCCTACCTTGTGCTGTTCGTGACTGATTACGTCATCACAAGAGTAACTGTTTCAATTTGTTTTAAGACTTCTTAGATATGTAAAGATGTAGTAATATGAACTCCTTCCTTTCGCAGCATACGGCAGGCGCAGACGCAGCTGGACAAAGTCTAATATCACCTGGATCTTGTCTCCGCGAGTTCCGTACACGTCCATTTATAGAATGTAACGGACTCGGTCGATGCAATTATTTCGCCACAGCAGTTTCCTATTGGTTGTCGACCATCGATGATAATAGAATGTTCTTACGACCCGAACAACAAACGCTCAAGGAAGATAAAGTTTCTAAAGTTAGCAGGTACGTCCAAACTTTACATCAGAAAATAATTTACAATTAATATAAAAAAAATACTTAAAGTCTCTTGCACTTCTTACAACCCATGTATCACAGCAGTGGTAAAGTTAGTGCAATAAGATAAACTGAATTAGGGTTAGGCGGCAACTTTAAAGTGAAACAACATTACACCTTCTATTATGGCAAAAAAAACTAGATATCGATCGATCGAAAGAATCGTTATTTACTAATTCATAGGCATTTTTTATAACATGGCAACATGTTCTTTTTTGCGTAGGTGGATGTCTATAGACAATACTAAAGTATAAATACAAACTTTAGCGGATAGAATTCAAAACGCTAAAATTATAATATTAACTAAAGTAAGCTGTAGTTAAAATATATTACTTAAAAAAAGGAAACTTTTTGCCTGCGGATAATAAGTGTGGTGTTGTTATCCGCAGGCAGAAAGTTTTCCTATGAATAACTCTCTCACTTTCGCCTACCAATGCAGGACTGGTAGATAAAAATTAGAGATATCACTAATCGACGATTTTCACCTGGCTCACCTGGCCAATACTATTATCAAAACAGTCGTAGGTACTTATGTAAGAACGATGTGGAGGTTAGTCGGCAAACTTTCTGCGCGCGGATAATATCTCCACAACGTTAATGCACAAATACCTTCTAATGTTCTAAGATAAAAAAAGACGCGGGATATCTACGAAATACGCGCGAGCGAGCAACACAAATCTGTGCGGTCGCGTTCGCGCGAACTGCTACGCGTACTAAAGCGTCGGTCATCGCACGAAAAATCATAGTAAGATCGAATCAACCACATATACGAGTTTCAGTAAACCCAGTAACTGGCAATAGATGACCATCACTACTAAATGTAAAAACGTGCCAATTAGCACGAATTATTAGGAATACGAACTTAAGTGTGCTTTCATTAATTTTAAAGCGGCTTTATAACTTCGTATTAATATCTACCTATGTTAACCATTTGGTTTTATACTAAGATTTGCAAATGACCTGCGGATTTGTTAGCCGTACCTCGATTCAAATAAGCTATAACAGTGCTAATAAGAGCCATAATGGTCGAAGAGCTATGTAAATATTTAAATTGTGTAATATTTGAATTTAAGATGTTCGGTGTGTATGAGACGAATACCGGGCCCGCCGGCTGGCACCTTCTACCAGACTGGCGACGTGAGGTCGGTACCCAACGAGGTGGTGCGGCGCCCTCCGTACTACCCTGTGCGTCGCAGACCCAACGTGCGGAGATACGGCATCCCGCGCGGCCGACGCCAGCCCCTCAGAACTTATAAGCGCGTCGCCACATAG"
lerema_accius = "ATGGTAAGATTTTCTAACTCTATATAATTATAAAACAAATTCCGCAATTATTATTAACGATTTTTATGTGCAAAAAAAAATTATAAGGGTGTATTTATTAAAACCTTGATAATATAGTGTGCTATTTGTACATGACTAATATTTTTTTTTAATTAAAATTGCAAACTTTAAGTTGCATAATGAATAATGCATGAAATTATTTCTTTAGGTTTGTGGCCGCTTTGGTGCTACTGAGTGGAGTAAATTCGGTGAGTGAGAATTTTCTTATTGGAAACTAATATAAAAATATAATTTATTACAAGTTATCTGAATTAGAGAATGTAGCGCAGGAGTCGCGGCGGGCACGGGCGCGAGCGGACCGACCCGCTCGCTTGCTTGCAGTTGTTCTTTTGCAATTTCTTAAAAATTCGAGCTTTATCAAGGTTTTGTGCAGAAGCATAATGTGTTTAGAAAGAGATATGTTTTCCTCCGCCAAAGTCGAATAATTTTAATTTCAATTCACAGTTTTAACTGCTTAAGTACTTCTCAACAATAAATTATTTTAAGTACAGCGCAAATGTATATGAGGCCGACAAAGTTTATCATCACTCGGATGTTAAGTGTCGGCATTGCGCAAACCAATGTTTTTCTGTAATATCTATGAAGTTAATATTAATACTTCTAATATAGACATTGATCTAATTGTTTTATTGAGGATTATTTACTTATCCTTGGACTAATTATCTTAAATGACATACCTGACTATTTTAATTTTTAACACTTAATTTTAAAGTCAAACTTTTAAATTGAATACTGAAAAGAAAGTAGTTAAGTCAAATAAAGAGAAAATACCGTAAATACATATACCTACTTACAGTATCAAATTAAATTTTTTTTTTTTAAGAATACTTACGTACTTTAAACATTTTCAATATTTTCATAATTTGTAATTAAATAAATACTGCATGCCTTAAATGGTTTTATTACATAGTGCGATTTCCTAGGTGTTATTTGCGGCGACAGGGACCAACGCCCAGTAGGCGGCAAAATAGGTACCTTTCTAATGTCTACTATTCATGGGAACCTATTCCAGTACGTTAGGTACATAATGTATACTGAAATTGGTTTTCGGAGAGGTCTGTAAAGTTTTCTACAAAAAAAAAGAGTGAAGAGAGTGACACCTTGTTGGGACAGAATTCCTTTCGCAATAATATACGATTAATAACACAATGATTAATGTATAAAAGATGGCCGTGAAGAAAAAAAAATATCCTGACAGAATACATATTTTGTATAATGTGATATTAACACCTACCATAATTTTATATACAGAGTATGTACACTACATGACTGTTTTTTAAATAGTTTGTGAACTATTTCCCCCTCTATTGAATTTCATGTTATCCTGGAAGTGAAAATTCGACATATTGTTGGAAAATTTAAATAAGAGACAGAAAGCATTTCCGTTACTTTATTTTTACCGGTTACGTAACTCCTGCCGCAAACCTTATTAGGGATCTTTGTTCCAAAAACATGGCCTTAAAGTGTTATTAGTGATAACTGACAGAAAATATTTGTAGGTATATTTTGAGTAATAGATAATGCTAGTAGTGTTTTATATAAAAAAATAGAAGTGGTAAATTTTTTATGCTTTAAGATATCTTAAAAAACAAATTAAATAAGTACTATATCAACACCAAAAATGGGTTTGTAAATGATTTCAAAATAAACACAAATACCTATTCAAAATATGTTTTGATTTAGGCACTTTAACATTTTTTTATTTAAGTAAGTGTCTACTTCTTTTAAATTAAATTATAGGTACGTTAGATAAAGTACCTACCTGTGACAGTTCAACAAAACTTGAATTTTAATTATAATTTATTTAAAATATCTCAATATGCTTGTCCCTCAATATTATCATAATAAAATATTCCAACGACCAATTAAAATTAGGCATTGATAAAATTGTTATCGTTGGTAAAACTGACTAGATTATCAAATAAAATAATAAAATAACTACGGTACATAAAGATAAATAAAAAATACTTAATAAGCTAAACGTTGCACATACCGACAAGGGATCATTTTACGATAAAATTGCAACTACTGCAAAATATCACGTGTCATAACGGCTGCACTACCAATATTATAGTTACAATCATAGAATGCTTGAAGCTAATGACGTCTAGATGAAATAAACTTAATTTAGGATTCGTATGTAACTGTCATTTCAGTGACATAATTTTTTTAAAGCAATATATTTGGATATTACATTTTCTAAAGAATCATGGCAAGATCCATACATTGAATTGTACCAAAAAAAAAGGCGGTCTAAAATGTTTCCTTAAAATTTTGTCATATTTTTACGAACATAAATATACACTCAAAATATTTTTTAAACCCGGATTACGTGCAAAAATATTAATATAATTTTTGGGCAATCTTGCCATTCTAATAAATGAATACGCCATTTGAGGTATTCTGTCAGTGACAATTGAGTATTGGCAAAAATAGAAGATTGAGGTTACACAAAACCAATATTATTAAGTTTTTATTTTAACAATAATTATTTATCCTGTTATAATTTGGCATTACAATTTTTGTTTCGTAACTTATTTCAATTGAATGTATTTCTGAAGAACTTCACAACAAGAATAGAAGTCTACTGAGTACACTGAATGTGAATTGTTGAAGCCTACTGCATTTCTACGCTGATTCCTGGAGAGTTGTGTTCGTCATAACATTTACAACATTAGATATCGAAGAAACAGTGATATAATAAGCTGAATATAATATAATGTATACCTACATGCTGCACTGTTGCTATTGCTCATTTTAGTTTGGAAAATAGTTGCTTAGTACCTTATACGAATGAACAGCAGTGAATAGTGGTGTGATAAATATTGTGAATGTTTAAATAAAAGGAAACTAAAAGTATCAAGGGCGTCTATGATTTGAAACTACTTTTGCGGCAAATAAAACATCTTGTTGCTTATTATTATTGTATGTTCACATAGATTCTATAGAATTAATTAATTAATTAGAACAATGTAATTTGTTTACAAGATATGATTTATTAAATGAAATACCAATTTTTTACAATGTTTTATTAATCATTTTCGTTTTCTATAAAAACAGTATTTAAAATACTGAGCAGGGGTTACAATAGTACCTTTATATTTTGCCCAACCAATATATTAAACAAGTTAGTGTCATAACATAGGCACAGCAACCCAGCGTTCGCCAACCAACTATATACTACCCGTAATATATATGCATTATAATACGAGATAATTGCAGCAATACACTATAAATTATTATTCCATTTCGCCCTGATGAGTTATTTTGACACCAGAGATCATTTCTGATCGCTGTTTGACACTAATAATAATGTCATATAAATGACAATCTTGTTCTTACTTCCGCTGTAACGATTCGTGCAGAAATATTCTACTGATATTAATAAAAATAATAATTTTGATCCCGGAGTCTTAAAAATACGTTGATTGCTTTAAGTTGTTCCTTGTGGTCTAATAACTAATTGTGAACTTAATATTGCGGGCCTTTTTTTCTGGTACAAATTCTGCCATGATTCTTTACTGATGACATATGAGAAATATCCGACGATGTTGAAATTAACTATTACCTTACACAAGAACTAGAAAACCGGGCGGACGTTGTTTTGCCAGATATTTTATCTCTGAAAGGTTAGAAAGATCCCTTAGTCTATCAAGTTCAGTTCTTCAATTTCCATGTACCTTTAGTAAATGCTCATCGTGTCGGACAACGTTTGCTATGGCAGCGTTTCAATAACTAATAGTTTGGCTGGTCCCTTGGAGGGTTTTGACATCACCAACTTCTGCCGGGTCCAGCTGCAGCTCGAAACTATACTTAGTCCTTGTAAAATACTTTAATTTTTTTTTAATTATATAGTTTCTAGGTTTGTACTACAATAAAGTTTTCAAATAAATAAATAAATTATTGTATCTCTTTTTTCTGTCTTTAGGCTTGTATATTAATCACAGGTCCATAATACCTAATGTAACTGAGGTGGGGTTTACGACGCCGCCAGTAGCGATGAATTGTATTTAATTAAGGGTATTTATTTTGTGTCAAAAAATCGATTTAAGTATCACGGTTTTATTTGCAAAAAATTCGTTTTCGTGGAGAATTTATTAGAGTCATGAACATAATTGTGACGACGTCTGTTCTAATTGTTTAACATAAAAATGTGAACTAATTTGGACAATACGAAGGCTTTATCAGTAGACATCACCATTGACACTTGTAGTTTCAGTTAATGACAGCTGAGTTTGGTACTTATGTTGAGGGATACGTTGAGTTGAGGGTACCTCCTTTATTTTTATTATTCTAATATGGGTAGATTGACCTCCACCCGCTAGCAATCTCTCCGCTCTGCTTCATTTAGTGTAGGATAAAAGATATAAGTACATATTTCACGAAATAATATTCATCTGATATCTGAAAGTTTCGACTCCGTTACCCCCTTTATTAATAGTGCAATAAATTAAAGTAGGTACGATATTTTTGCTCAAATGTAATATTATAATTAGAGTTGTAACAAGTTATTGGAAATGAATAAAAAAAAATTTTTCGACTATATGGATATCGTATTTGATATTAATCCACGCGGCCGAAGTTCGTCCCAGCTTAAGCGCAATTTCTCTATGTGTCCCTTATCTGCTTAAGTTTATACATGTCTGTAACCTATAGTACAGTAACTATTGGAAAATCTTCAGATATAAAACTTAAATTTTAATCCCTACTAACATTTTTAACAGTAAATTTTTGAACAAGTCTATAAAATGAAACTATGTTTCAAATTTTAATTTTAATTTATTTTTGTTTTAGCAAGATGATTACGGAAGGGGCGATTTGCTGGAGAACAATTTATACCCTGACAATGAGTGGTACACAGCGACTTTACCTGAAGGACCTCCACCAGACAATACATATAATTATCCTGGATCAGAATATCCAGTGCCGCCGCAGTCAGTGAACACGTATGGTTTGTCTGGAAGACGTGATTATCCATTACCGCCATCATCAGCGAGCACCTACGGACAGTCTGGAAGGTCAGAGTATCAACCACCATCATCGTCATCGAATACTTACGGTTTGTCTAGAAGACCAGATTATCCGGGACCATCACCATCATCGAACCCCTACGATTTGTCTGGAAGAGTAGATTATCAATCGCCACCTCAGTCGGAATCCACATATGGCCAGTCTGGAAGATCCGACTATCCAGTGCCACCTCAATCAGTGAACACGTTTGGTGAAGGTGAAAGGCCAGATTATTCCGCGTCATCATCACGCGCACAATTAGGCTCCAATTTTGCTGTTTATGATCCTGTTACAAGACAGCGTACCGTAGCATTTGATCGCAACTGTACTGCAACAGGTTGCTGTGTTCCTAAATGTTTTGCGGAAAAGGGTAACAGAGTAAGTATTCTAAATGTTATAAAAATATAAATAACGTAAAAAGGTTTCACAAATTACTTATTATCCTAAACATCTTTCAGGGCTTTCCAGGAATGATTGGACTGCAGGGCCCTCCAGGATTACCTGGTCACGAAGGAGTCGAAGGGCCTCAAGGACCGAAGGGTCAAAAGGGACAAATGGGTCCCACAGGCCCTCGTGGACCAAGAGGTGATATAGGTAAACCAGGTACTCAAGGATTTACTGGCATAGCTGGACCTCCAGGACTACAAGGTGAACAAGGTCCGCCAGGTATTCCGGGCCGAGATGGTTGTAATGGAACTGATGTAAGTATATTTTTATCCATAACAAACAAAGTAAAATAAACTTAATATTATTAATATAGTACTTAGTTATAACCCTTCTGCGAAGCCCTAGCACATATGATTGAGTTTCCAACACCGAATTATTTCTACAAAAATATTTTCTACTCCGGTGTCCGGATTTAAAAATATATTATATAATTTAGGTTCAGCCATCACTGATTTAGTTTAGAGAGTTAATATTCATCCTTTTTGCATTACATAATAGTTCATAAATTTTTCTGTTTAACATAGTTTTAAGTAGGCTGGAATGTATTCCAATAATAAAAATGCTTTTATTATCGCAATAATTATATTGAATCAACACATTTTACAATATTATTTATATTCTTTTATAGGGCGAGCAGGGTCCACAAGGTTTACCAGGATTACAAGGCCCTCGGGGCTATCCTGGTCCGAAAGGAGAAAGAGGTGATAAGGGCGAAGCAGCTCAAACTGGGCGCTATCCCGACAAAGGTCAAAAGGGAGAAGCTGGAATTGACGGAATGCAAGGGCCACCCGGCTCTGTAGGACCCACAGGATTACCTGGTTTAAAAGGACCCAAAGGAAACACAGGCCCACTGGTAATTTGCTATCTTATAAGTTTCTATTTTATATTCGTTAAATTTCGAGTATTGCAAAATTGGGTTGCCTCGGTGTAAATTGGTAATAGCTATTTCGATGATAAATAGTTGATTTTATTTTCATTAATAAGTAGTTATTTTGTATCCTTTAATCAAATTAATTTGTCTAAAATCTTCACTAGGGCCCCCAAGGACCAAAAGGTGATAAAGGTTCTAAAGGGTCAAAAGGCGCGGCCATACCAGGTGACAAAGGAGATAGAGGAGATCGAGGAGACAGGGGTCCTGGTTGTCCTCCTGTAGTTTTACCTGGAGCATGGGAAAATAAAGGTGCAATTGAAGGGGCGAAAGGAGACATGGGACCAAAAGGAGATAAAGGAGAACCTGGAAGAGAAGGTGAAAAAGGTGATCTAGGAATTACTGGTGAACCGGGTTTACCAGGTCAAATGGGCATAAAGGGGGAAAAGGGCATCAGAGGAAATCCTGGAATAAGGGTATGTATACCTAAATATATTAATTAAAAACAAAACAATAATTATTAAATTAACCAAATAAAATATTGTTTATAGGGCAGAGAAGGTATGATTGGACCTGCTGGGCCGTTGGGACAAAAGGGTGACAGAGGAAATGATGGCTTATCAGGACTTCCTGGAAGACCAGGAAGCAAAGGAGAACCTGGAAAGGATGGAACTCCTGGCTTAAGAGGACTTAGAGGATTACCGGGGGCACCTGGAGGTAGGGCAGGGGCACGAGGGCCACCAGGGCCTATTGGCCCTCGAGGTTACACTGGACCTCCTGGAGTACCAGGTACAGAAGGAAAACCTGGTGAAAGGGGACAACCAGGACCAATGGGTGCTCCGGGTGGTTTAGGTGAACCGGGTACTCCTGGTAGAGAAGGCCCATCTGGTGTTAAGGGAGAAAAAGGCGAGCCTGGATTGGAGGGTCCTAAAGGTGAAATAGGCCCTAGAGGCTACGATGGACCAGTCGGTCCTCAAGGTCCTAGAGGACTTAAAGGTGAAGATGGACTTACAATACCGGTAAGCTTATTTTTCCCACAAGTTAAGATGGAGTATGTAGAGACATCTAAATTCTAAGTATACATTATAGATATTTCAAATAATTAATTTCAAATACTTTATTAATATTTATGAGATCCTTAATTTCTTAATTTACGGTATAATGTTTCAGGGTGAGACTGGTATTCCGGGTCTAGCTGGTCGACCAGGTGATAAAGGTCAAAAGGGAGAAAGGGGATATACAGGCTTACGAGGAACACCTGGTAATTCCACAAGAGGTACTCCTGGCATGCCAGGTGAAATGGGACCTAGAGGTGAAAAGGGTGACAAAGGTAGTCCAGGTAACGACGGCGTACCAGGCTCGCCAGGGTCAAAAGGTGACATTGGTGGACAATGTAATGAATGCAGGCCTGGCGGTCCAGGGCGGAAAGGAGAGAAAGGTGCTGATGGCAGAGATGGCGAACGTGGAGAACGAGGTCCAACGGGTCCAACTGGAGTTCCTGGTGAACGAGGTGCTGATGGACTAAACGGAATACCTGGATCACCCGGTGCTCCAGTAAGTACATACTTATAAATTTTGAAATCAAAAACAAAAGTACCGCGTGTCTATACATTGCTTATTTTGGGCAGTGAGAATGAGACGTAGAAGAATTATTTTACATAAAGATGTCTTTCTGTTTTTCTGTATGTTTCAACGCGCATCACGCCAAAACTACGGATTTGTCTGACCAATAAACAAAATATTATATGTATAGTATAATTGAATTTGGGTAAAACTTAGACTTAAACTTATTGCAATCGGTTCACTGTATCAAAAGTCATAAAAATTTGCGTGGAACTCGTCTAAGTAATAATATTGTAACACGTTGTCAGTGGTATTAAAAAAATGCACAAAGTCATTTGTTTTTATAGTTTTAGTAGTTCTCATTTATTTTATATGTTTGAGTATCACGCGGAAACCACTGGACCAAATTAGATGAAAATGGCTAATGGGGGATTTTTATAAGATACATTTTATCCCAAAAACTACTGGGGTCTCGCGTGATAATAGGTAAAAAGTTCACAAGCGAAGCGAAGCGAGAGCGGGCCTACTAATGTCAAATATATCACAAATAAAGGTGATTTATTTCAGACTAGGAAGATTTATTTCCTTATATCCAAAAAAATACTTGTACCTGCTTATAAAAAACAATAATATGTGTTTTATACTAAAATAGTCAGAAATAAATGATTTTCTGATCGGCAACGTGTCTATGGATCCCATTATGCAACAAAATTAATTACTGTTAATCATTAGATCAGATCATTTTCGCACATCGAGTGTAATAGTTTTGCATATACCCGTTATTACTTTAAACACCTATTGGCATACTGGACTACCTGGCATATTTGCGACGTCATATTCTTCAGTAAAATTACTTAATACCTATTGCAACAAAATCTAGTCATTGCGATAGCAAGAATACAATTTATATTTATGTATTAAATTAAAATCAAACCTTAACAAACCTCAAGTATTAAGTGAGTACTTACCTTAAGTATTTCTTTCCGTAGGGTGAGCGTGGCGATGACGGACCTATGGGTCCTCCGGGAGAACGTGGAAAAGATGCTATGATACCACATAATTTAACTCGAGGACCTCCGGGAGAAAAAGGGTCGGTTGGAGAGAAGGGTTCACCGGGTCCCAAAGGTGAAAAGGGCCGCGAGGGACCTAAAGGTGACCGTGGTTTAAATGGTATGCCGGGACAAAAAGGCGACCAAGGTAGAATGGGGCCTCCGGGTGTTGATGGAATTCCGGGTAGTGATGGAATACCTGGTGTACCAGGTCGAAAAGGTATTTCCTTAAAAGGAGAAAAGGGTACGCCAGGTGATATTGGACTAAAGGGTGACAAGGGATTCCCTGGAAGAGACGGTCTTAAGGGCGAGGCCGGTCAATGTCCAGCCAACCTTCAAGAATTGACTAAAGGTGATAAAGGGTTTACTGGTCCACCAGGGCCTCAAGGACCACAAGGTGAAGTATTTTTTGTAAACGGGCAAGCACAATGCCTTTCACGATTTAAACGGGCTTCATATCACGATACTGAATTTATAATAATATAAAAAATATTGCAGGTGATACAGGTGACAAAGGAGACACCGGTTTACCAGGTCCAAGAGGGGATAAAGGTGACATGGGATTACCAGGAAAACCAGGAACAGTAGGACCGCGTGGGCTTATGGGTCTAAAAGGAGACAAAGGTGATTTAGGAGCGATGGGTTTCCCCGGAACTCCTGGACAGAGTGGTGCTAGAGGTTTCCCAGGATTGCCAGGACGAAAAGGGGATAAAGGAGAAATTGGACCATCTATGCCTGGACCACCAGGGCAACCGGGATCAAGAGGACTGAAGGGAGAACCGGGTTTGAGAGGTATACCAGGCACTCCTGGTAATGATGGCCCCCCGGGGCCTATTGGGTTGCAAGGAGAAAAAGGAGATAGAGGATTGACAGGACGACAAGGACTTCCTGGTCCGCAAGGACAGAAAGGTGATTCTGGGCCTGTTGGTCCACCAGGGGTACCCGGTACTCCAGGTACACCAGGAAGGCCAGGACCAAAGGGGCAACAAGGATTTCAAGGTTTAATTGGAACACCAGGTCTTATAGGATTACCTGGAAATAAAGGTGAACCTGGAGTGCAAGGACCTGAAGGACCGAAAGGATTCCCGGGACCACGCGGTCGATCCGGTCTCATTGGCACTACGGGTATCGATGGTACTCCTGGCTTAAAAGGAGATAAAGGACAAACGGGTTTCCCAGGGCAACCAGGCCAAAACGGATTGATGGGTCCGCCTGGACCAATAGGGTTACCGGGATTTAAGGGCGACCAAGGATTCCAAGGATCTCCGGGACTTCCTGGAAGAATGGGTTTACCTGGCGATAAAGGTGATCGTGGTTTCCCGGGTGATTTTGGACTGAAAGGAGAACCAGGACAGTCATCAGACAAAGGACAAAAGGGTGAAAAAGGGGTGCCAGGAACAAGGGGATTAAACGGTGTACCAGGACGGGAGGGCCCCAAAGGCGATAAAGGAGATACAGGTGCTCCAGGTTTTGGGATTCCTGGAACACCAGGTGAGAAGGGTGACGCCGGATTTCCTGGTCTAATTGGTATACCAGGGGAACGCGGAGAAAAGGGTGATAGAGGCTTTCAAGGATTACCAGGGTTAAAGGGTGATATTGGAATGCCCGGTTTCCAAGGTCAACCAGGTGTTCCTGGTTTAGATGGAGCTCCAGGATTACCAGGCGAGGTAGGACTGCCTGGATTAGAAGGAATTAAGGGCGATAAAGGTGAAATTGGTTTCTCTGGTCGAGATGGATTTGATGGCGCTAAAGGAGAAACTGGACCAGTTGGGCCTATGGGACCCCCTGGTTTACGAGGTTATCCTGGACCGAAGGGAGATACTGGACTCCCAGGAATAGCTATAAATATCAAGGGACAAAAGGGAGAAATTGGGTTACCAGGTGTGCCTGGTACTCCTGGTCCTAAAGGTGACACGGGCTTAATGGGTTTGCAAGGTCAAAAAGGAGAGAGAGGTGAACGCGGCTTTACTGGAATCAAAGGAGAAATGGGTCTAATCGGTATTACCGGAAATAAAGGTAAATACAAATTTATACAAAGTATTACTATTAAACTCTTGTTTACTTATGTTAACCTCTTTTTTCTTTATAGGAGATACCGGACCTGCTGGACCAATGGGTATATCTGGACTTACAATCAAAGGAGAAAAAGGACTTCCTGGTTTACCCGGAAAACATGGAGCCCGTGGTTTCCAAGGGTCGCCTGGAGAAAAAGGTGATATAGGCTTACCAGGCCTTCCTGGACTAATTGGGCGACCTGGTACCCCTGGAAGTCCGGGACAAAGAGGTGAAAAGGGTGATCAAGGACGTGAAGGTCTTGCTGGTCCTCCCGGTTACCAAGGCCCACAGGGATTACCTGGTCTACCTGGACTTGATGGGCCCAGAGGTGAAAAGGGCAACAAAGGTGCTACTGGTTATGGTTTACCGGGAGAAAGAGGAAACCCAGGACCACAAGGTATTCCTGGAGAGAAGGGTGCAAAGGGAGATAAAGGCGACAGGGGATTCGATGGTCTTAATGGACAACCTGGTCCCATGGGTATTCAAGGCGAAAAGGGGGATACAGGCATTCAAGGCAGGCCAGGTATAGTCGGTATCAGAGGAGATAAAGGAGATAAAGGTGAACCGGCTTCGATTGTATTTGGTCCTAAAGGGGAAGCTGGACCACCTGGTCCTCCTGGCTTTGATGGTGCGCCAGGAAGAGATGGTATGCCGGGTGCACCAGGGCTAGACGGAGCTAAGGGAGACAAGGGAGATCGTGGTTATCCTGGCATACCTGGACCACCAGGTCCAATAGGTCTTCAAGGCATACAAGGCGAACGGGGAGATAGAGGTGAAATTGGACGTACTGGATCGTCTGGTTTGCCAGGTCCCCCTGGTACACCTTGCGCTCCAATTGATTACTTAACTGGTAATCTCTTAGTTAAACACAGTCAATCAGAAATTATACCTCAATGTGAACCAGGTCACATTAAACTATGGGACGGATATTCTTTACTTTACATCGATGGAAACGAAAAAGCCCATAATCAGGACTTAGGCTATGCAGGTTCTTGTATAAGAAAATTCAGTACCATGCCATTCCTTTTCTGTGATCTTAACGATGTATGTAATTATGCAAGCCGAAACGACAGAAGTTATTGGTTATCTACTAATGAACCTATACCAATGATGCCAGTTCAAGATAAAGAAATTTCTCGATATATATCAAGATGCGTCGTTTGCGAAGTTCCTGCCAATGTTATAGCTGTGCATAGTCAAACATTAGATACACCAAGTTGCCCTCCAAGTTGGAGTATCTTATGGATTGGATACAGTTTTGTAATGGTGAGTAATTACAATACACATAACTAGTTATAGCATAATAGTTATTTAATAAAACATTATTTATCTTGCCATCGACGCACATTGCATTGCAGTTTACAAAAATAATTTATCAGTAACGTAACAATTTGACGTCATTACACAACTACCTACATGTAAAAGGTCTTATCATCTCATCTTAAAGCTCTAAAACGATAAGTCTAAAAATTATTATATTTTTAGCACACTGGCGCTGGTGGACAAGGAGGTGGTCAAGCATTAGAGAGTCCTGGCTCTTGTCTTGAAGGATTCCGATCAACACCATTCATAGAATGCAATGGAGAAGCTGGCACGTGTCATCATTTCGCTAATAAACTCAGTTTTTGGCTGACAACCATAGATGACAACAAACAGTTTTCCGCCCCTGAACGGGAAACTTTAAAAGCAGGTTGGCTATTACAGCGCGTATCCAGGTGTTCAGTTTGCATAAAAAATACTACGTAGTCTAATAACAACTTTATAGCACTCGTTCGACTTTTCATCTACATAATATGCTTGTGATTTTGCCATTTCTTTTTACATAGGTACCCTAATCGCATCGAAATTATAAAATCAATCATAATTAATGTATACATTTGTACTTAGTAAGGTTTCCATATCTACATAAACAAAATTATACATAGGTACCTATTTACTTACAATAGCATTTATTCGAGTGTCTTGATGAACCAAAGTTATTTGCAAATAAGTTTTATAATTAAGTACATTGTAATATTAGAAAGATTTATTTAAAACCTACCTACATGCACTTCATCGGCAATTTTTGCATTTTAAGTATCCATGTGATTTTTGTGTTTTTGGAGTACCTACAATATAAGTTCAGTTATAGTGTTTCTTTAGTTGATTTATAGTAATTCTCATGGACATTATAATTATTATAAGTCATCGTGTATTGTCACCTAGTCACATTAAGAACGATAATAAAAATAATAAAATAATTTGTGACTTCAAAAATAAGAATTAAATTCATTTAGCTTATTTATCCTTAAGTATATTATTGTAAATATTATGCCTTTTGAAACTTTAACTGTGCAAATTTACTACATCAATCTGCATTTAATGTACCTACCTACCTATCTACCTACCTAAATTATAATATTATGTATATTGAAATAATTACTGTTAAATAAATATTGTAAAACTAATCACATTCTTATACCTAAATGTTAACATGATAACGTATTGAAATGATCGATATCTGTATACACTGCCAAATAGATAAAATAACCTTATACTTATAGGTAGAACTTTAATGAGAATTCAATAAATATAAAAAAATAATCCACAATGTTTCATTGGTATTTCCTTCCTAGCCGTATGTATGTATGTATTTGCAGGTGGAAACAAATTGAAAGTACGAAAGTGAAATGAGCTATTTCACCAGTCGCGATAGTAGTTGGTAGTAATATTAAAAGCGCCTACATTATGATCGTTTACCTGGAGTGAGTTACTAATGATTTTGGTCAATGACACCTATTAATGATTAAAATAGCCGGTGGCCCATAAATATCTATAATAATAATAATTAAACTGTAACATTAAATATTTTTTGGAAATTTATTCTGGTAGGCTTCGTTACATAATTTTTTTTTTGGATTTATTGTCCGTTTCTATACGAGCCGGACGACAGTTTTATACGAGATTTACATTTTTGTAACTTATACATTCAACTATTTGCGAGCTGTTGCCCGCAGCTTTGCTTGCGGAAATTATAGTTTTGTGATTATATTTACCCCCTTAAGGGTTGATTTAAATCAACAACACATTTATTTGGATAAAGATTAATATTATTATGTTGGTACAANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTCGATCCGGAATTTTTATCATGATTGATTTTTTATTGATTTTTGAGGCGATACGAAGTTCGCCGGGTCAGCTAGTAATATTAATATAGATTTACATTTTTGTAACTTATACATTCAACTATTATAATTTTTTTAAGTAGATAAAGATAATACCATAAATAATACATATTAATATGGAGGATAATACTTCTTCAGGCACGTTGATAGGGTGCTGTAGTGTCGGTCGTACAAATGACGAACCGCGCATTCATTTTTAAAAAAAGTCAGTGAAACAAACCGCGGAAACTACACGCCACCGCACCGCGAGAAACATAAATTATTTTCTCACTGACCTCAAAATAAATGTTTTAAAACTAAAACTACTACTACTACTAGTTAATTTTTTTTTGTCGTGCATGTTGGCGTTGCCCATTTTTTTCGCGCCTAATGTCATTCATTCCCATACATTTATTAAAGATTGCGTTATTTGCGTTTGGCGTGAGCGTTCGAAGGAAAGGGCATTTGGCTAGAGGCTCAGACGCGAAATCGTAAAATGGCGAATCCTGCAACAATTCATATAATGATTCACGTGCAATTCATATTAGCAATTCTGTTGTTTGTTAAGGTATGCTTGCTAAGCTTAGAGTAATTACTATTCACAGTGTAGACATAAAAATAACAAGCAGACCTAACATAAGGGGGAAAAAAGCGTGCCACTTGCGCACACAATAGACAAAGTAGCTATGACGGGGCCGAACTCTGTCCGTGTGAATTATGATTTAAATACGAATATACGATATCCATAAAATCAAAAAATATTTTTAATCAATTTCCAATAACGCGGTAGGATTCTAAATTACAATATTACATTTGGGTAAAAAATACTTTAATTTAATTTATTGTACTTATAATGTTATAAAGGTGTAATGGAGTCGAAACTATACATTGAACACTATTTGGAAATTTTAATTAAATGCAGTCCTAAAAATACTTATTATTATGAAATATACTTTTCCTTTTCTACCCTAAACTAAATGAAGCAGAGCGGAGAGATGCGAGGTTACAAGTTATTAATGCTGATAATATCTTCGGATAAAGTCTTCATACAATTATGAAAGAACTTCACTTACAGGTAAGTTCGTTTAATCACTAATTAGTTCTCAAGCTAAATACGGCCCAGTATAATTTGAATCCATAAAATATGTTCGAAAAGGTGCTTGCTAAGAAATTCACCGTGTCTATTGCAATTGCAAGTAAGATCAATTCATCATGTACTTACAATCTAGCGTGTACTATATAGCGACGTTAGCCTACCCGCCAAAATTGATGGCACGCGCTCTTTTTTGTTTATGTGTGAGTGAATGTAGCAACACAAAGAAAAACTGCAATAGAATGATTCACGTTCAGTGGGTGAGAAAGAGACAAAAGTTTTGTTTATTGTTGTCATTGTGGTAGTAAATATTATGTTTGGTCTGCTTGTTATTTATGGCTGTGTTACTATTGTATATTATTACTCTGTGGTAATATCATACGTTAGTCTGTGGTTATATATATTTATTTTTTATGCTTACAATACTACATCATGCTAATGTCAAATGTGGCAATGGCAACACCGTGAAGCCTATTGTCACATCGCGGGAAATCAACAAAAACTCAATTTATTTACTGAAAATCGAAACAAAAATTATAAATTAAGTGCAAATTATAAATTTTTATTGTTTTATGTACAATATATATTTTTACTATGTTCGAATGGGCTTACAGTGGTGCAAATAAAGCCGTCCCTCGCAATGTGGGCCCTGAATGTGCATATTTTTTATCTCCTCAAAGGCAATTTATTGAAACTGTTATAGTAACAACGGTTTGCATTTATATATTAGTAAGTAAAGTAATTAAATAATATATTATACGAAAATTAATTTTGTTTTACCGATAAACCTTAAATAGTTTCCCACTTATTCATTATTAGTTCATTAATTAATCGAACGAAAGTCGGTTCGATAAAATGCTTATTTATAGAAAATAACGAAATAAAAGTTTTATTGACTTTATTTTACAGGTAAAAACATACCCGAAGTTACAAATACCGAAAGATATAGACTATGTCAAGAGTGATAGAGGTGGAAAAAGATTACTTGTTATCCTCTTAGCATTGCTGTGGGGGATGGAAATTGGATTTAAGTTTGCATCACGTACTGTTATATATTTGCTTAATCCCTGTCACGTAACTACTTTAATACAGGTCAGTGTTTTAGTAATTACTCTATGTTGTAGTCAAATCATATCTTACCAAGTATACAAACAAAACTCTTTCAATAAAAATAATGTAAATAACTCATAAGTAATCAAGATAATTATTACTAAAATTTAATTTATGTGCCAAAAATTACCAAACTGGAATCCTGTTGTATGTTGGACTTCCAACAGAAAAACAGTAATGATTAAAATGTGTTTTTTATACAGATATAATTATGCATATTGTACAACTAATTTGTTAAGTGAGCAAACTAATTGAATTCATTATTCAATTATTCACATAGGTACCAATACTTAAAGGAGCCTTAAAATAGAAATACCGTAAAAAGAAATACCAAAAATTTTACATTATCCTAGTTAATCTGTAAAGTAAGCCCTCAAGCAGTGTCTCCAACATCATTATGAACTCTTGTATCATTCTAATATTTTCTCAGTATTATGTTGGATCATAACACTGACCACTACAGGTCTAATAGTTCATTTCGGAGGCATAATACATCTACATATTAATGAATACATAAAGAGTTTAACTGGAGACCTGTTTAAGAATAATGCAGACCTTTATGGGTTTGAGATTTTGCATTGAAGTTTGCGTGGAGTTGTATTTTGAAGCTATGGGACTTCAAGTCAGCTCTACCTGATCATCATACAATTTGCTGACTTACAGTTTAACCACCATGGAATACTAGTTTTCTATATTATCCTGACCTTCATATTTTACCATGATCTCTTTAGTGGAACAGCAAAACATTTACGAATTGTCTCAGTTGGTAGTAAGCCAGTTATTGAATCTAAATTCCTTGATTTTACAGATGTTTAGCAATTTTCTGAATTGACATTTAACAATTTAATTTTAATTCTTTCTTTTCAGATATACTTATTATCAGCACCTCCAAGTAAAACTGTCACTGCATTGTTTAGAATACATTTAAATTTACTAAATGGGCCACTTTTAGCATTTCTGTTTCCAGAAACTGCGTCTAGAACGGTATGATAGTAGCATTAATGTTAATTTATTTTATCGTCTGTTTAAGTGTTTAATAATTTATTTATCAGATTTTAGCAGAAGCTGCTTTGTACTGGATACAACATGGAATGATGTTCGTAATACCTTATTACTTATTAAGAATTGGTGGTATGTTATTCTGTTTTGAATTTGGTATTTTATTTCATAATAATAATAACATTGTGTTACTTAGTTTGTTTAAATTTTCAGGTGTTTATAATGTAGAGCCATTCTGGGATTTCTCTTGGTCCATCTTTAGCTACAGTTTGAATTTGTTGTATCACTTCATAATCCTACAGCCAATTGCAATAGTAAGTAGCATTATTTAATTTAGAATCTAATGTTCTAATTACTACCGTTCACTTCTCTATCTGTCTTTACCCTGACCTTGCATCATTCGTGATACTTAGACATTACAAAAGCCAAGTGTCCACTTTTGGAGGCAATATATAGCTAGATAAAACCCTAAGGTTATAATATTAATTGTTAATCCACATTTTCGTGGCAAGCAATACTTCAATATTTTTTTTCTTAACTTTACCTTTTTATGTATAATTTTATTGACTTTTAGTTGGTTGGTGTCTTAAAAATAGCCTACTCACTATTGTGCATAGCACGGGTCAATTACCTACCGCACTCAATTATGCGTAAAATCTACATTTTAACTCTCGCGTAATGAGGCGCCCATTTTCGTCAAATTTAAAAATATTTGCAGTTATTGCACTATGATGTTTACGACCATTTAACATCAGACTAATAATAACGATTTTATTATTTGTTTCAGCCAGCCCAAGTTAATCTGAACCACATGCTCTGTCCTGCTATTTTGGATCCCTTCGATGGTCCTTGGTACCGTATAGCGGCCGTAACCCACCAAGCAATTCTTTGTCCGTTGCTAGGCAAACTATTTTGCCTCATTGCAGATTTTTGCCTTACAAAGTTTCCACCGACGAAAGTTAAACCACAAATGAAAGATCATTTAATCGATGATAGATTTCTTAAAGAATATAAACTTCATCACAATGAGTAG"

print("Analysis for Danaus plexippus - sample 1 (DPOGS206535):", calculate_nucleotide_frequencies_dna(danaus_plexippus_seq_1))
print("Analysis for Danaus plexippus - sample 2 (DPOGS206549):", calculate_nucleotide_frequencies_dna(danaus_plexippus_seq_2))
print("Analysis for Papilio xuthus (RR46_12983):", calculate_nucleotide_frequencies_dna(papilio_xuthus_seq))
print("Analysis for Papilio glaucus (pgl2663.20):", calculate_nucleotide_frequencies_dna(papilio_glaucus_seq))
print("Analysis for Lerema accius (lac66.102):", calculate_nucleotide_frequencies_dna(lerema_accius))

Analysis for Danaus plexippus - sample 1 (DPOGS206535): A:32.43% T:27.15% C:16.23% G:24.19%
Analysis for Danaus plexippus - sample 2 (DPOGS206549): A:31.82% T:28.66% C:16.15% G:23.37%
Analysis for Papilio xuthus (RR46_12983): A:30.61% T:27.67% C:17.67% G:24.05%
Analysis for Papilio glaucus (pgl2663.20): A:32.12% T:29.10% C:16.89% G:21.55%
Analysis for Lerema accius (lac66.102): A:32.52% T:31.07% C:16.48% G:19.61%
