# Algoritmo:

1. Carregar os Reads:
   - Ler as sequências de DNA do arquivo `reads.fasta`.
   
2. Encontrar as Sobreposições Máximas:
   - Para cada par de sequências, encontrar o maior prefixo de uma sequência que se sobrepõe com o maior sufixo da outra.
   
3. Fundir as Sequências:
   - Combinar as duas sequências que possuem a maior sobreposição em uma única sequência.
   
4. Iterar até Obter o Contig Completo:
   - Repetir o processo de sobreposição e fusão até que reste apenas uma sequência que seja o contig.
   
5. Salvar o Contig:
   - Escrever a sequência do contig final em um arquivo no formato FASTA.

# Código

In [2]:
def read_fasta(file_name):
    with open(file_name, 'r') as file:
        sequences = []
        sequence = ""
        for line in file:
            if line.startswith('>'):
                if sequence:
                    sequences.append(sequence)
                    sequence = ""
            else:
                sequence += line.strip()
        sequences.append(sequence)
    return sequences

def find_overlap(seq1, seq2, min_length=3):
    start = 0
    while True:
        start = seq1.find(seq2[:min_length], start)
        if start == -1:
            return 0
        if seq2.startswith(seq1[start:]):
            return len(seq1) - start
        start += 1

def assemble_contig(sequences):
    while len(sequences) > 1:
        max_length = -1
        best_pair = None
        best_seq = None

        for i in range(len(sequences)):
            for j in range(len(sequences)):
                if i != j:
                    overlap_length = find_overlap(sequences[i], sequences[j])
                    if overlap_length > max_length:
                        max_length = overlap_length
                        best_pair = (i, j)
                        best_seq = sequences[i] + sequences[j][overlap_length:]

        sequences.pop(best_pair[0])
        sequences.pop(best_pair[1] - 1)
        sequences.append(best_seq)

    return sequences[0]

def save_fasta(sequence, file_name):
    with open(file_name, 'w') as file:
        file.write(f">Contig\n{sequence}\n")


In [3]:
reads = read_fasta("/content/drive/MyDrive/AB/exercicio_7/data/reads4.fasta")
contig = assemble_contig(reads)
save_fasta(contig, "contig.fasta")
print(f"Contig salvo em contig.fasta: {contig}")

Contig salvo em contig.fasta: ATTAGACCTGCCGGAATAC
