### GreedyMotifSearchWithPseudocounts(Dna, k, t)
Escreva uma função 'GreedyMotifSearchWithPseudocounts(Dna, k, t)' que pega uma lista de strings 'Dna' seguidas de inteiros 'k' e 't' e retorna o resultado da execução 'GreedyMotifSearch', onde cada matriz de perfil é gerada com pseudocontagens. 
(Dica: Idealmente, você só precisa de uma modificação extremamente pequena no seu arquivo original da função 'GreedyMotifSearch')

```
GreedyMotifSearch(Dna, k, t)
    form a set of k-mers BestMotifs by selecting 1st k-mers in each string from Dna
    for each k-mer Motif in the first string from Dna
        Motif1 ← Motif
        for i = 2 to t
            apply Laplace's Rule of Succession to form Profile from motifs Motif1, …, Motifi-1
            Motifi ← Profile-most probable k-mer in the i-th string in Dna
        Motifs ← (Motif1, …, Motift)
        if Score(Motifs) < Score(BestMotifs)
            BestMotifs ← Motifs
    output BestMotifs
```

In [None]:
# Função para calcular a probabilidade de um k-mer dado um perfil
def Pr(Text, Profile):
    probability = 1.0
    # Multiplica as probabilidades de cada símbolo em suas respectivas posições
    for i in range(len(Text)):
        probability *= Profile[Text[i]][i]
    return probability

# Função para contar nucleotídeos com pseudocontagens
def CountWithPseudocounts(Motifs):
    t = len(Motifs)
    k = len(Motifs[0])
    # Inicializa com pseudocontagens de 1
    count = {symbol: [1] * k for symbol in "ACGT"}
    # Atualiza as contagens baseadas nas Motifs
    for i in range(t):
        for j in range(k):
            symbol = Motifs[i][j]
            count[symbol][j] += 1
    return count

# Função para gerar o perfil com pseudocontagens
def ProfileWithPseudocounts(Motifs):
    counts = CountWithPseudocounts(Motifs)
    t = len(Motifs)
    k = len(Motifs[0])
    profile = {}

    # Normaliza as contagens para obter as frequências de cada nucleotídeo
    for symbol in counts:
        profile[symbol] = []
        for j in range(k):
            # Considera as pseudocontagens
            profile[symbol].append(counts[symbol][j] / (t + 4))
    return profile

# Função para encontrar o k-mer mais provável baseado no perfil
def ProfileMostProbableKmer(text, k, profile):
    n = len(text)
    max_prob = -1
    most_prob_kmer = text[0:k]  # Inicia com o primeiro k-mer
    # Calcula a probabilidade de cada k-mer no texto com base no perfil
    for i in range(n - k + 1):
        kmer = text[i:i+k]
        prob = Pr(kmer, profile)
        if prob > max_prob:
            max_prob = prob
            most_prob_kmer = kmer
    return most_prob_kmer

# Função para calcular o score das sequências de padrões
def Score(Motifs):
    consensus = Consensus(Motifs)
    score = 0
    # Calcula o score somando as diferenças entre Motifs e consenso
    for i in range(len(Motifs)):
        for j in range(len(Motifs[i])):
            if Motifs[i][j] != consensus[j]:
                score += 1
    return score

# Função para calcular a sequência consenso a partir das Motifs
def Consensus(Motifs):
    count = CountWithPseudocounts(Motifs)
    consensus = ""
    k = len(Motifs[0])
    # Identifica o símbolo mais frequente em cada posição
    for j in range(k):
        max_count = 0
        frequent_symbol = ""
        for symbol in "ACGT":
            if count[symbol][j] > max_count:
                max_count = count[symbol][j]
                frequent_symbol = symbol
        consensus += frequent_symbol
    return consensus

# Função principal do algoritmo Greedy Motif Search com pseudocontagens
def GreedyMotifSearchWithPseudocounts(Dna, k, t):
    # Inicializa os melhores padrões com os primeiros k-mers de cada string
    BestMotifs = [Dna[i][0:k] for i in range(t)]
    n = len(Dna[0])
    # Percorre todas as posições possíveis do primeiro DNA
    for i in range(n - k + 1):
        motifs = [Dna[0][i:i+k]]  # Escolhe o k-mer inicial
        # Para cada sequência subsequente, encontra o k-mer mais provável baseado no perfil
        for j in range(1, t):
            profile = ProfileWithPseudocounts(motifs)
            motifs.append(ProfileMostProbableKmer(Dna[j], k, profile))
        # Atualiza os melhores padrões caso os novos tenham um score melhor
        if Score(motifs) < Score(BestMotifs):
            BestMotifs = motifs
    return BestMotifs


Dna = ['GGCGTTCAGGCA',
       'AAGAATCAGTCA',
       'CAAGGAGTTCGC',
       'CACGTCAATCAC',
       'CAATAATATTCG'
       ]
k = 3
t = 5 # Número de sequências

print(GreedyMotifSearchWithPseudocounts(Dna, k, t))

### GreedyMotifSearchWithPseudocounts_2(Dna, k, t)

In [None]:
# Copy your GreedyMotifSearchWithPseudocounts_2 function (along with all required subroutines) from Motifs.py below this line
# Função para calcular a probabilidade de um k-mer dado um perfil
def Pr_2(Text, Profile):
    probability = 1.0
    # Multiplica as probabilidades de cada símbolo em suas respectivas posições
    for i in range(len(Text)):
        probability *= Profile[Text[i]][i]
    return probability

# Função para contar nucleotídeos com pseudocontagens
def CountWithPseudocounts_2(Motifs):
    t = len(Motifs)
    k = len(Motifs[0])
    # Inicializa com pseudocontagens de 1
    count = {symbol: [1] * k for symbol in "ACGT"}
    # Atualiza as contagens baseadas nas Motifs
    for i in range(t):
        for j in range(k):
            symbol = Motifs[i][j]
            count[symbol][j] += 1
    return count

# Função para gerar o perfil com pseudocontagens
def ProfileWithPseudocounts_2(Motifs):
    counts = CountWithPseudocounts_2(Motifs)
    t = len(Motifs)
    k = len(Motifs[0])
    profile = {}
    # Normaliza as contagens para obter as frequências de cada nucleotídeo
    for symbol in counts:
        profile[symbol] = []
        for j in range(k):
            # Considera as pseudocontagens
            profile[symbol].append(counts[symbol][j] / (t + 4))
    return profile

# Função para encontrar o k-mer mais provável baseado no perfil
def ProfileMostProbableKmer_2(text, k, profile):
    n = len(text)
    max_prob = -1
    most_prob_kmer = text[0:k]  # Inicia com o primeiro k-mer
    # Calcula a probabilidade de cada k-mer no texto com base no perfil
    for i in range(n - k + 1):
        kmer = text[i:i+k]
        prob = Pr_2(kmer, profile)
        if prob > max_prob:
            max_prob = prob
            most_prob_kmer = kmer
    return most_prob_kmer

# Função para calcular o score_2 das sequências de padrões
def Score_2(Motifs):
    consensus_2 = Consensus_2(Motifs)
    score_2 = 0
    # Calcula o score_2 somando as diferenças entre Motifs e consenso
    for i in range(len(Motifs)):
        for j in range(len(Motifs[i])):
            if Motifs[i][j] != consensus_2[j]:
                score_2 += 1
    return score_2

# Função para calcular a sequência consenso a partir das Motifs
def Consensus_2(Motifs):
    count = CountWithPseudocounts_2(Motifs)
    consensus_2 = ""
    k = len(Motifs[0])
    # Identifica o símbolo mais frequente em cada posição
    for j in range(k):
        max_count = 0
        frequent_symbol = ""
        for symbol in "ACGT":
            if count[symbol][j] > max_count:
                max_count = count[symbol][j]
                frequent_symbol = symbol
        consensus_2 += frequent_symbol
    return consensus_2

# Função principal do algoritmo Greedy Motif Search com pseudocontagens
def GreedyMotifSearchWithPseudocounts_2(Dna, k, t):
    # Inicializa os melhores padrões com os primeiros k-mers de cada string
    BestMotifs = [Dna[i][0:k] for i in range(t)]
    n = len(Dna[0])
    # Percorre todas as posições possíveis do primeiro DNA
    for i in range(n - k + 1):
        motifs = [Dna[0][i:i+k]]  # Escolhe o k-mer inicial
        # Para cada sequência subsequente, encontra o k-mer mais provável baseado no perfil
        for j in range(1, t):
            profile = ProfileWithPseudocounts_2(motifs)
            motifs.append(ProfileMostProbableKmer_2(Dna[j], k, profile))
        # Atualiza os melhores padrões caso os novos tenham um score_2 melhor
        if Score_2(motifs) < Score_2(BestMotifs):
            BestMotifs = motifs
    return BestMotifs

# Código para colocar aspas e vírgulas na str Dna
def aspas_vir_str():
    with open("dataset_30306_9.txt", "r") as file_1:
        linhas_1 = file_1.readlines()
    Text = linhas_1[1].strip()
    string_original = Text
    palavras = string_original.split()
    return palavras

# Let's copy the ten strings occurring in the hyperlinked DosR dataset below.
Dna = aspas_vir_str()
t = len(Dna)
k = 12

Motifs = GreedyMotifSearchWithPseudocounts_2(Dna, k, t)

print(aspas_vir_str())
print(Motifs)
print(Score_2(Motifs))