### ProfileMostProbableKmer(text, k, profile)

Dada uma matriz de perfil 'Profile', podemos computar a probabilidade de cada k-mer em uma string 'Text' e encontrar um k-mer mais provável do 'Profile' no 'Text', ou seja, um k-mer que tenha a maior probabilidade de ter sido gerado pelo 'Profile' entre todos os k-mers no 'Text'. 

Para a matriz de perfil NF-κB, “ACGGGGGATTACC” é o 12-mer mais provável do Profile em “ggtACGGGGATTACCt”. De fato, todos os outros 12-meros nessa string têm probabilidade 0. Em geral, se houver vários k-meres mais prováveis do perfil no texto, selecionaremos o primeiro k-mer que ocorrer no texto.

* Problema do k-mer mais provável do perfil: encontrar um k-mer mais provável do perfil em uma string.
* Entrada: Uma string 'Text', um número inteiro 'k' e uma matriz 'Profile' de 4 x 'k'.
* Saída: Um k-mer mais provável do perfil em 'Text'.

ProfileMostProbableKmer(text, k, profile): Encontra o k-mer (subsequência de comprimento k) mais provável em uma sequência de DNA (text) com base em um perfil de probabilidades (profile).

In [None]:
def Pr(Text, Profile):
    p = 1
    for i in range(len(Text)):
      for j in "ACGT":
        if Text[i] == j:
          p *= Profile[Text[i]][i]
    return p

def ProfileMostProbableKmer(text, k, profile):
    most_probable_kmer = ''
    max_probability = -1.0 #  inicializar max_probability com um valor negativo, como -1.0, 
                           # é garantir que qualquer probabilidade calculada seja maior do que o valor inicial. 
    for i in range(len(text) - k + 1):
        kmer = text[i:i+k]
        probability = 1.0 # inicia em 1 por causa das multiplicações que irão ocorrer
        # Calcular a probabilidade do k-mer com base no perfil
        for j in range(k):
            probability *= profile[kmer[j]][j]
        # Verifica se a probabilidade calculada é maior que a maior já encontrada
        if probability > max_probability:
            max_probability = probability
            most_probable_kmer = kmer
    
    return most_probable_kmer
  
text = "ACCTGTTTATTGCCTAAGTTCCGAACAAACCCAATATAGCCCGAGGGCCT"
k = 4

Profile = {
    'A': [0.2, 0.4, 0.3, 0.1],
    'C': [0.3, 0.3, 0.5, 0.2],
    'G': [0.3, 0.2, 0.2, 0.7],
    'T': [0.2, 0.1, 0.0, 0.0]
}

print(ProfileMostProbableKmer(text, k, Profile))