### ApproximatePatternMatching(Text, Pattern, d)
Dizemos que um k-mer 'Pattern' aparece como uma substring de 'Text' com no máximo 'd' de incompatibilidades se houver alguma substring k-mer 'Pattern' de 'Text' tendo 'd' ou menos incompatibilidades com 'Pattern'; aquilo é, 'HammingDistance(Pattern, Pattern')' ≤ 'd'. 

Nossa observação de que uma caixa de DNA pode aparecer com pequenas variações leva à seguinte generalização do Problema de Correspondência de Padrões.

* Problema de correspondência de padrões aproximados: Encontre todas as ocorrências aproximadas de um Pattern em uma string.
* Entrada: Strings 'Pattern' e 'Text' junto com um inteiro 'd'.
* Saída: Todas as posições iniciais onde 'Pattern' aparece como uma substring de 'Text' com no máximo 'd' de incompatibilidades.

In [None]:
def HammingDistance(p, q):
    if len(p) != len(q):
        print("Variáveis com tamanhos diferentes!")
    distancia = 0
    for i in range(len(p)):
        if p[i] != q[i]:
            distancia += 1
    return distancia

def ApproximatePatternMatching(Text, Pattern, d):
    positions = []  # initializing list of positions
    for i in range(len(Text) - len(Pattern) + 1):
        if HammingDistance(Text[i:i+len(Pattern)], Pattern) <= d:
            positions.append(i)
    return positions

with open('dataset_30278_4.txt', 'r') as file:
    linhas = file.readlines()

# Atribuindo as variáveis
Pattern = linhas[0].strip()  # Primeira linha
Text = linhas[1].strip()    # Segunda linha
d = int(linhas[2].strip())  # Terceira linha

print(ApproximatePatternMatching(Text, Pattern, d))

Considerações:

* A expressão range(len(Text) - len(Pattern) + 1) é usada para determinar todas as possíveis posições iniciais em 'Text' onde o 'Pattern' (padrão) pode ser comparado. 
* O motivo de subtrair len(Pattern) de len(Text) é garantir que o padrão só seja comparado dentro dos limites do texto.
* O +1 é adicionado para garantir que o último possível segmento do texto, com comprimento igual ao padrão, seja considerado. Isso ocorre porque o índice de Python é baseado em zero.

##### Exemplo:

  - Text: "AAGCCTAG"
  - Pattern: "GCC"
  - d: 1

Passo a Passo:

1. Comprimento do Text: len(Text) = 8
2. Comprimento do Pattern: len(Pattern) = 3
3. A expressão len(Text) - len(Pattern) + 1 se torna: 8 − 3 + 1 = 6
4. Portanto, range(6) gera os índices 0, 1, 2, 3, 4, 5. Estes são os pontos de partida possíveis para extrair substrings de comprimento 3 (o comprimento do Pattern) do Text.

4.1. Substrings Comparadas:

* Para i = 0: Substring Text[0:3] = "AAG"
* Para i = 1: Substring Text[1:4] = "AGC"
* Para i = 2: Substring Text[2:5] = "GCC"
* Para i = 3: Substring Text[3:6] = "CCT"
* Para i = 4: Substring Text[4:7] = "CTA"
* Para i = 5: Substring Text[5:8] = "TAG"

Essas são todas as substrings do Text com o mesmo comprimento do Pattern.