# Edit Distance
**Edit Distance** é uma medida de "distância" ou o quão diferentes duas Strings são.

Para computar esse valor devemos somar o mínimo de operações sobre os caracteres das Strings para que elas se tornem iguais.

Por exemplo:
- As Strings "ostra" e "astral" se diferem em 2 operações sobre seus caracteres.
- Se partirmos da String "ostra" e:
> 1. Substituirmos o caracter 'o' pelo caracter 'a'
> 2. Inserirmos o caracter 'l' ao final
- Então obtemos a String "astral" e portanto a **Edit Distance** entre essas duas Strings é igual a 2

As operações de utilizadas são: inserir caracter, deletar caracter ou substituir caracter. Cada uma dessas três operações tem custo igual a 1. Ao final, somamos todos os custos do mínimo necessário de operações para transformar uma String na outra (ou vice-versa).

Dica:
> Para criarmos um algoritmo que computa a **Edit Distance** podemos usar "Programação Dinâmica" (pesquise no google) que utiliza recursividade para percorrer todo o espaço de busca das combinações de soluções possíveis. 

Dica 2:
> Para implementarmos a programação dinâmica, além de utilizarmos recursividade, devemos utilizar uma "memorização" de estados previamente já visitados (pois o algoritmo acaba revisitando diversas vezes um estado já computado e isso é ineficiente).




In [None]:
def distance(input1: str, input2: str) -> int:
  pass

In [None]:
# Edit distance
# Custo de inserção de caracter = 1
# Custo de deletar um caracter = 1
# Custo de substituir um caracter = 1

# Programação dinâmica
# Recursividade
# Cache de posições do array

str1 = 'ostra'
str2 = 'astral'

print( distance(str1, str2) )

# Solução
- Não olhe antes de tentar resolver por conta própria

In [None]:
def distance(input1, input2):
  cache = {}
  trace = ''
  def recurse(m, n):
    if m == 0:
      return n, 'i' * n
    if n == 0:
      return m, 'd' * m
    if (m,n) in cache:
      return cache[(m,n)]
    if input1[m-1] == input2[n-1]:
      val, t = recurse(m-1, n-1)
      cache[(m,n)] = val, t + '.'
      return cache[(m,n)]
    insert = recurse(m, n-1)
    delete = recurse(m-1, n)
    replace = recurse(m-1, n-1)
    
    min_val, t = insert
    best_op = 'i'
    for op, bop in [(delete, 'd'), (replace, 'r')]:
      cost, tt = op
      if cost < min_val:
        min_val = cost
        t = tt
        best_op = bop

    cache[(m,n)] = 1 + min_val, t + best_op
    return cache[(m,n)]
  return recurse(len(input1), len(input2))