# Damerau-Levenshtein
Nava del Río José Antonio  
Ojeda Contreras Braulio Melquisedec  
Suárez Pérez Juan Pablo

In [1]:
# Implementación de corrector de Levenshtein. 
def levenshtein_corrector(palabra, palabras, aux_path = ""):
    """
        Corrector de levenshtein. 
        Entrada: palabra, palabras. 
        Salida: correcion. 
    """
    # Validación
    if palabra in palabras:
        print("Ya está correcta.")
        return palabra
    
    puntajes = dict()
    for p in palabras:
        
        m, n = len(palabra), len(p)
        
        # Matriz de tamaño (m+1)x(n+1)
        mat = [[0] * (n + 1) for _ in range(m + 1)]
        
        # Inicializar primera fila y columna.
        for i in range(m + 1):
            mat[i][0] = i
        for j in range(n + 1):
            mat[0][j] = j
        
        # Calcular distancias.
        for i in range(1, m + 1):
            for j in range(1, n + 1):
                costo = 0 if palabra[i - 1] == p[j - 1] else 1
                mat[i][j] = min(mat[i - 1][j] + 1, mat[i][j - 1] + 1, mat[i - 1][j - 1] + costo)
                
                # Transposición.
                if i > 1 and j > 1 and palabra[i - 1] == p[j - 2] and palabra[i - 2] == p[j - 1]:
                    mat[i][j] = min(mat[i][j], mat[i - 2][j - 2] + costo)
                
        # El mínimo número de operaciones.
        distancia = mat[m][n]
        
        # Guardamos el resultado.
        puntajes[p] = distancia
    
    # Ordenamos el diccionario.
    correciones = (sorted(puntajes.items(), key = lambda item: item[1], reverse = False))
    
    # Guardamos en un archivo.
    with open('./damerau_levenshtein/similar_to_' + palabra + aux_path + '.txt', 'w', encoding = 'utf-8') as f:
        for item in correciones:
            f.write(str(item) + '\n')
    # Retornamos el mejor valor.
    correcion = correciones[0]
    print("Se identifico que no está bien escrita.")
    return correcion

In [2]:
# Lectura de archivo con palabras. 
root = "./pruebas_bibliotecas/Correctas-Incorrectas.txt"
with open(root, 'r', encoding='utf-8') as archivo:
    lista_palabras = list()
    for linea in archivo:
        palabras = linea.strip().split("-")
        # Convertimos las palabras en minúsculas.
        palabras = [i.lower() for i in palabras]
        if len(palabras) == 2:
            lista_palabras.append(palabras)

# Seleccionamos solo 100 palabras.
lista_palabras = lista_palabras[:100]
palabras = [palabra[0] for palabra in lista_palabras]
palabras

['automóvil',
 'computadora',
 'teléfono',
 'restaurante',
 'caminar',
 'feliz',
 'viaje',
 'refrigerador',
 'rápido',
 'biblioteca',
 'diferente',
 'acción',
 'comida',
 'mañana',
 'solución',
 'correcto',
 'fácil',
 'jardín',
 'interesante',
 'gobierno',
 'problema',
 'universo',
 'experiencia',
 'vehículo',
 'comunicación',
 'naturaleza',
 'sorpresa',
 'aprovechar',
 'conocimiento',
 'felicidad',
 'construcción',
 'comenzar',
 'desarrollo',
 'finalizar',
 'imaginación',
 'química',
 'tecnología',
 'educación',
 'información',
 'planificación',
 'relación',
 'enseñanza',
 'historia',
 'matemáticas',
 'ciencia',
 'lenguaje',
 'sociedad',
 'comunidad',
 'aprendizaje',
 'desarrollar',
 'comunicación',
 'trabajar',
 'experiencia',
 'gobierno',
 'solución',
 'educación',
 'desarrollo',
 'química',
 'matemáticas',
 'relación',
 'historia',
 'lenguaje',
 'tecnología',
 'sociedad',
 'comunidad',
 'aprendizaje',
 'desarrollar',
 'conocimiento',
 'información',
 'planificación',
 'imaginación'

In [3]:
# Escritura de palabra.
palabra = input()
correcta = levenshtein_corrector(palabra, palabras)
print("Correctamente escrita:", correcta)

nautraleza
Se identifico que no está bien escrita.
Correctamente escrita: ('naturaleza', 1)
