# Исправление опечаток

Расстояние Левенштейна (также известное как редакционное расстояние или расстояние редактирования) - это метрика, используемая для измерения различия между двумя строками. Она измеряет минимальное количество редакционных операций (вставки, удаления и замены символов), необходимых для превращения одной строки в другую.

Расстояние Левенштейна полезно в различных приложениях, включая исправление опечаток в тексте, сравнение строк в поисковых системах, определение сходства между текстами и многие другие. Это расстояние названо в честь советского математика Владимира Левенштейна, который разработал эту метрику в 1965 году.

Пример расстояния Левенштейна между словами "кот" и "кит" выглядит следующим образом:

```python
Levenshtein.distance("кит", "кот")
```

Таким образом, минимальное количество операций для превращения "кот" "кит" 1, что и является расстоянием Левенштейна между этими двумя словами.

Это расстояние часто используется в алгоритмах автоматической коррекции опечаток, поисковых системах, а также в задачах сравнения текстов и вычисления сходства между ними.ду ними.

In [1]:
import numpy as np
import Levenshtein

# Простой словарь
dictionary = ["cat", "dog", "fish", "bird", "apple", "banana", "cherry", "and", "like", "I"]

# Функция для нахождения ближайшего слова в словаре
def find_closest_word(word, dictionary):
    min_distance = float('inf')
    closest_word = word

    for dict_word in dictionary:
        distance = Levenshtein.distance(word, dict_word)
        if distance < min_distance:
            min_distance = distance
            closest_word = dict_word

    return closest_word

# Текст с опечатками
text_with_typos = "I likk ctas and bnanas"

# Разбиваем текст на слова
words = text_with_typos.split()

# Исправляем опечатки
corrected_text = []
for word in words:
    closest_word = find_closest_word(word, dictionary)
    corrected_text.append(closest_word)

# Собираем исправленный текст обратно в строку
corrected_text = " ".join(corrected_text)

print("Исходный текст:", text_with_typos)
print("Исправленный текст:", corrected_text)

Исходный текст: I likk ctas and bnanas
Исправленный текст: I like cat and banana
