-
Notifications
You must be signed in to change notification settings - Fork 1
Open
Description
Здравствуйте. А возможно ли как-то обработать с помощью rurecoder-а текст, который включает не один тип кракозябр, а несколько?
Сейчас, если, например, ввести текст из двух кракозябр, rurecoder распознает только последнюю.
Я пытался придумать алгоритм, чтобы корректно обработать.
- по буквам если разбивать, он часто некорректно распознает
- по словам, тоже часто путает, когда раздельно
Возможно ли как-то различать кракозябры с помощью какого-то триггера? Например, утилита считывает абзацы/строки, идут кракозябры одного типа, одной кодировки, она их отщипляет, распознает. Идет дальше. Другой тип закончился, начался третий. Второй тип отщепила, распознала. И т.д.
Metadata
Metadata
Assignees
Labels
No labels