In [None]:
def create_translation_dict(original_text, russian_translation):
    # Функция create_translation_dict() создает словарь, в котором ключами являются слова на корейском языке, а значениями - слова на русском языке.
    translation_dict = {} # словарь, который вернет функция
    for word, translation in zip(original_text, russian_translation): # word - корейское слово, translation - русское. zip() создает пару.
      translation_dict[word] = translation # наполняем словарь
    return translation_dict # возвращаем словарь

In [None]:
def translate_to_russian(text, translation_dict, punctuation):
    # Функция translate_to_russian() переводит оригинальный текст скорейского на русский язык, используя созданный словарь перевода, сохраняя пунктуацию.
    translated_text = '' #  строка с текстом, которую вернет функция
    ind = 0 # индекс для знаков препинания
    flag = True # флаг для слов с прописной буквы
    for word in text: # пробегаемся по каждому слову в тексте
      if flag: # если слово надо начать с большой буквы
        flag = False # сбрасываем флаг - след. слово с маленькой буквы
        translated_text = translated_text + ' ' + translation_dict[word][0].upper() + translation_dict[word][1:] # записываем в строку слово с большой буквы
      else: # если слово надо начать с маленькой буквы
        translated_text = translated_text + ' ' + translation_dict[word] # записываем в строку слово с маленькой буквы
      if ind in punctuation.keys(): # если после данного слова нужно поставить знак препинания
        translated_text += punctuation[ind] # записываем в строку знак препинания
        if punctuation[ind] in '.!?': # если этот знак - начало нового предложения
          flag = True # следующее слово будет с большой буквы
      ind += 1 # увеличение индекса
    return translated_text.strip() # возвращаем получившуюся строку

In [74]:
def check_punctuation(text):
  # Функция check_punctuation() вернет словарь, в котором ключами будут позиции знаков препинания, а значениями сами знаки препинания
  punctuation_marks = {} # словарь, который вернет функция
  ind = 0 # индекс обрабатываемого слова
  for word in text.split(): # пробегаемся по каждому слову в тексте
    if word[-1] in './,!?*&^%': # если слово оканчивается на знааак препинания
      punctuation_marks[ind] = word[-1] # добавляем в словарь пару
    ind += 1 # увеличение индекса
  return punctuation_marks # возвращаем словарь

In [75]:
def delete_all_punctuations(text):
  # Функция delete_all_punctuations() вернет измененный текст, в котором не будет знаков препинания
  punctuation = ',./!?&()' # знаки пунктуации
  for i in punctuation: # пробежим по всем возможным знакам
    text.replace(i, '') # заменяем в тексте знак на пустоту
  return text # возвращаем получившуюся строку

In [84]:
# Основной блок кода. Часть 1
with open('перевод.txt', 'r', encoding='utf-8') as file: # считываем файл с корейским текстом
  korean_text = ''.join(file.readlines()) # образуем строку, склеивая разные 'строки' файла
punctuation = check_punctuation(korean_text) # проверяем пунктуацию корейского текста
korean_text = delete_all_punctuations(korean_text) # удаляем знаки препинания из корейского текста
korean_words = korean_text.split() # создаем на основе текста список
# Создаем список с русскими словами
russian_translation = ["тигр", 'кролик', 'дракон', 'змея', 'лошадь', 'баран', 'обезьяна', 'петух', 'собака', 'свинья', 'двенадцать', 'животные', 'по очереди', 'к финишу', 'прибыли', 'с тех пор', 'двенадцать', 'животные', 'по очереди', 'каждый год', 'сменялись и', 'главный', 'становились', 'мир', 'защита', 'начинали', 'мир', 'снова', 'покой', 'обрел', 'в воду', 'упавшая', 'кошка', 'в итоге', 'двенадцать', 'животных', 'в число', 'войти', 'не смогла', 'с тех пор', 'кошка и', 'мышь', 'поссорились']
translation_dict = create_translation_dict(korean_words, russian_translation) # создаем словарь с переводом корейских слов
russian_text = translate_to_russian(korean_words, translation_dict, punctuation) # получаем строку с русским переводом корейского текста

# Выводим результат
print("Перевод на русский язык:")
print(russian_text)

Перевод на русский язык:
Тигр, кролик, дракон, змея, лошадь, баран, обезьяна, петух, собака, свинья, двенадцать животные по очереди к финишу прибыли. С тех пор двенадцать животные по очереди каждый год сменялись и главный становились мир защита начинали мир снова покой обрел. В воду упавшая кошка в итоге двенадцать животных в число войти не смогла с тех пор кошка и мышь поссорились.


In [88]:
# Основной блок кода. Часть 2
original_translate = set() # пустое множество слов в оригинальном переводе
program_translate = set() # пустое множество слов в переводе, полученным программой
with open('оригинал.txt', 'r', encoding='utf-8') as file: # считываем файл с оригинальным переводом
  original_text = ''.join(file.readlines()).strip() # образуем строку, склеивая разные 'строки' файла

original_text = delete_all_punctuations(original_text) # удаляем все знаки препинания из оригинального перевода

for word in original_text.split(): # переберем каждое слово в списке оригинального перевода
  original_translate.add(word.lower()) # добавляем слово в нижнем регистре в множество оригинального перевода

russian_text = delete_all_punctuations(russian_text) # удаляем все знаки препинания из перевода программы

for word in russian_text.split(): # переберем каждое слово в списке перевода, полученного программой
  program_translate.add(word.lower()) # добавляем слово в нижнем регистре в множество перевода, полученного программой

# Проверка на корректность слов (склонение и падежи)
print(f"Процент совпадения слов: {round((len(original_translate.intersection(program_translate)) / len(original_translate)) * 100, 3)}%")

# Проверка на совпадение слов (правильную последовательность, построение предложения)
counter = 0 # счетчик несовпадений
for ind in range(0, len(russian_text.split())): # переберем каждое слово из списков оригинального и программного переводов
  if russian_text.split()[ind] != original_text.split()[ind]: # если слова не одинаковые
    counter += 1 # увеличиваем счетчик
print(f"Процент несовпадения слов (построение предложения): {round((counter / len(russian_text.split())* 100), 3)}%")

Процент совпадения слов: 78.723%
Процент совпадения слов (построение предложения): 47.368%
