In [1]:
import re
import numpy as np
import random
from collections import Counter

### Продвинутое машинное обучение: Домашнее задание 3

В этом небольшом домашнем задании мы попробуем улучшить метод Шерлока Холмса. Как известно, в рассказе The Adventure of the Dancing Men великий сыщик расшифровал загадочные письмена, которые выглядели примерно так:

Пользовался он для этого так называемым частотным методом: смотрел, какие буквы чаще встречаются в зашифрованных текстах, и пытался подставить буквы в соответствии с частотной таблицей: E — самая частая и так далее.

В этом задании мы будем разрабатывать более современный и продвинутый вариант такого частотного метода. В качестве корпусов текстов для подсчётов частот можете взять что угодно, но для удобства вот вам “Война и мир” по-русски и по-английски:


https://www.dropbox.com/s/k23enjvr3fb40o5/corpora.zip 

In [2]:
NAME_TEXT = ['AnnaKarenina.txt', 'WarAndPeace.txt', 'WarAndPeaceEng.txt']
URL_DATE = 'data/'

In [3]:
texts = {}

In [4]:
def text_conversions(text):
    a = re.sub(r'[^а-яё ]', ' ', text.lower())
    return re.sub(r'\s+', ' ', a)[1:]

In [5]:
with open('data/WarAndPeace.txt') as f:
    text = f.read()
    texts['WarAndPeace'] = text_conversions(text)

In [6]:
SAMPLE_TEXT = " Пьер так и не успел выбрать себе карьеры в Петербурге и, действительно, был выслан в Москву за буйство. История, которую рассказывали у графа Ростова, была справедлива. Пьер участвовал в связываньи квартального с медведем. Он приехал несколько дней тому назад и остановился, как всегда, в доме своего отца. Хотя он и предполагал, что история его уже известна в Москве, и что дамы, окружающие его отца, всегда недоброжелательные к нему, воспользуются этим случаем, чтобы раздражить графа, он всё-таки в день приезда пошел на половину отца. Войдя в гостиную, обычное местопребывание княжен, он поздоровался с дамами, сидевшими за пяльцами и за книгой, которую вслух читала одна из них. Их было три. Старшая, чистоплотная, с длинною талией, строгая девица, та самая, которая выходила к Анне Михайловне, читала; младшие, обе румяные и хорошенькие, отличавшиеся друг от друга только тем, что у одной была родинка над губой, очень красившая ее, шили в пяльцах. Пьер был встречен как мертвец или зачумленный. Старшая княжна прервала чтение и молча посмотрела на него испуганными глазами; младшая, без родинки, приняла точно такое же выражение; самая меньшая, с родинкой, веселого и смешливого характера, нагнулась к пяльцам, чтобы скрыть улыбку, вызванную, вероятно, предстоящею сценой, забавность которой она предвидела. Она притянула вниз шерстинку и нагнулась, будто разбирая узоры и едва удерживаясь от смеха."

In [7]:
SAMPLE_TEXT = text_conversions(SAMPLE_TEXT.lower())

### Задание 1: Реализуйте базовый частотный метод по Шерлоку Холмсу
- подсчитайте частоты букв по корпусам (пунктуацию и капитализацию можно просто опустить, а вот пробелы лучше оставить);
- возьмите какие-нибудь тестовые тексты (нужно взять по меньшей мере 2-3 предложения, иначе вряд ли сработает), зашифруйте их посредством случайной перестановки символов;
- расшифруйте их таким частотным методом.



In [8]:
dict_count = Counter(texts['WarAndPeace'])
dict_count

Counter({'в': 24461,
         'о': 60281,
         'й': 6106,
         'н': 34505,
         'а': 44557,
         ' ': 102847,
         'и': 35276,
         'м': 15690,
         'р': 24208,
         'с': 27680,
         'ы': 10071,
         'з': 9452,
         'е': 41841,
         'т': 30188,
         'л': 26793,
         'ь': 10350,
         'к': 19040,
         'ч': 7224,
         'г': 11008,
         'д': 16134,
         'у': 15247,
         'п': 13605,
         'я': 12290,
         'ж': 5378,
         'б': 9181,
         'щ': 1489,
         'ф': 1198,
         'э': 1594,
         'х': 4533,
         'ю': 3462,
         'ш': 5001,
         'ц': 2163,
         'ё': 424,
         'ъ': 272})

In [9]:
list_key = list(dict_count.keys())
list_key_shuffle = list_key.copy()
random.shuffle(list_key_shuffle)
dict_decode = dict(zip(list_key,list_key_shuffle ))


In [10]:
def encoder_text(samlpe_text, dict_shuffle):
    text = ''
    for sym in samlpe_text:
        text += dict_shuffle[sym]
    return text

In [11]:
encode_sample_text = encoder_text(SAMPLE_TEXT, dict_decode)
SAMPLE_TEXT

'пьер так и не успел выбрать себе карьеры в петербурге и действительно был выслан в москву за буйство история которую рассказывали у графа ростова была справедлива пьер участвовал в связываньи квартального с медведем он приехал несколько дней тому назад и остановился как всегда в доме своего отца хотя он и предполагал что история его уже известна в москве и что дамы окружающие его отца всегда недоброжелательные к нему воспользуются этим случаем чтобы раздражить графа он всё таки в день приезда пошел на половину отца войдя в гостиную обычное местопребывание княжен он поздоровался с дамами сидевшими за пяльцами и за книгой которую вслух читала одна из них их было три старшая чистоплотная с длинною талией строгая девица та самая которая выходила к анне михайловне читала младшие обе румяные и хорошенькие отличавшиеся друг от друга только тем что у одной была родинка над губой очень красившая ее шили в пяльцах пьер был встречен как мертвец или зачумленный старшая княжна прервала чтение и мо

In [12]:
encode_sample_text

'цисбахщьатаосанзцсэамышбщхиазсшсаьщбисбыамацсхсбшнбчсатайсрзхмтхсэиокашыэамызэщоамафкзьмнагщашнрзхмкатзхкбт аькхкбнлабщззьщгымщэтаначбщущабкзхкмщашыэщазцбщмсйэтмщацисбанжщзхмкмщэамазм гымщоитаьмщбхщэиокчказафсймсйсфакоацбтсвщэаосзькэиькайосрахкфнаощгщйатакзхщокмтэз аьщьамзсчйщамайкфсазмксчкакхещавкх акоатацбсйцкэщчщэажхкатзхкбт асчканъсатгмсзхощамафкзьмсатажхкайщфыакьбнъщлптсасчкакхещамзсчйщаосйкшбкъсэщхсэиоысаьаосфнамкзцкэигнлхз аёхтфазэнжщсфажхкшыабщгйбщътхиачбщущакоамзяахщьтамайсоиацбтсгйщацкдсэаощацкэкмтонакхещамкрй амачкзхтонлакшыжоксафсзхкцбсшымщотсаьо ъсоакоацкгйкбкмщэз азайщфщфтазтйсмдтфтагщац эиещфтатагщаьотчкраькхкбнламзэнважтхщэщакйощатгаотватвашыэкахбтазхщбдщ ажтзхкцэкхощ азайэтооклахщэтсразхбкчщ айсмтещахщазщфщ аькхкбщ амывкйтэщаьащоосафтвщрэкмосажтхщэщафэщйдтсакшсабнф оысатавкбкдсоиьтсакхэтжщмдтсз айбнчакхайбнчщахкэиькахсфажхканакйокрашыэщабкйтоьщаощйачншкракжсоиаьбщзтмдщ ассадтэтамац эиещвацисбашыэамзхбсжсоаьщьафсбхмсеатэтагщжнфэсооыразхщбдщ аьо ъощацбсбмщэщажхсотсатафк

In [13]:
def decoder_text(encode_text, dict_count):
    rating_full_text = {i : sym[0]  for i, sym in enumerate(dict_count.most_common())}
    rating_sample_text = {sym[0] : i  for i, sym in enumerate(Counter(encode_text).most_common())}
    decode_text = ''
    for sym in encode_text:
        decode_text += rating_full_text[rating_sample_text[sym]]
    return decode_text

In [14]:
text_decode = decoder_text(encode_sample_text, dict_count)

In [15]:
print('Оригинальный текст: ')
SAMPLE_TEXT

Оригинальный текст: 


'пьер так и не успел выбрать себе карьеры в петербурге и действительно был выслан в москву за буйство история которую рассказывали у графа ростова была справедлива пьер участвовал в связываньи квартального с медведем он приехал несколько дней тому назад и остановился как всегда в доме своего отца хотя он и предполагал что история его уже известна в москве и что дамы окружающие его отца всегда недоброжелательные к нему воспользуются этим случаем чтобы раздражить графа он всё таки в день приезда пошел на половину отца войдя в гостиную обычное местопребывание княжен он поздоровался с дамами сидевшими за пяльцами и за книгой которую вслух читала одна из них их было три старшая чистоплотная с длинною талией строгая девица та самая которая выходила к анне михайловне читала младшие обе румяные и хорошенькие отличавшиеся друг от друга только тем что у одной была родинка над губой очень красившая ее шили в пяльцах пьер был встречен как мертвец или зачумленный старшая княжна прервала чтение и мо

In [16]:
print('Декодированый текст: ')
text_decode

Декодированый текст: 


'ягес тод и не мляер вьзсотг лезе досгесь в яетесзмсые и кейлтвитергна зьр вьлрон в уалдвм бо змйлтва илтасип датасмц соллдобьвори м ысоэо салтаво зьро лясовекриво ягес мчолтвавор в лвпбьвонги двосторгнаыа л уеквекеу ан ясиешор нелдаргда кней таум нобок и алтонавирлп дод влеыко в кауе лваеыа атхо шатп ан и ясекяароыор чта илтасип еыа мюе ибвелтно в уалдве и чта коуь адсмюоцщие еыа атхо влеыко неказсаюеротергнье д неум валяаргбмцтлп фтиу лрмчоеу чтазь собксоюитг ысоэо ан влё тоди в кенг ясиебко яажер но яаравинм атхо вайкп в ыалтинмц азьчнае уелтаясезьвоние днпюен ан яабкасаворлп л коуоуи ликевжиуи бо япргхоуи и бо дниыай датасмц влрмш читоро акно иб ниш иш зьра тси лтосжоп чилтаяратноп л криннац торией лтсаыоп кевихо то лоуоп датасоп вьшакиро д онне уишойравне читоро урокжие азе смупнье и шасаженгдие атричовжиелп ксмы ат ксмыо таргда теу чта м акнай зьро сакиндо нок ымзай аченг дсоливжоп ее жири в япргхош ягес зьр влтсечен дод уествех ири бочмуренньй лтосжоп днпюно ясесворо чтение и уа

#### Задание 2
Вряд ли в результате получилась такая уж хорошая расшифровка, разве что если вы брали в качестве тестовых данных целые рассказы. Но и Шерлок Холмс был не так уж прост: после буквы E, которая действительно выделяется частотой, дальше он анализировал уже конкретные слова и пытался угадать, какими они могли бы быть. Я не знаю, как запрограммировать такой интуитивный анализ, так что давайте просто сделаем следующий логический шаг:

- подсчитайте частоты биграмм (т.е. пар последовательных букв) по корпусам;
- проведите тестирование аналогично п.1, но при помощи биграмм.

In [17]:
def get_bigrams(text):
    return [text[i:i + 2] for i in range(0, len(text) - 1)]

In [18]:
samlpe_text_bigram = get_bigrams(texts['WarAndPeace'])

In [19]:
dict_count_bigram = Counter(samlpe_text_bigram)

In [20]:
encode_sample_text

'цисбахщьатаосанзцсэамышбщхиазсшсаьщбисбыамацсхсбшнбчсатайсрзхмтхсэиокашыэамызэщоамафкзьмнагщашнрзхмкатзхкбт аькхкбнлабщззьщгымщэтаначбщущабкзхкмщашыэщазцбщмсйэтмщацисбанжщзхмкмщэамазм гымщоитаьмщбхщэиокчказафсймсйсфакоацбтсвщэаосзькэиькайосрахкфнаощгщйатакзхщокмтэз аьщьамзсчйщамайкфсазмксчкакхещавкх акоатацбсйцкэщчщэажхкатзхкбт асчканъсатгмсзхощамафкзьмсатажхкайщфыакьбнъщлптсасчкакхещамзсчйщаосйкшбкъсэщхсэиоысаьаосфнамкзцкэигнлхз аёхтфазэнжщсфажхкшыабщгйбщътхиачбщущакоамзяахщьтамайсоиацбтсгйщацкдсэаощацкэкмтонакхещамкрй амачкзхтонлакшыжоксафсзхкцбсшымщотсаьо ъсоакоацкгйкбкмщэз азайщфщфтазтйсмдтфтагщац эиещфтатагщаьотчкраькхкбнламзэнважтхщэщакйощатгаотватвашыэкахбтазхщбдщ ажтзхкцэкхощ азайэтооклахщэтсразхбкчщ айсмтещахщазщфщ аькхкбщ амывкйтэщаьащоосафтвщрэкмосажтхщэщафэщйдтсакшсабнф оысатавкбкдсоиьтсакхэтжщмдтсз айбнчакхайбнчщахкэиькахсфажхканакйокрашыэщабкйтоьщаощйачншкракжсоиаьбщзтмдщ ассадтэтамац эиещвацисбашыэамзхбсжсоаьщьафсбхмсеатэтагщжнфэсооыразхщбдщ аьо ъощацбсбмщэщажхсотсатафк

In [21]:
text_decode = decoder_text(re.findall(r'..', encode_sample_text), dict_count_bigram)

In [22]:
print('Оригинальный текст: ')
SAMPLE_TEXT

Оригинальный текст: 


'пьер так и не успел выбрать себе карьеры в петербурге и действительно был выслан в москву за буйство история которую рассказывали у графа ростова была справедлива пьер участвовал в связываньи квартального с медведем он приехал несколько дней тому назад и остановился как всегда в доме своего отца хотя он и предполагал что история его уже известна в москве и что дамы окружающие его отца всегда недоброжелательные к нему воспользуются этим случаем чтобы раздражить графа он всё таки в день приезда пошел на половину отца войдя в гостиную обычное местопребывание княжен он поздоровался с дамами сидевшими за пяльцами и за книгой которую вслух читала одна из них их было три старшая чистоплотная с длинною талией строгая девица та самая которая выходила к анне михайловне читала младшие обе румяные и хорошенькие отличавшиеся друг от друга только тем что у одной была родинка над губой очень красившая ее шили в пяльцах пьер был встречен как мертвец или зачумленный старшая княжна прервала чтение и мо

In [23]:
print('Декодированый текст: ')
text_decode

Декодированый текст: 


'чтм атю а  исттвоеогт дрбеоттен ноодтиег с вшим удтусти лалянясь рид тлиогт итло сравовиор дв кртоина то ох ноь  освелреы прспкои ор жихо ротоеро лиове вару мс за втиокныреняерко се изикзасии виодя наолене ра монлатаак вобсяко идел нал нивей  н а ипрвса  птолоерри зною  стедно дагл ге иназ ть  ччеь гоака  вкаду еннкоан на то ох именк  уа трдеожо даисы она ан нниалилияая яты бимен пязо емазку и мтьро уовзннамастомве а своаснаыйул зымдитаитныеетажетьилу леу рыоймеу иц пбыемийя са сни котва блео асутогне в ееросорь  ч сетус смеводимосктьятолст гтошакализаарстамсе к пбыасле оерко зе ниалали лслагрвни  д ввыжаали и  дноаренй л  наяскемевдо ля ов пнуо ив икиа долимиатобе я очпоан э нр ь негоошужосолскя с вше сопепониз уго я е алпоноь  опо слыедрио омловеракиажмильст ля овраовще б пн еллуиебра че оич кчи б ппабурубадегослей пкнслейо  ннал ат хан нк  пнуетв хоо роылмуо нендмнжий д  котькреесавгозьбории дашена чдочтм в хо стокаезбыцеом гопоныврии  дряэт кмай тоодавгоамсене вкаебкоо же к ба ра 

### Задание 3
Но и это ещё не всё: биграммы скорее всего тоже далеко не всегда работают. Основная часть задания — в том, как можно их улучшить:
- предложите метод обучения перестановки символов в этом задании, основанный на MCMC-сэмплировании, но по-прежнему работающий на основе статистики биграмм;
- реализуйте и протестируйте его, убедитесь, что результаты улучшились.
        

In [24]:
encode_sample_text = encoder_text(SAMPLE_TEXT, dict_decode)

In [25]:
encode_sample_text

'цисбахщьатаосанзцсэамышбщхиазсшсаьщбисбыамацсхсбшнбчсатайсрзхмтхсэиокашыэамызэщоамафкзьмнагщашнрзхмкатзхкбт аькхкбнлабщззьщгымщэтаначбщущабкзхкмщашыэщазцбщмсйэтмщацисбанжщзхмкмщэамазм гымщоитаьмщбхщэиокчказафсймсйсфакоацбтсвщэаосзькэиькайосрахкфнаощгщйатакзхщокмтэз аьщьамзсчйщамайкфсазмксчкакхещавкх акоатацбсйцкэщчщэажхкатзхкбт асчканъсатгмсзхощамафкзьмсатажхкайщфыакьбнъщлптсасчкакхещамзсчйщаосйкшбкъсэщхсэиоысаьаосфнамкзцкэигнлхз аёхтфазэнжщсфажхкшыабщгйбщътхиачбщущакоамзяахщьтамайсоиацбтсгйщацкдсэаощацкэкмтонакхещамкрй амачкзхтонлакшыжоксафсзхкцбсшымщотсаьо ъсоакоацкгйкбкмщэз азайщфщфтазтйсмдтфтагщац эиещфтатагщаьотчкраькхкбнламзэнважтхщэщакйощатгаотватвашыэкахбтазхщбдщ ажтзхкцэкхощ азайэтооклахщэтсразхбкчщ айсмтещахщазщфщ аькхкбщ амывкйтэщаьащоосафтвщрэкмосажтхщэщафэщйдтсакшсабнф оысатавкбкдсоиьтсакхэтжщмдтсз айбнчакхайбнчщахкэиькахсфажхканакйокрашыэщабкйтоьщаощйачншкракжсоиаьбщзтмдщ ассадтэтамац эиещвацисбашыэамзхбсжсоаьщьафсбхмсеатэтагщжнфэсооыразхщбдщ аьо ъощацбсбмщэщажхсотсатафк

In [26]:
def decoder_text(encode_text, dict_count):
    rating_full_text = {i : sym[0]  for i, sym in enumerate(dict_count.most_common())}
    rating_sample_text = {sym[0] : i  for i, sym in enumerate(Counter(encode_text).most_common())}
    decode_text = ''
    for sym in encode_text:
        decode_text += rating_full_text[rating_sample_text[sym]]
    return decode_text, rating_sample_text.keys() , [sym[0] for i, sym in enumerate(dict_count.most_common())]

In [27]:
text_decode, list_sym_sample, list_sym_full_text  = decoder_text(encode_sample_text, dict_count)

In [28]:
def cal_score(text_decode, bigram_count):
    samlpe_text_bigram = re.findall(r'..', text_decode)
    score = 0
    for b in samlpe_text_bigram:
        score += np.log(bigram_count.get(b, 1))
    return score

In [29]:
def encoded_text(encode_sample_text, mapping):
    text = ''
    for i in encode_sample_text:
        text += mapping[i]
    return text

In [30]:
best_score = 0
best_mapping = 0
score = 0

for i in range(1, 10000):
    x, y = np.random.choice(len(list_sym_full_text), size=2, replace=False)
    list_sym_full_text_new = list_sym_full_text.copy()
    save_value = list_sym_full_text_new[x]
    list_sym_full_text_new[x] = list_sym_full_text_new[y]
    list_sym_full_text_new[y] = save_value
    mapping_new = dict(zip(list_sym_sample, list_sym_full_text_new ))

    text_endode = encoded_text(encode_sample_text, mapping_new)

    new_score = cal_score(text_endode, dict_count_bigram)
    score_diff = min(np.exp(new_score - score), 1) 
    if score_diff > random.uniform(0,1):
        
        score = new_score

        mapping = mapping_new
        list_sym_full_text = list_sym_full_text_new
                    
    if score > best_score:
        best_score = score
        best_mapping = mapping_new
    if i % 1000 == 0 or i == 1:
        print(f'_____________________Шаг {i}__________________')
        print(encoded_text(encode_sample_text, best_mapping))

_____________________Шаг 1__________________
ягрс тод и нр мляре вьзсотг лрзр досгрсь в яртрсзмсыр и крйлтвитрегна зье вьлеон в уалдвм бо змйлтва илтасип датасмц соллдобьвоеи м ысоэо салтаво зьео лясовркеиво ягрс мчолтвавое в лвпбьвонги двостоегнаыа л урквркру ан ясиршое нрлдаегда кнрй таум нобок и алтонавиелп дод влрыко в каур лварыа атхо шатп ан и ясркяаеоыое чта илтасип рыа мюр ибврлтно в уалдвр и чта коуь адсмюоцщир рыа атхо влрыко нрказсаюреотрегньр д нрум валяаегбмцтлп фтиу лемчору чтазь собксоюитг ысоэо ан влё тоди в крнг ясирбко яажре но яаеавинм атхо вайкп в ыалтинмц азьчнар урлтаясрзьвонир днпюрн ан яабкасавоелп л коуоуи ликрвжиуи бо япегхоуи и бо дниыай датасмц влемш читоео акно иб ниш иш зьеа тси лтосжоп чилтаяеатноп л кеиннац тоеирй лтсаыоп крвихо то лоуоп датасоп вьшакиео д оннр уишойеавнр читоео уеокжир азр смупньр и шасажрнгдир атеичовжирлп ксмы ат ксмыо таегда тру чта м акнай зьео сакиндо нок ымзай ачрнг дсоливжоп рр жиеи в япегхош ягрс зье влтсрчрн дод урстврх иеи боч

  score_diff = min(np.exp(new_score - score), 1)


In [31]:
SAMPLE_TEXT

'пьер так и не успел выбрать себе карьеры в петербурге и действительно был выслан в москву за буйство история которую рассказывали у графа ростова была справедлива пьер участвовал в связываньи квартального с медведем он приехал несколько дней тому назад и остановился как всегда в доме своего отца хотя он и предполагал что история его уже известна в москве и что дамы окружающие его отца всегда недоброжелательные к нему воспользуются этим случаем чтобы раздражить графа он всё таки в день приезда пошел на половину отца войдя в гостиную обычное местопребывание княжен он поздоровался с дамами сидевшими за пяльцами и за книгой которую вслух читала одна из них их было три старшая чистоплотная с длинною талией строгая девица та самая которая выходила к анне михайловне читала младшие обе румяные и хорошенькие отличавшиеся друг от друга только тем что у одной была родинка над губой очень красившая ее шили в пяльцах пьер был встречен как мертвец или зачумленный старшая княжна прервала чтение и мо

#### 4 задание

In [107]:
text_task4 = '←⇠⇒↟↹↷⇊↹↷↟↤↟↨←↹↝⇛⇯↳⇴⇒⇈↝⇊↾↹↟⇒↟↹⇷⇛⇞↨↟↹↝⇛⇯↳⇴⇒⇈↝⇊↾↹↨←⇌⇠↨↹⇙↹⇸↨⇛↙⇛↹⇠⇛⇛↲⇆←↝↟↞↹⇌⇛↨⇛⇯⇊↾↹⇒←↙⇌⇛↹⇷⇯⇛⇞↟↨⇴↨⇈↹⇠⇌⇛⇯←←↹↷⇠←↙⇛↹↷⇊↹↷⇠←↹⇠↤←⇒⇴⇒↟↹⇷⇯⇴↷↟⇒⇈↝⇛↹↟↹⇷⇛⇒⇙⇞↟↨←↹↳⇴⇌⇠↟↳⇴⇒⇈↝⇊↾↹↲⇴⇒⇒↹⇰⇴↹⇷⇛⇠⇒←↤↝←←↹⇞←↨↷←⇯↨⇛←↹⇰⇴↤⇴↝↟←↹⇌⇙⇯⇠⇴↹↘⇛↨↞↹⇌⇛↝←⇞↝⇛↹↞↹↝↟⇞←↙⇛↹↝←↹⇛↲←⇆⇴⇏'

In [108]:
with open('data/AnnaKarenina.txt') as f:
    text = f.read()
    texts['AnnaKarenina'] = text_conversions(text)

In [109]:
samlpe_text_bigram = get_bigrams(texts['WarAndPeace'] + ' ' + texts['AnnaKarenina'])
dict_count_bigram = Counter(samlpe_text_bigram)

In [110]:
count_text_task4 = Counter(text_task4)

In [111]:
_, list_sym_sample, list_sym_full_text  = decoder_text(text_task4, dict_count)

In [112]:
best_score = 0
best_mapping = 0
score = 0

for i in range(1, 100000):
    x, y = np.random.choice(len(list_sym_full_text), size=2, replace=False)
    list_sym_full_text_new = list_sym_full_text.copy()
    save_value = list_sym_full_text_new[x]
    list_sym_full_text_new[x] = list_sym_full_text_new[y]
    list_sym_full_text_new[y] = save_value
    mapping_new = dict(zip(list_sym_sample, list_sym_full_text_new ))
    text_endode = encoded_text(text_task4, mapping_new)

    new_score = cal_score(text_endode, dict_count_bigram)
    score_diff = min(np.exp(new_score - score), 1) 
    if score_diff > random.uniform(0,1):
        score = new_score
        mapping = mapping_new
        list_sym_full_text = list_sym_full_text_new
                    
    if score > best_score:
        best_score = score
        best_mapping = mapping_new
    if i % 10000 == 0 or i == 1:
        print(f'_____________________Шаг {i}, score: {best_score}__________________')
        print(encoded_text(text_task4, best_mapping))

  score_diff = min(np.exp(new_score - score), 1)


_____________________Шаг 1, score: 882.6334996926905__________________
олие рд реяесо навгтиундь еие памсе навгтиундь соклс з шсаыа лаабйонеч касавдь иоыка пваместсу лкавоо рлоыа рд рло ляоитие пвтреиуна е паизмесо гтклегтиундь бтии жт палиояноо мосровсао жтятнео кзвлт ъасч каномна ч немоыа но абойтю
_____________________Шаг 10000, score: 1035.4393911188185__________________
етви ча чишине лорясвылам иви подни лорясвылам нектн з эного тообщелий конорам вегко продинсны ткорее чтего ча чте тшевсви прсчивыло и повздине ясктиясвылам бсвв ус потвешлее денчерное усшслие кзртс жонй коледло й лидего ле обещсь
_____________________Шаг 20000, score: 1060.1762284955073__________________
ерли вы вижите носкальный или почти носкальный тегрт у фтомо рообщения готосый лемго псочитать ргосее времо вы вре ржелали псавильно и получите кагрикальный балл да порлежнее четвестое дажание гусра эотя гонечно я ничемо не обещаз
_____________________Шаг 30000, score: 1064.6924728402303__________________
если вы 

In [113]:
print(encoded_text(text_task4, best_mapping))

если вы вимите нордальный или почти нордальный текст у жтого сообщения который легко прочитать скорее всего вы все смелали правильно и получите даксидальный балл за послемнее четвертое замание курса эотя конечно я ничего не обещах
