
# Воспроизведение "King James Programming" для русского языка, или "Ветхий алгоритм"

http://kingjamesprogramming.tumblr.com/

## Данные

In [1]:
%load_ext autoreload
%autoreload 2

In [2]:
import regex 
import numpy as np

In [3]:
# Читаем алгоритмы Кормена
with open('./texts/cormen.txt', encoding='utf8') as f:
    cormen = f.read().replace(u'\xa0', u' ').replace(u'\x0c', u'.').replace(u'\xad', '')
    cormen = cormen.replace(".w", "м").replace("19", "ю").replace("ё", "е")
cormen = regex.sub(u'[^\p{L}\ \n\.\!\?\;]', '', cormen) # оставляем только буквы и знаки препенания
cormen = regex.sub('[\!\?\;]', '.', cormen) # заменяем все знаки препинания на точки
cormen = regex.sub('Глава', '', cormen)
cormen = regex.sub('\n+\ *\n*\ *', ' ', cormen) # сокращаем \n
cormen = regex.sub('\.+[ *\.*\n*]*', '. ', cormen) # сокращаем точки

In [4]:
import nltk
from nltk.tokenize import TweetTokenizer

sent_detector = nltk.data.load('tokenizers/punkt/english.pickle')
tokenizer = TweetTokenizer()

cormen_sentences = []

for sent in sent_detector.tokenize(cormen.lower()):
    tokens = tokenizer.tokenize(sent)
    if tokens[0].isdigit():
        tokens = tokens[1:]
    cormen_sentences.append(tokens)

In [5]:
# Читаем книгу про юникс
with open('./texts/unix.txt', encoding='utf8') as f:
    unix = f.read().replace(u'\xa0', u' ').replace(u'\x0c', u'.').replace('\xad', '')
    unix = unix.replace(".w", "м").replace("19", "ю").replace("ё", "е")

unix = regex.sub(u'[^\p{L}\ \n\.\!\?\;]', '', unix) # оставляем только буквы и знаки препенания
unix = regex.sub('[\!\?\;]', '.', unix) # заменяем все знаки препинания на точки
unix = regex.sub('Глава', '', unix)
unix = regex.sub('\n+\ *\n*\ *', ' ', unix) # сокращаем \n
unix = regex.sub('\.+[ *\.*\n*]*', '. ', unix) # сокращаем точки


In [6]:
unix_sentences = []

for sent in sent_detector.tokenize(unix.lower()):
    tokens = tokenizer.tokenize(sent)
    if tokens[0].isdigit():
        tokens = tokens[1:]
    unix_sentences.append(tokens)

In [7]:
# читаем ветхий завет
with open('./texts/testament.txt', encoding='utf8') as f:
    testament = f.read().replace(u'\xa0', u' ').replace(u'\x0c', u'.').replace('\xad', '')
    testament = testament.replace(".w", "м").replace("19", "ю").replace("ё", "е")
# # чистим ветхий завет
testament = regex.sub(u'[^\p{L}\ \n\.\!\?\;]', '', testament) # оставляем только буквы и знаки препенания
testament = regex.sub('[\!\?\;]', '.', testament) # заменяем все знаки препинания на точки
testament = regex.sub('Глава', '', testament)
testament = regex.sub('\n+\ *\n*\ *', ' ', testament) # сокращаем \n
testament = regex.sub('\.+[ *\.*\n*]*', '. ', testament) # сокращаем точки

In [8]:
testament_sentences = []

for sent in sent_detector.tokenize(testament.lower()):
    tokens = tokenizer.tokenize(sent)
    if tokens[0].isdigit():
        tokens = tokens[1:]
    testament_sentences.append(tokens)

### Подготовка данных

Оставим предложения длиной не меньше 5.

In [10]:
code_sentences = cormen_sentences + unix_sentences
code_sentences = [s for s in code_sentences if 5 <= len(s)]
testament_sentences = [s for s in testament_sentences if 5 <= len(s)]

In [11]:
all_words = [w for s in testament_sentences for w in s] + [w for s in code_sentences for w in s]
words = np.array(list(set(all_words)))

In [12]:
# np.save("words_alph.npy", words)
words = np.load("words_alph.npy")

Обучим модель fasttext для представлений слов.

In [14]:
import gensim
from gensim.models import FastText

In [13]:
np.random.seed(923418)
all_text = np.array(testament_sentences + code_sentences)
np.random.shuffle(all_text)

In [14]:
all_text = [" ".join(s).lower().split(" ") for s in all_text]

In [18]:
fast_text_model = FastText(size=256, window=4, min_count=2)
fast_text_model.build_vocab(sentences=all_text)
fast_text_model.train(sentences=all_text, total_examples=len(all_text), epochs=10)

In [13]:
from gensim.test.utils import get_tmpfile

fname = get_tmpfile("fasttext.model")

# fast_text_model.save(fname)


In [16]:
# fast_text_model.save("fast_text_model.model")

In [15]:
fast_text_model = FastText.load(fname)

Создаем обучающую и тестовую выборки и алфавит всего текста.

In [16]:
np.random.seed(923418)
idx = np.random.choice(range(len(code_sentences)), len(code_sentences) // 10, False)
mask = np.ones((len(code_sentences)), dtype=bool)
mask[idx] = False

In [17]:
code_train = np.array(code_sentences)[mask]
code_test = np.array(code_sentences)[~mask]

In [18]:
idx = np.random.choice(range(len(testament_sentences)), len(testament_sentences) // 10, False)
mask = np.ones((len(testament_sentences)), dtype=bool)
mask[idx] = False

In [19]:
testament_train = np.array(testament_sentences)[mask]
testament_test = np.array(testament_sentences)[~mask]

In [20]:
alphabet = " ".join(words)

In [25]:
alphabet = sorted(set(list(alphabet)))
print(alphabet)

[' ', '.', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', 'а', 'б', 'в', 'г', 'д', 'е', 'ж', 'з', 'и', 'й', 'к', 'л', 'м', 'н', 'о', 'п', 'р', 'с', 'т', 'у', 'ф', 'х', 'ц', 'ч', 'ш', 'щ', 'ъ', 'ы', 'ь', 'э', 'ю', 'я']


In [22]:
char_idx = dict(zip(alphabet, np.eye(len(alphabet))))

### Импорт и кофиг tensorflow и keras

In [26]:
from tensorflow.keras import backend as K
from tensorflow.keras.callbacks import Callback, ReduceLROnPlateau
from tensorflow.keras.layers import (Bidirectional, TimeDistributed, LSTM, Activation, Dense, Dropout, Flatten, Input, MaxPool2D, Embedding)
from tensorflow.keras.models import Model, load_model, Sequential
from tensorflow.keras.optimizers import SGD, Adam, RMSprop
from tensorflow.keras.losses import categorical_crossentropy, sparse_categorical_crossentropy
from tensorflow.keras.layers import Layer
from tensorflow.keras.utils import Sequence
from tensorflow.keras.backend import set_session
import tensorflow as tf

In [27]:
config = tf.ConfigProto()
# config.gpu_options.per_process_gpu_memory_fraction = 0.4
config.gpu_options.visible_device_list='0'
config.gpu_options.allow_growth = True
# config.log_device_placement=True
sess = tf.Session(config=config)
set_session(sess)

### LSTM на словах с cosine loss

In [21]:
class generator(Sequence):
    
    def __init__(self, code, bible, batch_size=100, window=5):
        self.text = np.concatenate([np.array(bible), np.array(code)])
        np.random.shuffle(self.text)
        self.batch_size = batch_size
        self.window = window
        self.indices = np.arange(self.text.shape[0])
        
    def __len__(self):
        return len(self.text) // self.batch_size
    
    def __getitem__(self, idx):
        inds = self.indices[idx * self.batch_size:(idx + 1) * self.batch_size]
        text = self.text[inds]
        text = [w for s in text for w in s]
        text_vecs = [fast_text_model.wv[w] for w in text]
        batch_in = []
        batch_out = []
        for i in range(self.window, len(text_vecs) - self.window):
            batch_in.append(text_vecs[i - self.window:i])  
            batch_out.append(text_vecs[i])
        return np.array(batch_in), np.array(batch_out)
    
    def on_epoch_end(self):
        np.random.shuffle(self.indices)

In [22]:
def get_model(dropout=0.3, window=5):
    model = Sequential()
    model.add(Bidirectional(LSTM(256, return_sequences=True), input_shape=(window, 256)))
    if dropout > 0:
        model.add(Dropout(dropout))
        
    model.add(LSTM(256))
    return model

In [24]:
m = get_model()

In [25]:
m.compile(loss='cosine_proximity', optimizer=Adam(), metrics=['CosineSimilarity'])

In [26]:
cos_his = m.fit_generator(generator=generator(code_train, testament_train, batch_size=200), 
                validation_data=generator(code_test, testament_test, batch_size=200),
                workers=16, use_multiprocessing=True, 
                epochs=800, shuffle=False)

W1009 19:31:18.308707 140395259537216 deprecation.py:323] From /usr/local/lib/python3.6/dist-packages/tensorflow/python/ops/math_grad.py:1250: add_dispatch_support.<locals>.wrapper (from tensorflow.python.ops.array_ops) is deprecated and will be removed in a future version.
Instructions for updating:
Use tf.where in 2.0, which has the same broadcast rule as np.where


Epoch 1/800
Epoch 2/800
Epoch 3/800
Epoch 4/800
Epoch 5/800
Epoch 6/800
Epoch 7/800
Epoch 8/800
Epoch 9/800
Epoch 10/800
Epoch 11/800
Epoch 12/800
Epoch 13/800
Epoch 14/800
Epoch 15/800
Epoch 16/800
Epoch 17/800
Epoch 18/800
Epoch 19/800
Epoch 20/800
Epoch 21/800
Epoch 22/800
Epoch 23/800
Epoch 24/800
Epoch 25/800
Epoch 26/800
Epoch 27/800
Epoch 28/800
Epoch 29/800
Epoch 35/800
Epoch 36/800
Epoch 37/800
Epoch 38/800
Epoch 39/800
Epoch 40/800
Epoch 41/800
Epoch 42/800
Epoch 43/800
Epoch 44/800
Epoch 45/800
Epoch 46/800
Epoch 47/800
Epoch 48/800
Epoch 49/800
Epoch 50/800
Epoch 51/800
Epoch 52/800
Epoch 53/800
 36/217 [===>..........................] - ETA: 9s - loss: -0.6220 - cosine_similarity: -0.6220

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 87/800
Epoch 88/800
Epoch 89/800
Epoch 90/800
Epoch 91/800
Epoch 92/800
Epoch 93/800
Epoch 94/800
Epoch 95/800
Epoch 96/800
Epoch 97/800
Epoch 98/800
Epoch 99/800
Epoch 100/800
Epoch 101/800
Epoch 102/800
Epoch 103/800
Epoch 104/800
Epoch 105/800

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 134/800
Epoch 135/800
Epoch 136/800
Epoch 137/800
Epoch 138/800
Epoch 139/800
Epoch 140/800
Epoch 141/800
Epoch 142/800
Epoch 143/800
Epoch 144/800
Epoch 145/800
Epoch 146/800
Epoch 147/800
Epoch 148/800
Epoch 149/800
Epoch 150/800
Epoch 151/800
Epoch 152/800

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 186/800
Epoch 187/800
Epoch 188/800
Epoch 189/800
Epoch 190/800
Epoch 191/800
Epoch 192/800
Epoch 193/800
Epoch 194/800
Epoch 195/800
Epoch 196/800
Epoch 197/800
Epoch 198/800
Epoch 199/800
Epoch 200/800
Epoch 201/800
Epoch 202/800
Epoch 203/800
Epoch 204/800

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 225/800
Epoch 226/800
Epoch 227/800
Epoch 228/800
Epoch 229/800
Epoch 230/800
Epoch 231/800
Epoch 232/800
  9/217 [>.............................] - ETA: 12s - loss: -0.6761 - cosine_similarity: -0.6761

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 240/800
Epoch 241/800
Epoch 242/800
Epoch 243/800
Epoch 244/800
Epoch 245/800
Epoch 246/800
Epoch 247/800
Epoch 248/800
Epoch 249/800
Epoch 250/800
Epoch 251/800

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 271/800
Epoch 272/800
Epoch 273/800
Epoch 274/800
Epoch 275/800
Epoch 276/800
Epoch 277/800

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 286/800
Epoch 287/800
Epoch 288/800
Epoch 289/800
Epoch 290/800
Epoch 291/800
Epoch 292/800
Epoch 293/800
Epoch 294/800
Epoch 295/800
Epoch 296/800
Epoch 297/800

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 314/800
Epoch 315/800
Epoch 316/800
Epoch 317/800
Epoch 318/800
Epoch 319/800
Epoch 320/800

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 330/800
Epoch 331/800
Epoch 332/800
Epoch 333/800
Epoch 334/800
Epoch 335/800
Epoch 336/800
Epoch 337/800
Epoch 338/800
Epoch 339/800
Epoch 340/800
Epoch 341/800

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 359/800
Epoch 360/800
Epoch 361/800
Epoch 362/800
Epoch 363/800
Epoch 364/800
Epoch 365/800

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 377/800
Epoch 378/800
Epoch 379/800
Epoch 380/800
Epoch 381/800
Epoch 382/800
Epoch 383/800
Epoch 384/800
Epoch 385/800
Epoch 386/800
Epoch 387/800
Epoch 388/800

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 414/800
Epoch 415/800
Epoch 416/800
Epoch 417/800
Epoch 418/800
Epoch 419/800
Epoch 420/800
 15/217 [=>............................] - ETA: 12s - loss: -0.6853 - cosine_similarity: -0.6853

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 428/800
Epoch 429/800
Epoch 430/800
Epoch 431/800
Epoch 432/800
Epoch 433/800
Epoch 434/800
Epoch 435/800
Epoch 436/800
Epoch 437/800
Epoch 438/800
Epoch 439/800
 45/217 [=====>........................] - ETA: 9s - loss: -0.6890 - cosine_similarity: -0.6889

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 454/800
Epoch 455/800
Epoch 456/800
Epoch 457/800
Epoch 458/800
Epoch 459/800
Epoch 460/800
 50/217 [=====>........................] - ETA: 8s - loss: -0.6885 - cosine_similarity: -0.6885

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 469/800
Epoch 470/800
Epoch 471/800
Epoch 472/800
Epoch 473/800
Epoch 474/800
Epoch 475/800
Epoch 476/800
Epoch 477/800
Epoch 478/800
Epoch 479/800
Epoch 480/800

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 500/800
Epoch 501/800
Epoch 502/800
Epoch 503/800
Epoch 504/800
Epoch 505/800
Epoch 506/800
 40/217 [====>.........................] - ETA: 9s - loss: -0.6892 - cosine_similarity: -0.6892

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 516/800
Epoch 517/800
Epoch 518/800
Epoch 519/800
Epoch 520/800
Epoch 521/800
Epoch 522/800
Epoch 523/800
Epoch 524/800
Epoch 525/800
Epoch 526/800
Epoch 527/800

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 550/800
Epoch 551/800
Epoch 552/800
Epoch 553/800
Epoch 554/800
Epoch 555/800
Epoch 556/800
Epoch 557/800
  1/217 [..............................] - ETA: 11s - loss: -0.6789 - cosine_similarity: -0.6789

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 575/800
Epoch 576/800
Epoch 577/800
Epoch 578/800
Epoch 579/800
Epoch 580/800
Epoch 581/800
Epoch 582/800
Epoch 583/800
Epoch 584/800
Epoch 585/800
Epoch 586/800
Epoch 587/800
  5/217 [..............................] - ETA: 11s - loss: -0.6916 - cosine_similarity: -0.6916

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 604/800
Epoch 605/800
Epoch 606/800
Epoch 607/800
Epoch 608/800
Epoch 609/800
Epoch 610/800

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 614/800
Epoch 615/800
Epoch 616/800
Epoch 617/800
Epoch 618/800
Epoch 619/800
Epoch 620/800
Epoch 621/800
Epoch 622/800
Epoch 623/800
Epoch 624/800
Epoch 625/800

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 646/800
Epoch 647/800
Epoch 648/800
Epoch 649/800
Epoch 650/800
Epoch 651/800
Epoch 652/800
Epoch 653/800
Epoch 659/800
Epoch 660/800
Epoch 661/800
Epoch 662/800
Epoch 663/800
Epoch 664/800
Epoch 665/800
Epoch 666/800
Epoch 667/800
Epoch 668/800
Epoch 669/800
Epoch 670/800
Epoch 671/800
Epoch 672/800
Epoch 673/800
Epoch 674/800
Epoch 675/800
Epoch 676/800
Epoch 677/800

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



Epoch 736/800
Epoch 737/800
Epoch 738/800
Epoch 739/800
Epoch 740/800
Epoch 741/800
Epoch 742/800
Epoch 743/800
Epoch 744/800
Epoch 745/800
Epoch 746/800
Epoch 747/800
Epoch 748/800
Epoch 749/800
Epoch 750/800
Epoch 751/800
Epoch 752/800
Epoch 753/800
Epoch 754/800
Epoch 755/800
 16/217 [=>............................] - ETA: 10s - loss: -0.6964 - cosine_similarity: -0.6965

IOPub message rate exceeded.
The notebook server will temporarily stop sending output
to the client in order to avoid crashing it.
To change this limit, set the config variable
`--NotebookApp.iopub_msg_rate_limit`.

Current values:
NotebookApp.iopub_msg_rate_limit=1000.0 (msgs/sec)
NotebookApp.rate_limit_window=3.0 (secs)



In [27]:
m.save('./models/cos.h5')

### LSTM на словах с cross-entropy loss

In [34]:
class generator(Sequence):
    
    def __init__(self, code, bible, batch_size=100, window=5):
        self.text = np.concatenate([np.array(bible), np.array(code)])
        np.random.shuffle(self.text)
        self.batch_size = batch_size
        self.window = window
        self.indices = np.arange(self.text.shape[0])
        
    def __len__(self):
        return len(self.text) // self.batch_size
    
    def __getitem__(self, idx):
        inds = self.indices[idx * self.batch_size:(idx + 1) * self.batch_size]
        text = self.text[inds]
        text = [w for s in text for w in s]
        text_vecs = [fast_text_model.wv[w] for w in text]
        batch_in = []
        batch_out = []
        for i in range(self.window, len(text_vecs) - self.window):
            batch_in.append(text_vecs[i - self.window:i])  
            batch_out.append(np.where(words==text[i])[0][0])
        return np.array(batch_in), np.array(batch_out)
    
    def on_epoch_end(self):
        np.random.shuffle(self.indices)

In [35]:
def get_model(dropout=0.3, window=5):
    model = Sequential()
    model.add(Bidirectional(LSTM(256, return_sequences=True),input_shape=(window, 256)))
    if dropout > 0:
        model.add(Dropout(dropout))
        
    model.add(LSTM(256))
    if dropout > 0:
        model.add(Dropout(dropout))
    model.add(Dense(len(words)))
    model.add(Activation('softmax'))
    return model

In [36]:
m = get_model()

In [37]:
m.compile(loss='sparse_categorical_crossentropy', optimizer=Adam(), metrics=['CosineSimilarity'])

In [None]:
ce_his = m.fit_generator(generator=generator(code_train, testament_train, batch_size=200), 
                validation_data=generator(code_test, testament_test, batch_size=200),
                workers=16, use_multiprocessing=True, 
                epochs=350, shuffle=False,)

In [35]:
m.save("./models/ce.h5")

### LSTM на символах с cross-entropy loss

In [None]:
class generator(Sequence):
    
    def __init__(self, code, bible, batch_size=100, window=30):

        self.text = np.concatenate([np.array(bible), np.array(code)])
        np.random.shuffle(self.text)
        self.batch_size = batch_size
        self.window = window
        self.indices = np.arange(self.text.shape[0])
        
        
    def __len__(self):
        return len(self.text) // self.batch_size
    
    def __getitem__(self, idx):
        inds = self.indices[idx * self.batch_size:(idx + 1) * self.batch_size]
        text = self.text[inds]
        text = " ".join([w for s in text for w in s])
        batch_in = []
        batch_out = []
        for i in range(self.window, len(text) - self.window):
            batch_in.append([char_idx[ch] for ch in text[i - self.window:i]])
            batch_out.append(char_idx[text[i]])
        return np.array(batch_in), np.array(batch_out)
    
    def on_epoch_end(self):
        np.random.shuffle(self.indices)

In [None]:
from tensorflow.keras.layers import TimeDistributed
def get_model(dropout=0.5, window=30):
    model = Sequential()
    model.add(LSTM(256, return_sequences=True, input_shape=(window, len(alphabet))))
    if dropout > 0:
        model.add(Dropout(dropout))
        
    model.add(LSTM(256))
    if dropout > 0:
        model.add(Dropout(dropout))
    model.add(Dense(len(alphabet)))
    model.add(Activation('softmax'))

    return model

In [None]:
m = get_model()

In [None]:
m.compile(loss='categorical_crossentropy', optimizer=Adam(), metrics=['accuracy'])

In [None]:
char_his = m.fit_generator(generator=generator(code_train, testament_train, batch_size=40), 
                validation_data=generator(code_test, testament_test, batch_size=40),
                workers=16, use_multiprocessing=True, 
                epochs=50, shuffle=False,)

In [None]:
m.save("./models/char_lstm_under.h5")

### Bidirectional LSTM на символах с cross-entropy loss

In [25]:
class generator(Sequence):
    
    def __init__(self, code, bible, batch_size=100, window=30):

        self.text = np.concatenate([np.array(bible), np.array(code)])
        np.random.shuffle(self.text)
        self.batch_size = batch_size
        self.window = window
        self.indices = np.arange(self.text.shape[0])
        
        
    def __len__(self):
        return len(self.text) // self.batch_size
    
    def __getitem__(self, idx):
        inds = self.indices[idx * self.batch_size:(idx + 1) * self.batch_size]
        text = self.text[inds]
        text = " ".join([w for s in text for w in s])
        batch_in = []
        batch_out = []
        for i in range(self.window, len(text) - self.window):
            batch_in.append([char_idx[ch] for ch in text[i - self.window:i]])
            batch_out.append(char_idx[text[i]])
        return np.array(batch_in), np.array(batch_out)
    
    def on_epoch_end(self):
        np.random.shuffle(self.indices)

In [26]:
from tensorflow.keras.layers import TimeDistributed
def get_model(dropout=0.5, window=30):
    model = Sequential()
    model.add(Bidirectional(LSTM(256, return_sequences=True),input_shape=(window, len(alphabet))))
    if dropout > 0:
        model.add(Dropout(dropout))
        
    model.add(LSTM(256))
    if dropout > 0:
        model.add(Dropout(dropout))
    model.add(Dense(len(alphabet)))
    model.add(Activation('softmax'))
    
    return model

In [41]:
m = get_model()

In [42]:
m.compile(loss='categorical_crossentropy', optimizer=Adam(), metrics=['accuracy'])

In [None]:
ce1_his = m.fit_generator(generator=generator(code_train, testament_train, batch_size=40), 
                validation_data=generator(code_test, testament_test, batch_size=40),
                workers=16, use_multiprocessing=True, 
                epochs=30, shuffle=False)

In [44]:
m.save("./models/char_bidirect_under.h5")

### Инференс

In [28]:
char_models = [
    "./models/char_lstm.h5",
    "./models/char_bidirect.h5",
    "./models/char_bidirect_under.h5"
    "./models/char_lstm_under.h5"
]
words_models = [
    "./models/ce.h5",
    "./models/cos.h5",
]

Функция sample семплирует объект с некоторой вероятностью, изменяемой температурой. Температуру мы будем использовать, чтобы разнообразить предсказания моделей.

In [31]:
def sample(preds, temperature=1.0):
    preds = np.asarray(preds).astype('float64')
    preds = np.log(preds) / (temperature + 1e-2)
    exp_preds = np.exp(preds)
    preds = exp_preds / np.sum(exp_preds)
    probas = np.random.multinomial(1, preds, 1)
    return np.argmax(probas)

def pformat(seq):
    if not type(seq) is str:
        seq = " ".join(seq)
    return seq

def infer(model, mode="char", window=30, divs=np.linspace(0, 1, 6), seq_len=200):
    '''
    Returns sequences of length seq_len for each diversity
    mode: {"char", "words_ce", "words_cos"}
    '''
    vocab = alphabet if mode == "char" else words
    sentence = np.random.choice(np.concatenate([code_test, testament_test]), 10)
    
    if mode == "char":
        sentence = " ".join([" ".join(s) for s in sentence])
        sentence = sentence[:window]
        start = [char_idx[ch] for ch in sentence]
    elif mode == "words_cos" or "words_ce":
        sentence = [w for s in sentence for w in s][:window]
        start = [fast_text_model.wv[w] for w in sentence]
    
    for diversity in divs:
        print(f'----- Diversity: {diversity}\n')
        print(f'----- Generating with seed:\n"{pformat(sentence)}"\n')
        res = '' if mode == "char" else []
        if seq_len is 200:
            seq_len = 200 if mode == "char" else 40
        for i in range(seq_len):
            
            preds = model.predict(np.array(start)[None, :, :], verbose=0)[0]
            
            # sample next word
            if mode == "char" or mode == "words_ce":
                next_index = sample(preds, diversity)
                next_word = vocab[next_index]
            elif mode == "words_cos":
                top_similar, probas = list(zip(*fast_text_model.wv.most_similar([preds])))
                next_word = top_similar[sample(probas, diversity)]
            
            # add next word to queue
            start = start[1:]
            if mode == "char":
                start.append(char_idx[next_word])
            elif mode == "words_ce" or mode == "words_cos":
                start.append(fast_text_model.wv[next_word])
            
            # add next word to result
            if mode == "char":
                res += next_word
            else:
                res.append(next_word)
        print(pformat(sentence + res), "\n")
    print('='*80 + '\n')

Посмотрим на выходы моделей с разной температурой.

In [32]:
model = load_model("./models/char_lstm.h5")
infer(model, window=30, mode="char")

----- Diversity: 0.0

----- Generating with seed:
"второй третий и четвертый аргу"

второй третий и четвертый аргумент . и сказал господь моисею говоря скажи сынам израилевым в сердце своем . и сказал господь моисею говоря скажи сынам израилевым в сердце своем . и сказал господь моисею говоря скажи сынам израилев 

----- Diversity: 0.2

----- Generating with seed:
"второй третий и четвертый аргу"

второй третий и четвертый аргуым по приношению их . и сказал им иосиф и сказал ему пойди в сердце твоем . и сказал господь моисею говоря скажи ему вот я дал тебе и сказал вот я наполнил тебя и сказал вот я поставил меня . и послал 

----- Diversity: 0.4

----- Generating with seed:
"второй третий и четвертый аргу"

второй третий и четвертый аргу иоав сын иоава и поставил с ними . в этом случае в этом случае функция signal в случае успеха поскольку процесс создает текущий каталог процесс вызывает функцию pthreadmutexattrinit . и сказал господ 

----- Diversity: 0.6000000000000001

----- Genera

In [33]:
model = load_model("./models/char_bidirect.h5")
infer(model, window=30, mode="char")

----- Diversity: 0.0

----- Generating with seed:
"if n sysconfschostnamemax n ho"

if n sysconfschostnamemax n hostnamemax . и сказал господь моисею говоря объяви его и сказал ему не поступай с ним . и сказал господь моисею говоря объяви его и сказал ему не поступай с ним . и сказал господь моисею говоря объяви  

----- Diversity: 0.2

----- Generating with seed:
"if n sysconfschostnamemax n ho"

if n sysconfschostnamemax n hoего и сказал ему имя его . и сказал господь моисею говоря вот сыны израилевы подобно что поставил в себя все стана и поставил себе колена израилевы и все служащие господней . и сказал господь моисею г 

----- Diversity: 0.4

----- Generating with seed:
"if n sysconfschostnamemax n ho"

if n sysconfschostnamemax n hoоворя обратил мне господу все сии от сего дня . и сказал господь моисею говоря скажи сынам израилевым и сказал не построил господь и построил все бога и обложил его в стене и на долине божие . и сказа 

----- Diversity: 0.6000000000000001

----- Genera

In [32]:
model = load_model("./models/ce.h5")
infer(model, window=5, mode="words_ce")

----- Diversity: 0.0

----- Generating with seed:
"использование барьера include include include"

использование барьера include include include apue . и сказал господь моисею говоря объяви сынам израилевым и скажи им когда придете в землю ханаанскую в которую ты идешь чтоб овладеть ею . и сказал господь моисею говоря объяви сынам израилевым и скажи им когда придете в 

----- Diversity: 0.2

----- Generating with seed:
"использование барьера include include include"

использование барьера include include include землю ханаанскую в которую ты идешь чтоб овладеть ею . и сказал господь моисею говоря скажи сынам израилевым если кто из сынов израилевых не введете в нее и не будешь пить . и сказал господь моисею говоря объяви сынам израилевым 

----- Diversity: 0.4

----- Generating with seed:
"использование барьера include include include"

использование барьера include include include и скажи им когда придете в землю ханаанскую к иакову в землю ханаанскую и рассказали ему за то что ты не с

In [35]:
model = load_model("./models/cos.h5")
infer(model, window=5, mode="words_cos")

----- Diversity: 0.0

----- Generating with seed:
"давайте рассмотрим два конкретных случая"

давайте рассмотрим два конкретных случая нн оно лепсо придите pcchownrestricted тестя неудачу оно vo оно лечь елдад щ оно vo нн некорректно онан vo постоянно иисус щ некорректно if сильнее struct сильнее vo нее иисус nй некорректно действительно елдад щ tsys hh нн постоянно мне 

----- Diversity: 0.2

----- Generating with seed:
"давайте рассмотрим два конкретных случая"

давайте рассмотрим два конкретных случая иаир некорректно ситуации нее иаир ирад enqueuemsgstruct оставьте rif тест щ ю между щ credstruct жителям щ елдад нужным иевусеев удивительно щ херувимов некто poll некорректно my приходят ресурса египтяне struct извне from тестя iff тест аргумента досталось аморреев неявно 

----- Diversity: 0.4

----- Generating with seed:
"давайте рассмотрим два конкретных случая"

давайте рассмотрим два конкретных случая иоав ipv ресурсы щ нетрудно иевусеев мудр controlb ситуаций щ интерпретацию юa

In [36]:
model = load_model("./models/char_lstm_under.h5")
infer(model, window=30, mode="char")

----- Diversity: 0.0

----- Generating with seed:
"socket предопределенное имя се"

socket предопределенное имя семафора . и сказал господь моисею говоря возьми себе и поставил их и сказал им и сказал им и сказал им и сказал им и сказал им и сказал им и сказал им и сказал им и сказал им и сказал им и сказал им и  

----- Diversity: 0.2

----- Generating with seed:
"socket предопределенное имя се"

socket предопределенное имя сесказал им и сказал сыны израилевы сыны израилевы и сказали ему и он сказал им и послал и положил их и пошли с ним и сказал им на себе который вы поставили его и сказал вот и послал сын мой и сказал ем 

----- Diversity: 0.4

----- Generating with seed:
"socket предопределенное имя се"

socket предопределенное имя сеу господь вознесет в нем и послал и возвратился и все земли вашей в который возьми в сердце его . например программа поддерживает файл поддерживаются в случае успеха в случае ошибки int flag . в проце 

----- Diversity: 0.6000000000000001

----- Genera

In [37]:
model = load_model("./models/char_bidirect_under.h5")
infer(model, window=30, mode="char")

----- Diversity: 0.0

----- Generating with seed:
"за описанием структур в system"

за описанием структур в system . и сказал ему сын израилевы и поставил их и сказал ему и сказал господь бог твой . и сказал ему и сказал господь бог твой . и сказал ему и сказал господь бог твой . и сказал ему и сказал господь бог 

----- Diversity: 0.2

----- Generating with seed:
"за описанием структур в system"

за описанием структур в system твой . и сказал ему исполняет и сказал ему в семь старом и сказал ему и на семь своем . и сказал ему семь свое свое при не создавал их . и возвратился в стана и пошли и сказал господь бог твой и сказ 

----- Diversity: 0.4

----- Generating with seed:
"за описанием структур в system"

за описанием структур в systemал господь бог твой . и положил собрание все дня вам есть возвращает из сигнала sigset и sigalrm из системы на реального времени запускаемого процесса . и сказал господь моисею своему . и пришли сыны  

----- Diversity: 0.6000000000000001

----- Genera

По этим результатам мне кажется лучше всего выбрать темепературу 0.4-0.6 и underfit модели на символах.

Функция, возвращающая сгенерированную моделью последовательность по входной последовательности:

In [33]:
def sample_sentences(model, sentence=None, mode="char", window=30, diversity=0.3, seq_len=200):
    '''
    Returns sequences of length seq_len for each diversity
    mode: {"char", "words_ce", "words_cos"}
    '''
    vocab = alphabet if mode == "char" else words
    
    if sentence is None:
        sentence = np.random.choice(np.concatenate([code_test, testament_test]), 1)[0]
    if mode == "char":
        sentence = " ".join(sentence)
        sentence = sentence[:window]
        start = [np.zeros_like(char_idx["."]).tolist()] * (window - len(sentence))
        start.extend([char_idx[ch] for ch in sentence])
    elif mode == "words_cos" or "words_ce":
#         sentence = [w for s in sentence for w in s][:window]
        start = [np.zeros_like(fast_text_model.wv["."])] * (window - len(sentence))
        start.extend([fast_text_model.wv[w] for w in sentence])
    
    res = '' if mode == "char" else []
    if seq_len is 200:
        seq_len = 200 if mode == "char" else 40
    for i in range(seq_len):

        preds = model.predict(np.array(start)[None, :, :], verbose=0)[0]

        # sample next word
        if mode == "char" or mode == "words_ce":
            next_index = sample(preds, diversity)
            next_word = vocab[next_index]
        elif mode == "words_cos":
            top_similar, probas = list(zip(*fast_text_model.wv.most_similar([preds])))
            next_word = top_similar[sample(probas, diversity)]

        # add next word to queue
        start = start[1:]
        if mode == "char":
            start.append(char_idx[next_word])
        elif mode == "words_ce" or mode == "words_cos":
            start.append(fast_text_model.wv[next_word])

        # add next word to result
        if mode == "char":
            res += next_word
        else:
            res.append(next_word)
    print(pformat(sentence + res))

Выберем несколько предложений из теста в качестве сидов.

In [42]:
code_s = np.random.choice(np.concatenate([code_test]), 5)
testament_s = np.random.choice(np.concatenate([testament_test]), 5)

In [43]:
print(*code_s)
print()
print(*testament_s)

['целью', 'этих', 'руководств', 'было', 'повышение', 'переносимости', 'прикладных', 'программ', 'которое', 'стало', 'возможным', 'благодаря', 'простому', 'следованию', 'опубликованным', 'стандартам', '.'] ['в', 'противном', 'случае', 'мы', 'изменяем', 'реальный', 'и', 'эффективный', 'идентификаторы', 'вызовом', 'функций', 'setgid', 'и', 'setuid', '.'] ['h', 'pidt', 'tcgetsidint', 'fd', '.'] ['предыстория', 'одной', 'из', 'популярных', 'библиотек', 'функций', 'для', 'работы', 'с', 'базами', 'данных', 'в', 'unix', 'является', 'библиотека', 'dbm', '.'] ['однако', 'файл', 'должен', 'существовать', 'если', 'другой', 'процесс', 'смог', 'установить', 'на', 'него', 'блокировку', '.']

['он', 'злословил', 'меня', 'тяжким', 'злословием', 'когда', 'я', 'шел', 'в', 'маханаим', '.'] ['мы', 'умертвим', 'их', 'и', 'искореним', 'зло', 'из', 'израиля', '.'] ['хотя', 'бы', 'до', 'полуцарства', 'она', 'будет', 'исполнена', '.'] ['аврам', 'послушался', 'слов', 'сары', '.'] ['иосиф', 'подвел', 'их', 'к', '

In [44]:
test_s = [
    ['но', 'мы', 'будем', 'исходить', 'из', 'предположения', 'что', 'вызывающий', 'процесс', 
     'просто', 'не', 'пожелал', 'сбрасывать', 'содержимое', 'буферов', '.'],
    ['выполнение', 'программ', 'командной', 'оболочкой', '.'],
    ['целью', 'этих', 'руководств', 'было', 'повышение', 'переносимости', 'прикладных', 'программ', 
     'которое', 'стало', 'возможным', 'благодаря', 'простому', 'следованию', 'опубликованным', 'стандартам', '.'],
    ['однако', 'файл', 'должен', 'существовать', 'если', 'другой', 'процесс', 'смог', 'установить', 'на', 'него', 'блокировку', '.'],
    
    ['не', 'ешь', 'с', 'нею', 'квасного', '.'],
    ['но', 'я', 'отрок', 'малый', 'не', 'знаю', 'ни', 'моего', 'выхода', 'ни', 'входа', '.'],
    ['в', 'шестой', 'же', 'день', 'собрали', 'хлеба', 'вдвое', 'по', 'два', 'гомора', 'на', 'каждого', '.'],
    ['он', 'злословил', 'меня', 'тяжким', 'злословием', 'когда', 'я', 'шел', 'в', 'маханаим', '.']
]

In [59]:
model = load_model("./models/char_lstm_under.h5")
for s in test_s:
    sent = []
    i = 0
    while len(" ".join(sent + [s[i]])) <= 30:
        sent.append(s[i])
        i += 1
        if i == len(s):
            break
    print(f"T=0.4")
    sample_sentences(model, sentence=sent, mode="char", window=30, diversity=0.4)
    print(f"T=0.6")
    sample_sentences(model, sentence=sent, mode="char", window=30, diversity=0.6)
    print()

T=0.4
но мы будем исходить из состояния может получить переменную от дочернего процесса . и возвратился и сказал господь бог твой . после вызова функции read в последнем случае не получает поддержку последнего изменения процесса 
T=0.6
но мы будем исходить из нового дочерей согрешили три против сие . и пришел иудей говорил ему и сказал по себе и все возможности и в момент командной оболочки . если же поставил его из народа который вы был о рукою своем с н

T=0.4
выполнение программ командной оболочки . h int pthreadrwlocktrlecpthreadbarrierattrt devtid . например вызывает поток при программе из листинга . и поставил господь поставил себе и послал его и все израильтяне в сердце своем и ск
T=0.6
выполнение программ командной оболочки которые приложения обычно обработать файл создаются самым приостановким передача такого случая и поддерживается это последние дескрипторы процесса . когда мы можем открыть пример открытия фа

T=0.4
целью этих руководств было создана поток и обработчик сигнал

In [60]:
model = load_model("./models/char_bidirect_under.h5")
for s in test_s:
    sent = []
    i = 0
    while len(" ".join(sent + [s[i]])) <= 30:
        sent.append(s[i])
        i += 1
        if i == len(s):
            break
    print(f"T=0.4")
    sample_sentences(model, sentence=sent, mode="char", window=30, diversity=0.4)
    print(f"T=0.6")
    sample_sentences(model, sentence=sent, mode="char", window=30, diversity=0.6)
    print()

T=0.4
но мы будем исходить из сигнала sigconf . и сказал ему вот становил господь бог твой и на после во все семь дней на него и сказал им не положил что бог твой . и сказал ему по отца моего и сказал господь бог твой он будет от
T=0.6
но мы будем исходить из пользователя . h с . возвращает в случае успеха код ошибки в случае успеха в случае ошибки int sigintint signo . реальный сигнал sigint или exec в этой сигналось над сигналом и не обработки поддержив

T=0.4
выполнение программ командной строки . функция poll выполняет передачи процесса . и послал господь моисею сказали им земля так тебе . при вызове функции signal и sigalrm . в случае успеха в случае ошибки int fd struct otemax stru
T=0.6
выполнение программ командной оболочки . такое использование одну как глава так против пророков и стана . в качестве пользователя в системе . тогда бог он все пред ним пользовательскому для над строки на рис . h с . возвращает в 

T=0.4
целью этих руководств было соответствующим и поддерживает пр

In [68]:
model = load_model("./models/char_lstm_under.h5")
sample_sentences(model, sentence="придумал бог алгоритм а он".split(), mode="char", window=30, diversity=0.6)

придумал бог алгоритм а они посвятил господь соединение и не определены на серверных случая . когда работает от меня в поля struct passwd fd . вызов функции system остановить возможность вернуться в данной потоке . обокнавальн


In [77]:
sample_sentences(model, sentence="придумал бог алгоритм а он".split(), mode="char", window=30, diversity=0.4)

придумал бог алгоритм а он принесет в египет . и послал им и возвратился сын его по стражу и простирал раба моего в семьдесят первых вершины . и сказал господь моисею говоря он поставил его . и сказал господь моисею говоря пос


In [71]:
sample_sentences(model, sentence="значение аргумента".split(), mode="char", window=30, diversity=0.6)

значение аргумента control вызывает read которая управляют левиты с тебя чтобы аарон и иерусалим в пустыне до разного пред себе . и сказал господь моисею вот я повелел ему и сыновья своего против бить и возврати службу


In [74]:
sample_sentences(model, sentence="если исходный текст".split(), mode="char", window=30, diversity=0.6)

если исходный текст . и отдал господь моисею с всех городах и стал был иерусалима и приносите их и сказал аарону и ты нам у своего одного на дом свой . и дай тебе стояли который принесли народ твой из дома их да это был


In [67]:
sample_sentences(model, sentence="вызов функции".split(), mode="char", window=30, diversity=0.6)

вызов функции setprintf а управляющий терминал является одной при процессе из системы которые можно изменить оба только в структуре функции wait . тогда сказал такого господь сделал и было дело его и не повелел ем
