In [1]:
! pip3 install transformers
! pip3 install datasets

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting transformers
  Downloading transformers-4.26.1-py3-none-any.whl (6.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m6.3/6.3 MB[0m [31m49.3 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting tokenizers!=0.11.3,<0.14,>=0.11.1
  Downloading tokenizers-0.13.2-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (7.6 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.6/7.6 MB[0m [31m49.6 MB/s[0m eta [36m0:00:00[0m
Collecting huggingface-hub<1.0,>=0.11.0
  Downloading huggingface_hub-0.12.1-py3-none-any.whl (190 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m190.3/190.3 KB[0m [31m7.1 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: tokenizers, huggingface-hub, transformers
Successfully installed huggingface-hub-0.12.1 tokenizers-0.13.2 transformers-4.26.1
Looking in indexes: https://pypi.org/simple, http

In [2]:
from google.colab import drive

drive.mount('/content/gdrive')

Mounted at /content/gdrive


In [3]:
from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM, TrainerCallback, TextDataset, DataCollatorForLanguageModeling, TrainingArguments, Trainer
import torch
from os.path import join


DEVICE='cuda'


def get_ru_model(checkpoint = "sberbank-ai/rugpt3small_based_on_gpt2"):
    model = AutoModelForCausalLM.from_pretrained(checkpoint).to(DEVICE)
    tokenizer = AutoTokenizer.from_pretrained(checkpoint)
    return model, tokenizer


def print_generations(prefix = ". ", n_samples=4, max_len=70, one_line=True):
    global model, tokenizer
    input_ids = tokenizer.encode(prefix, return_tensors='pt').to(DEVICE)
    sample_outputs = model.generate(
        input_ids,
        do_sample=True, 
        max_length=max_len, 
        top_k=50,
        top_p=0.90, 
        num_return_sequences=n_samples,
        pad_token_id=50256
    )
    for row in sample_outputs:
        text = tokenizer.decode(row)
        if one_line:
            text = text.split("\n")[0]
        print(text)


class PringSamplingCallback(TrainerCallback):
    def on_log(self, args, state, control, **kwargs):
        print("=====", "progress:", state.epoch, "=========")
        print_generations()
        print("==========================")


def freeze_layers(model, n_layers=8):
    assert (n_layers >=0) and (n_layers <= 12)
    to_freeze = (
        model.transformer.wte,
        model.transformer.wpe,
        model.transformer.drop,
        model.transformer.h[:n_layers]
    )
    for paramgroup in to_freeze:
        for param in paramgroup.parameters():
            param.requires_grad = False


def finetune(model, tokenizer, path, n_epochs="auto", adjust_to_size=5e6):
    if n_epochs == "auto":
        filesize = len(open(path).read())
        num_train_epochs = adjust_to_size / filesize
        print("SETTING N_EPOCHS TO ", num_train_epochs)
    else:
        num_train_epochs = n_epochs
    
    dataset = TextDataset(
        tokenizer = tokenizer,
        file_path = path,
        block_size = 256,
    )
    data_collator = DataCollatorForLanguageModeling(
        tokenizer=tokenizer, 
        mlm = False,
    )
    training_args = TrainingArguments(
        output_dir=".",
        overwrite_output_dir=False,
        per_device_train_batch_size=8,
        num_train_epochs=num_train_epochs,
        logging_steps=50,
        save_steps=500,
    )
    trainer = Trainer(
        model=model,
        args=training_args,
        data_collator=data_collator,
        train_dataset=dataset,
        callbacks=[PringSamplingCallback],
    )
    trainer.train()
    trainer.save_model()


COLAB_DATA_PATH = "/content/gdrive/MyDrive/datasets/"
OLDRU_PATH = join(COLAB_DATA_PATH, "oldrussian.txt")
DOST_PATH = join(COLAB_DATA_PATH, "dost.txt")
TOLST_PATH = join(COLAB_DATA_PATH, "tolst.txt")
LENIN_PATH = join(COLAB_DATA_PATH, "lenin.txt")

# Тексты на древнерусском языке

In [4]:
model, tokenizer = get_ru_model()
freeze_layers(model, 4)

Downloading (…)lve/main/config.json:   0%|          | 0.00/608 [00:00<?, ?B/s]

Downloading (…)"pytorch_model.bin";:   0%|          | 0.00/551M [00:00<?, ?B/s]

Downloading (…)olve/main/vocab.json:   0%|          | 0.00/1.71M [00:00<?, ?B/s]

Downloading (…)olve/main/merges.txt:   0%|          | 0.00/1.27M [00:00<?, ?B/s]

Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.


In [5]:
finetune(model, tokenizer, OLDRU_PATH)

SETTING N_EPOCHS TO  0.587214714943076


***** Running training *****
  Num examples = 11776
  Num Epochs = 1
  Instantaneous batch size per device = 8
  Total train batch size (w. parallel, distributed & accumulation) = 8
  Gradient Accumulation steps = 1
  Total optimization steps = 865
  Number of trainable parameters = 56704512


Step,Training Loss
50,4.4193
100,4.2914
150,4.2192
200,4.155
250,4.0967
300,4.0715
350,4.0767
400,4.0571
450,4.0598
500,4.0168


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Он же, видя что питием бо и от чадъя и от духовъ приимъ. о семъже поели со мною, и крѣпие дѣти въ церковь, а и прииде, и бысть съ пнемъ сь в церковь, и въ ней
.  Вѣрное же преставление, яко всѣм бо, якоже вѣдущие., възможенъ житию, тѣла и мысли, бысть, бѣяшшу, вѣтмо мѣсяца, и паки въздержанишися.
.  Когда же досточны и отчисто их сѣдили, и оных же съсоръзницъ наѣх и снѣкъ при нихъ, и отъ нихъ же съградоша съ нимиъ, и от нихъ же въ тъмъ же тъмъ же в
.  Он же от лица свѣта сьде на лѣта, и мѣськи постави, и от лѣта, и от тѣхъ, но и от нихъ. и яко въ ту ночь от нихъ къ царю и от царя к нему, и на то время къ его. 


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Въдѣть же несть ея въдѣхь, а сѣя, бо по тѣло, въздохъ. и ея же по прелъстве дыххъ, вниде в раку, и ея сребѣ дыхх, и дыххъ
.  И взалъкося, и взалъкъ, и тако, взалъкъ, и тако и заишашаша, и приѣхши, и и приѣхша, и огоша, и приѣхша, и приехша, и приехше,
. 
.  Вългаеже мѣны быша, и сшедше во всѣ монастыри, а инаше в него вздѣлишася. и се, нѣчюже, мнѣ и быша по монастырскому житию и по всѣмъъ псковскимъ м


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



. 
.  И вот, идѣже, измѣнився, но и вмѣнився, тако рече имъ: "кто не имеетъ того, не вѣстникъ, но иночестный?  вы льшишъся лишися лишишася, и с нами, такоже
.  Егда же он во вси, и не дастъ ему прилога. оть бяше сътворишися, и отьграх ся, и преведе от него и мя, и рече къ немцу, яко: «отъкы». онъ же убо не дасть
.  За симъгласите мьстеньствующу: "заблудитеся и погубите! не по нь си бѣ, но нынѣ!" и паки убо възложишися на тя. и оттуду не престаниша. и к тому приидоша,


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Пребнѣ бѣти по-прежнему, а наслѣдше въседѣй, аз же, въсиде въ единѣ, глаголюще с вами: «вѣдаете ли еси, да не буду се».  «кто се будетъ и речем, се и будетъ и
.  "аще бо нѣкааши", то азъ же, прияха къ игуму и вопроша: «о, игуменъ, что хощеть?" — игуменъ рече: «дани, иже у насъ есть», и глагола: «и не боши ми, о
.  И то бысть жѣ в мъстецѣ, а в том мѣсто — не бысть. да и ни в чем бысть: "не вѣду мѣсто на небо". убо бо есть в темнити многа и мѣсто на землю, яко в той земле сечеши,
.  И се нарекаше, яко: "о, что възможеши, о, что ми, о, что намъ не нападаше?" и бысть, и възможеши, о, что ми събѣшеть? како же се?


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  "всем же, убо дьрва, да не съзрѣшати иныя: ни убо ся, ни убо отъ меня; и нынѣ едина многа дѣла и многа чюдности и възращающа. сему жити, яко не ток
.  и рече: "не тужи, си си, не хужи, а яко хощеши и присно тебе. иже в лѣтѣхъ твоем, не молилъ Бога, а остави мя богъ, иже от рускаа, еже въси от начала и до низ
.  А иже въпроси, постави, уразуметь си, тако да просветлешися, присно разумѣ и о блаженный духъ, еже сътворяетъ единаго вѣрца и творятъ мнѣти о всѣхъ оныхъ; не убо, яко бы
.  и мнози бѣ воину въ тѣсѣхъ. аще же не учиняше всему, аще же онущешя, то отже се творящю вѣрѣ, такожде и всѣхъ: онущашуся, и егоже не могуша


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Яда же у негоъ не было, и вои на конныхъ и на зъ коней, не побѣжавшися от них, а иные в ту же вечерину по вся дни в келии своея молишящеся имъ. 
.  Вълѣзая по седому древнию мосту, узреть бо в землю остави и от златотка. он же с любовию своею святую икону святителя, яко святую его икону в лѣтъ своего мѣста, и оставиша икону его, иже в руцѣ
.  Онъ же, видя, яко не по себе, и не можѣся отъстояти от мене, то и не взимайся на дружины своих. и не обрѣтоша их и сею, в поле и в ратуши с сѣбѣхомъ и с дружины.  И
.  Аже о мнозе, в нейже нисми. оже мноза и яко нѣкый мздоимѣстникомъ своимъ былъ, но иже отлѣжникъ мноза и едина ему има, да яко бывъ борисѣи и рече: “


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  И тако на мясе и на зѣло, и тако на мясе и на зѣло и на ептарехъ и на въпихиихиихиша. и тако на мясе и на ептареху и на ептарех и на бяше,
.  Одурети бяш, не доставиши к отцу своих, в то время же, и на нь, отцем своимъ, и самъ злая, отъ брата своего, яко рать, и по вся дни не оти. самъ же. в том же лѣто 6345.
.  И рече ему: "сеи бо еси: аще хощеши на нѣтмо, да не отринут в землю си иже есть въсхотѣнии, то с тобою будеть земли его, аще и нынѣ быхъ былъ, отрину бых, да и
.  Они же, понеже, христовы дары разлучением пречистых и преславным преставлением во мнѣх причастию, и вѣры, и вѣры, и грѣх, и мьстицѣм. иже възбрало вѣры свое, и по


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  "въста бо есть до пѣнии поѣдъ". а въста, яко не по нозѣ пѣдѣти, и рече: «не хощу отиже въздѣ». тѣло то, слово рече, да не вѣдати, ни поть, ни
. 
.  И точию же убо зрѣти и приидоша к свѣту богу, и положити в церковь.  и оттоле, а в то же время съкрови его свѣтися от всѣхъ оныхъ, и глаголаше: «иисусе нашь,
. 


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  И паче убо изищу, и съзноваю, — глаголють. 
.  А ты у тя в китцѣ былъ. и все. а то у насъ толькы ничьныя оттуды и делися, а мы у тебѣ такъ и званъ былъ, не то не можеши, чего можеши сотворити. и не мы
.  Святый же апостолъ же от злата и от крестиславовъ уде и́ отъ злата в землю и от святаго свѣта и от сребро и славно, а от сребреника и от отроча, и от отроча, и отроча отрока и отрока
.  "уготовила нѣкого князя убо и възвести въ храмъ с нимъ и сядуща с нимъ с братомь", понеже и въспомянуся и моляся ему: "кы буди ти с нимъ? и поидѣмъ кы ему, но ему


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}





Saving model checkpoint to ./checkpoint-500
Configuration saved in ./checkpoint-500/config.json
Configuration saved in ./checkpoint-500/generation_config.json


.  Но, когда же от того бываша имаши божиимъ поити въ обитель и съдѣти бысть, и паки бысть тамъ.и по подобании въсхотѣ нирсиши имъ. и поставиша к тѣхъ же во обители и, оттом
.  И повелѣше даниллу на брань даниллу, и с нимъ со служби срѣтоша о себѣ, яко бо в домѣ своемъ онъ, нъ отлѣжи же ему сътворити. но змилостивь к великому князю и бояре своему да
.  Самъ же святый, по евангельскому образу, приступивъ с пастырскимъ руководствомъ и от пастырскихъ обязанностейъ к тому, како по многыя добродетели бысть ему приити к единому от них образу, не токмо исповеди, но и прилучи к нему, и так
.  Вѣсть и приять, и не имѣти на него греха, яко не не имѣти на его греховникъ, ни мѣсяць от бога възмѣшение, ни мѣсяць мѣсяць чрѣзьнѣцю. онъ не имѣть, ни


Model weights saved in ./checkpoint-500/pytorch_model.bin
Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Господь бо с намиъ начатъ, и не внидо ти. и тако тѣ же преставится с нами. и паки преставится от мертвых. и възможе богъ нась богъ на всяку болезнь, и възнесеться съ нами. не възможеши бо
.  Но аще есть въ церкви святаго отца нашего кирила и во святых отець сих, преподобне, и, яко богъ, аки зверь и человѣкъ, и въ своих святыхъ книгахъ писано бысть. аще бы кто и на томъ соборе во церкви бысть, ни во святыхъ отца
.  а аки олъ, яко и ти есть и во граде. аще бо не въсѣлѣ, не възлюбяще. аще бо, но вѣдай, но въставься. аще бо есть, но вѣре, не бываеши. аще бо, то
.  В день святой богородица не остави, и в молитвах оных не впадоши.  отнищи же тогда своя рука от друзии его, и в снѣ уподобихся от нихъ, и не преклонися ницѣ, но предаше ихъ господеви и на молитву


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  "не можетъ бо ся зрѣти, якоъ такоже и в домѣ своемъ пребывати. и от того, что по всей
.  И тое и другое не повѣсть инея, иже и въ лѣто прииде вси, да не сътвори. и, слышав, князь великий, егоже князь тысяцкий, со всѣми своими рать, и мнози с нимиъ, и рѣхомъ, и
.  Тогда же, по сему повѣдаша сице: и дасть имъ бѣ дѣти, иже уразумѣвше, отиде к нимъ, и възвратишася къ нимъ. имѣя бо ихъ нѣколико дѣти и вънидуше
.  Да и не только, а иныя есть в чюдесе. а ты, яко быти, не уведе есмо, но с прочими святыми по вся дни по сребрянымъ имѣниа. а о хвале, есмо, — какоже умыслиши, или како


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  И повелѣша убо царю царю: "о, царь, крѣпкими вѣры, яко и многа лета вѣтрамъ, и яко мнѣ азъ мняше имаши от вас и до сихъ, но от сихъ, не извольте от вас, ни от иных
.  О немъже имѣти крѣпкого вѣстника и побѣдоша его от него. и не дасть ему корина или мниху. тот же корин, вѣрже ему в себѣ, нача ему со всяцѣй руской земли и и с руси со
.  Пьех и рѣховъ, нѣкы же зѣяниих, бѣхъ неистовъ, и отнидохъ, яко нѣколико вси зѣи. да будеть имамъ боиваа и воставь. воскресь и приди,
.  Приложи же к руцѣ и не возможе ли не дати мнѣ мѣда? и ничиюже мнѣ есмы не имамъ, ни мѣста не быти и не можеши дати мѣста. и не можеши ли хощетъ? и вѣ


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  А в мѣсто то есть на руцѣ сѣдлех и на горах, и аки сѣдлех сѣдлехъ. но александръ, великий и любимый, от него коида же приатти? александръ же самъ рече: «я
.  Тако же и на манастырь, и на павловъ, и на отьцѣ, и на змия, и на дьруг, и на христа ради, и на пресвятую троицу. по сих же внидохъ, яко и нѣкто бысть, глаг
.  Приидоша же князи, зръдъ и прасть, прииде в раи на себѣ, и рекоша ему: «брате и нь, и тъ не ослугайте евы. и азъ ослушаюся и не ослушаюся. и не ослу
.  И крѣпко рече мне: "не можеши, отче". и пристави ми руку, а онъ рекоти тако и не прииму, не имати. аз же рече ему: "не можеши, отче, тое възъевати кѣмо, да


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



. 
.  Оттого же сего, когда и я вѣду, но и понеже нѣчто от ина дѣлеся с нимъ с нимь дѣлующем и многа има, аще бѣло, но егда бо бывъ на ипѣ и тъчашеся,
.  Сийъ, глаголетъ, что, и мы, имаи, его не хотящю.
.  "и паки сподобся, и вѣдаше, яко мѣсто есть — святый камени. не постой ми во всем, ни в чемже вѣрою и нечестиаго, ни в чемже, но и вѣрова и разумѣва". и тогда святый апостолъ рече


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Александръ же не инако глаголеть: "молися о ней, а не молить о ней". и рече влѣсникъ: "но се убо приидетъ съ нами, да поиде, — и прииде, и от насъ от насъ отвѣщеть".
.  а с нѣмцем и съ слезами, и со слезами, и со слезами, и со слезами, и с молитвами. а с нѣмцем и слезами, и со слезами, и с слезами, и со слезами, и с слезами, и со слезами, и со слезами, и со слезами, и со слезами,
. 
.  И те же, и те же, да и по два-три в год с половецкой войны воеводы его. и до сего времени воеводы наших да на три стороны в осаду его бяше, да по два-три раза по двадцать. и от сего времени воева быш я, яко нѣкох


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  А также до вечера, понеже възвещаю, и в немь будуть, аще ли въмьчь, тогда имѣемъ внидоша въ кыевъ. от нихъ же и доиде в цесарьскиа, на то же время убо не преже вси
.  аще есть в чем не тѣмо, аще же есть, но есть в чем, и се сътворити възбратиша, якоже и до сихъ. точию и въ всѣхъ еси. аще же есть, или не въста еси; вѣдаеши ли
.  Яже есть по земли, и в ней есть мѣсто, и мѣсто, иже елли его отьця, и съмь, якоже елли, в нейже, бѣса, и даждь и до гроба вниди. и се есть мѣсто, и в
.  И на свѣтѣ вѣмъ вѣрѣхъ имѣя, тако иже, иже въ мѣсту христосъ, яко не вървутъ тѣло, не възвысятъ от земли, на землю, не възъгохомъ, не




Training completed. Do not forget to share your model on huggingface.co/models =)


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Да, рече о них, яко многа к нимъ приити. се бо имѣния.  и приидоша ко граду. и пришедша ко граду крѣпцы, и взиде на мѣсто имаша, и приидоша к граду; и поставиша городъ и
.  И в томъ часѣ не быша от мала, ни великаго чюдеса. и на томъ часѣ не бысть. и на томъ часѣ не бысть. 
. 
.  и тако възрасту въ блаженной,


Saving model checkpoint to .
Configuration saved in ./config.json
Configuration saved in ./generation_config.json
Model weights saved in ./pytorch_model.bin


In [6]:
print_generations(prefix="самое главное это", max_len=200)

Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



самое главное это вѣрие,
самое главное это воя, а иежеи внидуще в немъ.
самое главное это слово». иже от того времени ина единаго, якоже от бога о сем есть, иже и сам бог да не возненавидят, да и не возненавидят.
самое главное это


In [7]:
print_generations(prefix="зачем", max_len=200)

Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



зачем и кто и как? не измѣютъ, да и какъ будетъ, не знают, а кто и какъ будетъ, а кто и какъ будетъ, а кто и какъ будутъ, то не ведаютъ.
зачемъ сѣче его на пути, сыйже въ агианѣ, и иже поставиши на пути его». и, не въздержавши, паки внидоша и сѣче сѣче на пути его, и иже постави его на пути его, и паки положити его на пути его и спяти ему от него, аки въсконь его питися. и тако прииде вѣтренъ, и дошед до земли, овии же, паче всехъ своих, и рече: «время, отьцю. тако и вы, отче, на земле живя, каяйтесь и молим тя. да будеши ны». и бывъши сѣчу, приидох до земли, и рече, — глаголаше господь: «видѣх васъ, въздаша ми тя». и пре
зачемъ, но, аще убоится имѣния, имѣющу бога вѣра его. вѣрь ми велика, в нейже азъ от него, яко ничию же и мняше, ни сѣдою, ни сѣднаго, яко богъ, сътворять. яко же не от бога, а от бога от бога и отъ
зачем ми, яко же быти, или, яко не хотѣл быти, тако и быти ми не вѣмь, и тѣмь жити на мѣстехъ.


In [8]:
print_generations(prefix="когда", max_len=200)

Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



когда от нее, оже глаголаше, оже глаголѣти: «съдѣте на небо и повѣдайте, яко дѣло и воля ваша суть, егоже бо есть богъ. и възбранно и христолюбезное его есть иже есть есмы, оже не вѣру от насъ творяху, ни единому другому же с вами не обрѣтуя. да аще бо вамъ чего имать на небо и повѣдати, не хто ли ми вѣдаю вамь и есмы, аще бо вамъ о томъ есмы, и не хто ли ми вѣжду?».
когда онъ же сядя и рече к ней: «видѣ, брате, что нѣсть поѣда в той градѣ и нѣ что есть въ немъ? или нѣкогда? и есть ли у тебя вѣсты, а у насъ съ тобою вѣстники и дѣла дѣяти и дѣлати, и дѣлати есть приати въ рускыихъ городѣхъ? и не смѣемъ ити. и аще и нѣсмь кто достоитъ на немъ, то, брате, от насъ мняшть с собою крѣпкие дѣли». она же оттудяше и повѣда ему, како есть и каковы дѣти, а самъ приати в русь, а самъ въ русь. и оттуду же бѣше у нее в русь. она же убо,
когда у нас много народу, от вас много и ты, не жалей о нем, а ты молиши бога и нас, чтобы тебя и нас на мя не обижали! а ты, брат, ни у кого не бѣдай, а у нас мало,

# Собрание сочинений Достоевского

In [9]:
model, tokenizer = get_ru_model()
freeze_layers(model, 8)
finetune(model, tokenizer, DOST_PATH)

loading configuration file config.json from cache at /root/.cache/huggingface/hub/models--sberbank-ai--rugpt3small_based_on_gpt2/snapshots/f2f7c585b05a16726efe8974586e10b4d5939082/config.json
Model config GPT2Config {
  "_name_or_path": "sberbank-ai/rugpt3small_based_on_gpt2",
  "activation_function": "gelu_new",
  "architectures": [
    "GPT2LMHeadModel"
  ],
  "attn_pdrop": 0.1,
  "bos_token_id": 50256,
  "embd_pdrop": 0.1,
  "eos_token_id": 50256,
  "gradient_checkpointing": false,
  "initializer_range": 0.02,
  "layer_norm_epsilon": 1e-05,
  "model_type": "gpt2",
  "n_ctx": 2048,
  "n_embd": 768,
  "n_head": 12,
  "n_inner": null,
  "n_layer": 12,
  "n_positions": 2048,
  "reorder_and_upcast_attn": false,
  "resid_pdrop": 0.1,
  "scale_attn_by_inverse_layer_idx": false,
  "scale_attn_weights": true,
  "summary_activation": null,
  "summary_first_dropout": 0.1,
  "summary_proj_to_labels": true,
  "summary_type": "cls_index",
  "summary_use_proj": true,
  "transformers_version": "4.2

SETTING N_EPOCHS TO  0.34442475176791504


Loading features from cached file /content/gdrive/MyDrive/datasets/cached_lm_GPT2TokenizerFast_256_dost.txt [took 0.940 s]
PyTorch: setting up devices
The default value for the training argument `--report_to` will change in v5 (from all installed integrations to none). In v5, you will need to use `--report_to all` to get the same behavior as now. You should start updating your code and make this info disappear :-).
***** Running training *****
  Num examples = 14590
  Num Epochs = 1
  Instantaneous batch size per device = 8
  Total train batch size (w. parallel, distributed & accumulation) = 8
  Gradient Accumulation steps = 1
  Total optimization steps = 629
  Number of trainable parameters = 28353024


Step,Training Loss
50,3.6617
100,3.6379
150,3.6345
200,3.5787
250,3.5895
300,3.5795
350,3.5626
400,3.5493
450,3.5422
500,3.5709


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Он, по крайней мере, понял, что с ним делают. – Он уже хотел было сказать, что с этой женщины – хоть это и было для него все же… то есть, видимо, потому что она была почти что и так не такой, как была. 
.  В его глазах читалось много, в том числе и сожаление, о том, что даже несмотря на это, не мог он и мечтать быть рядом с ним.  Они оба были в этом единении, но как часто он в последний раз оборачивался!  Даже в глазах его и его сестры не было сожаления или сожалений. 
.  Когда же дотащила его до кровати, он с негодованием, и даже со страхом отшатнулся от нее, посмотрел на нее и не нашел ответа.  Что касается ее, то теперь она поняла. 
.  Он сказал, что он не сможет жить без нее.  Мне он обещал передать это в письменном виде, но он не верит.  Что за письмо от тебя он получил?  Неужели ты, наконец, веришь?  И если веришь в то, что он может умереть, так не умирай, а прими его как дар. 


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  В этот период еще в XVIII веке была в моде маскарад.  Но ее заменили шляпа и платье с пышной, пышной головой и длинными ногами.  С помощью маскарадных масок были преобразованы даже самые знаменитые в истории Франции маскарады. 
.  И если бы вы с таким удовольствием и как следует и, особенно, с удовольствием, принялись за свое дело, то вполне могли бы и потерпеть в этом отношении неудачу. 
. 
.  В таком случае в суд приходит еще несколько тысяч граждан России, но они не могут решить, кто задает вопрос: так ли все это было в действительности, и как они поступили бы в случае какого-нибудь скандала.  Вот и получается, что по сути дела, все, что здесь описано, уже давно придумано и опубликовано: "С


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Он говорил, что это для него и есть самое лучшее: все его любят, а сам он очень счастлив и все ему прощают. — Вы мне о всех обо всем говорили? — спросил я в первый раз. 
.  Все три недели я так же, как и прежде, ходила туда.  Каждый день в школе я была так же как и всегда, с каким-то лихорадочным любопытством.  И если меня особенно интересовал учитель, то, может быть, еще и потому, что я уже к тому привыкла.  Я так же часто, как и
.  При этом Вы можете написать мне, о каком письме вы просили бы написать.  Для писем о том, что Вы хотите от меня, пишите мне.  Я сама иногда не умею писать.  В письмах, написанных в эту пору, не осталось и следа моего письма.  Я теперь пишу письмо исключительно для своего наслаждения.  Я не
.  Ну и вот... 


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Если вдруг она спросит, если вдруг будет в чем упрекнуть, то это в самую минуту.  Так что вы даже не можете себе представить, как она могла прийти сюда и с вами разговаривать, даже не видя меня.  Даже при первом же упоминании имени, вы бы заметили, что она начала говорить.  Это она сама и
.  Все вы знаете об этой трагедии, я также был свидетелем. Но все равно я чувствовал, что вы говорите обо мне. Все это очень похоже на правду. Вы сказали, что все вы видели меня, но я не помню, кто, кажется, видел вас. Вы говорили, что видели меня. Если же вы не знали, зачем я приходил
.  В этом смысле он был весьма похож на всех, кого я когда-нибудь знал и о которых слышал, но, в отличие от многих, он был более-менее порядочным и не совсем умелым человеком.  Мне было ясно только одно: он не знал о том, что он нанял меня и что это на него с таким настро
.  И только на то время, когда он в третий раз, как он уже не мог поверить, но все еще не веря, как он тогда не был в силах поверить и не мог, и не

Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Из всего сказанного мною следует, что в таком случае я буду говорить не об одном лице и не о роде в целом, а как о совокупности лиц, которым должно быть поручено мое поручение о составлении и отправлении в тюрьму человека, назначенного в моем ведомстве, по смерти которого была произведена ужасная казнь в отношении того, который, несомненно,
.  Во всяком случае, я помню, как именно он мне вручил ему это письмо.  Он был так взволнован, что уже и не помню точно, кто он, – я помню, он, не помню, что его лицо, его лицо было удивительно неподвижное и какое-то грустное, – но точно какое-то лицо
.  Я и сам могу в этих делах разобраться.  Пришла в такое расстройство; как это там я могу, при свете дня и при свете дня, по собственной милости, при одном только моем сердце?  Вот ты, я знаю, что тебя не обманешь! – перебил его Илюша. 
.  Все это хорошо, но почему-то я не знаю, как это сказать; но то, что я сказал, было что-то вроде "милость моя, что это такое, если я так тебя хочу". 


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Я думаю, все эти люди не на одно дело учились, на одни и те же задачи.  По крайней мере, в моей семье.  И, несмотря на то, что многие из нас не могут жить, как я, они с этим, я думаю, живут.  Ведь в наше время, не знаю почему, все так по
.  В этой же ситуации, но при еще большей силе и при более резком движении, но уже и более быстром и более медленном продвижении, но в более резком падении, так что в этих случаях она, в свою очередь, сама в свою очередь, не удержится и остановится, и тогда уже, даже и не разобравшись
.  Он был в это время один и даже без отца.  Но, во-первых, он не только был одним из них, но и даже в этом случае, был еще одним.  Это был тот еще, и если бы он мог иметь и двух сынов, то с одним из них он бы никогда не решился уже идти на преступление,
.  А если вы пришли из России в Америку и начали смотреть на наши денежки и на нашу землю, то это совсем другой народ, совершенно иной язык и совершенно иной образ жизни! 


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  И если в том, что я не могу назвать еще одним словом, может показаться странным и неправильным, то в этом отношении я, как уже говорилось, еще более чем могу быть довольно доволен.– Сударь, может быть, это какое-то преувеличение, и, может быть, не только преувеличение, но и какое-то
.  О!  Теперь я понимаю, зачем мне нужен этот весь этот дом с его надменными и насмешливыми лицами, которые, впрочем, на редкость и часто раздражают других людей, так? 
.  И, наконец, он был в это в то же время ужасно доволен собой, был как будто в каком-то состоянии. 
.  Они все, конечно, помнят, какие у нас в городе хорошие дворники, но все же… 


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Здесь я только что прочла, что он за птица: 
.  Как только с нею познакомился, а я не знаю, на что годитесь, так и не решилась ее принять; так и сказала ей: "Я вас только к одному приглашу, а вы меня не примете".  Она согласилась; я с ней не соглашалась.  Вот я и говорю: "Я вас одного из вас пригла
.  С этой точки зрения можно предположить, что и для "великого князя" было более выгодно как раз то, что ему в этот день предстояло явиться именно на богомолье.  "На богомолье же, – добавил он, – я был бы рад". Тут же прибавил:
.  Если уж вы любите, то вам пора знать, что для вас в этом доме лучше всего. – Я бы еще в этом доме жил, и это хорошо; – Вот он, мой дом. 


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  И мы, все как один, все из них, и все мы, все вместе… Но ведь так хочется, что уж я, пожалуй, могу с ним спорить… – вскинулся Иван Петрович, не слушая, впрочем, ни одного жеста, в котором и он, и все собравшиеся в зале были убеждены; но они слышали
.  У нас есть возможность в вашей игре играть в любом виде. 
.  Он, как и всякий человек, очень похож на своего предшественника; но я думал, что он уж слишком умник.  Я не мог его понять: то ли он совсем не глуп, то ли он действительно не в своем уме.  Я был убежден, что он сумасшедший. 
.  Вышлите же Вы мне их на дом.  Я их очень прошу, умоляю, и очень умоляю. 


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}





Saving model checkpoint to ./checkpoint-500
Configuration saved in ./checkpoint-500/config.json
Configuration saved in ./checkpoint-500/generation_config.json


.  Но, когда-нибудь, в эти дни и минуты я расскажу тебе один пример. Он был очень подробно рассказано и не было каких-то особенных подробностей, никаких пояснений.  В то же самое время он был так же подробно записан и несколько, особенно, когда я в последний раз его читал, во весь роман, 
.  И, наконец, в этот день у Петра Алексеевича был свой собственный день.  По-настоящему он с утра собирался идти к портному, чтобы в последний раз показать свою рукопись.  Но в этот час он должен был быть у портного.  "Я не могу, - подумал Петр Алексеевич, - ведь здесь не так, как
.  О том, как на этом же самом месте в тот же самый день, ровно с полчаса назад, я и подумал.Попробовал на свою голову: "Почему?"  Нет, не потому, что я чего-то не понял, не оттого, что не знал, и не оттого, что не понимал, и не потому, что
.  В "Брюсселя" же, несмотря на все свойственное его особому пристрастию и даже в его убеждении, на этот счет даже не думали, и, вероятно, сами чувствовали, что, если бы не я, и вообще н

Model weights saved in ./checkpoint-500/pytorch_model.bin
Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  И мы с ним тоже на минутку, как будто бы в самом деле расстались.– И как-то же мы с ним так расстались? – спросила Соня, глядя на него, с невыразимым ужасом смотрящего в глаза.  Но он все еще ждал, что вот-вот скажет, но не мог начать.– Он меня не любит
.  Но не все они были такие и уж, конечно, в сущности и не все так уж и плохо.  Вот, например, к примеру, в "Крестителе" есть такой эпизод, который я знаю как раз до того, как в нашем театре появился первый герой.  Он не случайно был убит, он действительно убит, как я
.  Это же самый лучший! – сказал Алик. 
.  В начале своего пути я не мог решить, зачем и почему я приехал сюда в такой дорогой и не такой счастливый день.  Я думал – потому что я люблю быть в курсе и, наконец, мне, возможно, не хочется быть таким, как я. Но в эти минуты мои мечты о моей скорой и неотложной поездке к вам на родину


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  В начале тридцатых годов в это же самое время, в сороковых, к великому удовольствию немцев, в Петербурге было уже много и в то же самое время много всего.  К этой теме, в том же году, при жизни моего друга, который был в ссылке, о которых сейчас уже очень и очень хорошо известно, принадлежал он,
.  Все-таки надо дать ему время и пройти через это.  А если и пропустим, то зачем нам в это дело вся эта грязь, чтобы потом не идти к нему, чтобы не быть ему не на своих же ногах, а к другому человеку, к чему, к чему идти с такой грязью?  Вот и получается что-то
.  В этих словах, с виду как будто наигранная улыбка и все-таки в лице была улыбка, была какая-то странная, удивительная, почти до отвращения простая, в общем-то, и в то же время была какая-то необыкновенная, странная, словно бы какая-то волшебная. 
.  Да и вообще, я в таком смысле не вожусь, – сказал он. – Вот мне кажется, у вас есть один очень серьезный и очень важный вопрос.




Training completed. Do not forget to share your model on huggingface.co/models =)


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Мне показалось, что тут какое-то что-то было другое.  И в особенности, что-то не похожее на правду. 
.  И хотя, по сути своей, она не была похожа ни на какую другую женщину; но что-то во взгляде, взгляде, в выражении глаз, в каждом движении этого лица, в каждом движении его головы и в каждом движении этих движений было что-то странное.  Оно как будто не отличалось от обыкновенных людей ни в чем.
.  Огородная часть, как всегда, довольно своеобразна.  В основном это дома крестьян.  Захоронения же можно наблюдать за частными, на случай, если вы проживаете в другой деревне.  Сходные деревянные строения тоже вполне могут быть похожи на дворы крестьян.  В этих местах есть еще и сельские избы,
.  По окончании работы необходимо сообщить в комиссию по делам несовершеннолетних, и тогда уже и мы сами будем в полном порядке и совершенно по закону. 


Saving model checkpoint to .
Configuration saved in ./config.json
Configuration saved in ./generation_config.json
Model weights saved in ./pytorch_model.bin


In [10]:
print_generations(prefix=". Самое главное это", max_len=200)

Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



. Самое главное это – чтоб все-таки и в ту же минуту не случилось. «Нет, – подумал Павел Павлович, – он не может быть в эту минуту так бессилен, что не смеет переступить через себя». Он подошел к кровати и стал в изголовье, как бы обдумывая какое-то решение. Он не знал, в какую сторону броситься, чтоб не только убежать, но и спастись. Он уже приготовился бежать, но как будто бы вдруг как бы что-то изменилось, что-то исчезло в нем. Что это было? Почему он вдруг опять ничего не видит? Что он видел?
. Самое главное это не в том, что это будет, это не то, что это будет; а именно в том, что я уже говорил, то, чего я не могу сказать. В том, что я еще не знаю, что это будет. Но, может быть, и в том, что я это все понимаю, и если я не говорю этого, это, вероятно, не есть, но то, что я говорю, если я не говорю этого, я все-таки говорю это. Это было бы слишком неубедительно, потому что я и так знаю все, но ведь и так было бы довольно, даже слишком легко и просто; ибо как человек, который много з

In [11]:
print_generations(prefix="В 2024 году", max_len=200)

Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



В 2024 году (в связи с «Сонмами») был произведен ремонт дома на Рублёвке, но не в здании, а в частном доме на Старом Арбате. Не знаю почему, да и зачем так делать, у меня в том же доме ремонт был, а я и не помню его, так что это скорее к слову… А до тех пор было дело, и я не знаю как в этот дом попасть.
В 2024 году в России по предложению В. И. Ленина в письме к одному из знакомых в Москве «о новых вещах», он был поставлен в один ряд с представителями духовенства и с некоторыми из приближенных, бывших еще в то время членами правительства, с некоторыми из которых он и сам встречался иногда, например, еще в Петербурге. В письмах к В. И.
В 2024 году, после смерти графа Разумовского, этот молодой человек в своем кабинете, над письменным столом, продолжал писать. Так как же мог он так много писать, то, конечно, не мог не подумать, что его непременно убьют. Он так и сказал вслух, что он и есть убийца и убийца.
В 2024 году этот период становится для крестьянским юношей самым трудным. Он еще н

In [12]:
print_generations(prefix="Больше всего на свете я", max_len=200)

Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



Больше всего на свете я ее боюсь, – отвечала она тихо и нежно. – Я в нее хочу превратиться и стать ее матерью. И я в это верю, потому что… я… Я, наконец, она, я… я… Я…
Больше всего на свете я хотела быть его… как будто это так и было. Убить…
Больше всего на свете я в восторге! Это было одно из моих самых счастливых воспоминаний! Я была в восторге. Она была счастлива, в восторге и даже, кажется, чуть в слезы не билась, но я чувствовала, что она плачет. Когда она выходила, она уже была в волнении. У меня были дрожки в коленях. Как мне хотелось ее поцеловать, но она сама мне все целовала, а я только в недоумении глядела на нее… Она целовала меня во весь рот, потом вдруг, в порыве благодарности, стала ее целовать, целовать на глазах ее блестели слезы, и так она в упоении целовала меня всю ночь! – И она покраснела.
Больше всего на свете я ненавидел эти деньги. В тот же вечер я принес эту вещь. Я положил ее на стол, положил, открыл… я взял ее… и, клянусь, мне показалось… показалось, что я… в

Собрание сочинений Толстого

In [13]:
model, tokenizer = get_ru_model()
freeze_layers(model, 8)
finetune(model, tokenizer, TOLST_PATH)

loading configuration file config.json from cache at /root/.cache/huggingface/hub/models--sberbank-ai--rugpt3small_based_on_gpt2/snapshots/f2f7c585b05a16726efe8974586e10b4d5939082/config.json
Model config GPT2Config {
  "_name_or_path": "sberbank-ai/rugpt3small_based_on_gpt2",
  "activation_function": "gelu_new",
  "architectures": [
    "GPT2LMHeadModel"
  ],
  "attn_pdrop": 0.1,
  "bos_token_id": 50256,
  "embd_pdrop": 0.1,
  "eos_token_id": 50256,
  "gradient_checkpointing": false,
  "initializer_range": 0.02,
  "layer_norm_epsilon": 1e-05,
  "model_type": "gpt2",
  "n_ctx": 2048,
  "n_embd": 768,
  "n_head": 12,
  "n_inner": null,
  "n_layer": 12,
  "n_positions": 2048,
  "reorder_and_upcast_attn": false,
  "resid_pdrop": 0.1,
  "scale_attn_by_inverse_layer_idx": false,
  "scale_attn_weights": true,
  "summary_activation": null,
  "summary_first_dropout": 0.1,
  "summary_proj_to_labels": true,
  "summary_type": "cls_index",
  "summary_use_proj": true,
  "transformers_version": "4.2

SETTING N_EPOCHS TO  0.8218274747444199


Loading features from cached file /content/gdrive/MyDrive/datasets/cached_lm_GPT2TokenizerFast_256_tolst.txt [took 0.704 s]
PyTorch: setting up devices
The default value for the training argument `--report_to` will change in v5 (from all installed integrations to none). In v5, you will need to use `--report_to all` to get the same behavior as now. You should start updating your code and make this info disappear :-).
***** Running training *****
  Num examples = 6018
  Num Epochs = 1
  Instantaneous batch size per device = 8
  Total train batch size (w. parallel, distributed & accumulation) = 8
  Gradient Accumulation steps = 1
  Total optimization steps = 619
  Number of trainable parameters = 28353024


Step,Training Loss
50,3.5064
100,3.4464
150,3.4331
200,3.4262
250,3.3905
300,3.4336
350,3.3588
400,3.3833
450,3.374
500,3.3648


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Он, по своему внутреннему убеждению, и не хотел быть на стороне.  Он просто не мог допустить того, что, по его мнению, он все же имел то, что имел. 
.  В зависимости от характера проблемы мы можем получить очень интересные и оригинальные предложения, которые заставят вас задуматься о развитии, работе, карьерной и личной жизни. 
.  Когда она была у нее, он, как он знал, не мог заставить ее взять ее.  Он чувствовал, что ее сердце разрывается от любви.  Что она знала, что ей хочется его. 
.  Он сказал, что он не сможет жить без нее.  Мне он не нужен. 


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  В Москве в декабре этого года не было дождя.  Мы уже привыкли к этому, как к новому, что по утрам, приехав на базар, мы слышим: "Поезжайте на базар, а завтра – обратно в Москву!"  А если дождь все-таки начался, то мы не слышим, как ехали назад. 
.  И если бы вы с ними, и они с вами, вы были бы так счастливы, что в этой жизни так просто не поймете своих страданий. 
. 
.  В нем не только в самом начале, но и на протяжении всего этого времени был и его руководитель — генерал-майор граф Алексей Дмитриевич Рогов.  В этом издании есть также его автографы, но только, по словам того же Кити, при нем. 


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Он говорил, что это для того, чтобы показать ему, как его любит княгиня Ольга, и чтобы он не забывал ее и в доме ее.  И он не забывал, как хорошо чувствовал ее. 
.  После того, как мы все сели за стол и я, как мне показалось, чувствовал себя в новой жизни так же хорошо, как мы с Тосиным, я чувствовал себя по-новому: чувствовал себя так, как чувствовал себя в свое время и я. А когда я ехал к Тосиным, я так же чувствовал себя так же
.  При этом многие знакомые уже видели, как я езжу на своем скутере. – говорит Наталья, — когда-то в нашем дворе была очень простая деревянная скамейка для собак, и собаки его боялись.  А сейчас, если собака будет одна, то, значит, будет много собак.  Мы всегда ждем, когда придут друзья. 
.  После чего все были отправлены в штаб-квартиру. 


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Пребывая в нем, человек невольно соприкасается с жизнью и чувствами других людей, с своими поступками, чувствами, понятиями, понятиями, понятиями, идеями и убеждениями.  Но в человеке, в глубине души стремившемся жить своим умом, в нем нет никаких этих духовных ориентиров.  Напротив, именно в человеке,
.  Все вы знаете, что это такое, вы – моя подруга, которую я хочу видеть, но вы – не жена.  Как вы могли догадаться, что я буду жить с одной женщиной, которая, с вашего слова, мне изменила, и вы можете считать меня сумасшедшим.  Вы не понимаете этого, но не понимаю.  И вот
.  В этом смысле то, что я такою дорогой шла, я была бы счастлива и не была бы дурой, которая, взявшись за шпагу, шпажет, так и не сделала того, что я могла, я была бы счастливой.– Так ли это? – сказал он, отвечая, – но это неправда.  Я не
.  И только на то время, когда он будет лежать без движения в земле, а не после убийства, можно считать, что он не мертв, не был ранен, как и все, что осталось от тела.


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Из-за этого, у меня нет возможности ходить на работу. 
.  Все эти планы можно охарактеризовать так: в начале сентября, как говорится, не было ни одного дня.  Из пяти пунктов и двух (из которых один касается армии) было три.  И, не теряя времени даром, мы начали, как говорится, настраивать себя на то, что будет сделано. 
.  Я знал, что она все так умеет, и у меня в душе не было сомнений, что в ее взгляде, при воспоминании об этой минутной слабости, она не могла ничего сказать. 
.  Все это хорошо, но почему-то я не знаю, как быть.  Как понять, что я – девушка?  А, что я – не девушка, что я – пустое место?  Неужели я не понимаю, что значит "понимаю", и что значит: "я – не девушка"?  Я – не девушка, я


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Я думаю, все эти люди не могут быть так, чтобы быть вместе, как и должны быть вместе.  Они не только не были вместе со мною, но как будто были вместе со мной.  Я думаю, что я тоже был частью чего-то другого. 
.  Влияние на это влияние и привело ее к тому, чтобы начать движение к единству. 
.  Он чувствовал, что он был занят мыслями, и вдруг почувствовал, что он не в том расположении духа.  Он вспомнил и то, что случилось в этом доме.  Вспомнил, как все смеялись над ним, и вспомнил его слова: "Какое милое создание!" — и снова представил себе его улыбку, взгляд, когда он обратился
.  А если вы хотите, чтобы в нашем обществе не было ничего, чего нельзя было бы делать, то подумайте, почему бы вам не заняться тем, что есть у вас?  Что вы хотите, чего вы хотите в мире – то, что вы можете сделать? 


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



. 
.  О!  Теперь я понимаю, зачем мне нужен этот новый мир, как только можно его покинуть?  Ты говоришь о новом мире. [Г]
.  И, чувствуя себя обманутым и оскорбленным этим, в то же время, был уверен, что положение его будет так же благолепно и легко, как и всегда. 
.  Они были, очень милые люди, и, наверное, самые счастливые, честные и всесильные люди на свете, которые так нуждаются и рады.  Эти благородные люди хотели бы, чтобы все было отлично, чтобы все было красиво, чтобы все любили и были любимы.  И все это, а также все это для того, чтобы


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Здесь надо только заметить, что здесь нет никакой необходимости в том, чтобы как можно скорее, в одну сторону смотреть, как приедем, так и будем.  А приедем мы тогда, потому что все будет готово.  Все будет готово и по законам, и по закону.  А главное, что будет то же самое, что и
.  Как только с нею познакомился, ей стало легче, так и помолодела.  К осени, наконец, стало так же.  Муж уезжал в Москву, а дочь, чтобы не ездить к тетке, оставила его с женой и, оставшись одна, опять не вышла на работу. 
.  Как и другие, эти, к большому удовольствию и прискорбности, были в то же время очень приятны ему, в своем равнодушии, и, наоборот, он находил, что это чувство его было особенно мучительно для самого себя, для других людей.
.  Если вы думаете, что с вас требовать, то, как бы вы ни старались, что бы вы ни делали, в этом не будет никакого смысла. 


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  И мы, все русские, не могли оставаться равнодушными и не можем, чтобы те, которые не могли быть для нас неприятны, мы не можем не чувствовать своей чести и не должны быть должны прощены, когда мы так мало сделали для нее. 
.  Но даже если вы сейчас поедете в лес, не надо думать, как вам надо ехать.  Во-первых, вы не будете так легко и хорошо говорить, во-вторых, вы не будете так много думать и так скучно говорить, как вы.  Но, во-первых, вы будете не так хорошо думать и не так
.  Он, как и всякий человек, очень похож на человека.Он не может ни двигаться, ни бегать, но чувствует в себе человека, который живет его жизнью, и говорит с ним, и чувствует, что он имеет на это право.Признав это существование, Николай II тотчас же уехал в Москву.Слово это он получил только в
. 


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}





Saving model checkpoint to ./checkpoint-500
Configuration saved in ./checkpoint-500/config.json
Configuration saved in ./checkpoint-500/generation_config.json


.  Но, когда она была здорова и счастлива, и ей не надо было ни думать о чем-то, ни думать, а было очень важно одно – чтобы это было то самое самое счастье, которое она желала себе всю жизнь. 
.  И, наконец, в 1853 году по возвращении домой в Петербург был вызван по следу на дело.
. 
.  В течение пяти минут при полной темноте и освещенности, на всех углах были расставлены орудия и бомбы, и, наконец, на месте, где они должны были быть, был найден настоящий труп.  Не считая нескольких трупов, в том числе одного мертвого, в этом трупе были только двое русских и три француза.  Из


Model weights saved in ./checkpoint-500/pytorch_model.bin
Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  И мы с женой пошли на ужин, как вдруг слышим в сенях крик: 
.  Но не все они были одинаково хороши; как в первом случае, так и во втором — ни одна партия, ни один игрок не был, кроме него самого, очень, кажется, лучшим из тех, которые на первый раз делали это в первые годы своей игры.  Но на этот счет не было другого мнения, кроме одного: очень трудно в
.  Это было бы так. 
.  В начале своего пути (после долгого размышления) он поневольно узнает о том, что и как надо думать.


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  В начале лета он вернулся в свои родные места, оставив мать и сестру. 
.  И то, что он хотел сказать, было правдой, но для меня так и осталось тайной, я не знал тогда, что было бы лучше, если бы он сказал, что это хорошо, что он не любит меня, но, видимо, думал, что не понимает, потому что я люблю его.
.  В этих словах, с которым и в первый раз в первый раз в его жизни, он был не только поражен словами, но и совершенно серьезно удивлен тому, как точно так же он понимал их и знал, в особенности, если он верил, что им удастся все это сказать.  Он только теперь понял всю глубину значения того, что он
.  Да и не только, в таком смысле, в нем много общего, как и в моем прошлом.  Я много думала о том, как, и что нужно делать, и что я для этого сделаю, что бы сделать для того, чтобы быть, как человек, я не только люблю, я люблю, люблю то, что есть и чем




Training completed. Do not forget to share your model on huggingface.co/models =)


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  При этом необходимо учитывать, что у каждого человека бывают свои индивидуальные причины (высокая или маленькая температура воздуха, головная боль, плохое самочувствие). 
.  С помощью этих советов вы не только избавитесь от боли в желудке и поднимите его аппетит, но и будете знать, как в домашних условиях устранить эту неприятную проблему. 
. 
.  Она сидела в глубоком кресле, лицом к лицу с Петром.  По тому, как она старалась подавить страх, он заметил, что она пристально, внимательно следит за каждым его словом.  Она молчала.  Он, в том же положении, в которое его она поставила, знал, что она не захочет говорить ни о чем и потому смотрел на


Saving model checkpoint to .
Configuration saved in ./config.json
Configuration saved in ./generation_config.json
Model weights saved in ./pytorch_model.bin


In [14]:
print_generations(prefix="В 2024 году", max_len=200)

Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



В 2024 году в Петербурге в Петербурге был построен новый типовой дом для петербургского купечества. Князь Дмитрий, не дождавшись разрешения войти в него, вошел с женой в свою спальню и при участии супруги. В ней в комнате в эту минуту был и сын князя Дмитрия, который был в это время один и с матерью и с дядей и, вместе с своею дочерьми, в спальне в комнате княжны. Князь Дмитрий, оставшись в одиночестве в комнате и не смея войти в нее, с своей женой, в это время находился в комнате княжны.
В 2024 году Россия пережила первую Великую войну, когда русский флот в виде эскадр дошел до Парижа в 20-х. Русская дипломатия была занята во Франции.
В 2024 году, когда она была сделана, ее и причислили к лику святых. После этого в 1812 году она была перевезена в Париж, где была встречена и положена в алтарь, названный в ее честь церковью святого Доминика».
В 2024 году, между 2026 и 2026 годами, в составе царского войска был объявлен план об уничтожении русского царя, его семьи и всего русского войска

# Собрание сочинений Ленина

In [15]:
model, tokenizer = get_ru_model()
freeze_layers(model, 6)
finetune(model, tokenizer, LENIN_PATH)

loading configuration file config.json from cache at /root/.cache/huggingface/hub/models--sberbank-ai--rugpt3small_based_on_gpt2/snapshots/f2f7c585b05a16726efe8974586e10b4d5939082/config.json
Model config GPT2Config {
  "_name_or_path": "sberbank-ai/rugpt3small_based_on_gpt2",
  "activation_function": "gelu_new",
  "architectures": [
    "GPT2LMHeadModel"
  ],
  "attn_pdrop": 0.1,
  "bos_token_id": 50256,
  "embd_pdrop": 0.1,
  "eos_token_id": 50256,
  "gradient_checkpointing": false,
  "initializer_range": 0.02,
  "layer_norm_epsilon": 1e-05,
  "model_type": "gpt2",
  "n_ctx": 2048,
  "n_embd": 768,
  "n_head": 12,
  "n_inner": null,
  "n_layer": 12,
  "n_positions": 2048,
  "reorder_and_upcast_attn": false,
  "resid_pdrop": 0.1,
  "scale_attn_by_inverse_layer_idx": false,
  "scale_attn_weights": true,
  "summary_activation": null,
  "summary_first_dropout": 0.1,
  "summary_proj_to_labels": true,
  "summary_type": "cls_index",
  "summary_use_proj": true,
  "transformers_version": "4.2

SETTING N_EPOCHS TO  0.14183550978504744


Loading features from cached file /content/gdrive/MyDrive/datasets/cached_lm_GPT2TokenizerFast_256_lenin.txt [took 1.256 s]
PyTorch: setting up devices
The default value for the training argument `--report_to` will change in v5 (from all installed integrations to none). In v5, you will need to use `--report_to all` to get the same behavior as now. You should start updating your code and make this info disappear :-).
***** Running training *****
  Num examples = 32598
  Num Epochs = 1
  Instantaneous batch size per device = 8
  Total train batch size (w. parallel, distributed & accumulation) = 8
  Gradient Accumulation steps = 1
  Total optimization steps = 578
  Number of trainable parameters = 42528768


Step,Training Loss
50,3.3899
100,3.2751
150,3.2767
200,3.2754
250,3.2126
300,3.197
350,3.1459
400,3.146
450,3.2098
500,3.1729


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Он, по сути, борется с "врагами" и противополагалниками. (Смех. ).  Он призывает к решительной мере социальной политики к укреплению местного самоуправления.  Это был один из тех уроков, которые не раз были поддернуты.  И сегодня, в условиях мира и мира, мы должны показать,
.  В. И. Ленин в своей «Экономической программе», написанной в 1913 году, отмечает: "Если мы не можем принять такой метод, как ликвидация войны, то нужно отказаться от этого метода во всей его полноте.  В России, в особенности, в области военного строительства и промышленности, не может быть еще достаточного числа таких
.  Когда же дотационная комиссия стала рассматривать вопрос о «процессинговой власти», ее «своеобразный» план, а не план, как говорили товарищи из комитета, – «б», – не мог ни в коем случае быть исключен. Теперь-то положение партии в партии окончательно становится таким образом, что нельзя сказать
.  В течение 3–4 недель в томатных и поварских цехах (такие как «Запорожсталь» и т. д.) необходимо пе

Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  В качестве основы для этого проекта выступает проект "Социализация молодежи".  В этой работе мы выступаем не только как руководство, но и как посредник в реализации проекта; это и есть важнейший аспект этой работы, это именно та основная задача, которой должен заниматься, с одной стороны, Маркс, с другой стороны, Энгельс,
.  И если бы не эти «знаменитости» и «изящные» их «позы», – если бы не их «позы», – если бы не эти «знаменитости», – если бы не эти «знаменитости» – то в России не осталось бы и следа бы «блестящей
.  На эти «добро» должны опираться силы всех, кто не разделяет с ними мнения о положении на этой «добро» (ибо «их» мнение было бы «лучшим»). С другой стороны, если они не согласны с этими «добро», то их не надо бы принуждать или требовать на это согласие, как это
.  В качестве примера того, как это работает, можно взять статью В. Г. Таневича «Нравственный контроль» «Обращение» к С. Н. Плеханову, изданную в 1916 году в Петербурге и опубликованную при поддержке издательств

Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Он говорил, что это – в основном политические лозунги: "Народная революция", "демократия", и все это – на основе сознательных представлений.  И не только сознательных, но и измышленных.  К примеру, не стоит путать большевистскую платформу с марксистско-ленинской, и наоборот, это
.  Все три вида рабочих работ могут быть расценены как разовое мероприятие.  Построят в день по несколько сооружений – и то без сноса, не разрушат и не заставят снести несколько десятков домов, не подорвут население. 
.  Подразумевается также и в том, что мы должны указать в своей резолюции, что у нас есть и крестьянские, и военные и т. д. вопросы, касающиеся не только крестьянской общины, но также и крестьянских общин.  С этой точки зрения очень много вопросов, касающихся сельского хозяйства, можно было бы и обсудить.  Можно
.  После чего все были исключены, и не было ни малейшего сомнения, что у этих "предпринимателей" были только деньги, которые они брали из кассы или из кармана рабочих.  У нас тоже в рук

Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  П. Г. Энгельс, В. И. Ленин, Сочинения.  Т. I, изд. тип. партии, стр. 322–323. 
.  Все они были "не на шутку" заигрывают с представителями рабочих, приучают их к тому, что рабочие являются хозяевами в мире, что рабочие должны всегда стоять на своих обязанностях, заботиться о своем «выполнении" и выполнении своих обязанностей, что рабочие всегда должны выполнять свой долг перед рабочими и во всяком
.  В этом смысле он был весьма похож на тех крестьянских ораторов, которые говорили и о том, как правильно строить партию и как ее применять. 
.  И только на то время, пока он будет в России, в которой уже имеется не одно такое правительство, мы должны иметь возможность не только в случае нужды, но и в случае крайней необходимости и когда не надо ни по какой иной причине стеснять и не только не позволять, но когда правительство, как нам нужно, в полной мере и не


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Из книги «Философия религии в России» (В.И. Ленин.  Спб., 1909, стр. 7). В этом труде она излагает взгляды Ф. Энгельса на вопрос о причинах революции в Германии. Затем автор доказывает необходимость борьбы пролетариата против «феодализма» и с классами мелкой буржуазии и мелкой
.  Во всяком случае, мы видим, что именно из этого источника исходит самая большая доля правды. 
.  Я и сам считаю себя "за" именно то, что в России, так как именно здесь я должен видеть, должны были бы и должны были бы поставить Россию "на место" мировой революции.  А то в России "не только в Германии" не понимают, что пролетариат в России есть, а в Германии не понимают, что именно
.  Все это хорошо, но почему же тогда на словах все и все говорят о том, что они не могут быть уверены в существовании «реальных» проектов? 


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Я говорю о том, что мне было сказано, что на съезде нужно было сказать, чтобы я дал всем, кто не может принять этот ответ, немедленно объявить его резолюцией, это не мое решение. Я не говорю ни слова о том, что это моя резолюция, что мы хотим в нее вступить, что это – не моя резолюция
.  В России, в Москве и ряде крупных городов уже более года существуют организованные в Москве группы населения. 
.  С другой стороны, эти данные и «справедливые» статьи доказывают, что пролетариат в России был на самом деле гораздо сильнее, чем в экономически отсталых странах.
.  А если вы хотите, чтобы в нашем обществе не было никакого социального «пролетариата», то вы должны понимать, что вы уже видели, что класс капиталистов был разгромлен. Но, прежде чем вы будете вырезать то, что можно вырезать и зарезать, вы должны будете понять, что они сами себя выбили из борьбы


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  И если мы наталкиваемся на какую-то ошибку, то неизбежно находим эту ошибку и наталкиваемся на ошибку с этой стороны, как на не всегда известную, мы говорим, что если бы мы хотели найти ошибку, которая есть наша самая близкая к истине, мы, не имея возможности, а вернее сказать, не имея представления об этом
.  О «реальной свободе» и большинстве подобных программ говорится в письме от 25 января, в котором подчеркивается, что "этот режим больше не соответствует интересам рабочих и что "все рабочие находятся под их руководством", а "вся масса рабочих должна работать в единственном числе" и т. д.
.  И, наконец, именно на этом основании мы будем требовать в проекте проекта указания места и состава рабочей группы, которая будет проводить исследование.  Поэтому в проекте нет указания места рабочей группы и состава рабочей группы, которая будет проводить исследование.  Вместо этого мы должны сказать, что такой категорический разнобой между членами рабочей группы и тем, что они сами
.  Они б

Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Эти два направления одинаково хорошо характеризуют себя во всем буржуазном обществе и в России в особенности.  Если не удастся полностью овладеть искусством диалектики, то только для этого необходим и этот метод, потому что именно он – диалектика вообще.  Этот метод особенно необходим для социализации народа. 
.  Как только с нами в одной точке окажутся все, так у нас будет уверенность, что мы не подведем до последнего.  Не подведем до конца.  Мы сделаем все, чтобы победить эту группу, как можно скорее.  Мы должны знать, что мы в силах и на что надо иметь время, чтобы победить это отчаянное отставание
.  С этой точки зрения деятельность партии определяется в основном, как борьба за единство партии с массой, как борьба за диктатуру рабочих, за полную свободу и диктатуру крестьян, а в то же время, – как борьба за право каждого крестьянина, для которого право выбора и обязанность выбора являются делом семьи и государства, – что «в этой
.  Если они в этом преуспевают, значит, и им прина

Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  И мы, все русские, не отрицаем того, что наша власть, несмотря на всю свою враждебность к этому движению, все-таки продолжает вести с ним борьбу.  Мы видим, что большинство наших противников, несмотря на все усилия нашей политики, продолжают в том же русле продолжать борьбу против народа.  И они будут идти по тому
.  Это – самая сильная революция русского национального движения в первые годы. 
.  На днях, в своем первом номере "Пролетарского Рабочего», редакция встретила заметку, в которой в качестве предисловия к статье приводятся слова профессора Московского университета, профессора Киевского университета, И. К. Иоффе о событиях, происходящих в Украине.
.  "Социал-Демократ" No 1 (286) ноября 1910 г. в газете "Социал-Демократ" № 1 (286) ноября 1910 года напечатано в редакции журнала "Сопротивления» № 207. В. И. Ленин. «Социал-Демократ


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}





Saving model checkpoint to ./checkpoint-500
Configuration saved in ./checkpoint-500/config.json
Configuration saved in ./checkpoint-500/generation_config.json


.  Но, когда они были созданы в единстве и единстве, они были только средством борьбы против «грязного империализма». Итак, марксизм представляет из себя одну из форм господства буржуазии над пролетариатом, ибо капитализм – есть империалист, а пролетариат – в то же время эксплуатирует капиталистические массы
.  И, наконец, в 1853 г. по инициативе социал-демократа И. В. Мартова (М. Е. – в «Письмах Н. Л.) он был избран в Думу. – 164. – 168, 228–230.
.  О том, как на самом деле должны бороться за Россию социал-демократы, с одной стороны, и большинство социал-демократов, с другой, – мы говорим в том, что мы знаем, что это происходит при участии передовых социал-демократов (впоследствии марксистов и меньшевиков), которые, к сожалению, большеви
.  В "Брюсселяре" был принят ряд воззваний к пролетариату и к крестьянству, в частности, о необходимости скорейшего сближения его с капитализмом, о его борьбе против буржуазии, против социализма и пр. В. Ленин писал в своей статье «Воля к освобождению

Model weights saved in ./checkpoint-500/pytorch_model.bin
Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  И мы с женой тоже на них ссылаемся, а потому и сами на них ссылаемся.  А теперь мы с женой на нее ссылаемся, а мы – на нее.  И, если у нас нет никакого намерения, то пусть все, кто на нас ссылается, не обижаются.  Так почему же они должны обижаться
.  Но не все они могут быть правы; как не всегда можно и не всегда нужно иметь дело с правыми, правыми или правыми, – вот в чем, кажется, суть их взаимоотношений. И вот как обстоит дело с правомерностью того или другого? Что является правомерным в правом поведении этих политических партий? Это вопрос в
.  Это доказывает тот факт, что не только в России и во Франции, и в Германии, и в Италии, и во Франции, что нет ни одного государства, которое не было бы уничтожено и уничтожено по частям или по частям.  Не может быть ни одного государства, где нет таких крупных капиталистических предприятий, где капиталистическая революция не
.  В начале 1906 года Ленин писал письмо, в котором писал: "Поражает ли, когда мы ставим вопросы, которые ставит п



Training completed. Do not forget to share your model on huggingface.co/models =)


Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



.  Однако для нас, всех этих групп, мы должны стремиться к тому, чтобы не только в виде исключения, но и в виде исключения из нашей политической партии, в партии, которая бы представляла собой более сплоченную и сплоченную группу.Наоборот, это может идти вразрез с политической необходимостью, может быть, с экономической потребностью, или же
.  В сущности, это даже и в голову не приходило, что на деле, хотя бы и теоретически, большевики являются демократами, которые ведут борьбу с революцией.  К. Маркс, например, доказывал, что только так можно провести социалистическую революцию, а затем и победу революции. 
.  За свою свободу он и в революцию не стал, но дело его, как говорят, в том, что он не стал говорить об этом, а говорил о политике. 
.  А в самом деле, что такого в нашей статье в пользу революционного правительства?  На что я не должен и никогда не должен смотреть, чтобы мы, большевики, думали, что дело партии пойдет на пользу социалистам.  Это только смешно.  Это значит: мы буде

Saving model checkpoint to .
Configuration saved in ./config.json
Configuration saved in ./generation_config.json
Model weights saved in ./pytorch_model.bin


In [16]:
print_generations(prefix=". самое важное", max_len=200)

Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



. самое важное, что мы можем делать, это создавать что бы то ни было более или менее в форме, когда-либо, в форме движения, или иначе, в форме организации.
. самое важное, чего хочет достигнуть буржуазный народ в этом столетии, – это перехода к демократии. И именно поэтому – борьба с буржуазной демократией, как бы она ни была вредна для буржуазии в России, как бы она ни была вредна для всех угнетенных наций в мире. Но именно благодаря этому переходу в России может теперь быть и буржуазная демократия. Но в этой демократии не должны быть неучтены и те условия, о которых говорит буржуазия. – В России нет ни одного сколько-нибудь известного демократического принципа, по которому нельзя было бы строить демократию. И здесь – только одна гарантия, что буржуазия в России не должна будет превращаться в какую-нибудь одну политическую партию. Но при всем разграничении с буржуазией в России можно добиться и этого. Борьба с буржуазной демократией – это – только первая ступень. Вторая ступень – это 

In [17]:
print_generations(prefix=". я верю, что", max_len=200)

Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



. я верю, что мы, – сказал Фокс, не отрываясь от окна. – Мы должны быть готовы защищать себя сами. Мы не хотим ни о какой защите ни просить, ни просить, а должны бороться со всеми этими противниками. Но только мы не хотим, чтоб эти противники были из-за угла, из-за забора, с улицы, в деревне, в своем городе, чтобы они не могли жить в собственном доме, чтобы не могли ни в какой мере внять нашему пожеланию.
. я верю, что в этом вопросе есть смысл. Но, пожалуй, не было бы в этой работе ни одной правильной, но чрезвычайно полезной, работы, которая бы в корне изменила всю жизнь и которую нужно проводить со всем старанием и любовью. «Отчего бы это» — скажете вы, а именно: «отчего бы это»–то, вы совершенно правы! Но мы опять же не можем с этим согласиться, ибо «отчего бы это»–то, мы еще увидим, но совершенно не в этом роде, а в следующем. В этой работе мы видим, что она только на счет «снижения» (отождествления и т. д. – вместе с тем вы увидите, что речь идет о «несуществе», а не об «снижении

In [18]:
print_generations(prefix=". я ненавижу", max_len=200)

Generate config GenerationConfig {
  "bos_token_id": 50256,
  "eos_token_id": 50256,
  "transformers_version": "4.26.1"
}



. я ненавижу либералов-декабристов-монархов и их «патриотические» «указатели» и отдельные слова-лирики. Я не ненавижу либералов-монофизитов, а в том, что они называют либералов «монархами» и т. и м. в слово (отдельно) «монархи», я вижу не в том, что они думают, а в том, что они видят и говорят (вместе с теми либералами, которые говорят: «монофизиками», «пролетариями», «дворцами» и т. д.). Но они не говорят, а говорят, что они говорят и делают (и на самом деле они говорят о том, что и на самом деле говорят о себе), говорят, что они делают, говорят, что они все делают правильно, ибо они могут только только говорить, но не делать не могут ничего другого, кроме
. я ненавижу их, и я презираю их. Не знаю, сколько времени прошло со времени нашей встречи, но я уже знаю, что они не могут оставаться такими, как до сих пор. Я понимаю, что они не могут больше жить без нас. Я говорю им, что они ничего не поняли, что они будут вечно в рабстве, что они будут терпеть, пока им дадут в долг. Я вижу, что