In [1]:
import re
import pickle
from random import uniform
from collections import defaultdict


class text_generator:
    def __init__(self):
        self.model = None
    def gen_lines(self, path):
        with open(path) as data:
            for line in data:
                yield line.lower()
    def gen_tokens(self, lines):
        for line in lines:
            for token in re.compile(u'[а-яА-Я0-9]+|[.,-:;?!]+').findall(line):
                yield token
    def gen_bigrams(self, tokens):
        t0 = '$'
        for t1 in tokens:
            yield t0, t1
            if t1 in '.!?':
                yield t1, '$'
                t0 = '$'
            else:
                t0 = t1
    def fit(self, path):
        lines = self.gen_lines(path)
        tokens = self.gen_tokens(lines)
        bigrams = self.gen_bigrams(tokens)
        mono, bi = defaultdict(lambda: 0.0), defaultdict(lambda: 0.0)
        for t0, t1 in bigrams:
            mono[t0] += 1
            bi[t0, t1] += 1
        self.model = {}
        for (t0, t1), freq in bi.items():
            if t0 in self.model:            
                self.model[t0].append((t1, freq/mono[t0]))
            else:
                self.model[t0] = [(t1, freq/mono[t0])]
    def save_model(self, filename):
        with open(filename, 'wb') as file:
            pickle.dump(self.model, file, pickle.HIGHEST_PROTOCOL)
    def import_model(self, filepath):
        with open(filepath, 'rb') as file:
            self.model = pickle.load(file)
    def generate_n_sentence(self, n):
        text = ''
        for i in range(n):
            text += self.generate() + ' '
            
        return text
        
    def generate(self):
        if self.model is None:
            print("Model is not trained")
            return ""
        phrase =self.unirand(self.model['$'])   
        t0 = phrase
        while 1:

            t0 = self.unirand(self.model[t0])
            
            if t0 == '$': break
            if t0 in ('.!?,;:'):
                phrase += t0
            else:
                phrase += ' ' + t0
        return phrase.capitalize()
    def unirand(self, seq):
        sum_, freq_ = 0, 0
        for item, freq in seq:
            sum_ += freq
        rnd = uniform(0, sum_)
        for token, freq in seq:
            freq_ += freq
            if rnd < freq_:
                return token

In [3]:
generator = text_generator()
generator.fit("Chechov.txt")
generator.save_model("model.pkl")

In [2]:
another_generator = text_generator()
another_generator.import_model("model.pkl")
print( "Введите количество необходимых предложений: " )
n = int(input())
print(another_generator.generate_n_sentence(n))

Введите количество необходимых предложений: 
10
Что? Теперешний агроном, придумывая вс, который будет судить по избам, назначенной под наказания, ни чаек. Если взять влево от желудочно - копали канавы направо. Имелось собственных средств. По тыми. Да возиться с ними прикованные к монгольскому, в море и земли, кто - надзирателям, и попросить их жены - самое верное и если он назад, кухарку и лежит полушубок и переселенцев охоту любоваться пейзажем. Выражение лица, поселенец 40; в рыковском, так как еще ни легки кандалы; один. Чертя на данных ни к невылазной грязи, не будет признано неудобным, крутой горе в рыковском в череповецком уезде, бывало. - имевшему в тупоумной влажно - 30 лет не совершенный, отвечает с проведением сибирской язвы. По антропологии и грустный вопрос предлагают решать модного вопроса будет верст на заработки. 
