In [120]:
import jieba
from jieba import posseg as pseg
from collections import Counter, defaultdict
import random

In [165]:
def load_file(file_name):
    f = open(file_name, 'r')
    lines = f.readlines()
    f.close()
    segs = []
    for line in lines:
        line = line.strip().decode('utf-8')
        words = pseg.cut(line)
        words = [key for (key, flag) in words]
        for word in words:
            segs.append(word)            
    return segs

In [166]:
def create_model(segs, n, padding):
    Delimiter = [u'。',u'！',u'？']
    lm = defaultdict(Counter)
    if n < 1:
        n = 1
    post_segs = []
    for i in range(n):
        post_segs.append(padding)
    for word in segs:
        post_segs.append(word)
        context = tuple(post_segs[-n-1:-1])
        lm[context][word] += 1
        if word in Delimiter:
            for j in range(n):
                post_segs.append(padding)  
                
    for key, cnt in lm.items():
        s = float(sum(cnt.values()))
        for word in cnt:
            cnt[word] /= s
    return lm
    

In [167]:
def generate_head(n, pad):
    head = []
    for i in range(n):
       head.append(pad)
    return head

In [168]:
def generate_word(lm_counter, context):
    r = random.random()
    s = 0.0
    for word, value in lm_counter[context].items():
        s += value
        if s > r:
            return word

In [169]:
def generate_sentence(lm, start):    
    context = start
    sentence = []
    text = ''

    while (True):
        word = generate_word(lm, context)
        if word == None: 
            break
        else:
            text += word
            temp = list(context)[1:]
            temp.append(word)
            context = tuple(temp) 
            
    sentence.append(text.encode('utf-8'))
    return sentence


In [170]:
def generate_sample_text(lm, n, sentence_count, padding):
    heads = generate_head(n, padding)
    start = tuple(heads)
    text = ''
    for i in range(sentence_count):
        sentences = generate_sentence(lm, start)
        sentences.append('\r\n')
        text += ''.join(sentences)
    return text


In [171]:
def demo_model_from_file(file_name, max_n):
    segs = Load_File(file_name)
    padding = u'%'
    
    if max_n > 5:
        max_n = 5
    else:
        if max_n < 1:
            max_n = 1
            
    for n in range(1,max_n):
        print '-----------ngram = %d-----------' % (n)
        lm = create_model(segs, n, padding)
        text = generate_sample_text(lm, n, 10, padding)
        print text
        print '--------------------------------'

In [173]:
demo_model_from_file('happiness.txt', 5)

-----------ngram = 1-----------
实际上，因为需要烫的关系的想法倒是不恰当地以同样重要的阶段对生活是要满足，忌妒是我在有些东西之后，在最好是最显著的界定。
这种帮助。
在他去尽情地满足于基督教教旨的习惯。
而且和栗树的人。
中国的恩赐，英国人放弃是会生病，其总数约25岁便会仍然不能品尝出一条更多大的原因是摘自1925年。
结果就是正确的指导者是最好没有什么极端复杂的快乐并不总是强调个人认为孩子安静的理由行事。
此外，我只需付出的事情的做法反而以为公正的缘故。
如果更清楚些！
我说：他们的方法，她的，要是运气怎么努力地合作，伦敦警察厅提起它不能希冀控制大规模的生活比起在本能目标之一便是要他们会说话通常会发现，这些农家的作用，非常重要的大部分文明男女，理由，即是微小过失。
这种情况就不会忌妒凯撒忌妒拿破仑。

--------------------------------
-----------ngram = 2-----------
首先脚趾运动纯粹是由于一匹马曾经突然大声吼叫从她身边正奔而去的缘故。
在公共建筑中，建设性劳动一样，而无损于文明的这一特征一直比许多人认为它是一无用处的地位，于是铁钉生产过剩，有一个你所爱的孩子。
若干世纪前一直受到了挫伤。
这件案子将向高级法院上诉，大众正以极具兴趣的学习不仅能使极度平凡的男人，坚守贞操的社会上通常认为青春期中的每代族长都袭有爵位――这种观念一直为之担忧烦恼不已。
如今大多数艺术家都似乎由于对世界报复，通过采用这些方法不至于使人口减少，还因为其中包含着许多野蛮因素，这些事物的不容置疑的知识和思想的中心。
基于无论哪种方式，让雅克①的博爱之士创立社会团体，以客观的态度，就没有真正的患者不得不摒弃许多必需的。
只要死亡是一个简单的蓄妾还要大些。
她应该对他多半不能成功，以至于在需要消除这种苦恼。
幸福之路第九章　舆论恐惧症，像在大多数情形内，是引起了这样的思想和习惯中的父亲，婚姻的生物学上的信念，它们身上的那种爱上了戏院而不愿意的行为是各不相同的。
这几种普遍的特性始于希腊人，他们的史前原型一样，这种学究气使得大学里的感人之处在于，他们专心致志地致力干搜寻一切有关诺斯替教②的公民，有的与教学方法有关，他们的生活变得幸福。

--------------------------------
--

In [174]:
demo_model_from_file('LuXun.txt', 5)

-----------ngram = 1-----------
然而我的失声，读下去，我们也常常看见咬死孝女；他的是一条蛇，她已经知道，兽；关城在她也没有了一柄而过庭”但在街上的曹娥，还有许多炙疮疤。
咱们的这种照片。
想到苍术和鳝鱼来，孩子们便跑到用过午膳，冻肉，五株葱卖菜的，那些闲看的。
）“那么热的运动。
中国也轻易便变成泥鳅么？
只听清数目呀，回答说。
你么？
…。
”“拿来用这铁屋的坐着五十枚大嚷起来，直待自己战栗，就是你的赠品：－－－－即似辩士，是集》的绣像，菜汤流着白牛尾）我倒不要紧。
有分，手上还没有笑了许久，都可以拿拄杖，但山上虽然也开始了几扭了。

--------------------------------
-----------ngram = 2-----------
〔6〕墨子（约前468—前286）名周，战国时墨翟弟子，著有短篇小说集《故乡》等先后被改编成电影。
她很聪明，倒不如换一张雪莱淹死在海里的记念像或是伊孛生，谈伊孛生（H。
后来她回去了，母亲知道没有，只为了它们在我的守御的器械，古书中无可查考，知道你在做什么用。
羿忽然心惊肉跳起来，脸色也铁青。
“那么，你便去；自己是完全孤立了；他哭，这便是自己先前所做的事我生平都没有，叫我还有话要当大众面前说说清，教他拜社老爷么？
他跳了一笑。
”一个店伙背了一口棺材，从岸上看起来，很吃菜，非大宴会不吃的羊肉。
我的推测。
这是庚桑楚》中有如下的一段议论之后，就到了杉树林边。
但是连殳的了，在他背后，摸到钻火家伙，点起灯来看，道，为臣亦不易。

--------------------------------
-----------ngram = 3-----------
“但我看他脸上的黑气愈见其黑了；不料那病是轻的，于是后来便被孩子们的声音便低下去，静下去了，他大概不叫‘鲧’是一条鱼，鱼鱼会治水水水的吗？
“这大概也就是大家所谓异样之一端罢。
但再前行了十多步，他即刻心花怒放了，远远地望见一间土屋外面的平地上，的确停着一匹飞禽，一步一啄，像是很大的鸽子。
冬季又逼近得这么快，火炉就要成为很大的问题；它的食量，在我们其实早是一个极易觉得的很重的负担。
“大欢喜的光采，便从你父亲的眼睛里还闪出苏醒和欢喜的光辉来。
”（按：指齐桓公），公曰‘惟蒸婴儿之未尝’，于是蒸其首子而献之公。
然而原

In [175]:
demo_model_from_file('HongLouMeng.txt', 5)

-----------ngram = 1-----------
”黛玉接着小史侯家，今风尘碌碌，回程已是来要给我逛半年，帐子．倘又将．你也是你只听了． 我也是因问父亲已皆弦． 我让道：“以后， 先是平儿上去轻轻笼住马了．宝玉答应了原故。
姑妈去世的在泥涂多说的人眼见他们去找，便知道我们三个作什么？
" 也有病的，要来罚！
”鸳鸯女人们不许走漏风声．幸而卖的事，有好吃的东西来的拿绳子，便下来，只见贾母和他还是宝钗便命贾蓉还要说等在宝钗走．抱厦厅上写了！
”正说着人无错，到底问这个人，纵然好了他，只得将终没有听见老太太还弹压的生日我，看见．我不过是《则洗耳谛听，故发恣意的丫鬟去了。
你的金架子上站的院落。
”平儿将赵姨娘道：“也都完了你是姨娘安，又一一见紫鹃忙进了这话不好听了，等回什么好亲大爷是正经。
”说村居不好说是享得富贵风流悲感一番，虽不叫他们想着，只有他来弄那个？
”说了一回做主意，两边阶下几个正经侄儿中之贪眠，便要会秦钟， 你这样说着呢．岂知赵姨娘所阻．这么个读书人，再整基业还没你说什么法儿，按贾政居长，皆打叠起，不过几个是土地下希嫩的五弦迟了．贾政，第十个极小的．姑娘的．那秦太虚写到姑娘的， 你只管揪着很烦． 难道昨儿放走了不成？
倒有个情既这么周到，忽听了，救人一命，就点头微笑不语婷婷点缀一两样，在这一条偷梁换柱之常事．　欲志今朝霜，不必添了式样，只得蹭了． 请去念书真孝顺婶子去应景儿乱迸，方自提笔向日也乏了。

--------------------------------
-----------ngram = 2-----------
明儿比这个小东道我还到那边坐罢。
”薛姨妈本来气得还骂， 只见司棋又打发人看了脉，疑惑说道：“妹妹在我们跟前说话，只见紫鹃，死也不放，说着，贾芸带着二三十个拿扫帚簸箕的人做去， 薛姨妈与黛玉．　　时凝翡翠翘．黛玉换上掐金挖云红香羊皮小靴，罩一件海龙皮小小鹰膀褂，束着一条柳绿汗巾，方知是邢夫人岫烟来了．家中常走出去！
 "王夫人笑道：“姥姥你有话问你出去的。
看他说，将来都要依我呢．因贪王家的问道：“青天白日怕什么！
”贾母与众人说：“谁都象三妹妹如今也不用你来了。
我前儿闹了些什么东西，这样薄情无义。
什么药，虽然自己承认，别无他话，都说：“才刚赶到的？
”宝钗听见了么！
”说毕，亲友络绎不绝，终不能在家一辈子的荣华富

In [176]:
demo_model_from_file('ZhangAiLing.txt', 5)

-----------ngram = 1-----------
一天。
”没有。
就是一个朋友代分辩，其中只有这有中风而浪费了，可是，就停留。
世钧笑他吃吃”菊荪嘻嘻笑了，怎么就像"四字样。
只有此本Ｘ本──当然知道他把下面椅子一同进去的眼睛也显得她听见。
炎樱为妻，增加，给他们正在厨下操作，一切。
第四十八回回前总批）草颈项也要动三动，从梯子笔直地日以继夜，也可以吃，难不成‘凶狠’应当带着她thekraut.她因为年代不能吃早饭，弹了，从他有心打趣，等着叫夏妈背剪蜡花”家多大乡里”刘妈会基本的人竟掉了人生的情报。
她的信上。
这里，岂不打算！
"二房东太太打电话回去了一会时局亦"这张妈煮一总结删了一下的年纪已经削发为尼。

--------------------------------
-----------ngram = 2-----------
就到这里，不由得就有格磴，反而觉得安心了。
你年轻么？
开幕的时候，她手腕上扎着一条垂直线的街道黑沉沉的。
她不过是个高个子，也是他的口吻。
两样都是刻意穿插进去的时候，他受一点委屈。
你现在心里不快乐？
”小寒道：“在家，你看我们那时候学着做。
翠远皮包里有福利会的次日晚间，红玉是否也是对你说假话，她母亲道：“即使过了老太太没有？
作者说：“你上次到南京找了块污旧的东拼西改，才十三岁，被邱吉尔打开箱子，夺过纸包，他的衣服而不出去，觉得非常诧异，因为很短，大概是诺朵夫等只会算计”（她常常给人的坏处，只想把一个后身做好了又不是个事，或者是出于一种自卫。
不信，连衣服也会说法文与拉丁文；梁太太因薇龙心里一酸，道：“徐太太的人气派大些，不论在环境上，凑到她的脸，马太太望着。

--------------------------------
-----------ngram = 3-----------
”翠远不答。
吹了一半，新郎新娘回来了，二贝在楼底下咿咿呀呀唱着解放歌曲。
薇龙打开了皮箱，预备把衣服腾到抽屉里，桌子底下，箱子背后，到处都有这样一个女儿在外面，然后用那条围巾兜头兜脸一包，把大半个脸都藏在里面，好在二爷明天就搬上来了。
──"嬷嬷"是老年高等女仆的职衔，"妈妈"相间。
——我有这个钱，便似乎觉得是应该的。
金福的老婆因为叔嫂关系，要避一点嫌疑，不好再住在阁楼上躺着，连鞋也没脱，便向地上重重地啐了一口，又用