In [1]:
# 依赖：
# !pip install sentencepiece
# !pip install jieba
# !pip install regex
# !pip install tensorflow
# !pip install tensorflow-hub

In [2]:
import tensorflow_hub as hub
import tensorflow as tf

from gpt2_tokenizer import GPT2Tokenizer

In [3]:
tokenizer = GPT2Tokenizer(
    'CPM-Generate/bpe_3w_new/vocab.json',
    'CPM-Generate/bpe_3w_new/merges.txt',
    model_file='CPM-Generate/bpe_3w_new/chinese_vocab.model')

In [4]:
gpt = hub.load('./cpm-lm-tf2/')

In [5]:
def sample(tokenizer, gpt, sentence, number=1, length=20):
    inputs = tf.constant([tokenizer.encode(sentence)] * number, dtype=tf.int64)
    length = tf.constant(length, dtype=tf.int64)
    ret = gpt.signatures['serving_default'](inp=inputs, length=length)['output_0']
    return [
        tokenizer.decode(s).replace(' ', '')
        for s in ret.numpy()
    ]

# 英文问答例子

In [6]:
ret = sample(tokenizer, gpt, '默写英文：\n狗dog\n猫cat\n鸟', 3, 10)
for x in ret:
    print(x)
    print('-' * 20)

Building prefix dict from the default dictionary ...
Loading model from cache /tmp/jieba.cache
Loading model cost 0.693 seconds.
Prefix dict has been built successfully.


默写英文:
狗dog
猫cat
鸟southern
萤火虫
--------------------
默写英文:
狗dog
猫cat
鸟bird
马horse

--------------------
默写英文:
狗dog
猫cat
鸟bird
老虎stripper
--------------------


# 默写古诗例子

In [8]:
ret = sample(tokenizer, gpt, '默写古诗：\n白日依山尽，黄河入海流。\n床前明月光，', 3, 10)
for x in ret:
    print(x)
    print('-' * 20)

默写古诗:
白日依山尽,黄河入海流。
床前明月光,疑是地上霜。
举头望
--------------------
默写古诗:
白日依山尽,黄河入海流。
床前明月光,疑是地上霜。
举头望
--------------------
默写古诗:
白日依山尽,黄河入海流。
床前明月光,疑是地上霜。
举头望
--------------------


# 不同的角色对话生成例子

In [11]:
ret = sample(tokenizer, gpt, '李大嘴：“各回各家，各找各妈！” \n佟掌柜：“', 3, 20)
for x in ret:
    print(x)
    print('-' * 20)

李大嘴:“各回各家,各找各妈!”
佟掌柜:“朱儿,请你看好店!”
郭芙蓉:
--------------------
李大嘴:“各回各家,各找各妈!”
佟掌柜:“好啊!”
老七:“笑话,我见过
--------------------
李大嘴:“各回各家,各找各妈!”
佟掌柜:“他这个讨饭的,凭什么收你的银子,有地儿是
--------------------


In [12]:
ret = sample(tokenizer, gpt, '李大嘴：“各回各家，各找各妈！” \n白展堂：“', 3, 20)
for x in ret:
    print(x)
    print('-' * 20)

李大嘴:“各回各家,各找各妈!”
白展堂:“问联吧,到处都是。”
佟湘玉
--------------------
李大嘴:“各回各家,各找各妈!”
白展堂:“李大嘴,背上背的啥?”
李大嘴
--------------------
李大嘴:“各回各家,各找各妈!”
白展堂:“那正好,我告禀绿竹林,你要所有人,全都走
--------------------


In [13]:
ret = sample(tokenizer, gpt, '李大嘴：“各回各家，各找各妈！” \n莫小贝：“', 3, 20)
for x in ret:
    print(x)
    print('-' * 20)

李大嘴:“各回各家,各找各妈!”
莫小贝:“好,你走吧!”
管家:“那他...
--------------------
李大嘴:“各回各家,各找各妈!”
莫小贝:“小眉姐,你是几个意思?”
佟湘玉
--------------------
李大嘴:“各回各家,各找各妈!”
莫小贝:“那我看贾宝玉了!(众人笑)贾宝玉那能跟我走
--------------------


In [17]:
ret = sample(tokenizer, gpt, '李大嘴：“各回各家，各找各妈！” \n李白：“', 3, 20)
for x in ret:
    print(x)
    print('-' * 20)

李大嘴:“各回各家,各找各妈!”
李白:“陛下的江山我的爱,轰轰烈烈!”
孟姜
--------------------
李大嘴:“各回各家,各找各妈!”
李白:“阿阿,太白一去不复返,不信你问月亮。”
--------------------
李大嘴:“各回各家,各找各妈!”
李白:“哈哈,你真是太不厚道了,你完全可以喊我李大嘴
--------------------


# 问答的例子

In [18]:
ret = sample(tokenizer, gpt, '中国的首都是北京\n日本的首都是东京\n美国的首都是', 3, 3)
for x in ret:
    print(x)
    print('-' * 20)

中国的首都是北京
日本的首都是东京
美国的首都是华盛顿
加拿大
--------------------
中国的首都是北京
日本的首都是东京
美国的首都是华盛顿
英国
--------------------
中国的首都是北京
日本的首都是东京
美国的首都是华盛顿
<eod>
--------------------


In [19]:
ret = sample(tokenizer, gpt, '李白所在朝代是唐\n李清照所在朝代是宋\n唐伯虎所在朝代是', 3, 1)
for x in ret:
    print(x)
    print('-' * 20)

李白所在朝代是唐
李清照所在朝代是宋
唐伯虎所在朝代是元
--------------------
李白所在朝代是唐
李清照所在朝代是宋
唐伯虎所在朝代是明
--------------------
李白所在朝代是唐
李清照所在朝代是宋
唐伯虎所在朝代是明
--------------------


# 算数例子

In [25]:
ret = sample(tokenizer, gpt, '1+1=2\n2+2=4\n3+3=6\n4+4=', 3, 1)
for x in ret:
    print(x)
    print('-' * 20)

1+1=2
2+2=4
3+3=6
4+4=12
--------------------
1+1=2
2+2=4
3+3=6
4+4=8
--------------------
1+1=2
2+2=4
3+3=6
4+4=8
--------------------


In [27]:
ret = sample(tokenizer, gpt, '1+1=2\n1+2=3\n1+3=4\n1+4=', 3, 1)
for x in ret:
    print(x)
    print('-' * 20)

1+1=2
1+2=3
1+3=4
1+4=5
--------------------
1+1=2
1+2=3
1+3=4
1+4=5
--------------------
1+1=2
1+2=3
1+3=4
1+4=8
--------------------


# ???的例子

In [29]:
ret = sample(tokenizer, gpt, '''惊雷这通天修为
天塌地陷紫金锤
紫电这玄真火焰
''', 3, 30)
for x in ret:
    print(x)
    print('-' * 20)

惊雷这通天修为
天塌地陷紫金锤
紫电这玄真火焰
紫雷吼着万妖王
魔风这魔音响九天
紫尘这雾清天下
但是这邪剑
--------------------
惊雷这通天修为
天塌地陷紫金锤
紫电这玄真火焰
紫金斧一挥天地灭
霹雳剑一挥天地裂
......
<eod>诗词:画里闲空
--------------------
惊雷这通天修为
天塌地陷紫金锤
紫电这玄真火焰
金弧子传千年斩首钢瓶
火蛇钻裂风雷斧
着一身银甲手拿银锤
--------------------


# 写作文例子

In [30]:
ret = sample(tokenizer, gpt, '''爱情是''', 3, 50)
for x in ret:
    print(x)
    print('-' * 20)

爱情是盲目的所以我很少会主动去谈恋爱我是个很现实的人而且目前为止我都不清楚我自己想要的是什么身边好友来来往
--------------------
爱情是什么感觉?-爱情1.半夜的时候,迷迷糊糊的时候。昏昏沉沉的时候,听见电话响,他的声音,都会不自觉的兴奋
--------------------
爱情是以什么样的方式产生,是否可以以这样的方式相爱,相爱后是否可以长相厮守,还有有没有什么其它的态度等等等等...
--------------------


In [32]:
ret = sample(tokenizer, gpt, '''一时黛玉进了荣府，下了车。众嬷嬷引着，便往东转弯，穿过一个东西的穿堂，向南大厅之后，仪门内大院落，上面五间大正房，两边厢房鹿顶耳房钻山，四通八达，轩昂壮丽，比贾母处不同。黛玉便知这方是正经正内室，一条大甬路，直接出大门的。''', 3, 200)
for x in ret:
    print(x)
    print('-' * 20)

一时黛玉进了荣府,下了车。众嬷嬷引着,便往东转弯,穿过一个东西的穿堂,向南大厅之后,仪门内大院落,上面五间大正房,两边厢房鹿顶耳房钻山,四通八达,轩昂壮丽,比贾母处不同。黛玉便知这方是正经正内室,一条大甬路,直接出大门的。只见宝玉的小丫鬟麝月,一个人在甬路东头刚舀了一瓢汤先端来了,黛玉笑道:“这汤可以解渴。”说着,便伸手想接。麝月笑道:“亲奶奶那边不是茶水,恐怕小姐要犯头疼。我给你另盛一碗来。”黛玉因吃了药,怯弱不胜,便知今日是遇到的贵人了,便也顾不得客气,接了来,一气吃完。这时人已近了东首正房大厅,黛玉方知迎面而来的人竟是林妹妹。众人不觉都愣住了,林妹妹扶了林黛玉的手笑道:“他看咱
--------------------
一时黛玉进了荣府,下了车。众嬷嬷引着,便往东转弯,穿过一个东西的穿堂,向南大厅之后,仪门内大院落,上面五间大正房,两边厢房鹿顶耳房钻山,四通八达,轩昂壮丽,比贾母处不同。黛玉便知这方是正经正内室,一条大甬路,直接出大门的。五间大房,北朝南正房五间,东西各有耳房两个,南房三间,贾母王夫人住左边西炕,贾母王夫人住右边,贾母陪着贾母王夫人同住,正好两屋宇相对。东配房北房三间,西边配房东西各五间,四个人在那里住。只见那些媳妇丫鬟丫环婆子们,手里拿着簸箕⁇帚,在山石后头,竹林内旁边,土坡凹处,找寻出路土坡之外,并没甚事,正谈说道:“太太的婢子雪雁,早投奔二爷去了。我说二爷对他再好,二
--------------------
一时黛玉进了荣府,下了车。众嬷嬷引着,便往东转弯,穿过一个东西的穿堂,向南大厅之后,仪门内大院落,上面五间大正房,两边厢房鹿顶耳房钻山,四通八达,轩昂壮丽,比贾母处不同。黛玉便知这方是正经正内室,一条大甬路,直接出大门的。黛玉适才搭姊妹屋住,现在看了父亲是客,自己是主,她的外祖母是管贾母衣帽的凤姐,而贾母只比她大几岁,按外祖母给她的荣府的名字,是正妻的孙女儿。即使贾母的位分高过她十倍,这一姓很可能还是姨太太。黛玉看到自己的外祖母,自然不觉心中凄楚,只是低头站着,可巧早有小丫头打扫出一所客厅来,擦得干干净净,铺着地毡,也做了一席葛布。黛玉在贾母处住了两年,这第一抹灯光的这里睡了两年,才看了一半,如今早有小丫头把四周房子里的
--------------------


# 对话例子

In [33]:
ret = sample(tokenizer, gpt, '''A：“今天我想吃火锅”
B：“''', 3, 50)
for x in ret:
    print(x)
    print('-' * 20)

A:“今天我想吃火锅”
B:“好啊”
A:“那就火锅”
B:“那我吃什么?”
A:“随便”
B:“......”
--------------------
A:“今天我想吃火锅”
B:“恩,这个,嘿嘿,如果你愿意,我请你吃饭”
A:“那这样,就由我请你吃火锅,你看行不行?”
B
--------------------
A:“今天我想吃火锅”
B:“那我明天再煮吧”
现在就是:
C:“今天我想吃火锅”
那么到底能不能明天煮呢?在在这里就帮你提示一下,明天
--------------------


In [34]:
ret = sample(tokenizer, gpt, '''A：“跟我一起去看电影吧”
B：“''', 3, 50)
for x in ret:
    print(x)
    print('-' * 20)

A:“跟我一起去看电影吧”
B:“我等你回来。”
A:“我今天已经告诉过你了,我不会去看电影。”
B:“好吧,我们就假设如果我
--------------------
A:“跟我一起去看电影吧”
B:“那怎么可以”
A:“上面有猫咪玩偶,对对对,就是它,能喝牛奶,特乖”
B:“......”
--------------------
A:“跟我一起去看电影吧”
B:“好啊好啊”
A:“我请你吃饭吧”
B:“那,一起看电影吧”
只是一次正常的经历,不要想太多
--------------------


# 对联例子

In [50]:
ret = sample(tokenizer, gpt, '对对联：\n天对地\n雨对风\n大陆对长空\n雷隐隐对雾蒙蒙\n开心大吉对万事亨通\n王老五对', 3, 3)
for x in ret:
    print(x)
    print('-' * 20)

对对联:
天对地
雨对风
大陆对长空
雷隐隐对雾蒙蒙
开心大吉对万事亨通
王老五对矮脚虎
--------------------
对对联:
天对地
雨对风
大陆对长空
雷隐隐对雾蒙蒙
开心大吉对万事亨通
王老五对张二嫂
--------------------
对对联:
天对地
雨对风
大陆对长空
雷隐隐对雾蒙蒙
开心大吉对万事亨通
王老五对金鼓锣
--------------------


In [45]:
ret = sample(tokenizer, gpt, '对对联：\n天对地\n雨对风\n大陆对长空\n雷隐隐对雾蒙蒙\n开心大吉对万事亨通\n爱因斯坦对', 3, 4)
for x in ret:
    print(x)
    print('-' * 20)

对对联:
天对地
雨对风
大陆对长空
雷隐隐对雾蒙蒙
开心大吉对万事亨通
爱因斯坦对海森堡

--------------------
对对联:
天对地
雨对风
大陆对长空
雷隐隐对雾蒙蒙
开心大吉对万事亨通
爱因斯坦对双生子

--------------------
对对联:
天对地
雨对风
大陆对长空
雷隐隐对雾蒙蒙
开心大吉对万事亨通
爱因斯坦对爱迪生

--------------------


In [44]:
ret = sample(tokenizer, gpt, '对对联：\n天对地\n雨对风\n大陆对长空\n雷隐隐对雾蒙蒙\n开心大吉对万事亨通\n李白对', 3, 3)
for x in ret:
    print(x)
    print('-' * 20)

对对联:
天对地
雨对风
大陆对长空
雷隐隐对雾蒙蒙
开心大吉对万事亨通
李白对求笔架
--------------------
对对联:
天对地
雨对风
大陆对长空
雷隐隐对雾蒙蒙
开心大吉对万事亨通
李白对杜甫
蔡
--------------------
对对联:
天对地
雨对风
大陆对长空
雷隐隐对雾蒙蒙
开心大吉对万事亨通
李白对杨玉环
--------------------


In [46]:
ret = sample(tokenizer, gpt, '对对联：\n天对地\n雨对风\n大陆对长空\n雷隐隐对雾蒙蒙\n开心大吉对万事亨通\n容嬷嬷对', 3, 3)
for x in ret:
    print(x)
    print('-' * 20)

对对联:
天对地
雨对风
大陆对长空
雷隐隐对雾蒙蒙
开心大吉对万事亨通
容嬷嬷对福禄寿
--------------------
对对联:
天对地
雨对风
大陆对长空
雷隐隐对雾蒙蒙
开心大吉对万事亨通
容嬷嬷对孙猴子
--------------------
对对联:
天对地
雨对风
大陆对长空
雷隐隐对雾蒙蒙
开心大吉对万事亨通
容嬷嬷对女仆

--------------------


In [47]:
ret = sample(tokenizer, gpt, '对对联：\n天对地\n雨对风\n大陆对长空\n雷隐隐对雾蒙蒙\n开心大吉对万事亨通\n孙悟空对', 3, 3)
for x in ret:
    print(x)
    print('-' * 20)

对对联:
天对地
雨对风
大陆对长空
雷隐隐对雾蒙蒙
开心大吉对万事亨通
孙悟空对唐僧
龙王
--------------------
对对联:
天对地
雨对风
大陆对长空
雷隐隐对雾蒙蒙
开心大吉对万事亨通
孙悟空对沙僧

--------------------
对对联:
天对地
雨对风
大陆对长空
雷隐隐对雾蒙蒙
开心大吉对万事亨通
孙悟空对紫霞

--------------------
