Skip to content

yiyepiaoling0715/chinese_ancient_poetry

Repository files navigation

思路: 1.模型输入数据:

    利用四句七言古诗
    
    利用textrank提取每句诗中的权重较高的词作为本句诗的训练意图【优化点】
    
    利用不超过上三句作为上下文
    
    ^$作为分割诗句的标志
    
    gensim.model 训练的word2vec 作为预训练字向量【优化点】
    
2.模型结构:

    Seq2Seq+BahdanauAttention,作为网络结构
    
    输入数据 添加每个字的拼音【优化点】作为输入数据
    
3.训练:

    正常训练,每次epoch,打乱数据顺序,重新训练
    
4.测试:

    从输出排序中挑选尾字押韵且possibility最高的字进行输出
    
    降低重复出现的字的权重
    
    提高押韵尾字的权重

损失: tensorboard/lr_and_loss.png

启动文件:

entrance.py

预训练:

    python entrance.py -p
    
训练:

    python entrance.py -t
    
测试:

    python entrance.py -i

示例: 输入keywords,4个,通过空格区分怀归 归心 孤云 望远

赋诗:

    山不风一春水花
    
    毛荡带修庙胜发
    
    极禅苗焚索渠节
    
    就烛危卷经离华
    
输入keywords,4个,通过空格区分怀古 今古 江山 望远

赋诗

    山不风一春水花
    
    毛荡带修庙胜发
    
    极禅苗焚索烂渠
    
    汝底后难莫何他

About

seq2seq attention tensorflow textrank context

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages