GitHub - fendaq/chinese_ancient_poetry: seq2seq attention tensorflow textrank context

思路： 1.模型输入数据：

    利用四句七言古诗
    
    利用textrank提取每句诗中的权重较高的词作为本句诗的训练意图【优化点】
    
    利用不超过上三句作为上下文
    
    ^$作为分割诗句的标志
    
    gensim.model 训练的word2vec 作为预训练字向量【优化点】
    
2.模型结构：

    Seq2Seq+BahdanauAttention,作为网络结构
    
    输入数据 添加每个字的拼音【优化点】作为输入数据
    
3.训练：

    正常训练，每次epoch，打乱数据顺序，重新训练
    
4.测试：

    从输出排序中挑选尾字押韵且possibility最高的字进行输出
    
    降低重复出现的字的权重
    
    提高押韵尾字的权重

损失： tensorboard/lr_and_loss.png

启动文件：

entrance.py

预训练：

    python entrance.py -p
    
训练：

    python entrance.py -t
    
测试：

    python entrance.py -i

示例：输入keywords，4个，通过空格区分怀归归心孤云望远

赋诗：

    山不风一春水花
    
    毛荡带修庙胜发
    
    极禅苗焚索渠节
    
    就烛危卷经离华
    
输入keywords，4个，通过空格区分怀古 今古 江山 望远

赋诗

    山不风一春水花
    
    毛荡带修庙胜发
    
    极禅苗焚索烂渠
    
    汝底后难莫何他

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
__pycache__		__pycache__
data		data
raw		raw
save		save
tensorboard		tensorboard
.DS_Store		.DS_Store
README.md		README.md
char2vec.py		char2vec.py
char_dict.py		char_dict.py
data_utils.py		data_utils.py
entrance.py		entrance.py
generate.py		generate.py
infer.py		infer.py
paths.py		paths.py
poems.py		poems.py
pron_dict.py		pron_dict.py
rank_words.py		rank_words.py
requirements.txt		requirements.txt
segment.py		segment.py
singleton.py		singleton.py
train.py		train.py
utils.py		utils.py

fendaq/chinese_ancient_poetry

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Stars

Watchers

Forks

Languages