介绍

NLP中，对于生成问题如NMT，QA, Paraphrase 任务来说通常会存在生成多样性不足的问题，通常我们会采用beamSearch来增加多样性。但是beamSeach 生成的句子还是有很大的相似度，无法满足项目落地需求。我采用了这篇A Deep Generative Framework for Paraphrase Generation 的基于CVAE的结构思想构造了一个模型，试图解决生成任务的多样性。

模型结构图

提示：请先看这篇论文A Deep Generative Framework for Paraphrase Generation 的思想和结构，再看我下面的这个模型结构图

文件说明

/data/PAGE 训练语料

train.txt 格式：id---xhm--src---xhm--tgt

eval.txt 格式：id---xhm--src---xhm--tgt

test.txt 格式：id---xhm--src---xhm--tgt

results

/results/bert

该文件是预训练的好中文bert模型，大家可以去这里下载，解压后放在这里

/results/PAGE

该文件夹是复述模型保存路径

运行命令

模型训练使用的是tf.data.* API 从tfrecord文件中构造的迭代器（感慨一下：非常强大的API.建议大家都采用这种方式）

python train_TPAGE.py   \
     --train=data/PAGE/train.txt \
     --eval=data/PAGE/eval.txt \
     --init_checkpoint_bert=results/bert/bert_model.ckpt \
     --batch_size=32 \
     --eval_batch_size=32 \
     --num_epochs_PAGE=10   \
     --maxlen_vae_Encoder=80 \
     --maxlen_vae_Decoder_en=40\
     --maxlen_vae_Decoder_de=40\

温馨一刻

大家若对于KL loss的计算公式有疑问，请看这里的公式推导你就会明白代码为啥这样写了

KL_loss = tf.reduce_mean(0.5 * tf.reduce_sum(tf.square(mu) + tf.square(sigma) - tf.log(1e-8 + tf.square(sigma)) - 1, [1]))

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
.idea		.idea
bert		bert
data		data
results		results
README.md		README.md
beamsearch.py		beamsearch.py
bert_transformer_vae_for_PAGE.py		bert_transformer_vae_for_PAGE.py
data_load.py		data_load.py
hparams.py		hparams.py
model.jpg		model.jpg
model.py		model.py
modules.py		modules.py
prepro.py		prepro.py
test.py		test.py
test_PAGE.py		test_PAGE.py
train_TPAGE.py		train_TPAGE.py
utils.py		utils.py
代码解释		代码解释
运行命令		运行命令

xuhaiming1996/BERT-T2T

Folders and files

Latest commit

History

Repository files navigation

介绍

模型结构图

文件说明

/data/PAGE 训练语料

results

/results/bert

/results/PAGE

运行命令

温馨一刻

About

Resources

Stars

Watchers

Forks

Languages