text-adversarial-training

在NLP中，对抗训练可以看做是一种正则化方法。此外还包括正则化方法：

随机噪声
对抗训练
梯度惩罚
虚拟对抗训练

这里实现对抗训练和梯度惩罚在NLP中的应用。此处提供的实现是把扰动加到Embedding矩阵上，即论文Adversarial Training Methods for Semi-Supervised Text Classification上的思路。

在Tensorflow2.x上实现很简单，具体见文件adversarial_training.py中的AdversarialTrainer类。AdversarialTrainer使用方法和tf.keras.Model一致。假设已经实现好模型的输入和输出，那么

model = AdversarialTrainer(inputs, outputs)
model.compile(loss="categorical_crossentropy",
              optimizer="adam",
              metrics=["accuracy"],
              epsilon=0.8)
model.fit(X, y)

就可以实现对抗训练。

根据实验需要和数据集位置修改相关参数后，运行：

$ python3 adversarial_training.py

梯度梯度惩罚运行，

$ python3 gradient_penalty.py

具体可参看源码。

通过我的实验，对抗训练在一些数据集上有1%+提升。需要说明，这里的对抗训练作为一种正则化方案，不能保证在任何数据集上都有提升，可能需要多跑几组实验调整下参数才有结果。

参考

[1] https://tensorflow.google.cn/tutorials/generative/adversarial_fgsm?hl=en

[2] Explaining and Harnessing Adversarial Examples

[3] Adversarial Training Methods for Semi-Supervised Text Classification

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.gitignore		.gitignore
README.md		README.md
adversarial_training.py		adversarial_training.py
dataset.py		dataset.py
gradient_penalty.py		gradient_penalty.py
pooling.py		pooling.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

.gitignore

.gitignore

README.md

README.md

adversarial_training.py

adversarial_training.py

dataset.py

dataset.py

gradient_penalty.py

gradient_penalty.py

pooling.py

pooling.py

Repository files navigation

text-adversarial-training

参考

About

Releases

Packages

Languages

allenwind/text-adversarial-training

Folders and files

Latest commit

History

Repository files navigation

text-adversarial-training

参考

About

Resources

Stars

Watchers

Forks

Languages