bert

modification of official bert for downstream task

Support OQMRC, LCQMC, knowledge distillation, adversarial disturbation and bert+esim for multi-choice, classification and semantic match

for OQMRC, we can get 0.787% on dev set for LCQMC, we can get 0.864 on test set knowledge distillation supports self-distillation

for a downstream task, we add masked lm as a auxiliary loss which can be seen as denoising and similar to word dropout to achieve robust performance.

Name		Name	Last commit message	Last commit date
Latest commit History 2,711 Commits
.idea		.idea
BERT-keras-master/BERT-keras-master		BERT-keras-master/BERT-keras-master
BERT-pytorch/BERT-pytorch		BERT-pytorch/BERT-pytorch
ConvBert		ConvBert
Funnel-Transformer		Funnel-Transformer
TensorFlowSinkhorn		TensorFlowSinkhorn
adversarial-robustness-public		adversarial-robustness-public
bert-master		bert-master
bert_language_understanding-master/bert_language_understanding-master		bert_language_understanding-master/bert_language_understanding-master
config		config
data		data
free_adv_train		free_adv_train
language		language
pegasus		pegasus
t2t_bert		t2t_bert
test		test
vat_tf		vat_tf
.DS_Store		.DS_Store
.gitignore		.gitignore
Dockerfile		Dockerfile
LICENSE		LICENSE
README.md		README.md
__init__.py		__init__.py
build.sh		build.sh
copy_data.sh		copy_data.sh
distributed_horovod_master.sh		distributed_horovod_master.sh
distributed_horovod_slave.sh		distributed_horovod_slave.sh
init.sh		init.sh
install_requirements.txt		install_requirements.txt
nohup.out		nohup.out
requirements.txt		requirements.txt
run.sh		run.sh
run_horovod.sh		run_horovod.sh
run_horovod_1_4.sh		run_horovod_1_4.sh
run_tf_1_11.sh		run_tf_1_11.sh
run_tf_2.7.sh		run_tf_2.7.sh
run_tfgpu_docker_1_15.sh		run_tfgpu_docker_1_15.sh
shadowsocks		shadowsocks
tf_serving.sh		tf_serving.sh