adaptershare

History

Name		Name	Last commit message	Last commit date
parent directory ..
assets		assets
data_utils		data_utils
experiments		experiments
int_test_data/glue		int_test_data/glue
module		module
mt_dnn		mt_dnn
scripts		scripts
tasks		tasks
tests		tests
README.md		README.md
_config.yml		_config.yml
adapter_diff_train.py		adapter_diff_train.py
adapter_diff_train.yaml		adapter_diff_train.yaml
adapter_train.py		adapter_train.py
adapter_train.yaml		adapter_train.yaml
calc_metrics.py		calc_metrics.py
download.sh		download.sh
predict.py		predict.py
prepare_distillation_data.py		prepare_distillation_data.py
prepro_std.py		prepro_std.py
pretrained_models.py		pretrained_models.py
requirements.txt		requirements.txt
run_toy.sh		run_toy.sh
train.py		train.py

README.md

AdapterShare: Task Correlation Modeling with Adapter Differentiation

Introduction

Thanks to the development of pre-trained language models, multitask learning (MTL) methods have achieved great success in natural language understanding. However, current MTL methods pay more attention to task selection or model design to fuse as much knowledge as possible, while the intrinsic task correlation is often neglected. It is important to learn sharing strategies among multiple tasks rather than sharing everything. In this paper, we propose AdapterShare, an adapter differentiation method to explicitly model task correlation among multiple tasks. AdapterShare is automatically learned based on the gradients on tiny held-out validation data. Compared to single-task learning and fully shared MTL methods, our proposed method obtains obvious performance improvements. Compared to the existing MTL method AdapterFusion, AdapterShare achieves an absolute average improvement of 1.90 points on five dialogue understanding tasks and 2.33 points on NLU tasks.

Quickstart

Setup Environment

Install via pip:

install requirements
> pip install -r requirements.txt
install our modified adapters package
> pip install git+https://github.com/WowCZ/adapter-transformers.git

prepare the nlu dataset:

Download data
> sh download.sh
Please refer to download GLUE dataset: https://gluebenchmark.com/
Preprocess data
> sh experiments/glue/prepro.sh

Training scripts:

Individual training script (baseline multitask learning):
> sh scripts/adapter_train.sh -tr wnli -te wnli -ls 50 -ss 100 > LOGS/mtnlu_wnli.log
AdapterShare training script:
> sh scripts/adapter_train.sh -tr mnli,cola,qnli,qqp,rte,sst,stsb,wnli -te mnli_matched,mnli_mismatched,cola,qnli,qqp,rte,sst,stsb,wnli -ls 1000 -ss 2000 > LOGS/mtnlu_unified.log

Claim

In this repository, the code of NLU dataset collection and baseline multitask learning is based on https://github.com/namisan/mt-dnn. The AdapterShare training process is modified from https://github.com/adapter-hub/adapter-transformers.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Files

adaptershare

adaptershare

README.md

AdapterShare: Task Correlation Modeling with Adapter Differentiation

Introduction

Quickstart

Setup Environment

Install via pip:

prepare the nlu dataset:

Training scripts:

Claim

Files

adaptershare

Directory actions

More options

Directory actions

More options

Latest commit

History

adaptershare

Folders and files

parent directory

README.md

AdapterShare: Task Correlation Modeling with Adapter Differentiation

Introduction

Quickstart

Setup Environment

Install via pip:

prepare the nlu dataset:

Training scripts:

Claim