Zero-shot Learning (ZSL) for consumer health answer summarization

Implementation of experiments for Towards Zero-Shot Conditional Summarization with Adaptive Multi-Task Fine-Tuning (Goodwin et al., Findings 2020).

To install related dependencies:

pip install -r requirements.txt

To train the model:

export CHECKPOINT_DIR = <path to save model checkpoints>
export PREDICTION_DIR = <path to save predictions>
python -m fslks.run_experiment \
                --training_tasks=\"medinfo bioasq/single_doc bioasq/multi_doc pubmed_summ medlineplus_references super_glue/copa scientific_papers/arxiv scientific_papers/pubmed cochrane_summ cnn_dailymail ebm/answer ebm/justify squad movie_rationales evi_conv cosmos_qa::validation mctaco qa4mre/2011.main.EN qa4mre/2012.main.EN qa4mre/2013.main.EN qa4mre/2012.alzheimers.EN qa4mre/2013.alzheimers.EN\" \
                --testing_tasks=\"chiqa/section2answer_single_extractive duc/2004 duc/2007 tac/2009 tac/2010\" \
                --do_train=True \
                --checkpoint_dir=$CHECKPOINT_DIR \
                --do_predict=True \
                --prediction_dir=$PREDICTION_DIR \
                --do_test=True \
                --init_checkpoint=t5-base \
                --num_epochs=10 \
                --max_seq_len=512 \
                --cache_dir=MEMORY \
                --batch_size=8 \
                --eval_batch_size=16 \
                --eval_batches=10 \
                --steps_per_epoch=1000 \
                --warmup_epochs=3 \
                --prefetch_size=-1 \
                --cache_dir=MEMORY \
                --implementation='pytorch' \
                --use_amp=False \
                --temperature=2

To use BART-Large, replace "t5-base" with "bart-large". To do temperature-scaling, set --temperature=<T>. To do adaptive mixing set --dynamic_mixing=True To do self-adaptive mixing set --dynamic_mixing=True --mix_from_validation=False

To do testing only:

python -m fslks.run_experiment \
                --testing_tasks=\"chiqa/section2answer_single_extractive duc/2004 duc/2007 tac/2009 tac/2010\" \
                --do_predict=True \
                --prediction_dir=$PREDICTION_DIR \
                --do_test=True \
                --init_checkpoint=$CHECKPOINT_DIR \
                --max_seq_len=512 \
                --cache_dir=MEMORY \
                --eval_batch_size=16 \
                --eval_batches=10 \
                --prefetch_size=-1 \
                --cache_dir=MEMORY \
                --implementation='pytorch' \
                --use_amp=False

Note: --init_checkpoint can be the name of any hugging face model, or the path to any saved checkpoint created by --do_train=True

Fine-tuning Tasks

Task in Paper	Task Name in TFDS
QA4MRE 2013 Alz.	`qa4mre/2013.alzheimers.EN`
QA4MRE 2012 Alz.	`qa4mre/2012.alzheimers.EN`
QA4MRE 2013 Main	`qa4mre/2013.main.EN`
QA4MRE 2012 Main	`qa4mre/2012.main.EN`
QA4MRE 2011 Main	`qa4mre/2011.main.EN`
MC-TACO	`mctaco`
Cosmos QA	`cosmos_qa`
IBM Evidence	`evi_conv`
Movie Rationales	`movie_rationales`
SQuAD	`squad`
EBM Justifications	`ebm/justify`
EBM Answers	`ebm/answer`
CNN/DailyMail	`cnn_dailymail`
Cochrane	`cochrane_summ`
PubMed	`scientific_papers/pubmed`
ArXiv	`scientific_papers/arxiv`
CoPA	`super_glue/copa`
MedlinePlus	`medlineplus_references`
PubMed PubSum	`pubmed_summ`
BioASQ (multi-doc)	`bioasq/multi_doc`
BioASQ (single-doc)	`bioasq/single_doc`
CQaD-S	`medinfo`

Evaluation Tasks

Name in Paper	Dataset in TFDS
MEDIQA	`chiqa/section2answer_single_extractive`
TAC 2009	`tac/2009`
TAC 2010	`tac/2010`
DUC 2004	`duc/2004`
DUC 2007	`duc/2007`

Name		Name	Last commit message	Last commit date
Latest commit History 163 Commits
.idea		.idea
fslks		fslks
scripts		scripts
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Zero-shot Learning (ZSL) for consumer health answer summarization

Fine-tuning Tasks

Evaluation Tasks

About

Releases

Packages

Contributors 2

Languages

License

h4ste/mtft_zsl

Folders and files

Latest commit

History

Repository files navigation

Zero-shot Learning (ZSL) for consumer health answer summarization

Fine-tuning Tasks

Evaluation Tasks

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages