Sequence_Span_Rewriting

Code for EMNLP 2021 paper Improving Sequence-to-Sequence Pre-training via Sequence Span Rewriting

Usage

data_generation.py contains key functions of generating training data for the sequence span rewriting objective.

data_gen.py contains an example of data generation.

run_summarization.py is from Huggingface Transformers. We use this file to continually per-train with SSR and fine-tune it on downstream tasks.

run_generation.py is used for inference (i.e., generation).

Pre-trained models

You can load our pre-trained SSR-base from Huggingface's model hub:

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
  
tokenizer = AutoTokenizer.from_pretrained("microsoft/ssr-base")

model = AutoModelForSeq2SeqLM.from_pretrained("microsoft/ssr-base")

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
README.md		README.md
data_gen.py		data_gen.py
data_generation.py		data_generation.py
requirements.txt		requirements.txt
run_generation.py		run_generation.py
run_summarization.py		run_summarization.py
run_summarization_no_trainer.py		run_summarization_no_trainer.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

data_gen.py

data_gen.py

data_generation.py

data_generation.py

requirements.txt

requirements.txt

run_generation.py

run_generation.py

run_summarization.py

run_summarization.py

run_summarization_no_trainer.py

run_summarization_no_trainer.py

Repository files navigation

Sequence_Span_Rewriting

Usage

Pre-trained models

About

Releases

Packages

Contributors 2

Languages

MichaelZhouwang/Sequence_Span_Rewriting

Folders and files

Latest commit

History

Repository files navigation

Sequence_Span_Rewriting

Usage

Pre-trained models

About

Resources

Stars

Watchers

Forks

Languages