`MSLM`

Domain Sensitive Fine-tuning:

Improving Pre-trained Language Model Sensitivity via Mask Specific losses: A case study on Biomedical NER

Requirements

Python 3.8+
transformers 4.31.0
torch 2.0.1

Data

BLURB benchmark dataset

Data Preparation

python utils.py \
    [path to data] \
    [storage or destination directory]

Alternatively inherit pre-processed BLURB datasets such as,

BLURB

Masking

Our proposed Joint ELM-BLM masking approach

PMI masking

Construct a vocabularly from a dataset using the masking approach 

 ./run_pmi.sh

Fine-tuning

Specify the paths to the data and set the masking budgets for both the Base level masking BLM and the Entity level masking ELM

./run_train.sh [DATASET]

Citation

@article{abaho2024improving,
  title={Improving Pre-trained Language Model Sensitivity via Mask Specific losses: A case study on Biomedical NER},
  author={Abaho, Micheal and Bollegala, Danushka and Leeming, Gary and Joyce, Dan and Buchan, Iain E},
  journal={arXiv preprint arXiv:2403.18025},
  year={2024}
}

Name		Name	Last commit message	Last commit date
Latest commit History 107 Commits
mslm		mslm
scripts		scripts
README.md		README.md
__init__.py		__init__.py
mslm_masking.png		mslm_masking.png
run_train.py		run_train.py
run_train.sh		run_train.sh
run_train_no_tl.py		run_train_no_tl.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

`MSLM`

Domain Sensitive Fine-tuning:

Requirements

Data

Data Preparation

Masking

Our proposed Joint ELM-BLM masking approach

PMI masking

Fine-tuning

Citation

About

Releases

Packages

Languages

mykelismyname/MSLM

Folders and files

Latest commit

History

Repository files navigation

MSLM

Domain Sensitive Fine-tuning:

Requirements

Data

Data Preparation

Masking

Our proposed Joint ELM-BLM masking approach

PMI masking

Fine-tuning

Citation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

`MSLM`

Packages