pcgrad-transformers

Implementaion of experiment for applying PCGrad method on robeta-based model & multi NLP tasks. Refer to https://han0ahblog.tistory.com/2 for details.

Note

pcgrad.py is copy of https://github.com/WeiChengTseng/Pytorch-PCGrad/blob/master/pcgrad.py

Environment

python 3.10
pytorch==1.13.1
transformers==4.25.1

Setting

Task

Shared/Core PLM Model

klue/roberta-base

Run

python train.py # for baseline
python train_pcgrad.py # with pcgrad

Performance

Validation Loss

	baseline	+pcgrad
PAWS-KR	0.4793	0.4071
KLUE-NLI	0.4432	0.4365

Validation Accuracy

	baseline	+pcgrad
PAWS-KR	0.8030	0.8325
KLUE-NLI	0.8486	0.8520

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
.gitignore		.gitignore
README.md		README.md
data.py		data.py
model.py		model.py
pcgrad.py		pcgrad.py
train.py		train.py
train_pcgrad.py		train_pcgrad.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

pcgrad-transformers

Note

Environment

Setting

Task

Shared/Core PLM Model

Run

Performance

Reference

About

Releases

Packages

Languages

han0ah/pcgrad-transformers

Folders and files

Latest commit

History

Repository files navigation

pcgrad-transformers

Note

Environment

Setting

Task

Shared/Core PLM Model

Run

Performance

Reference

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages