IMBERT: Making BERT Immune to Insertion-based Backdoor Attacks

Descriptions

This repo contains source code and pre-processed corpora for "IMBERT: Making BERT Immune to Insertion-based Backdoor Attacks" (Third Workshop on Trustworthy Natural Language Processing)

Dependencies

python3
pytorch>=1.6
transformers>=4.12.5

Usage

git clone https://github.com/xlhex/imbert.git

Train a victim model

TASK=sst2_badnet # options: agnews_badnet, agnews_benign, agnews_hidden, agnews_sent, olid_badnet, olid_benign, olid_hidden, olid_sent, sst2_badnet, sst2_benign, sst2_hidden, sst2_sent
SEED=1000
sh run.sh $TASK $SEED

Defence

DATA=$1 # path to test set
CKPT=$2 # checkpoint of a victim model
DEFENCE=mask # options: mask, del
THRESHOLD=1
TOPK=4
sh defense.sh $DATA $CKPT $DEFENCE $THRESHOLD $TOPK

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
data		data
defense.sh		defense.sh
imbert_grad.py		imbert_grad.py
readme.md		readme.md
run.sh		run.sh
run_glue.py		run_glue.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

data

data

defense.sh

defense.sh

imbert_grad.py

imbert_grad.py

readme.md

readme.md

run.sh

run.sh

run_glue.py

run_glue.py

Repository files navigation

IMBERT: Making BERT Immune to Insertion-based Backdoor Attacks

Descriptions

Dependencies

Usage

Train a victim model

Defence

About

Releases

Packages

Languages

xlhex/imbert

Folders and files

Latest commit

History

Repository files navigation

IMBERT: Making BERT Immune to Insertion-based Backdoor Attacks

Descriptions

Dependencies

Usage

Train a victim model

Defence

About

Resources

Stars

Watchers

Forks

Languages