AdamMeme: Adaptively Probe the Reasoning Capacity of Multimodal Large Language Models on Harmfulness

The repository for AdamMeme: Adaptively Probe the Reasoning Capacity of Multimodal Large Language Models on Harmfulness.

setup

Please refer to LLaVA

Install other requirements by：

pip install -r requirements.txt

data

For data used in our paper, please refer to MAMI, HarM and FHM. To erase texts from image, please refer to OCR-SAM. The data file should look like this:

├── data
│   └── sampled_data
│       └── image
│           └── ori
│           └── erased
├── results
└── scripts

Harmfulness Mining

Run harmfulness mining by:

cd scripts
python mining.py

Model Scoring

First generate misbelief statement and reference answer by:

python gen_misb.py

Run model scoring by:

python scoring.py --exp_name exp_name --model_name model_name

Iterative Refinement

Run iterative refinement by:

python refinement.py --exp_name exp_name --model_name model_name

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
data		data
results/llava_5k		results/llava_5k
scripts		scripts
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AdamMeme: Adaptively Probe the Reasoning Capacity of Multimodal Large Language Models on Harmfulness

setup

data

Harmfulness Mining

Model Scoring

Iterative Refinement

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

AdamMeme: Adaptively Probe the Reasoning Capacity of Multimodal Large Language Models on Harmfulness

setup

data

Harmfulness Mining

Model Scoring

Iterative Refinement

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages