Interventional Reasoning of LLMs

A benchmark to assess and analyze the interventional causal reasoning capability of Large Language Models.

Example script commands

To generate prompts:
python ./scripts/generate_prompts.py --vt cs -t 5 --vc 3 --dp experiments/prompts
To query LLMs:
python ./scripts/run_gpt.py -m gpt-4-turbo-preview -p "./experiments/prompts/prompt_rchar_1709153316" -r ./experiments/results/ -i 1

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
data/tubingen		data/tubingen
experiments/templates		experiments/templates
notebooks		notebooks
scripts		scripts
src/rbias		src/rbias
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt

Provide feedback