LLM-Knowledge-Boundary

See our paper: Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augmentation.

🚀 Quick Start

Preprocess data and install dependencies.

bash preparation.sh
python data_preparation.py -d [nq/tq/hq]

Get supporting documents generated by ChatGPT (take Natural Questions dataset as an example).

OPENAI_API_KEY=[your api key] \
python run_llm.py \
    --source=data/source/nq.json \
    --usechat \
    --type=generate \
    --ra=none \
    --outfile=data/source/nq-chat.json

🔍 Conduct Experiments

Question answering.

OPENAI_API_KEY=[your api key] \
python run_llm.py \
    --source=data/source/nq-chat.json \
    --usechat \
    --type=qa \
    --ra=none \
    --outfile=data/qa/nq-none-qa.json

Priori judgement.

OPENAI_API_KEY=[your api key] \
python run_llm.py \
    --source=data/source/nq-chat.json \
    --usechat \
    --type=prior \
    --ra=dense \
    --outfile=data/prior/nq-dense-prior.json

Posteriori judgement.

OPENAI_API_KEY=[your api key] \
python run_llm.py \
    --source=data/qa/nq-none-qa.json \
    --usechat \
    --type=post \
    --ra=sparse \
    --outfile=data/post/nq-sparse-post.json

🌟 Acknowledgement

Please cite the following paper if you find our code helpful.

@article{ren2023investigating,
  title={Investigating the Factual Knowledge Boundary of Large Language Models with Retrieval Augmentation},
  author={Ren, Ruiyang and Wang, Yuhao and Qu, Yingqi and Zhao, Wayne Xin and Liu, Jing and Tian, Hao and Wu, Hua and Wen, Ji-Rong and Wang, Haifeng},
  journal={arXiv preprint arXiv:2307.11019},
  year={2023}
}

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
utils		utils
.gitignore		.gitignore
README.md		README.md
data_preparation.py		data_preparation.py
preparation.sh		preparation.sh
requirements.txt		requirements.txt
run_llm.py		run_llm.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

utils

utils

.gitignore

.gitignore

README.md

README.md

data_preparation.py

data_preparation.py

preparation.sh

preparation.sh

requirements.txt

requirements.txt

run_llm.py

run_llm.py

Repository files navigation

LLM-Knowledge-Boundary

🚀 Quick Start

🔍 Conduct Experiments

🌟 Acknowledgement

About

Languages

RUCAIBox/LLM-Knowledge-Boundary

Folders and files

Latest commit

History

Repository files navigation

LLM-Knowledge-Boundary

🚀 Quick Start

🔍 Conduct Experiments

🌟 Acknowledgement

About

Topics

Resources

Stars

Watchers

Forks

Languages