GitHub - lockon-n/self-prompting

Self-Prompting

Code example for paper Self-Prompting Large Language Models for Zero-Shot Open-Domain QA (NAACL 2024).

Requirements

python 3.7
openai==0.25.0
sentence-transformers==2.2.2
torch==1.13.1
transformers==4.28.1

Steps

Preparation

Save your openai api key into ./related_files/openai_api.txt.

We provide a sample test dataset in ./datasets/samples_nq/test.jsonl.

Data generation

We provide the generated data by InstructGPT in ./gpt3_gen_samples/filtered_flattened_topic_aware_gens.json

Clustering & Selection

Do clustering

python compute_sent_emb.py \
--genfile ./gpt3_gen_samples/filtered_flattened_topic_aware_gens.json \
--num_clusters_list [1,2,4,6,8,10] \
--clsuterfile ./gpt3_gen_samples/filtered_clustering_results_sbert_qa.json \
--device cuda:0 \
--way sbert \
--qapair

Do selection

python sbert_retrieve.py \
--genfile ./gpt3_gen_samples/filtered_flattened_topic_aware_gens.json \
--clusterfile ./gpt3_gen_samples/filtered_clustering_results_sbert_qa.json \
--device cuda:0 \
--way sbert \
--qapair \
--model_suffix sbert

Inference

python -u new_main.py \
--api_file ./related_files/openai-api.txt \
--model_name instructgpt \
--dataset_name samples_nq \
--dataset_dir ./datasets/samples_nq \
--start_pos 0 \
--end_pos -1 \
--output_files_folder ./outputs/samples_nq \
--num_sample 10 \
--source gpt3gen \
--pick_demo_seed -1 \
--sid -7 \
--instruction_way -2 \
--demo_way 4 \
--with_restrict ans \
--clusters_filename ./gpt3gen/filtered_clustering_results_sbert_qa.json \
--flattened_gen_data ./gpt3gen/filtered_flattened_topic_aware_gens.json \
--clusters_retrieve_filename ./gpt3gen/filtered_clustered_retrieve_res_samples_nq_sbert_qa.json

Evaluation

python collect_merge_delete_eval.py

Citation

If you find this code helpful, please kindly cite this:

@article{li2022self,
  title={Self-prompting large language models for zero-shot open-domain qa},
  author={Li, Junlong and Wang, Jinyuan, and Zhang, Zhuosheng and Zhao, Hai},
  journal={arXiv preprint arXiv:2212.08635},
  year={2022}
}

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
datasets/samples_nq		datasets/samples_nq
gpt3_gen_samples		gpt3_gen_samples
related_files		related_files
README.md		README.md
api_utils.py		api_utils.py
collect_merge_delete_eval.py		collect_merge_delete_eval.py
compute_sent_emb.py		compute_sent_emb.py
data_utils.py		data_utils.py
extract_utils.py		extract_utils.py
fastgen.py		fastgen.py
general_utils.py		general_utils.py
local_model_new.py		local_model_new.py
new_main.py		new_main.py
sbert_retrieve.py		sbert_retrieve.py
squad_evaluate.py		squad_evaluate.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Self-Prompting

Requirements

Steps

Preparation

Data generation

Clustering & Selection

Inference

Evaluation

Citation

About

Releases

Packages

Languages

lockon-n/self-prompting

Folders and files

Latest commit

History

Repository files navigation

Self-Prompting

Requirements

Steps

Preparation

Data generation

Clustering & Selection

Inference

Evaluation

Citation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages