Prompt-Weight Equivalence

Goal: How easy is it to train an LLM via weight updates s.t. its probability distribution over subsequent token sequences is identical to that of a prompted model.

Setup

# make virtual environment
python3 -m venv venv
source venv/bin/activate

# install dependencies
pip3 install -r requirements.txt

# download SQuAD dataset into data/*.jsonl
mkdir -p data
python3 download_data.py

Run Experiments

# enter venv
source venv/Scripts/activate

# generate trajectory dataset with ground truth prompted logits REDO 21-30
python generate_data.py \
  --x0_file data/backboard_x0.md \
  --question_dataset data/backboard_train_temp.jsonl \
  --num_questions 10 \
  --num_sequences_per_question 4 \
  --max_sequence_length 128 \
  --min_sequence_length 32 \
  --temperature 2.0 \
  --batch_size 1 \
  --traj_out_file data/train_traj_7q10_s4_len128_x0backboard.jsonl \
  --model_name meta-llama/Meta-Llama-3-8B-Instruct

# generate validation data
python generate_data.py \
  --x0_file data/backboard_x0.md \
  --question_dataset data/backboard_validation.jsonl \
  --num_questions 40 \
  --num_sequences_per_question 4 \
  --max_sequence_length 128 \
  --min_sequence_length 32 \
  --temperature 2.0 \
  --batch_size 1 \
  --traj_out_file data/val_traj_q20_s4_len128_x0backboard.jsonl \
  --model_name meta-llama/Meta-Llama-3-8B-Instruct

# CHANGE THE NAMES OF THE JSON FILES

# train a LoRA model to match the probabilities over the trajectories generated above.
python train_loop_custom.py \
  --num_epochs 50 \
  --batch_size 2 \
  --learning_rate 2e-4 \
  --data_path data/train_traj_q105_s4_len128_x0backboard.jsonl \
  --val_path data/val_traj_q40_s4_len128_x0backboard.jsonl \
   --out_dir results/baked_backboard_backboard_bs2_ep50

# How to use Resume (Starts again from latest epoch)
python train_loop_resume.py \
  --out_dir results/baked_backboard_backboard_bs2_ep50 \
  --data_path data/train_traj_q105_s4_len128_x0backboard.jsonl \
  --val_path data/val_traj_q40_s4_len128_x0backboard.jsonl \
  --batch_size 2 \
  --learning_rate 5e-5

python compare_models.py --results_dir results\baked_backboard_backboard_bs2_ep50\epoch_7 --data_file data\val_traj_q40_s4_len128_x0backboard.jsonl --batch_size 2

Dashboard

To run the streamlit dashboard, use

streamlit run dashboard/app.py

Experiments 2024 07 19

I'm blue baabaaadeeeebuuuuddaa

# Generate new dataset with improved system prompt management
# one prompt with all caps, one prompt always mention the color blue in each
# sentence you generate
python3 generate_data.py \
    --x0_file data/blue_x0.md \
    --question_dataset data/squad_train.jsonl \
    --num_questions 100 \
    --num_sequences_per_question 25 \
    --max_sequence_length 300 \
    --min_sequence_length 100 \
    --temperature 2.0 \
    --batch_size 64 \
    --traj_out_file data/traj_bluex0_squad_train.jsonl

# generate validation set
python3 generate_data.py \
    --x0_file data/blue_x0.md \
    --question_dataset data/squad_validation.jsonl \
    --num_questions 25 \
    --num_sequences_per_question 25 \
    --max_sequence_length 300 \
    --min_sequence_length 100 \
    --temperature 2.0 \
    --batch_size 32 \
    --traj_out_file data/traj_bluex0_squad_val.jsonl

# Train blue model 
python3 train_loop.py \
    --num_epochs 20 \
    --learning_rate 3e-4 \
    --data_path data/traj_bluex0_squad_train.jsonl \
    --val_path data/traj_bluex0_squad_val.jsonl \
    --out_dir results/blue20240719.1
    --batch_size 32

Experiments 2024 07 22

Planning doc: (Outline) Prompt-Weight Equivalence

# Data generation -- creates scripts/train_loop_commands_20240722.txt
bash scripts/datagen_20240722.sh

bash scripts/executor.sh scripts/commands_datagen_20240722.txt 0 7
bash scripts/executor.sh scripts/commands_datagen_20240722.txt 1 7
bash scripts/executor.sh scripts/commands_datagen_20240722.txt 2 7
bash scripts/executor.sh scripts/commands_datagen_20240722.txt 3 7
bash scripts/executor.sh scripts/commands_datagen_20240722.txt 4 7
bash scripts/executor.sh scripts/commands_datagen_20240722.txt 5 7
bash scripts/executor.sh scripts/commands_datagen_20240722.txt 6 7


# Training loop -- creates scripts/train_loop_commands_20240722.txt
bash scripts/train_loop_calls_20240722.sh

bash scripts/executor.sh scripts/train_loop_commands_20240722.txt 0 7
bash scripts/executor.sh scripts/train_loop_commands_20240722.txt 1 7
bash scripts/executor.sh scripts/train_loop_commands_20240722.txt 2 7
bash scripts/executor.sh scripts/train_loop_commands_20240722.txt 3 7
bash scripts/executor.sh scripts/train_loop_commands_20240722.txt 4 7
bash scripts/executor.sh scripts/train_loop_commands_20240722.txt 5 7
bash scripts/executor.sh scripts/train_loop_commands_20240722.txt 6 7

Comparison Script 2024 07 23

python3 compare_models.py \
    --results_dir results/20240722/traj_always_rhyme_x0_squad_ep150 \
    --x0_override data/blue_x0.md

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
__pycache__		__pycache__
dashboard		dashboard
data/InstructionX0		data/InstructionX0
README.md		README.md
baked_scaler.py		baked_scaler.py
compare_models.py		compare_models.py
download_data.py		download_data.py
generate_data.py		generate_data.py
interactive_baked.py		interactive_baked.py
requirements.txt		requirements.txt
test_instruct_model.py		test_instruct_model.py
test_math_model.py		test_math_model.py
train_loop.py		train_loop.py
train_loop_custom.py		train_loop_custom.py
train_loop_resume.py		train_loop_resume.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Prompt-Weight Equivalence

Setup

Run Experiments

Dashboard

Experiments 2024 07 19

I'm blue baabaaadeeeebuuuuddaa

Experiments 2024 07 22

Comparison Script 2024 07 23

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Prompt-Weight Equivalence

Setup

Run Experiments

Dashboard

Experiments 2024 07 19

I'm blue baabaaadeeeebuuuuddaa

Experiments 2024 07 22

Comparison Script 2024 07 23

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages