GitHub - nggsam/preference_model: Trains and compares a variety of preference models (reward models) with different losses and datasets.

Trains and compares a variety of preference models (reward models) with different losses and datasets.

Name		Name	Last commit message	Last commit date
Latest commit History 43 Commits
.vscode		.vscode
pm		pm
.gitignore		.gitignore
README.md		README.md
deepspeed.sh		deepspeed.sh
deepspeed_config.json		deepspeed_config.json
requirements.txt		requirements.txt
train.py		train.py
train.sh		train.sh
train_test.py		train_test.py

Provide feedback