personal-content-ranker

Draft design doc (Feedback appreciated)

Steps to train a ranker

Create preference data by running the colab
Start reward model training using accelerate launch reward_modeling.py