Add PairRM best-of-16 to AlpacaEval #181

jdf-prog · 2023-12-05T07:41:39Z

Add PairRM best-of-16 enhancement results on existing models. PairRM is a small reward model that can be used to enhance decoding results.

yuchenlin · 2023-12-05T18:22:16Z

@YannDubs Hi Yann, would you please take a look at this PR for uploading the results of PairRM? Thank you very much! :)

The model link on huggingface: https://huggingface.co/llm-blender/PairRM

A Twitter thread about this: https://x.com/billyuchenlin/status/1729194671178760551?s=46&t=C8k96ENtuupQOq_EnGk7vA

src/alpaca_eval/leaderboards/data_AlpacaEval/alpaca_eval_gpt4_leaderboard.csv

YannDubs · 2023-12-05T21:01:48Z

Thanks @jdf-prog and @yuchenlin really cool results for such a small reward model! 💯
I left a small comment for formatting of the leaderboard, and I'll merge once it's fixed!

jdf-prog · 2023-12-05T21:27:37Z

Hi, @YannDubs the formatting issue is solved! Thanks for help merge the PairRM's results

jdf-prog added 3 commits December 5, 2023 02:32

Add pairrm-zephyr-7b-beta to AlpacaEval

42e3db7

Add pairrm-tulu-2-13b to AlpacaEval

92d07e4

Add pairrm-tulu-2-70b to AlpacaEval

017786d

YannDubs reviewed Dec 5, 2023

View reviewed changes

src/alpaca_eval/leaderboards/data_AlpacaEval/alpaca_eval_gpt4_leaderboard.csv Show resolved Hide resolved

fix formating issues of the leaderboard

2b99b85

YannDubs merged commit 134244d into tatsu-lab:main Dec 5, 2023
2 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add PairRM best-of-16 to AlpacaEval #181

Add PairRM best-of-16 to AlpacaEval #181

jdf-prog commented Dec 5, 2023

yuchenlin commented Dec 5, 2023

YannDubs commented Dec 5, 2023

jdf-prog commented Dec 5, 2023

Add PairRM best-of-16 to AlpacaEval #181

Add PairRM best-of-16 to AlpacaEval #181

Conversation

jdf-prog commented Dec 5, 2023

yuchenlin commented Dec 5, 2023

YannDubs commented Dec 5, 2023

jdf-prog commented Dec 5, 2023