rbao2018

Follow

BaoRong rbao2018

Follow

2 followers · 4 following

Shanghai,China

Highlights

Pro

Block or Report

Block or report rbao2018

Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse

Popular repositories Loading

self_ref_feedback self_ref_feedback Public

Code for Improving Large Language Model Alignment from Self-Reference Model Feedback

Python 1
OpenRLHF OpenRLHF Public

Forked from OpenRLHF/OpenRLHF

A Ray-based High-performance RLHF framework (Support 70B+ full tuning & LoRA & Mixtral & KTO)

Python