Update agent demo #2867

Jintao-Huang · 2025-01-06T07:26:52Z

No description provided.

* commit 'a0d0351400d522392fb4535567bab83d8b9d45b2': Support infer n parameter (modelscope#2893) support multi round dpo (modelscope#2884) fix docs (modelscope#2882) update qlora shell (modelscope#2880) fix bugs (modelscope#2876) fix citest (modelscope#2873) Support ppo (modelscope#2783) fix bugs (modelscope#2869) Update agent demo (modelscope#2867) support mps (modelscope#2866) fix vllm video (modelscope#2864) support reward model train (modelscope#2862) fix jsonl writer (modelscope#2860) Support quant bert reward (modelscope#2859) # Conflicts: # examples/train/rlhf/ppo.sh # swift/trainers/__init__.py # swift/trainers/mixin.py # swift/trainers/rlhf_trainer/ppo_trainer.py

Jintao-Huang added 6 commits January 6, 2025 15:09

update agent_demo

9c0a4c9

update

a0135e0

update

14500e2

fix

7314f43

update

d33b967

update

e8efa93

tastelikefeet approved these changes Jan 6, 2025

View reviewed changes

Jintao-Huang merged commit 1db3d9f into modelscope:main Jan 6, 2025
2 checks passed

Provide feedback