pip install -r requirements.txt
下载【语义评估】
所需模型:
huggingface-cli download --resume-download thenlper/gte-large-zh --local-dir /home/wangguisen/models/gte-large-zh
下载【扮演能力】
所需模型:
huggingface-cli download --resume-download morecry/BaichuanCharRM --local-dir /home/wangguisen/models/BaichuanCharRM
run step1:
CUDA_VISIBLE_DEVICES=2,3 python main.py "step1" "./yamls/step1.yaml"
run step2:
CUDA_VISIBLE_DEVICES=2,3 python main.py "step2" "./yamls/step2.yaml"
run step3:
CUDA_VISIBLE_DEVICES=2,3 python main.py "step3" "./yamls/step3.yaml"
run step4:
CUDA_VISIBLE_DEVICES=2,3 python main.py "step4" "./yamls/step4.yaml"
./output
├── ceval
│ ├── results.json
│ └── results.log
├── CharacterEval
│ ├── step1_generation.jsonl
│ ├── step2_generation_trans.jsonl
│ ├── step3_evaluation.jsonl
│ └── step4_eval_scores.jsonl
├── cmmlu
│ ├── results.json
│ └── results.log
├── mmlu
│ ├── results.json
│ └── results.log
├── all_results.json
├── generated_predictions.jsonl
└── predict_results.json
4 directories, 13 files
model | rouge-1 | rouge-2 | rouge-l | samples_per_second | steps_per_second | sem_sim_score | avg_mmlu | avg_cmmlu | avg_ceval | ||
---|---|---|---|---|---|---|---|---|---|---|---|
- 与 llama factory 解耦。
- rouge解耦,增加f、p、r。
- 奖励模型训练。
- vllm推理。
- 支持多卡推理。
- 流式写入结果。
- 支持Lora。
- step2输出语义分值分布。
欢迎关注我的公众号: