Describe the bug
Lora训练完毕,出现文件夹v0-20251015-111023/iter_0002400,想要合并为HF权重。
我想要做合并,按照官方脚本,运行
CUDA_VISIBLE_DEVICES=0
swift export
--mcore_adapters megatron_output/1015/v0-20251015-111023/iter_0002400
--to_hf true
--torch_dtype bfloat16
--output_dir megatron_output/1015/v0-20251015-111023/checkpoint-2400
--test_convert_precision true
前面精度检测和模型加载都是正常的,最后出现异常终止的情况:

最后的文件夹里没有出现checkpoint-2400文件夹
麻烦大佬帮忙看看
**Your hardware and system info**
modelscope-registry.cn-hangzhou.cr.aliyuncs.com/modelscope-repo/modelscope:ubuntu22.04-cuda12.6.3-py311-torch2.7.1-vllm0.10.1.1-modelscope1.29.2-swift3.8.3
日志中的额外信息:
args:

有一句奇怪的话:
